top of page

NNIテクノロジーズ

はじめに

2025.09.17

1.ビッグアーカイブ(BA)とは

ビッグアーカイブ(BA)とは、日々蓄積され巨大化する表形式データです。工場のセンサー、店舗のPOS、物流のトレーサビリティ、病院の診療記録などがその代表例であり、取引・製造・流通・医療・行政・金融といった多様な分野で日常的に生成されています。

BAに格納されるのは、文章や画像から生成される「知識」ではなく、数値や文字列として記録された「FACT」です。FACTは、知識と異なり明確かつ膨大であり、曖昧さがありません。トレーサビリティや業務支援など、多くの実務領域がこのFACTに依存しており、その多くがBA内に存在しています。BAはまさに「宝の山」であると言えます。

2.生成AIが知識とFACTの両方を活用できれば

生成AIは知識の提供には長けています。しかし、BAに格納されたFACTにリアルタイムのアクセスが許されていませんでした。そのため、たとえば製品の品質不良について質問されても、仕入・製造・出荷の各履歴に基づいた調査や推論を行うことができず、有意義とは言えない回答しかできませんでした。もし知識に加えてBA内のFACTも活用できるようになれば、生成AIは実務レベルの分析・助言をすることが可能になり、その適用可能先が飛躍的に拡大します。

3.BA活用の3つの課題

しかし、BAを活用しようとすると3つの根源的な課題に直面します。

課題1.目的別BAの生成

BAは多数のファイルに分割され、さらに多数のカラムを含んでいることが普通です。そのため利用前に、利用目的に応じて、必要なカラムを抽出し、ファイルを結合した「目的別BA」を作成する必要があります。

この過程にはデータ形式の変換(単位の統一など)も含まれ、その生成処理には膨大な時間を要します。

課題2.目的別BAへの高速アクセス

生成された目的別BAにはインデックスがありません。そのため、例えクラウド環境などに置いたとしても、生成AIが要求するリアルタイムなレスポンスを実現することができません。

課題3.目的別BAの保管・転送

目的別BAは、巨大でありその保管や転送が困難です。保管できなければデータの継続的な利用が困難ですし、転送できなければその利用者に届けることができません。

これらの3大課題を解決できる「写像表形式データ」が2023年に実用化されました。

  1. 千個ものBAからでもリアルタイムに生成できます。

  2. 全てのカラム、全てのカラムの組合せ、全ての部分集合にインデックスがあるため高速アクセス可能です。

  3. ​値を持たないため巨大な表形式データを極めてコンパクトに表現できます。そのため保管・転送は容易です。

すでに、千個以上のBAを結合して31.5兆レコード・3千カラム規模の巨大表形式データを生成し、それをPC1台で対話型操作するデモを公開しています。課題解決への歩みはこちら

目的別BAを写像表形式データで作れば、3つの課題は一挙に解決されます。

4. 作れて、使えて、渡せるBA: Peta Book(PB) とは

​写像表形式データで作られた目的別BAは極めて有効ですが、不特定多数に利用してもらうには、①高次のメタ情報(作成の背景や想定利用方法など)、②補助情報(過去にその目的別BAから得られた知見など)を欠いています。しかも、仕入れ・組み立て・出荷のように関連する複数の目的別BAがセットになっていません。​

高次のメタ情報、補助情報を補充し、関連する複数の目的別BAを1つにまとめてファイル化したのが Peta Book(PB)です。PBによって作れて、使えて、渡せるBAが実現されます。

PB SuiteはPB Author、PB Viewer、PQL(Peta QL)などからなる、PBを使いこなすためのソフトウェア群を1つのパッケージにしたしたものです。

5. 実務支援型AIを実現するPeta Book

生成AIはPBを使うことで、幅広い実務に対応する実務支援型AIになります。すると、例えば、仕入れ・組み立て・出荷の各目的別BAからのFACTを使いこなし、幅白い実務を支援できるようになります。その支援内容には事故や故障などのAIが学習することが難しい稀な事象の解析も含まれます。予兆や原因の探索なども可能になると考えられます。

Information

756PB のビューイングとは

Movie ICON.png

(Youtube 2024.02)

オンデマンドでテイラーメイドのエクサバイトDBを供給

ビッグデータの共創・共同利用プラットフォームを実現

複雑なデータの組み合わせでも

Movie ICON.png

(Youtube 2024.01)

1msサンプリングで収集した1年分のデータ(315億レコード)100個と、

10msサンプリングで収集した1年分のデータ(31.5億レコード)1,000個とを

組み合わせて、3.15兆レコードの目的別データベースを生成し、

​ソート・検索・集計するデモを行っています。

(スライド)UPDATED 2025.02.01

スライド

​ビッグアーカイブの RAG を実現する Peta Book 

(スライド)UPLOADED 2025.03.01

スライド

​宇宙科学情報解析シンポジウム(2025.02.14) での発表資料

 

(スライド)UPLOADED 2025.03.01

スライド

DEIM2025 での発表資料

(スライド)UPLOADED 2025.03.06

スライド

​フライヤー BA-RAG rev. 4.3 

お問い合わせ

nni-tech.com

©2023, 2024, 2025 NNI Technologies

bottom of page