ディープ・レイク、民間のマルチモーダルデータに基づくディープ・リサーチ・プログラムを提案

吐司AI

アクティヴループのディープ・シンキング・テクノロジーは、より正確で柔軟なマルチモーダルナレッジエージェントをプライベートデータおよびパブリックデータに提供します。

2025年に向けて、ジェネレーティブAI(GenAI)は投資収益率(ROI)の面で極めて重要な年となる。マルチモーダルデータに基づくナレッジエージェントは、これを達成するためのコアドライバーである。

 

ディープリサーチを立ち上げた理由

過去1年間、Activeloopチームはフォーチュン500社を中心とした様々な組織と綿密な話し合いを行ってきました。その結果、ビジネスユーザーはパフォーマンスの遅延にはある程度寛容であるが、精度の低下は避けられないという傾向があることがわかりました。硬骨事実、データ検索の精度は、乗り越えられないボトムラインになっている。実際、データ検索の精度は乗り越えられないボトムラインになっており、組織がジェネレーティブAIを使用して収益や効率を真に改善し、そうすることでインフラやモデルの追加への巨額の投資を正当化する能力に直接関係している。

ナレッジワーカーは、保険金請求監査のために患者の健康データを照合する看護師から、特許出願のために徹底的な特許検索を行うパラリーガル、複合仮説を検証するためにPubMedで新たに発表された論文を評価する研究者まで、反復的で高度に手作業による検索作業に毎日多くの時間を費やしている。

控えめに見積もっても、組織内での手作業による検索行動は、およそ21.3%から25%の生産性を無駄にしている。 これは、従業員1人当たり年間約20,000ドルの損失に相当する。従業員1,000人の中規模組織では、非効率的な検索により、次のような損失が発生する可能性があります。 2000万ドル 経済的損失。 チームメンバーの1人が「紛失した」ファイルを探すのに時間を費やすたびに、組織のデータでかくれんぼをするためにお金を払っていることになり、誰も得をしていないことを想像してみてください。

Activeloopは、このような課題を解決するための革新的なソリューション、AIナレッジエージェントをご紹介します。このAIナレッジエージェントは、組織内外からのマルチモーダルなデータを基に、精度が高く、深く分析された回答を生成します。

 

OpenAIディープリサーチの比較

ディープレイク とともに OpenAIのディープリサーチOpenAIのDeep Researchは、インターネット上の情報を自律的に検索できるAI搭載アシスタントの構築に注力しており、Deep Lakeは、インターネット上の情報を自律的に検索できるAI搭載アシスタントの提供に注力している。一方、Deep Lakeは、インターネット上で自律的に情報を検索できるAIアシスタントを提供することに注力している。 エンタープライズクラスのマルチモーダルAI検索システム一緒に働く能力 公的データと私的データ シームレスな統合を実現ユーザーが質問できるデータの種類と、その検索結果については、以下のとおりです。 精度 そこまでやるか 熟練 ディープ・レイクは実証した に匹敵するか、それ以上である。 OpenAIディープリサーチの強み。

1.プライベートデータとパブリックデータの接続

Deep LakeとOpenAIのDeep Researchの主な違いは、次のとおりです。ディープ・レイクは公開データに限らない。. もともとは 企業ユーザーへのサービス特に、そのような人たちは 専有、機密、価値の高いデータセット その上でAI主導の検索を実行する企業。 Activeloopの調査によると、約63%の組織がデータを統合し、AIシステムに接続する上で課題に直面しているという。 Deep Lakeは、組織のAmazon S3またはAzureクラウド環境に即座に導入することができ(すでにそれぞれのアプリマーケットプレイスで利用可能)、ユーザーはこのデータに基づいて即座に質問や分析を行うことができる。

下の図に示すように、配備プロセスは非常に簡単だ:

Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案
  • ディープリサーチは、一般にアクセス可能なリソースの検索に限定されているが。しかし、Deep Lakeを使えば、組織は社内の調査、レポート、知的財産、機密データから貴重な洞察を安全に保存し、取り出すことができる。.
  • これは、次のステップのために非常に重要なことだ。 バイオテクノロジー、医療技術、金融、法律業界。 これらの業界は、オープンなウェブ検索結果ではなく、独自の情報に大きく依存しているため、これは非常に重要である。
  • エンタープライズクラスのセキュリティ機能 (RBAC権限管理、SOC 2 Type IIコンプライアンス認証、侵入テストなど) 機密データが常に以下の場所にあることを保証する。 コンプライアンスと保護 技術の現状。

2.視覚言語モデルに基づくマルチモーダル検索

ディープ・レイクは最初から基礎となるアーキテクチャに重点を置いている。 マルチモーダルAI検索 の機能が構築されている。 多様なデータタイプを含む複雑なタスクに有利その ディープ・リサーチが主に扱うのは テキストベースのクエリー (ディープ・レイクは完全にサポートされている:

  • テキスト、画像、動画、音声、構造化メタデータにまたがるシームレスなクロスモーダルクエリ.
  • マルチモーダル検索に最適化された視覚言語モデル(VLM)の微調整とはいえ 非常に複雑な混合データクエリまた、このシステムは正確で相関性の高い結果を返す。
  • リアルタイム・ハイブリッド検索ベクトル、キーワード、構造化ベースの検索技術を巧みにブレンドし、検索精度を大幅に向上させている。

3.同等以上の検索精度

ディープ・レイクはその名で知られている。 高度な検索アーキテクチャ検索結果は、彼らが OpenAIのディープリサーチと同等以上の精度. に頼るのとは対照的である。 テスト中の推論と思考プロセスの連鎖 ディープ・リサーチのディープ・レイクは、革新的に以下の技術を採用している:

  • ディープ・メモリー ユーザーの過去の検索行動から動的に学習し、特定のユースケースに合わせて検索結果をパーソナライズし、業界用語やユーザーの嗜好を学習することで、検索精度を継続的に向上させるテクノロジーです。 これにより、ディープレイクはドメイン固有のユースケースにおいて、最高水準のパフォーマンスを実現します。
  • マルチモーダル検索技術の実現である。 クラウドおよびローカルストレージのテキスト、画像、ビデオ、オーディオ、構造化データ 各項目間のシームレスな相互参照

4.BYOM:持ち込みモデル

ディープレイクは、単一のモデルベンダーに限定されることなく、基礎となるAIモデルの選択肢を提供します。 完全な柔軟性.

ユーザーは 好きなモデルを自由に選べる含まれるもの 最先端のオープンソースモデル、細かく調整されたドメイン固有の大規模言語モデル(LLM)や小規模言語モデル(SLM)、およびAnthropic ClaudeやGoogle Geminiなどの他の主要なクローズドソースモデル。.

5.コスト最適化されたパフォーマンスで秒以下のクエリ

Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案

自然言語によるクエリーは自動的にクエリーステートメントに変換されます。 また、Activeloopのシステムは、精度の高い回答をサポートする証拠を総合的に収集するために、どのようなデータのサブセットを追加クエリする必要があるかを決定します。

ディープ・レイク使用 インデックス・オン・ザ・レイク テクノロジー、サポート オブジェクトストアから直接 従来のインメモリシステムと比較して、サブ秒単位のクエリを実行し、以下を可能にします。 最大10倍のコスト効率. これは大きなメリットをもたらす:

  • サブセカンドディレイこのソフトウェアの最新バージョンは、膨大なデータセット(1億レコード以上)を扱う場合でも、最速のレスポンスタイムを実現します。
  • 高価なキャッシュは不要また、クエリープロセスは、リアルタイム検索を実現するために深く最適化されており、同時にストレージコストも低く抑えられている。
  • クラウド環境に柔軟に対応そのため、ディープ・レイクはスピードが求められる、費用対効果の高いAI検索 AIネイティブ・アプリケーションのためのソリューション。

 

ディープ・レイクの仕組み

Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案

Deep Lakeは、あらゆる種類のAIワークフローを強化するために最適な方法でデータを保存・検索する能力をユーザーに提供することを目的として、データの保存と検索のための主要コンポーネントを構築することに焦点を当てている。

ユーザーからの大量のデータを接続し、インデックスを作成した後、ディープレイクの ナレッジエージェント ナレッジエージェントは、一連の高度なリサーチタスクを計画し、幅広いデータセットとモダリティにわたってマルチステップクエリーを実行することができます。ユーザーが提示した質問に答えるために必要な主要データを正確に理解します(さらに重要なことに、システムが質問に答えるための十分な証拠を持っているかどうかを判断します)。 ナレッジエージェントはまた、MaxSimのような高度な検索技術を活用し、視覚とテキストを組み合わせたコンテキストに基づいて正確な検索を実行し、何十億行ものテキストデータからの引用とともに、検索された重要な情報を参照としてユーザーに提示します。

 

ユーザーができる質問の種類

Deep Lakeは現在、すべてのユーザー・チーム・メンバーに開放されており、ユーザーが質問できる数や、クエリできるデータのサイズや形式に制限はない。

ユーザーが質問できるタイプの例を以下に挙げる:

患者の病歴データ、臨床検査、磁気共鳴画像(MRI)レポートの組み合わせ

Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案

複雑な用語や概念について、参考文献を探し、関連付ける

次の例は、マルセル・プルーストの代表作『À la recherche du temps perdu』から引用したもので、PDF版は1150ページを超える長編のひとつである。

Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案

調査結果を横断した徹底的な調査

Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案

質問 ディープシーク 推論タスク全体のパフォーマンス

システムによって出される解答には、論文の本文と図表の両方からの情報が含まれる。

Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案

 

既知の制限

どんなシステムにも必然的に限界があり、これはディープレイクにも当てはまる。 Activeloopの場合、ディープレイクのナレッジエージェントは、より詳細な分析に重点を置き、回答結果に慎重になるように調整されている。 そのため、ユーザーが即座に簡単な回答を必要とする場合には、ディープレイクは最適な選択ではないかもしれない。 しかし、より深い思考を必要とするドメイン特有のクエリに直面したとき、ディープレイクはその性能を発揮する。

Activeloopは現在、ユーザーからの貴重なフィードバックに基づいて製品を継続的に改善するため、Deep Lakeシステムを正式に公開プレビューしています。 さらに、Activeloopは、ユーザーエクスペリエンスをさらに最適化するために、クエリの複雑さに応じて「高速」と「低速」の思考モードを切り替えることができるスマートルーターも積極的に開発しています。

 

フラッグシップ・パイオニアがディープレイクを活用してバイオテクノロジーのブレークスルーを達成した方法

フラッグシップ・パイオニアリング社は、革新的なプラットフォームの開発と、人間の健康と持続可能性の分野に革命をもたらす新興企業のインキュベーションに重点を置く先進的なバイオテクノロジー企業である。 フラッグシップ・パイオニアリング社は、科学研究能力を強化するため、アクティヴループ社と深い協力関係を結んだ。 ラグ (検索強化型生成)機能を提供します。 このパートナーシップにおいて、Flagship Pioneering社のPioneering IntelligenceチームはActiveloop社と緊密に連携し、Activeloop Deep Lake知識エージェントをベースとした先進的なシステムを開発しました。 このシステムにより、Flagship Pioneering社は、従来のベクトルやキーワードベースの検索と比較して、約181 TP3Tの精度向上で、世界中の科学研究結果を効率的に検索し、マルチモーダルな生物医学データをより深く掘り下げることができるようになりました。 特に、このシステムは、テキストに明示的に記載されていない特定のグラフやチャートからも、重要な情報を正確に捉えることができます。また、本文中に明示されていない特定の図表からも重要な情報を捉えることができるため、Flagship Pioneeringの研究能力を大幅に向上させることができます。

フォーチュン500に入る医療技術企業が、データモダリティとクラウドプラットフォームにまたがる4,000万件以上の論文の高速かつ正確なAI検索にディープレイクを使用

Deep Lakeのパワーは、医療技術における科学的発見とコンプライアンスのワークフローにおいて、高度に手作業で繰り返される検索タスクを自動化しました。 これにより、通常であれば数カ月かかる研究サイクルが、わずか数日にまで劇的に短縮されました。

Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案

今すぐchat.activeloop.aiにアクセスし、ディープレイク探検を始めてください。 最初の1週間は無料で、料金プランは1席99ドルから (また、実際のデータニーズに応じて柔軟に拡張できます。).

© 著作権表示
AiPPT

関連記事

コメントなし

なし
コメントはありません