マイクロソフトがCoRAGを発表：反復的推論によるAI検索の強化

原文リンク(2025-02-12)

Microsoft AIは中国人民大学と共同でRetrieval-Augmented Generation（RAG）モデルを強化するために設計された新しいAIフレームワーク、Chain-of-Retrieval Augmented Generation（CoRAG）を発表した。単一の検索ステップに依存する従来のRAGシステムとは異なり、CoRAGは反復検索と推論を可能にし、AIモデルが回答を生成する前に動的に検索結果をリファインすることを可能にする。

この改善により従来のRAGシステムの大きな欠点：複数のソースからの情報を効果的に統合する能力の欠如が克服された。複雑なクエリ、特にマルチホップ質問応答（QA）において、従来のRAGモデルは情報を一度しか検索しないため不完全または不正確な結果につながり、しばしば苦戦を強いられる。CoRAGは各ステップでクエリを再構築し、AIが人間の研究者のように検索を「考え抜く」ことを可能にすることでこの状況を変える。

CoRAGの核心的なイノベーションはその動的なクエリ再定式化メカニズムである。単一の検索ステップに依存する代わりに、モデルは中間推論状態に基づいてクエリを反復的にリファインする。このプロセスは各段階で検索された情報が文脈的に関連し、より完全な最終回答に向けて構築されることを保証する。

CoRAGを高価な人間のアノテーションなしで訓練するために、研究者たちは既存のRAGデータセットからもっともらしい検索チェーンを生成する技術である棄却サンプリングを使用した。モデルはこれらの拡張されたデータセットで訓練され、サブクエリ、サブアンサー、最終回答を生成することを学習する。

推論中、CoRAGは以下のような柔軟なデコーディング戦略を提供する：

効率化のための貪欲法
精度を最適化するためのBest-of-Nサンプリング
計算コストとパフォーマンスのバランスを取るためのツリー検索

このスケーラビリティによりユーザーは検索深度を制御し、精度と計算効率の最適なトレードオフを保証できる。

scheme

出典：https://arxiv.org/abs/2501.14342

CoRAGはKILTベンチマークとマルチホップQAタスクでテストされ、既存のRAGモデルと比較して改善された結果を示した。このアプローチは複数のソースから情報を検索し、合成する必要があるタスクにおいて特に効果的であるようだ。

KILTベンチマーク（出典：https://arxiv.org/abs/2501.14342）

マルチホップQAタスクベンチマーク（出典：https://arxiv.org/abs/2501.14342）

AIコミュニティはCoRAGの潜在的な影響力に注目している。Durapid Technologiesの創設者兼CEO Deepesh Jain氏はこうコメントした：

これはRAGにとって大きな前進です！従来の方法では重要な詳細を見逃すことが多いですが、CoRAGの反復的アプローチは検索をより賢く、よりダイナミックにします。人間が行うようにモデルに検索を改良させることで、複雑なクエリに対してより良い回答を導き出すことができます。

Velotixのシニア機械学習エンジニア Ekaterina Baru氏は人間の研究手法との類似性を強調した：

これは魅力的なアプローチです－反復検索を使ってクエリを洗練させることは、研究者として私たちが自然に問題を深く掘り下げていく方法をリアルに反映しています。マルチホップQAタスクのパフォーマンス向上は印象的で、より長いチェーンと計算コストのトレードオフが本番環境でどのように進化するのか興味があります。この先が楽しみです！

静的検索から反復的アプローチに移行することで、CoRAGはAI主導の検索と推論を扱う異なる方法を紹介している。これは正確で構造化された情報の取得が不可欠な自動化された研究、エンタープライズナレッジシステム、AI意思決定支援などの分野で役立つ可能性がある。

作者について

Robert Krzaczyński

もっと見るより少なく

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

バーチャルパネル：大規模言語モデルを採用する際の考慮点

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

作者について

Robert Krzaczyński

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

関連するコンテンツ

Appleの最新世代CPUに新たなサイドチャネル脆弱性が影響

JetBrainsのAIコーディングエージェントJunieがJetBrains IDEとの緊密な統合を提供

AWSがAmazon Q Developer エージェントに新機能（ドキュメント生成、コードレビュー、ユニットテスト）を追加実装

ほとんどの企業が毎週障害を経験：The State of Resilience 2025 Report

InfoQの新認定制度、シニア開発者とアーキテクト向けの実践的スキルにフォーカス

Netflixがレジリエンシー向上のためにサービスレベルで優先順位付き負荷制御を提供開始

Webコンテンツアクセシビリティガイドラインを使用したアクセシブルなウェブサイトの作成

SlackがAIを活用したハイブリッドアプローチでEnzymeからReactテストライブラリに移行した方法

インパクトのあるデータ製品戦略を形成する

マイクロソフトがCoRAGを発表：反復的推論によるAI検索の強化

Hugging Face、新たなプロバイダー統合でサーバーレス推論オプションを拡大

ラテンアメリカがAIの文化的関連性を向上させるためにLatam-GPTを発表

Slackが自動化によってアクセシビリティテストを強化

Dropboxの非同期プラットフォームの進化：課題から統一メッセージングシステムモデルへ

PreziのPrometheusからVictoriaMetricsへの道のり

QCon London

InfoQ Dev Summit Boston

InfoQ Dev Summit Munich

QCon San Francisco

InfoQ Dev Summit New York

Login with:

アカウントをお持ちでない方

マイクロソフトがCoRAGを発表：反復的推論によるAI検索の強化

作者について

Robert Krzaczyński

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

関連記事

関連スポンサーコンテンツ

関連するコンテンツ

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。