顔のクローンを抱きしめ、24時間でOpenaiの深い研究

顔のクローンを抱きしめ、24時間でOpenaiの深い研究

火曜日、ハグするフェイスの研究者は、OpenaiのDeep Research機能の開始から24時間後に社内チームによって作成された「Open Deep Research」と呼ばれるオープンソースのAI研究エージェントをリリースしました。報告。このプロジェクトは、開発者がテクノロジーを自由に利用できるようにしながら、ディープリサーチのパフォーマンスに匹敵することを目指しています。

「現在、強力なLLMがオープンソースで自由に利用できるようになりましたが、Openaiは深い研究の根底にあるエージェントフレームワークについてあまり明らかにしませんでした」と、その発表ページに抱きしめる顔を書いています。 「それで、私たちは彼らの結果を再現し、途中で必要なフレームワークをオープンソースするという24時間のミッションに着手することにしました!」

OpenaiのDeep ResearchとGoogleがGemini(12月に最初に導入された – Openaiの前)を使用した独自の「Deep Research」の実装の両方に似ています。情報を収集したり、レポートを構築したりするなどのタスクは、最後にユーザーに提示されることです。

オープンソースクローンは、すでに同等のベンチマーク結果を獲得しています。わずか1日の作業の後、Faceのオープンディープリサーチを抱きしめて、一般的なAIアシスタント(GAIA)ベンチマークで55.15%の精度に達しました。これは、複数のソースから情報を収集して合成するAIモデルの能力をテストします。 OpenaiのDeep Researchは、単一パス応答で同じベンチマークで67.36%の精度を獲得しました(Openaiのスコアは、コンセンサスメカニズムを使用して64の応答を組み合わせた場合、72.57%になりました)。

抱きしめる顔がその投稿で指摘しているように、ガイアにはこのような複雑なマルチステップの質問が含まれています。

2008年の絵画「ウズベキスタンからの刺繍」に示された果物のどれが、1949年10月のオーシャンライナーの朝食メニューの一部として提供されました。アイテムをコンマ区切りリストとして渡し、12時の位置から始まる絵画での配置に基づいて時計回りに注文します。各果物の複数形を使用します。

そのタイプの質問に正しく答えるために、AIエージェントは複数の異なるソースを探し出し、それらを一貫した答えに組み立てる必要があります。ガイアの質問の多くは、人間であっても簡単な作業を表していないため、エージェントAIのメトルを非常によくテストしています。

ソース参照

#顔のクローンを抱きしめ24時間でOpenaiの深い研究

You might also like