従来の LLM とは異なり、これらの SR モデルは応答を生成するのに余分な時間がかかり、多くの場合、この余分な時間が数学、物理学、科学を含むタスクのパフォーマンスを向上させます。そして、この最新のオープン モデルは、明らかに OpenAI に急速に追いついたとして注目を集めています。
たとえば、ディープシーク レポート R1 は、以下を含むいくつかのベンチマークとテストで OpenAI の o1 を上回りました。 AIME (数学的推論テスト)、 数学-500 (文章題集)、 SWEベンチ検証済み (プログラミング評価ツール)。いつも述べているように、AI ベンチマークは割り引いて考える必要があり、これらの結果はまだ個別に検証されていません。
テッククランチ レポート それは、DeepSeek、Alibaba、Moonshot AI の 3 つの中国の研究所です。 のように—現在、o1 の機能に一致するとされるモデルをリリースしており、DeepSeek は 11 月に R1 を最初にプレビューします。
しかし、新しい DeepSeek モデルには、次の環境で実行すると落とし穴があります。 クラウドホスト型バージョン—R1 はもともと中国人であるため、天安門広場や台湾の自治などの特定のトピックについては応答を生成しません。社会主義の中核的価値観を体現し、「中国のインターネット規制によると。このフィルタリングは追加のモデレーション層から来ており、モデルが中国国外でローカルに実行されている場合には問題になりません。
検閲の可能性があるにもかかわらず、ジョージ・メイソン大学のAI研究者ディーン・ボール氏はこう語る。 Xに書きました「DeepSeek の蒸留モデル (r1 の小型バージョン) の優れたパフォーマンスは、非常に有能な推論プログラムが今後も広く普及し、トップダウンの制御体制の目から遠く離れたローカル ハードウェア上で実行可能になることを意味します。」
ソース参照
#OpenAI #に匹敵する最先端の中国語推論モデル #しかもダウンロードは無料