従来の LLM とは異なり、これらの SR モデルは応答を生成するのに余分な時間がかかり、多くの場合、この余分な時間が数学、物理学、科学を含むタスクのパフォーマンスを向上させます。そして、この最新のオープン モデルは、明らかに OpenAI に急速に追いついたとして注目を集めています。 たとえば、ディープシーク レポート R1 は、以下を含むいくつかのベンチマークとテストで OpenAI の o1 を上回りました。 AIME (数学的推論テスト)、 数学-500 (文章題集)、 […]