その結果、現在私たちが利用している AI 翻訳者は、テキスト内で膨大な数の言語をサポートしていますが、音声の翻訳となると状況は複雑になります。このトリックを段階的に実行するカスケード システムがあります。発話は、ディクテーション サービスの場合と同様に、まずテキストに変換されます。次に、テキストからテキストへの翻訳が行われ、最終的に、結果として得られるターゲット言語のテキストが音声に合成されます。これらの各段階でエラーが蓄積されるため、この方法で得られるパフォーマンスは通常低く、リアルタイムでは機能しません。 音声を直接翻訳できるシステムはいくつか存在しますが、ほとんどの場合、英語に翻訳するだけで、英語に翻訳することはできません。外国語の対話者は、Google の AudioPaLM などのツールでサポートされている言語のいずれかであなたに何かを言うことができ、彼らはそれを英語の音声に翻訳しますが、双方向で会話を行うことはできません。 そこで、Meta のインタビュー対象者が夢見ていたスタートレックのユニバーサル翻訳機を実現するために、Seamless チームはデータ不足の問題を解決することから始めました。そして彼らはそれを非常に創造的な方法で実現しました。 世界共通言語の構築 数学者であり機械翻訳の先駆者であるウォーレン・ウィーバー氏は、 主張した 1949 年には、人間のコミュニケーションの共通基盤として機能する、まだ発見されていない世界共通言語が存在するかもしれないと考えられました。私たちのすべてのコミュニケーションのこの共通基盤は、まさにシームレス チームが 70 年以上後にデータを探し求めたものでした。ウィーバーの普遍言語は数学、より正確には多次元ベクトルであることが判明しました。 […]
Category: Computer science
研究者は AI を使用してヘビ毒をブロックするタンパク質を設計します
これら 2 つの毒性はまったく異なるメカニズムで作用するため、研究者らは別々に取り組みました。 神経毒をブロックする 神経毒性のあるスリーフィンガータンパク質は、主要な神経伝達物質であるアセチルコリンの受容体に結合してブロックすることに特化した、より大きなタンパク質ファミリーのサブグループです。これらの受容体に結合する能力の鍵となるその三次元構造は、タンパク質内で互いに寄り添う 3 本のアミノ酸列に基づいています (十分に高度な生物学の授業を受けた人にとって、これらは逆平行です)ベータシート)。そこで、これらの毒素を妨害するために、研究者らはこれらの文字列をターゲットにしました。 彼らは、RFdiffusion と呼ばれる AI パッケージに依存していました (RF は、Rosetta Fold タンパク質折り畳みソフトウェアとの関係を示しています)。 RF 拡散は、特定の化学物質を補うタンパク質構造の設計に向けることができます。この場合、スリーフィンガー毒素の鎖の端に沿って並ぶ可能性のある新しい鎖が特定されました。それらが特定されると、ProteinMPNN と呼ばれる別の AI […]