新たな展開：AIの可能性を広げる

ディープマインド（DeepMind）は、AI研究の名門として知られる研究所で最近、前例のない3Dゲーム環境で優れたAIエージェントを披露する画期的な研究を発表しました。この研究所はこれまでに囲碁やチェスなどの戦略ゲーム用のAIモデルや、ルールの指示なしで学習するゲームに焦点を当ててきましたが、今回の成果は、異なるゲーム環境を理解し、自然言語の指示に基づいてタスクを実行するAIエージェントの適任性を示しています。

ディープマインドは、Hello Games、Tuxedo Labs、Coffee Stainなどのゲームスタジオと協力し、9つのゲームの多様なセットで訓練を受けた「Scalable Instructable Multiworld Agent（SIMA）」を開発しました。これに加えて、ディープマインドの研究者たちは、エージェントがブロックを使用して彫刻を作成するように指示されるUnityベースの環境を含む4つの研究環境を利用しました。この総合的なアプローチにより、SIMAは3D仮想環境向けのAIエージェントとして、第一人称から第三人称までの広範な視覚スタイルと視点に触れました。

SIMAのポートフォリオ内の各ゲームは、それぞれ独自のスキルを持つユニークなインタラクティブな世界を展開しており、ナビゲーション、資源の採掘、宇宙船の操縦、アイテムの製作などを習得する必要があります。ディープマインドの研究者たちは、さまざまなビデオゲーム環境で指示に従いタスクを完了することが技能の獲得につながり、より適応性の高いAIエージェントの開発の道を切り開くと強調しています。

SIMAを訓練するために、研究者たちは人間のゲームプレイを観察し、行動を実行するために使用されるキーボードおよびマウスの入力を記録しました。このデータは後に「正確な画像言語マッピングと画面上の行動を予測するビデオモデル」を利用してSIMAを訓練するために使用されました。その結果、SIMAは多様な環境を理解し、特定の目標を達成するためのタスクを実行する能力を持つようになりました。

SIMAの特徴は、ゲームのソースコードやAPIにアクセスが必要ないことです；ゲームの商用バージョンで、画面上の視覚とユーザーの指示だけを使用して動作します。人間と同じ入力方法であるキーボードとマウスを使用することにより、ディープマインドはSIMAがほぼどんな仮想環境でも機能できると主張しています。

SIMAのパフォーマンスの評価は、ナビゲーション（「右に曲がる」）、オブジェクトの相互作用（「キノコを拾う」）、地図を開くかアイテムを作成するなどのメニューベースのタスクなど、数百の基本的なスキルに焦点を当てています。ディープマインドの究極の目標は、多段階の自然言語のプロンプトに基づく複雑なタスクを実行できるエージェントを可能にすることです。

SIMAは複数の訓練基準において有望な結果を示しており、9つすべてのゲームで訓練されたエージェントは、単一のゲームだけで訓練されたエージェントよりもはるかに優れていました。さらに、8つのゲームで訓練されたエージェントは、9番目のゲームだけで訓練されたエージェントとほぼ同等のパフォーマンスを発揮しました。これはSIMAが訓練を超えて広く適用できる能力を示しています。

しかし、SIMAが真の成功を収めるためには、言語入力が不可欠です。言語のトレーニングや指示がないテストでは、SIMAは特定の方向に従う代わりに資源の収集などの一般的な行動を優先する無目的な行動を示しました。これは、AIエージェントを適切に誘導するために言語理解が重要であることをより強調しています。

ディープマインドは、この研究がまだ初期段階にあることを認識しており、結果は有望ではありますが、SIMAのパフォーマンスと汎用性を向上させるためにさらなる開発が必要です。チームは、より複雑なタスクを実行できるようにエージェントを改善する将来のイテレーションを見据えています。最終的な目標は、様々なタスクを安全かつ効果的に実行できるAIシステムを開発し、オンラインおよび現実世界で個人を支援することです。

よくある質問：

Q: SIMAとは何ですか？
A: SIMAはScalable Instructable Multiworld Agent（スケーラブルインストラクタブルマルチワールドエージェント）の略称で、ディープマインドによって開発されたAIエージェントで、自然言語の指示に基づいて3Dゲーム内でさまざまなタスクを実行する能力を示しています。

Q: SIMAは異なるゲームでどのようにタスクを学ぶのですか？
A: ディープマインドは、SIMAを訓練するために人間のゲームプレイを観察し、対応するキーボードおよびマウスの入力を記録しました。このデータは、自然言語の指示に基づき画面上の行動を予測するためにSIMAを訓練する際に使用されました。

Q: SIMAはゲームのソースコードやAPIにアクセスする必要がありますか？
A: いいえ、SIMAはゲームのソースコードやAPIにアクセスする必要がありません。画面上の視覚とユーザーの指示のみを使用して、商用バージョンのゲームで動作します。

Q: この研究の究極の目標は何ですか？
A: この研究の究極の目標は、自然言語のプロンプトに基づいてタスクを優れた方法で実行することができるAIエージェントを開発し、最終的にオンラインおよび現実世界で個人を支援することです。

Q: 言語理解はSIMAのパフォーマンスにどのように影響しますか？
A: 言語理解はSIMAが効果的にタスクを実行するために不可欠です。言語のトレーニングや指示がないテストでは、SIMAが無目的な行動を示しました。これはSIMAの行動を誘導するために言語理解が重要であることを示しています。

Q: SIMAはどのような種類のゲームで訓練されましたか？
A: SIMAは異なるジャンルや視覚スタイルのゲームを含む9つの多様なゲームで訓練されました。

Q: SIMAはどのように新しいゲームに訓練を汎用化するのですか？
A: SIMAは、特に訓練されていないゲームでも優れたパフォーマンスを発揮することにより、その訓練を超えて汎用化する能力を示しています。これは、異なるゲーム環境での適応性と熟練性を示しています。

Q: SIMAがゲームで実行できるタスクの例は何ですか？
A: SIMAは様々なゲームでナビゲーション、資源の採掘、宇宙船の操縦、アイテムの製作などのタスクを実行できます。

Q: ディープマインドはSIMAを自然言語のプロンプトを理解させるためにどのように訓練しますか？
A: ディープマインドは、SIMAを自然言語の指示を理解させるために、人間のゲームプレイを観察し、対応するキーボードおよびマウスの入力を記録しました。これによりSIMAは自然言語の指示を理解するように訓練されました。

Q: SIMAは言語の入力がない場合のパフォーマンスの制限は何ですか？
A: 言語トレーニングや指示がない場合、SIMAは無目的な行動を示し、特定の方向に従う代わりに資源の収集などの一般的な行動を優先しました。これはSIMAの行動を誘導するために言語理解がどれほど重要かを示しています。

詳細については、公式ディープマインドウェブサイトをご覧ください： deepmind.com

[埋め込み]https://www.youtube.com/embed/Kj3bvLrePaI[/埋込み]

The source of the article is from the blog myshopsguide.com