新しいAIトレーニング方法がロボティクスを革新するかもしれません

人工知能モデルは絶えず進化しており、Google DeepMindの最新のブレークスルーは、現実世界で運用される一般的な知的AIを実現する可能性があります。これまでは、チェスや囲碁などのゲームでのAIの熟達が確立されてきましたが、これらのゲームには勝つ方法や負ける方法が明確に定義されており、それに基づいてAIシステムを訓練することは比較的容易でした。

しかし、Minecraftのようなオープンワールドゲームは、AIシステムにとってはより大きな挑戦を提供しています。これらのゲームは多くの選択肢と抽象的な目標を提供し、現実のシナリオにより近い状況を模倣しています。したがって、これらのゲームを習得することは、ロボットの制御や人工知能を用いた実世界のタスク遂行などにおいて重要なマイルストーンと考えられています。

Google DeepMindは、Scalable Instructable Multiworld Agent(SIMA)と呼ばれるAIモデルを導入しました。SIMAは、これまで出会ったことのない9つの異なるビデオゲームや仮想環境でプレイすることができます。SIMAは、ゲームからのビデオフィードの解析のみによってこの偉業を達成します。宇宙探検から問題解決の挑戦まで、SIMAはさまざまなゲームで約600の短いタスクを実行することができます。

この高いパフォーマンスを実現するために、DeepMindの研究者たちは、既存のビデオや画像認識モデルを利用して、ゲームのビデオデータを解釈しました。その後、SIMAにビデオ入力を基に特定のタスクをマッピングするようにトレーニングを施しました。このために、2人1組でビデオゲームをプレイし、1人が画面を見ながらもう1人に移動を指示しました。さらに、参加者は自身のゲームプレイを見直し、取ったマウスやキーボードのアクションを説明しました。人間の動きがどのようにタスクと関連しているかを学ぶことで、SIMAはこれらのアクションを正確に模倣して実行することができました。

SIMAはこれまでに接触していなかった第9のゲームをプレイする能力を示しましたが、人間レベルのパフォーマンスには及びませんでした。このギャップを解消するため、研究者たちは、SIMAを8つのゲームで訓練し、その後9番目のゲームでテストするトレーニング方法を実装しました。このプロセスは、SIMAが未知のゲームに適応できることを確認するために繰り返されました。

専門家たちは、異なるゲームにわたるスキルを一般化する能力は、一般的なAIエージェントを開発するための重要な段階であると認識しています。ただし、SIMAの現在の制限は、長期的な計画を必要としない比較的狭い範囲の短期タスクに限定されている点です。より広範囲かつ複雑なタスクに能力を拡張することは、より困難な課題であるでしょう。

DeepMindのような企業にとって、この研究は単にゲームに焦点を当てているわけではありません。3D環境をナビゲートすることは手段であり、これらの企業は周囲の世界を感知し、相互作用することができるAIシステムを開発することを目指しています。ビデオゲームへの影響は最小限かもしれませんが、ゲームの範囲を超えた私たちの生活への影響は未知のままです。

よくある質問

Q: SIMAとは何ですか?
A: SIMA(Scalable Instructable Multiworld Agent)は、Google DeepMindが開発した人工知能モデルです。このモデルは、ゲームからのビデオフィードのみを解析して、さまざまなビデオゲームと仮想環境で遊ぶことができます。

Q: SIMAはどのようにトレーニングされましたか?
A: SIMAを訓練するために、DeepMindの研究者は既存のビデオおよび画像認識モデルを利用しました。さらに、2人1組でビデオゲームをプレイし、1人がもう一方に移動やアクションを指示しました。これらのデータとゲームプレイの自己反省が、SIMAが人間の動きと特定のタスクの関係を理解するのに役立ちました。

Q: SIMAの制限は何ですか?
A: SIMAは未知のビデオゲームに適応する能力を示していますが、現時点では人間のレベルには及んでいません。また、そのスキルセットは、主に長期的な計画を必要としない短期タスクに限定されています。

Q: この研究の究極の目標は何ですか?
A: DeepMindの研究目標は、現実の世界で物事を感知し、相互作用することができるAIシステムを開発することです。ゲームはテストの場として使用されていますが、焦点はロボティクスを革新し、実世界でタスクを遂行できるAIエージェントを作成することにあります。

The source of the article is from the blog foodnext.nl

Privacy policy
Contact