高度なマルチモーダルAIアシスタントの誕生

Googleは最近、検索、Androidなど、さまざまな製品に統合されたAIプラットフォームであるGeminiに関する主要な詳細を明らかにしました。さらに、彼らはProject Astraと呼ばれるものをプレビューし、これはテキストや音声を介してリアルタイムにユーザーと対話するために設計された洗練された生成AIエンジンであり、カメラからの視覚データを解釈する能力も持ちます。このプラットフォームは、個人アシスタント技術の次の段階と見なされています。

Googleのデモは、Project Astraの能力を示すものであり、プラットフォームが処理できる印象的な対話レベルを紹介しました。

同様の軌道で、OpenAIはChatGPTの背後にある最新アップグレードであるGPT-4oを導入しました。Astraと同様に、GPT-4oはマルチモーダルで、テキスト、オーディオ、またはビデオを介してリアルタイムに対話する能力を持ち、かなりの柔軟性を示しています。OpenAIは、YouTubeの複数のビデオを公開しましたが、そのうちの1つでは、視覚障害を持つ人を支援するGPT-4oの記述能力と対話能力が壮観に示されました。

これらのAIシステムがどれほど人間らしい会話を模倣し、トーンの変化、ユーモア、自然な抑揚を含む完全な会話を行えるかは、AIエンティティとのつながりを持つ映画「Her」を連想させます。Geminiは、映画「Her」のプロットを思い起こさせることで、生活と技術の重なりを更に明示しました。

GoogleのCEOであるサンダー・ピチャイは、AIと無限の可能性を見据えています。彼はGoogle I/O 2024で、技術の潜在的な二重ユースについて語り、AIを使って愛する人の思い出を保存するか、ユーザーがAIエンティティとより深い関係を築くことができるようにすることなど、責任ある実装の必要性を強調しました。

これらのAIとの関係についての正当性は、近年のアキヒコ・コンドが初音ミクと結婚した事例など、歴史的な先例があります。

AIアシスタントの未来を見据える際、商業的な提供がまだ先の話ですが、OpenAIやGoogleのような企業がAIにどのような自由を与えるかは明確ではありません。さらなる企業が台頭し、会話型AI技術の旗を掲げる可能性は、興味深い未来への道を示唆しています。

Privacy policy
Contact