Google、Gemini Live to Rival ChatGPT 音声モードを開始

20年以上の経験を持つ、経験豊かな仮想通貨投資家でありテクノロジー愛好家として、私はGoogleからの最新の発表であるGemini Liveが私の興味を大いに刺激したことを認めざるを得ません。 AI の初期からの進化を目の当たりにしてきた私は、数え切れないほどの約束と、ほとんど実現されないものを見てきました。しかし、Gemini Live の登場により、いよいよ AI の会話がより人間らしく自然に感じられる新時代に足を踏み入れたように思えます。

2024 Made by Google イベントで、Google は OpenAI の ChatGPT 向けアドバンスト音声モードに対する新たな競合相手、Gemini Live と呼ばれる新機能を発表しました。この革新的なサービスは、アップグレードされた Gemini サブスクリプション パッケージを持つユーザーが利用できるようになりました。

この機能は、AI との会話をより自然でスムーズなものにすることを目的としています。 Gemini Live を使用すると、ユーザーは実際の人と同じように、トピック間を移動したり、会話を中断したり、会話を継続したりできます。 

Google、Gemini Live to Rival ChatGPT 音声モードを開始

音声起動テクノロジーを頻繁に使用する私は、デバイスの最新アップデートにより日常生活が大幅に改善されたと自信を持って言えます。 10 種類のリアルな音声を提供する新しい音声エンジンにより、まるで本物の人間と話しているように感じられます。自分のスピーチをリアルタイムで模倣できる機能は特に印象的で、マルチタスクをこれまでより効率的に行うのに役立ちました。

Gemini 1.5 Pro および Gemini 1.5 Flash モデルの支援により、この機能は、高度なコンテキスト ウィンドウの機能拡張により、拡張された流暢なダイアログを可能にします。さらに、今年後半にはマルチモーダル入力に対応し、写真やビデオなどの視覚的な手がかりを介したインタラクションが可能になる予定です。

現時点では、Gemini Live は Android デバイスで英語のみでアクセスできますが、追加言語と iOS との互換性は開発中です。近い将来、Gemini をカレンダー、Keep、YouTube Music などの他の Google アプリと一緒に利用できるようになります。これにより、音声だけでタスクを管理できるようになります。

その一方で、ChatGPT 用の OpenAI の高度な音声モードは革新的ではありますが、いくつかの批判にさらされています。一部のユーザーは、AI への過度の依存につながり、現実世界の人間関係に影響を与える可能性を懸念しています。 

これに応えて、OpenAI は、AI モデルが強力であるだけでなく、日常のアプリケーションにとって安全で使いやすいものとなるよう、AI モデルを強化することに重点を置いています。

Gemini Live は、人工知能チャットに革命をもたらし、より本物で適応性のある会話体験を提供しているようです。リアルタイムの音声模倣機能とマルチタスクのサポートにより、OpenAI が提供するサービスと互角に渡り合える可能性があります。

2024-08-14 08:21