OpenAI が ChatGPT の新しい高度な音声モードを公開

業界で 20 年以上の経験を持つ熟練のテクノロジー アナリストとして、私は AI が単なる概念から日常生活の重要な部分に進化するのを見てきました。 OpenAI による最新の開発、ChatGPT Johansson の高度な音声モードの展開は、疑いもなく印象的です。

OpenAI を利用した ChatGPT Johansson は現在、強化されたリアルな音声機能を一部の ChatGPT Plus メンバーに提供しています。これは、これらのユーザーが初めて驚くほど人間らしい応答を楽しむことができることを意味します。

一部の ChatGPT Plus 加入者向けに、「高度な音声インタラクション」と呼ばれる拡張された会話機能を段階的に利用できるようにしています。この新しいモードは、よりリアルで即時的なディスカッションを目指しており、いつでも意見を挟むことができ、感情をリアルタイムで理解して反応できるように設計されています。

— OpenAI (@OpenAI) 2024 年 7 月 30 日

5月のGPT-40発表会ではこの特性が初披露され、その先進的な機能が注目を集めた。それにもかかわらず、声がスカーレット・ヨハンソンによく似ていたため批判にさらされ、その類似性から倫理や法律に関する議論が巻き起こった。

OpenAIのイベントでは、スピーチモードの最新バージョンが前バージョンと比較して大幅な改善を示し、中断に動的に適応し、必要に応じてコースを調整する能力を実証した。 OpenAI のスタッフは、チャットボットをリアルタイムで対話させることでこの機能を紹介しました。

驚くべき事態の展開として、「スカイ」というあだ名が付けられたこの舞台上のキャラクターは、スカーレット・ヨハンソンが『Her』でAIを描いたものと驚くほど類似しているため、改良後も批判にさらされることになった。その結果、ヨハンソン氏は音声の発信元に関する追加の詳細を求めて OpenAI に連絡を取りました。

当初は 6 月下旬にベータ版を公開する予定でしたが、OpenAI がセキュリティ基準を満たし、特定の種類のデータをフィルタリングするモデルの機能を向上させる必要があるため、公開は 1 か月延期されました。

OpenAIの代表者タヤ・クリスチャンソン氏によると、音声モデルは、テクノロジーの潜在的な弱点を突くことを仕事とする「レッドチーム」と呼ばれることが多い100人以上の外部専門家による厳格なテストを受けたという。リリース延期の決定は、安全対策への注目の高まりに対するOpenAIの対応だった。

OpenAI は最新のアップデートで、音楽や著作権で保護されたサウンドの作成リクエストを禁止するフィルターを新しい音声設定に導入しました。スカーレット・ヨハンソンに似た声に関する懸念を受けて、OpenAI はこのモードを、プロの俳優が声を担当する事前に録音された 4 つの音声のみに限定しました。 OpenAIの代表者タヤ・クリスチャンソン氏は、ChatGPTが他人の声を模倣することはないと認めた。これらのプリセット音声から逸脱する生成された出力は、悪用を避けるために防止されます。

OpenAI は秋までに、すべての ChatGPT Plus 加入者に拡張音声機能へのアクセスを許可する予定です。このリリースの背後にある目的は、最高の安全性と倫理慣行をそのまま維持しながら、より魅力的で適応性のあるユーザー エクスペリエンスを提供することです。

2024-07-30 23:17