OpenAI已开始向部分ChatGPTPlus用户推出其高级语音模式。这项新功能旨在提供更自然的实时对话,允许用户随时打断对话,并允许系统感知和响应情绪。

ChatGPT高级语音模式开始向用户推出

ChatGPT高级语音模式

高级语音模式旨在通过提供更自然和实时的对话来增强用户互动。用户可以随时打断对话,使互动感觉更加流畅和动态。此外,该系统能够感知和响应用户的情绪,为互动增添一层情商。

兴趣点:

高级语音模式提供自然、实时的对话。

用户可以在对话过程中随时打断。

该系统可以感知并响应用户的情绪。

在接下来的几周内逐步向更多Plus用户推出。

预计秋季将向所有Plus用户全面开放。

视频和屏幕共享功能将稍后推出。

注重语音通话的质量和安全。

模型支持数百万个同时进行的语音对话。

低延迟和高质量的语音交互。

增强安全措施来检测和拒绝某些内容。

与配音演员合作创作的四种预设声音。

系统阻止冒充个人和公众人物。

新的过滤器可以阻止受版权保护的音频生成请求。

跨文本和语音模式应用的安全技术。

遵守适用法律以防止有害内容。

详细的安全报告将于八月初分享。

可用性和推出

OpenAI计划在未来几周内逐步扩大此功能的访问权限,目标是到秋季向所有ChatGPTPlus用户开放。参与alpha阶段的用户将在ChatGPT应用程序中收到通知,并收到有关如何使用新功能的说明的电子邮件。虽然视频和屏幕共享不是当前alpha版本的一部分,但这些功能预计将在稍后推出。

注重质量和安全

自2024年5月GPT-4o语音预览以来,OpenAI一直将确保语音对话的质量和安全放在首位。该模型得到了强化,可支持数百万次同时进行的实时语音对话,同时保持低延迟和高质量。

安全措施

2024年6月,OpenAI宣布将努力提高该模型检测和拒绝某些内容的能力。在过去的几个月里,该模型的语音功能已经过100多名外部红队成员的测试,他们总共讲45种不同的语言,代表29个不同的地区。根据他们的反馈和内部安全测试,已经实施了多项措施:

高级语音模式使用与配音演员合作创建的四种预设声音,以尊重用户的隐私。

ChatGPT无法模仿其他人的声音,包括公众人物的声音,并且会阻止与预设声音不同的输出。

已添加新的过滤器来识别和阻止生成音乐或其他受版权保护的音频的请求。

安全技术已应用于文本和语音模式,以确保遵守适用法律并防止产生有害内容。

未来的计划

OpenAI计划在8月初分享一份详细报告,介绍为使高级语音模式体验更安全、更令人愉悦而开展的工作。Alpha阶段专注于测试、学习和改进该功能,以提供最佳体验。通过逐步推出,OpenAI可以密切监控使用情况,并根据现实世界的反馈不断改进模型的功能和安全性。

对于那些对这项技术的更广泛影响感兴趣的人,其他值得探索的领域包括客户服务中的语音交互潜力、教育工具中语音功能的集成以及围绕人工智能和语音技术的道德考量。这些主题可以更深入地了解高级语音模式如何应用于各个行业以及随之而来的挑战。