如何使用AudioBoxMeta的新文本转声音AI工具

2023-12-15 09:25:48科技专一的悟空

Meta本月推出了一款新的AI声音生成器，名为AudioBox，旨在改变我们与声音互动的方式。这一创新工具允许用户将文本转换为语音、创作音乐、并使用简单的文本提示轻松创建音效。AudioBox的推出标志着在让广大用户更容易创建自定义音频内容方面向前迈出了重要一步。

Meta的Audiobox文本到声音音频创建系统是Voicebox的继任者。通过统一语音、音效(短而离散的声音，如狗吠、汽车喇叭、雷声等)和音景的生成和编辑功能，进一步推进音频生成人工智能，并提供多种输入机制最大限度地提高每个用例的可控性。

AudioBox具有多种功能，可满足各种音频生成需求。例如，其文本转语音功能使用户能够将书面文本转换为真实的语音，并提供一系列语音选项可供选择。对音乐感兴趣的人可以使用AudioBox制作音乐曲目，而无需掌握传统乐器或复杂的软件。此外，该工具还能够生成定制的音效，这对于游戏、电影和其他多媒体项目特别有用。用户可以使用直观的文本或音频提示根据自己的特定需求自定义音频输出。

文本转声音AI音频生成

Meta设计的Audiobox使人们能够使用自然语言提示来创建声音，以描述他们想要创建的声音或语音类型。例如，如果您想创建新的声音，只需在AI模型中输入文本提示，例如“流淌的河流和鸟儿鸣叫”。观看下面的视频，了解其当前功能的概述和演示。

此外，AudioBox不仅仅是一个基本的声音发生器;它包含突破人工智能生成音频界限的高级功能。其中一项功能是语音克隆，它允许复制样本中的任何语音，从而提供个性化的音频创建体验。该工具还可以重新设计现有音频以适应不同的上下文，并编辑或替换音频片段与人工智能生成的内容无缝连接，这一过程称为音频修复。

“Audiobox展示了语音和声音效果生成方面最先进的可控性。我们自己的测试表明，它在主观评估中的质量和相关性(对文本描述的忠实度)方面显着超越了之前的最佳模型(AudioLDM2、VoiceLDM和TANGO)。在各种语音风格上，Audiobox的风格相似度比Voicebox高出30%以上。”

供货情况和定价

Meta目前正在将Audiobox提供给精心挑选的一组在语音研究方面拥有良好记录的研究人员和学术机构，以帮助进一步发展该研究领域的最新技术。公司致力于确保AudioBox的使用符合道德和负责任。该公司已实施保障措施，以防止潜在的滥用并确保人工智能遵守道德准则。支持AudioBox安全应用研究的拨款申请进一步证明了这种对道德使用的承诺。

AudioBox的另一个令人兴奋的功能是AudioBoxMaker，它允许用户通过分层声音和音乐来构建复杂的音频场景。这使得能够创建复杂且身临其境的音景，从而增强任何音频体验。Meta的Audiobox交互式演示和研究论文现已可供您测试提出新的音频生成基础研究模型。

AudioBox有望对音频制作行业产生重大影响。其全面的功能和对道德使用的奉献意味着内容创作者、音乐家和开发者可以期待一个新的可能性领域。当我们等待AudioBox的进一步更新时，包括其潜在的开源版本以及正在进行的安全和责任研究的结果，很明显，该工具已准备就绪成为音频制作领域不可或缺的资产。