人工智能(AI)技术可能比带来版权启示录或让孩子在考试中作弊更有用。

人工智能技术可能比带来版权启示录或让孩子在考试中作弊更有用

PodSearch 使用 OpenAI 的 Whisper 语音转文本工具将播客剧集转换为可读、可搜索的文本。目前,只有少数节目可用,但是播客目录没有理由不能为所有播客执行此操作,理论上,您甚至可以在自己的计算机上运行一个应用程序来为您执行此操作。这是一件大事,不仅对播客听众和研究人员来说,而且对人工智能来说,作为一种通用工具而不是噱头。

“对于需要查看多个播客录音以收集有关某个主题的数据的研究人员来说,这种资源将是无价的。搜索和过滤播客成绩单的能力将使这个过程更加简化和高效,“人工智能音频和视频平台Synthesys的创始人兼首席执行官Oliver Goodwin通过电子邮件告诉Lifewire。

OpenAI的耳语

坦率地说,耳语是不可思议的。在OpenAI(Dall-E和ChatGPT背后的公司)的项目页面上,您可以查看一些示例。一个是旧的Micro Machines广告的片段,有一个低质量的录音,一个男人说话很快。我几乎听不清他在说什么,但成绩单看起来非常完美。

这种从混乱、嘈杂的上下文中提取单词的能力使其非常适合转录播客。PodSearch的开发者David Smith,Pedometer++的创造者和大热的Watchsmith,于2017年首次构建了PodSearch,但结果并不令人满意。现在,他已经更新了它,使用Whisper进行转录。

“在原始版本中,转录是用非常粗糙,缓慢,低准确性的系统完成的,这导致转录适合关键字搜索,但没有太多其他内容,”史密斯在他的博客上说。

他说,Whisper“产生的成绩单非常好,几乎和人类转录员一样好。当您在PodSearch网站上查看新旧之间的比较时,您会发现它们有多好。

播客成绩单的价值

播客有些难以理解。听过它们之后,它们大多是无用的。任何Google搜索都只有标题和标语,并显示一些更具前瞻性的播客创作者的笔记。这是一种耻辱,因为它们充满了各种信息。

想象一下,如果所有播客都有准确的转录,直到技术术语、奇怪的品牌名称等等。您将立即能够搜索大量信息。这对研究人员、记者或任何人来说都很棒。准确的语音转文本不仅适用于播客。任何时候你需要把口语准确地变成文本,OpenAI的Whisper可能是答案。

“人工智能技术还可用于更准确、更快速地识别和转录口语,为残疾人创造宝贵的资源。”

YouTube视频怎么样?他们有自动字幕,但它们通常很糟糕。虽然我们正在讨论它,但YouTube转录也是一种宝贵的搜索资源。您还可以将Whisper与其他AI应用程序结合使用。例如,与其使用棘手的听写软件,不如直接录制自己的自然说话,使用 Whisper 转录录音,然后使用 ChatGPT 之类的东西来清理和总结结果。

耳语不是您可以自己使用的应用程序。它现在是一个开发人员资源。但是如果你想尝试一下,开发人员Jordi Bruin已经使用它来创建Whisper Transcription,这是一款Mac应用程序,你猜对了,转录。

人工智能并不全是坏事

但并不是每个人都会永远使用OpenAI的Whisper。似乎无论发明什么技术,营销人员很快就会使用它更有效地向我们销售东西。

“这项技术可用于在播客上创建详细的分析,”古德温说。“此外,人工智能可用于检测实际对话中的模式和情绪,为企业和营销人员提供有价值的见解。

幸运的是,营销人员还没有太多机会接触到我们的演讲。在那之前,我们可以享受一个真正有用的人工智能工具,它将使很多事情变得更好、更容易。我们已经习惯了人工智能的一些负面影响——例如版权问题——但是当它也支持像Whisper这样的工具时,我们开始看到人工智能如何使我们受益,而不仅仅是让事情变得更糟。