OpenAI展示语音生成“武器库”：太强大以至于无法推广，生成声音的功能存在严重风险

访客 2024-03-30 11:00:33 38928 抢沙发

默认

摘要： 当地时间周五（3月29日），美国人工智能研究公司OpenAI在官网首次分享了名为Voice Engine（语音引擎）的预...

当地时间周五（3月29日），美国人工智能研究公司OpenAI在官网首次分享了名为Voice Engine（语音引擎）的预览。

据介绍，通过输入文本和15秒音频样本，Voice Engine便可以生成一个与音频中说话者非常相似的自然语音。新闻稿强调，生成的自然语音具有丰富的情感和逼真的声音。

OpenAI称，公司于2022年末首次开发了语音引擎，并使用它为文本到语音API以及ChatGPT语音和Read Aloud中的预设语音提供动力。与此同时，由于合成语音滥用的可能性，公司正在采取谨慎和知情的方式进行更广泛的发布。OpenAI希望负责任地部署合成声音以及社会如何适应这些新能力展开对话。基于这些对话和这些小规模测试的结果，OpenAI将对是否以及如何大规模部署这项技术做出更明智的决定。

新闻稿写道，儿童教育技术公司Age of Learning正在使用这个模型来生成一些预先编写好的内容，并且还结合GPT-4 创建实时的响应来与学生互动。

在案例中，OpenAI放出了一段英语男声和西班牙语女声的样本音频，并用两段音频各生成了讲解知识的语音。

除此以外，OpenAI还展示了生成较小语系和孤立语系声音的能力，以帮助落后地区的社区卫生工作者；同时还与神经科学研究所探索AI在临床环境中的应用，比如帮助语言障碍者等用途。

OpenAI写道，我们认识到，生成声音的功能存在严重风险，这一点在大选年尤为突出。我们正在与来自政府、媒体、娱乐、教育等领域的国际合作伙伴合作，以确保我们在建设过程中吸收他们的反馈。

OpenAI产品负责人Jeff Harris表示，如果你能正确地设置音频，基本上就能生成人类口径的声音，这是一种相当令人印象深刻的技术。但Harris提到，准确模仿人类语音的能力确实存在安全隐患。

今年1月，美国就出现AI拜登事件，由AI生成的假拜登在电话中用逼真的声音鼓励可能支持民主党的5000位选民在新罕布什尔州初选中不要投票。本月早些时候，拜登呼吁国会通过立法来监管AI，包括禁止AI语音模仿等。

CNN随后报道称，美国政府追查发现，71岁的男子沃尔特蒙克和其总部位于得克萨斯州的生命公司是幕后黑手。

当地时间3月7日晚，美国总统拜登发表备受瞩目的大选年国情咨文演讲，也是其任内第三场国情咨文。拜登呼吁国会紧急行动起来，通过立法来监管人工智能。拜登警告称，如果不加以控制，这项技术将给美国人带来风险。

去年10月底，美国总统拜登签署了一项关于人工智能的行政命令，推出白宫有关生成式人工智能的首套监管规定。根据行政命令，美国多个政府机构需制定标准，以防止使用人工智能设计生物或核武器等威胁，并寻求水印等内容验证的最佳方法，拟定先进的网络安全计划。具体而言，命令要求对人工智能产品进行测试，并将测试结果报告给联邦政府。它还提出吸引全球人工智能人才留在美国。

值得注意的是，近日，一款叫Suno AI的工具简直要一夜颠覆音乐圈。经它爆改的金曲，直接封神。人们纷纷惊呼：音乐人已死！有媒体的描述是这样的，这可能席卷全世界的可怕AI音乐。

在官网上，Suno AI的应用程序可以免费试用。

只要在框中输入提示，片刻之后，一段完全符合你要求的逼真、高保真的音乐片段就开始自动播放了。