OpenAI推出革新声音克隆技术“Voice Engine”

快科技3月31日消息，据最新报道，OpenAI公司近日发布了一项名为“Voice Engine”的前沿声音克隆技术。

Voice Engine技术的独特之处在于，它仅需通过文本输入和15秒的语音样本，即可生成与原始说话者高度相似、情感充沛且极为自然的语音。

这项技术的研究始于2022年，并已成功融入公司的文本转语音API和Read Aloud功能中的预设语音部分。

OpenAI强调，Voice Engine技术在多个领域具有深远的影响。对于阅读辅助和语言翻译服务而言，该技术能够提供更贴近自然的语音输出，显著提升用户体验。

值得一提的是，该技术还为言语障碍患者带来了新的希望。在布朗大学的一个试点项目中，利用该技术从学校项目录制的音频中创建了语音克隆，极大地帮助了言语表达有困难的学生进行更流畅的交流。

不过，考虑到合成语音技术可能被滥用的风险，OpenAI目前仅对少数经过筛选的合作伙伴开放了小规模测试。此举旨在更深入地探索技术的应用潜力，并对潜在风险进行评估。

同时，OpenAI期望此举能引发社会对合成语音技术负责任应用的广泛讨论，共同探索适应这一新技术的方法。

为了保障技术的安全使用，OpenAI还实施了多项安全措施，包括利用水印技术追踪音频来源，并对系统使用情况进行实时监控。

在产品正式上市时，公司将推出“禁止语音列表”功能，以检测和阻止与知名人士声音过于相似的人工智能生成语音，从而规避可能的版权和隐私问题。

暂无评论

暂无评论...