OpenAI推出革新声音克隆技术“Voice Engine”
快科技3月31日消息,据最新报道,OpenAI公司近日发布了一项名为“Voice Engine”的前沿声音克隆技术。
Voice Engine技术的独特之处在于,它仅需通过文本输入和15秒的语音样本,即可生成与原始说话者高度相似、情感充沛且极为自然的语音。
这项技术的研究始于2022年,并已成功融入公司的文本转语音API和Read Aloud功能中的预设语音部分。
OpenAI强调,Voice Engine技术在多个领域具有深远的影响。对于阅读辅助和语言翻译服务而言,该技术能够提供更贴近自然的语音输出,显著提升用户体验。
值得一提的是,该技术还为言语障碍患者带来了新的希望。在布朗大学的一个试点项目中,利用该技术从学校项目录制的音频中创建了语音克隆,极大地帮助了言语表达有困难的学生进行更流畅的交流。
不过,考虑到合成语音技术可能被滥用的风险,OpenAI目前仅对少数经过筛选的合作伙伴开放了小规模测试。此举旨在更深入地探索技术的应用潜力,并对潜在风险进行评估。
同时,OpenAI期望此举能引发社会对合成语音技术负责任应用的广泛讨论,共同探索适应这一新技术的方法。
为了保障技术的安全使用,OpenAI还实施了多项安全措施,包括利用水印技术追踪音频来源,并对系统使用情况进行实时监控。
在产品正式上市时,公司将推出“禁止语音列表”功能,以检测和阻止与知名人士声音过于相似的人工智能生成语音,从而规避可能的版权和隐私问题。
暂无评论...