微软推出声音克隆技术“Personal Voice”,只需1分钟样本即可生成AI语音

微软发布新技术:Personal Voice,可克隆用户声音并生成AI语音

近日,微软发布了一项名为Personal Voice 的新技术。该技术可以克隆用户的声音,并且能够复制出与原声音完全一致的人工智能语音。用户只需提供1分钟的语音样本,Personal Voice 就能在几秒钟内生成相应的 AI 语音。

这项技术支持多达100种不同语言的语音输出,包括中文、西班牙语、德语等。Personal Voice 利用设备端的机器学习技术,确保用户的个人信息安全,并与 LiveSpeech 进行无缝集成,让用户在与他人交流时可以使用 Personal Voice 的 AI 语音。
微软推出声音克隆技术“Personal Voice”,只需1分钟样本即可生成AI语音
除了为语音助手、游戏、语言配音等应用提供个性化声音,Personal Voice 还在娱乐、媒体领域有着广泛的应用。通过将用户的本声配音应用于故事、有声书、播客、视频等内容,可以使这些内容更加贴近用户,提升沉浸感。

微软还与海尔合作,将个性化声音引入其智能音箱和更智能的家电产品中,为品牌带来了创新的用户体验。微软的 Personal Voice 功能为用户提供了在短时间内实时复制自己声音的机会,使智能音箱更具家庭氛围,丰富了用户的生活。

该功能将在西欧、美国东部和东南亚地区率先上线,并于12月1日上线公共预览版。

微软强调了 Personal Voice 的责任使用。用户必须明确同意并录制声明,以确保对个人和社会权益的保护。微软承诺以有限的注册方式提供 Personal Voice,仅限于特定用途。符合资格的客户可以将 Personal Voice API 集成到支持个性化声音的应用中,包括智能设备的语音助手和游戏中角色声音的定制。

此外,微软还在 Personal Voice 生成的声音中添加水印,以便用户可以识别是否使用了 Azure AI Speech,并确定使用的是哪个声音。这为合规性和透明性提供了一层保障。

暂无评论

暂无评论...