Aug X最新推出了Augie平台,这是一个由人工智能驱动的视频创作平台,融合了语音克隆功能。该平台的主要功能是在无需预先准备录音室的情况下,将广告文案以用户自己或他人的声音进行阅读。
Aug X与ElevenLabs合作,让用户可以录制自己或他人的声音,并将其克隆用于其他短视频创作。Augie平台主要面向营销人员和社交媒体团队,为他们提供快速为视频添加旁白、照片、文字和音乐的功能,从而避免了学习音频和视频编辑所需的时间和精力。
Aug X创始人Jeremy Toeman表示,公司决定增加语音克隆功能是因为他们意识到有很多人不喜欢面对麦克风录制旁白。他说:“我们很惊讶地发现,许多用户在使用我们的语音克隆功能后对我们表示感激,因为他们不再需要亲自录制旁白。”
根据The Verge的演示,用户可以将文案写入或上传至Augie平台,然后选择预先录制的声音(用户需要录制一小段自己说任何话的声音片段)或从平台提供的库中选择一个声音。然后,该声音将按照视频所需的氛围(例如严肃、热情、恐怖等)来朗读文案。
用户还可以从Aug X授权的照片库中选择图片,Aug X与Getty合作获取了这些照片的授权,或者使用人工智能生成的图像来添加到视频中。Oeman表示:“我们已经事先考虑到了可能出错的地方,因此在克隆使用预先录制声音这一问题上非常谨慎。”
他进一步补充说,在Augie库中,录制的声音只能供个人账户使用。因此,同一个组织内的其他成员必须在他们自己的Augie账户上重新录制发言人的声音,才能进行克隆演讲。用户无法上传录音,平台只接受通过实时麦克风录制的声音。因此,将前任的声音放在扬声器上,再让一个奇怪但乐于助人的朋友假装打电话是不能在Augie上实现的。
此外,该公司还与语音克隆合作伙伴ElevenLabs合作,以区分由人工智能生成的声音和视频。