微软合作Project Gutenberg，利用AI语音技术创作5000本免费有声书

AI行业资讯 1年前 (2023) AI导航网

近期，美国IT巨头微软公司与古Project Gutenberg展开合作，利用人工智能技术为该计划的电子书库制作了超过5000本高质量的有声书。

首先，项目团队开发了一种算法，可自动分析电子书的结构，区分正文和非关键部分的页码、表格等。然后，他们运用了WaveNet、Tacotron和FastSpeech等先进的文本转语音技术，生成类似真人的自然朗读语音。此外，该团队还让系统能够辨别书中的叙述者、对话和不同角色，并相应调整语音，实现故事情节的语音表达。

据悉，这个项目已经收集整理了超过35000小时的有声书语音数据，涵盖了各类经典文学、戏剧、传记等作品。这些语音数据将以开源方式免费提供。用户甚至可以使用自己录制的少量语音，生成用自己的声音朗读整本书的效果。这一项目极大地丰富了有声书的内容，也为视障人士提供了便利。

Project Gutenberg是一个免费数字图书馆项目，用户可以在其网站免费阅读和下载超过7万本电子书。此次与微软合作制作有声书，将大幅增加免费有声书的数量，为公众提供了便捷的知识获取渠道。在这个项目中，团队结合了机器学习、自动文本选择和自然语音合成等多项AI技术，实现了电子书自动转化为语音的全流程。