声咖推出首款有声小说AI配音制作平台,带来声临其境的阅读新体验

电科技袁创03-28 11:23

罗曼罗兰曾经说过:“和书籍生活在一起,永远不会叹气。”热爱读书也是传承在一代代中国人中的优秀传统,当下,国家也在不断开展推广全民阅读的工作。

近些年,随着网络和新媒体的迅猛发展,人们获取知识的途径得到了空前的拓宽,阅读方式也发生了很大的变化。根据第七届中国数字阅读大会发布的《2020年度中国数字阅读报告》,全国数字阅读规模用户已经突破了4.94亿,其中有声书人均阅读量达到6.3本,发展尤为迅速。

有声书有着传播速度快、阅读便捷、读者受众广泛等优点,但另一方面,制作成本和使用体验的平衡还比较难以把控,导致有声书优质内容产能不足,制约着行业的发展。

目前,有声书内容制作主要有人工录制和机器生成两种方式。真人朗读在艺术表现力上有着很大的优势,但制作成本十分高昂,在部分平台上已经高达每分钟30元,如果录制的作品篇幅较长,那么成本很可能高达数十万元。

而通过机器生成有声书内容能够让制作成本下降约90%,是一种生产效率和性价比都更高的方式。并且,随着语音合成等技术的不断成熟,机器生成的朗读声音已经十分接近人声表达的效果,因此已经广泛应用到了人文知识、科学技术等科普类型的有声读物生产中。

而针对文学性、表现力更强的小说类作品,机器生成语音的潜力还有待发掘。一方面,这类作品对生成语音的表现力要求更高,另一方面,小说类作品中往往有较多人物,需要将他们区分开来,而这也离不开先进的AI技术。

在此背景下,腾讯PCG AI交互部旗下的音视频创作平台——“声咖”就依靠深厚的AI技术积累,首发了针对有声小说配音的AI制作功能。该功能目前限时免费,一个人就能完成整本有声小说的制作,将文本录入后即可通过AI生成配音,让有声书制作的成本大大下降,效率也能大幅提升。

另外,这项功能也能让所有用户都能够根据自己的喜好,免费创作出富有代入感、沉浸感的有声书,从而满足更多元化的有声书需求。

声咖的使用方法非常简单,将txt、doc等常见格式的文本导入,选择相应的AI配音,即可进行有声朗读。无论选择哪种AI配音,如果不特别注意听的话,真的可能会以为这是真人朗读的效果。

1AI配音、声音风格、方言等都可以随时更换.png AI配音、声音风格、方言等都可以随时更换

当然,由于中文丰富的表达性,全靠AI生成的效果难免会有些瑕疵,例如在我们测试的这段文字中,“茅椽蓬牖”一词中最后两个字就出现了停顿,另外“待在下将此来历注明”中的“待”也被发成了一声。声咖针对这些问题进行了良好的优化,用户能够通过词组连读、多音字等功能,很方便地对音频进行调整。此外,插入停顿、局部变速、单词读法等功能,让效果变得更生动、更具细节。

2选中任意区域后,都可以对朗读效果进行微调.png 选中任意区域后,都可以对朗读效果进行微调

而针对角色较多的小说,声咖还有非常有特色的有声小说创作功能。上传小说文本后,系统会通过NER算法自动识别小说中的角色,再通过“正则表达式“自动分好章节。其识别速度也是非常快的,《基督山伯爵》这种百万字的长篇小说所花时间也就30秒以内,这之后用户就可以根据自己对角色的理解为其选择AI配音了。声咖采用了跨说话人的风格迁移技术,让同一个AI配音演员能够演绎出不同的情感乃至方言。

3每种AI配音员下都标明了适合的作品风格.png每种AI配音员下都标明了适合的作品风格

进入编辑界面后,左侧章节、右侧角色的布局一目了然。如果有一个角色有多个名字(例如本书中的唐太斯、艾德蒙和基督山伯爵),或是由于表述方式而造成的重复识别(例如下图中的腾格拉尔先生和腾格拉尔),那么用户也可以方便快捷地为其选择相同的AI配音。此外,如果出现部分无名角色所说出的台词,也可以手动添加角色或是选中单句专门添加配音。

4角色识别准确率非常高,所有出场角色基本都已覆盖.png角色识别准确率非常高,所有出场角色基本都已覆盖

就拿《红楼梦》中经典的“林黛玉进贾府”一段为例,我们为黛玉、贾母、王熙凤三位主要角色分别选择了温婉、成熟、亲切三种AI配音声线,而旁白则选择了较为浑厚的男声。这其中王熙凤又以思维敏捷,说话利落著称,因此我们就将她的部分台词做了加速处理。如此一来,本就表现力极强的文字,在声音的加持下更显得活灵活现,更让人印象深刻。

5每名角色的台词前都有显眼标记,方便对单句进行调整.png每名角色的台词前都有显眼标记,方便对单句进行调整

许多长篇小说,都有十几个甚至数十个角色,如果单靠人力手动选择匹配的声音,耗时又耗力。而声咖的有声小说功能能够快速分辨不同角色,并通过不同的配音加深用户对每名角色的印象,这也体现了AI技术的发展对于用户阅读体验和阅读效果的革新。

随着生活方式的变化,消费者的阅读方式和阅读场景也都呈现出了更为多元化的趋势,数字化阅读展现出了越来越强的潜力。这其中,就属更便捷、情感更丰富的有声书发展前景最为广阔。

以大数据、5G、AI为代表的新一代信息技术正在飞速发展,应用场景也在不断拓宽,从而推动着各行各业的转型、升级和融合。有声书行业想要发展,也必然离不开技术的赋能。声咖就是一个技术为行业赋能的优秀案例,通过AI技术的加入,让有声书的制作成本大大降低,也便于批量生产内容,有助于在短时间内快速提升有声书行业的经济效益,形成规模效应。

而对于内容创作者来说,无论是对名著的二次创作还是对自己作品的“有声化”,声咖都提供了一种革新的解决方案。这样产出的内容,不仅满足了时下大众对有声小说的需求,也更适合推广到老年人、青少年、视障人士等特殊群体之中,改善他们的阅读现状。

原新闻出版总署副署长李东东表示:“面对数字化发展新趋势,要大力推进数字化阅读发展,建立全民阅读数字资源平台,推进数字化阅读服务。”而腾讯PCG AI交互部的声咖就是一个“阅读+技术”的优秀应用案例,它让用户能够随时随地、随身随心地获得专业优质阅读内容。这对于全民阅读的推广,也必将起到十分积极的作用。

电科技(www.diankeji.com)是一家专注于全球TMT行业的领先资讯媒体。

作为今日头条青云计划、百家号百+计划获得者,2019百度数码年度作者、百家号科技领域最具人气作者、2019搜狗科技文化作者、2021百家号季度影响力创作者,曾荣获2013搜狐最佳行业媒体人、2015中国新媒体创业大赛北京赛季军、 2015年度光芒体验大奖、2015中国新媒体创业大赛总决赛季军、2018百度动态年度实力红人等诸多大奖。

投稿、商务合作请联络微信公众号

声明:本站原创文章文字版权归电科技所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表电科技立场,图文版权归原作者所有。如有侵权,请联系我们删除。

//59087780b049bbb54ef4ba547ea51910