微软2020国际残疾人日特别活动:AI让有声读物更生动

新浪数码讯 12月2日下午消息,微软在北京举办2020国际残疾人日特别活动,展示了微软AI语音技术的最新进展——神经网络语音智能。神经网络语音智能拥有多音色、多情绪的能力,并且可以通过创作平台快捷的进行制作。同时,活动现场也举行了红丹丹“心目图书馆”有声内容捐赠仪式。

活动中,微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士发表主题演讲。洪小文首先强调了微软“予力全球每一人、每一组织,成就不凡”的使命。2020年,科技领域对全球GDP的贡献约有5%,预计到2030年将达到10%,微软也将一直致力于用足够包容的技术成就每个人,为所有人带来产品和服务。而人工智能也将继续从地球计划、技术无障碍、人道主义行为计划、文化遗产保护技术以及健康医疗技术六个方面,让世界变得更好。

随后,微软全球技术院士、微软Azure AI首席技术官黄学东博士也通过视频进行了分享:在微软亚洲研究院的努力下,微软的AI语音技术被整合为兼具使用和推广价值的智能有声内容创作平台,让没有接触过AI技术的人也能参与到有声内容的创作中,带来更丰富的有声内容。

在活动现场也举办了红丹丹“心目图书馆”有声内容捐赠仪式。红丹丹“心目图书馆”由北京红丹丹文化交流中心(以下简称红丹丹)设立,旨在为盲人提供有声图书借阅服务。红丹丹创办人郑晓洁表示,红丹丹在许多盲校调研时发现,现有的盲人书籍、有声内容普遍老旧,满足不了盲人的阅读需求,传统人工录制的有声内容也有着耗时长、数量少等缺点,与微软的合作可以带给盲人丰富的选择,让书籍能陪伴盲人的一生。

生动、丰富的语音合成如何实现?微软云计算与人工智能事业部首席产品总监丁秉公带来了相关技术的讲解:微软在语音合方面拥有最智能的语音合成、最广泛的全球语音覆盖、灵活的云和端调用以及强大的语音定制能力四大优势,在此基础上微软推出了神经网络语音智能,将输入的文本进行神经网络声学学习,并且进行神经网络声学解码后输出自然的有声音频。

与传统的智能语音相比,神经网络语音智能拥有多音色、多情绪能力,让有声内容声音不再单一。举例而言,神经网络语音智可以模拟新闻播报、客服、聊天等多种场景的说话风格,并且可以加入开心、不屑、生气等情绪,并且可以实现情绪的分级,让情感更细腻。除了平台声音外,神经网络语音智能也可以提供声音定制服务,设计符合企业、组织或个人品牌策略的声音,并且根据场景进行情感优化,打造独一无二的人设,实现自然的人机交互。

在实际使用中,微软打造的智能有声内容创作平台,通过智能的全自动生成模式和定制化的自由创作模式两部分,让不了解AI技术的志愿者,也可以通过简单的操作进行有声内容的创作。

活动最后,微软组织了“AI语音+公益”、“AI语音+行业”两场圆桌对话,分享了更多微软AI语音技术与红丹丹公益活动背后的故事。

原创文章,作者:PC4f5X,如若转载,请注明出处:http://www.wawxq.com/408.html

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息