语音合成

发布时间: 2020-09-03 17:01:34   核心技术   作者:猎维科技

导读: 项目背景语音合成是通过机械的、电子的方法产生人造语音的技术。在语音合成技术的发展过程中。满足泛阅读、订单播报、智能硬件等场景的语音播报需求。语音合成技术赋予阅读听书APP朗读听书能力。提供专为新闻资讯播报场景打造的特色音库。随时随地为用户播报新鲜资讯。通过语音合成进行订单播报。为智能硬件打造更自然、更亲切的人机交互体验。技术特色支持多语言多音色。可根据场景需求对发音人的语速、音调、音量进行灵活设置。

项目背景

语音合成是通过机械的、电子的方法产生人造语音的技术。TTS技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。

语音合成技术的研究已有两百多年的历史,但真正具有实用意义的近代语音合成技术是随着计算机技术和数字信号处理技术的发展而发展起来的,主要是让计算机能够产生高清晰度、高自然度的连续语音。在语音合成技术的发展过程中,早期的研究主要是采用参数合成方法,后来随着计算机技术的发展又出现了波形拼接的合成方法。

随着计算机技术的发展出现了波形拼接的合成方法

英国著名的物理学家史蒂芬·霍金就是依靠电脑语音合成器与世界交流。

我们基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式,满足泛阅读、订单播报、智能硬件等场景的语音播报需求。

应用场景

阅读听书:语音合成技术赋予阅读听书APP朗读听书能力,解放用户双手和双眼。多种特色音库让每一个故事都能找到合适的音色,为用户带来更极致的阅读体验。

语音合成技术赋予阅读听书APP朗读听书能力

资讯播报:提供专为新闻资讯播报场景打造的特色音库,让手机、音箱等设备化身专业主播,随时随地为用户播报新鲜资讯。

提供专为新闻资讯播报场景打造的特色音库

订单播报:应用于打车软件、餐饮叫号、排队软件等场景,通过语音合成进行订单播报,帮助用户第一时间即可便捷地获得通知信息。

通过语音合成进行订单播报

智能硬件:应用于儿童故事机、智能机器人、平板设备等智能硬件中,为智能硬件打造更自然、更亲切的人机交互体验。

更亲切的人机交互体验

技术特色

支持多语言多音色:支持中文、英文、中英文混读合成,提供基础音库和精品音库共14种音库供您选择,让您的产品拥有个性化的声音。

支持多音字标注:中文多音字可通过标注拼音、音调自行定义发音,例如“轻舟已过万重(chong2)山”、“脑筋急转(zhuan3)弯”。

语速音调可调节:支持多种参数配置,可根据场景需求对发音人的语速、音调、音量进行灵活设置,满足个性化需求。

集成方式灵活丰富:提供REST API接口、离线SDK、在线SDK,充分满足不同场景下的语音合成需求,提供流畅自然的合成体验。