Top
首页 > 正文

阿里达摩院发布新一代自研语音AI芯片技术 有望率先落地天猫精灵

据了解,Ouroboros芯片技术除了语音合成之外,还将支持AI语音识别。基于Ouroboros研发完整的语音AI芯片,有望率先在天猫精灵上落地。
发布时间:2019-08-22 09:35 来源:DoNews 作者:赵晋杰

在8月21日美国旧金山举行的芯片行业顶级学术会议HOTCHIPS上,阿里巴巴达摩院发布了新一代AI语音FPGA芯片技术——Ouroboros,该技术能将语音生成算法的计算效率提高百倍以上。这是业界首款专用于语音合成算法的AI FPGA芯片结构设计。

针对ASIC实现的性能仿真预估表明,Ouroboros的设计可以实时运行WaveNet等业界先进的文字转语音(TTS,Text-to-Speech)算法 ,实现实时语音合成。

算法很好但难以进行实时计算是语音芯片的行业难题。Ouroboros的突破在于它使用了端上定制硬件加速技术,替代云端服务器,有效避免了对网络连接和云端服务的强依赖性,解决了这一问题。以计算量最大的AI语音合成算法WaveNet为例,为了生成1秒的语音,CPU和GPU需要消耗50秒的计算时间,但Ouroboros在FPGA环境下只需要 0.3秒,大大提升计算效率,同时将整体服务成本降低 10 倍以上。

阿里用户在使用天猫精灵、高德导航、智能点餐机等服务时,将率先得到媲美真人语音交互的体验。


自研算法与自研AI芯片设计的结合,也意味着阿里在语音生成领域实现了真正的“软硬一体化”计算结构的落地。


据了解,Ouroboros芯片技术除了语音合成之外,还将支持AI语音识别。基于Ouroboros研发完整的语音AI芯片,有望率先在天猫精灵上落地。(完)

合作站点
stat
Baidu
map