您现在的位置是：亿华云 > IT科技

Facebook开源VoiceLoop，根据开放场景语音文字合成新语音

亿华云2025-10-03 11:47:25【IT科技】6人已围观

简介Facebook 研究员近日开源了他们在今年七月发表的一篇论文Voice Synthesis for in-the-Wild Speakers via a Phonological Loop）中的语音

Facebook 研究员近日开源了他们在今年七月发表的开源一篇论文（Voice Synthesis for in-the-Wild Speakers via a Phonological Loop）中的语音合成方法。

在论文中，据开景语他们提出了一种新的放场文字转语音的神经网络方法，可以将从开放场景下采样到的音文语音声音中提取的文字转化为语音。不同于其他的字合文字转语音系统，这种方法能够处理从公开演讲中提取出来的成新非约束性的云南idc服务商样本，而且网络架构比现存的开源解决同样问题的架构要简单。它基于新的据开景语移位缓冲内存储器区（shifting buffer working memory），这个缓冲区也可以用于评估注意力，放场计算输出音频，音文语音以及自身的字合更新。