中科大訊飛Interphonic5.0語音合成系統(tǒng)是科大訊飛打造的一款中英文混讀語音合成系統(tǒng),這款軟件可以幫助對(duì)中英混合的文章進(jìn)行閱讀,軟件提供中英文混合文本連續(xù)語音合成服務(wù),提供調(diào)用語音合成服務(wù)的開發(fā)接口,以及與語音合成相關(guān)的其他特性。
軟件特色:
·獨(dú)創(chuàng)的智能化文本預(yù)處理技術(shù)
·獨(dú)創(chuàng)的語料信息統(tǒng)計(jì)模型;
·前后端一致性的語料庫設(shè)計(jì)方法、和語料庫的自動(dòng)構(gòu)建方法;
·聽感量化思想指導(dǎo)下,以變長(zhǎng)韻律模板為基礎(chǔ)的高精度韻律模型;
·高魯棒性的智能化文本分析處理技術(shù);
·基于聽感損失最小的語料庫裁減技術(shù) ;
·特定語種知識(shí)和系統(tǒng)建模方法分離的多語種語音合成系統(tǒng)框架;
·面向特定領(lǐng)域應(yīng)用的定制語音合成技術(shù)。
功能介紹:
1. 高質(zhì)量語音——將輸入文本實(shí)時(shí)轉(zhuǎn)換為流暢、清晰、自然和具有表現(xiàn)力的語音數(shù)據(jù);
2. 多語種服務(wù)——整合了多語種語音合成引擎,可提供中文、中英文混讀、英文、廣東話的語音合成服務(wù);
3. 高精度文本分析技術(shù)——保證了對(duì)文本中未登錄詞(如地名)、多音字、特殊符號(hào)(如標(biāo)點(diǎn)、數(shù)字)、韻律短語等智能分析和處理;
4. 多字符集支持——支持輸入GB2312、GBK、Big5、Unicode和UTF-8等多種字符集,普通文本和帶有CSSML標(biāo)注等多種格式的文本信息;
5. 多種數(shù)據(jù)輸出格式——支持輸出多種采用率的線性Wav,A/U率Wav和Vox等格式的語音數(shù)據(jù);
6. 靈活的接口——提供了標(biāo)準(zhǔn)接口、簡(jiǎn)單接口、COM接口、SAPI接口,便于在多種環(huán)境下進(jìn)行系統(tǒng)的集成;
7. 語音調(diào)整功能——開發(fā)接口提供了音量、語速、音高等多種合成參數(shù)的動(dòng)態(tài)調(diào)整功能;
8. 配置和管理工具——合成引擎提供了統(tǒng)一進(jìn)行配置和管理的工具,完成了全局參數(shù)配置、用戶詞典、用戶規(guī)則、定制資源包管理等功能;
9. 效果優(yōu)化——合成引擎提供了以定制資源包和CSSML為代表的多種針對(duì)實(shí)際應(yīng)用環(huán)境進(jìn)行合成效果優(yōu)化的方法;
10.一致的訪問方式——能以Client/Server方式訪問遠(yuǎn)程的語音合成服務(wù),并且提供與本地調(diào)用相同的開發(fā)接口,實(shí)現(xiàn)了完全透明的訪問;
11.動(dòng)態(tài)負(fù)載均衡——提供了動(dòng)態(tài)負(fù)載均衡模塊,以對(duì)用戶透明的方式動(dòng)態(tài)調(diào)配多臺(tái)語音合成服務(wù)器的資源;
12.背景音和預(yù)錄音——合成系統(tǒng)還提供了背景音和預(yù)錄音的功能 ,滿足用戶不同場(chǎng)合的應(yīng)用和個(gè)性化需求。