NTPU TTS Demo Page


可調語速之國語TTS  [Chen 2014a] 合成語音範例

Text: 台塑公司相中的六輕地點相當多,而每一處台塑都有優劣點的評估,工業局長楊世緘昨日並透露道,近日台塑將再提出觀音以外的其他地區的環保評估報告書,不過楊世緘強調不論台塑相中那裡,都必須先通過環保署的審查過程。
 

Synthesized Speech (傳統HTS方法) :

語速(0.15 秒/音節)   語速(0.17 秒/音節)   語速(0.19 秒/音節)   語速(0.21 秒/音節)

語速(0.23 秒/音節)   語速(0.25 秒/音節)  語速(0.28 秒/音節)  語速(0.30 秒/音節)

Synthesized Speech (本團隊提出方法) :

語速(0.15 秒/音節)    語速(0.17 秒/音節)    語速(0.19 秒/音節)    語速(0.21 秒/音節)

語速(0.23 秒/音節)    語速(0.25 秒/音節)    語速(0.28 秒/音節)    語速(0.30 秒/音節)


可調語速之台語TTS  [Chiang 2015a] 合成語音範例

Text: 原來春枝迷著歌仔戲。呣敢siau想看規齣,有通看一te te仔就teh癮囉。自按呢日昇配合伊,調整送貨時間、路線,撥工載伊去看戲尾仔。彼khui仔是日昇一世人上樂暢的時陣,送貨的khang khoe,做著嘛加偌thiau iat咧。一下chiap去,連顧戲口的查某gin仔看in來,一句赫晏ouh?就知愛放戲尾仔啦。春枝知影日昇愛食甜,不時偷me烏糖互伊,日昇上愛那看那chng,chng甲規嘴hoe sa sa。一擺戲齣做到娘子落難,沿途奔波討食,尾仔煞真正跪ti台仔頂teh即時台仔腳看戲的銀角仔四界tan去lih。

Synthesized Speech (本團隊提出方法) :

語速(0.15 秒/音節)    語速(0.17 秒/音節)    語速(0.19 秒/音節)    語速(0.21 秒/音節)

語速(0.23 秒/音節)   語速(0.25 秒/音節)   語速(0.28 秒/音節)   語速(0.30 秒/音節)


可調語速之客語TTS  [Chiang 2016] 合成語音範例

Text: 客家人在歷史項,輒常分人看做「人客」。從歷史個文獻資料來看,客家人經過幾下擺個大遷徙;見擺遷徙,就去到別人既經早就先到個所在;高不將先向山區安身,先定疊下來,正定定仔對外發展。台灣個客家人,大部分對廣東梅州、惠州,少部分對福建永定、詔安遷徙過來。

Synthesized Speech (本團隊提出方法) :

語速(0.15 秒/音節)    語速(0.17 秒/音節)    語速(0.19 秒/音節)    語速(0.21 秒/音節)

語速(0.23 秒/音節)   語速(0.25 秒/音節)   語速(0.28 秒/音節)   語速(0.30 秒/音節)


線上中文文字分析系統

NTPU Chinese Text Analysis Demo

 


References:

[Chen 2014a]  Sin-Horng Chen, Chiao-Hua Hsieh, Chen-Yu Chiang, Hsi-Chun Hsiao, Yih-Ru Wang, Yuan-Fu Liao and Hsiu-Min Yu, “Modeling of Speaking Rate Influences on Mandarin Speech Prosody and Its Application to Speaking Rate-controlled TTS,” , IEEE Trans. on Audio, Speech and Language Processing, vol.22, no. 7, pp.1158-1171, July. 2014.

[Chiang 2015a]       Chen-Yu Chiang, “A Study on Adaptation of Speaking Rate-Dependent Hierarchical Prosodic Model for Chinese Dialect TTS,” in Proc. OCOCOSDA 2015, Shanghai, China, Oct. 2015. (OCOCOSDA 2015 ITN Best Paper Award)

[Chiang 2016] Chen-Yu Chiang, Hsiu-Min Yu, Sin-Horng Chen, “On Cross-Dialect and -Speaker Adaptation of Speaking Rate-Dependent Hierarchical Prosodic Model for a Hakka Text-to-Speech System,” accepted by Speech Prosody 2016.