中譯語通智能語音技術(shù)平臺擁有成熟的多語種語音識別和語音合成技術(shù),可面向真實(shí)語音交互場景,提供中、英、日、韓、德、葡等語種的語音交互解決方案。
語音作為最自然便捷的人機(jī)交互方式,是下一代人機(jī)交互的重要入口。中譯語通在語音領(lǐng)域積極布局,研發(fā)了國際領(lǐng)先的基于自適應(yīng)的上下文相關(guān)-深度神經(jīng)網(wǎng)絡(luò)-隱馬爾科夫模型語音識別技術(shù),同時(shí)將深層卷積神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用于聲學(xué)建模中,將其與基于長短時(shí)記憶單元(LSTM)和連接時(shí)序分類(CTC)的端對端語音識別技術(shù)相結(jié)合,降低識別錯(cuò)誤率,大幅度提升了語音識別的性能。
在大規(guī)模、深度整合高質(zhì)量語料的基礎(chǔ)上,應(yīng)用自主研發(fā)的深度學(xué)習(xí)技術(shù)框架,構(gòu)建了包含中、英、日、韓、德、葡等語種的語音識別引擎,每個(gè)語種的語料訓(xùn)練超過1萬小時(shí)。目前這些語音識別引擎已應(yīng)用于公司自主研發(fā)的字幕通、視頻會議同傳系統(tǒng)LanguageBox、悅譯翻譯機(jī)等多個(gè)語言科技產(chǎn)品中,在語音識別市場上奠定了良好的基礎(chǔ)。未來將不斷擴(kuò)充語種,為全球不同語種、不同場合的用戶提供語音識別解決方案。
方案咨詢:2030nlp@gtcom.com.cn