媒體聚焦 來源:鈦媒體日期:2017-12-28瀏覽次數(shù):4229
國際口語機器翻譯評測比賽(International Workshop on Spoken Language Translation,簡稱IWSLT)是國際上最具影響力的口語機器翻譯評測比賽,每年舉辦一次,至今已經(jīng)舉辦了14 屆。
在今年12月15號結(jié)束的2017 年IWSLT 大賽中,首次參賽的一家中國公司——中譯語通科技股份有限公司(以下簡稱中譯語通),取得了16 個語言方向平均分第一名的成績。而此前,科大訊飛曾經(jīng)在2014 年獲得中英和英中兩個語言方向第一。
賽后接受媒體采訪時,中譯語通CEO于洋說:“我們的技術(shù)能力是領(lǐng)先的、更是全面的。在跨語言及多語言翻譯層面,大賽比拼了在限定數(shù)據(jù)范圍內(nèi)英、德、意、荷、羅馬尼亞五個語種,共20 個語言方向互譯。同時還比較了在缺少德語與荷蘭語以及意大利語與羅馬尼亞語雙語平行語料的情況下翻譯引擎對該四個語言方向解碼的效果。在除去沒有平行雙語語料的其他16個語言方向中,我們?nèi)〉昧似骄值谝幻暮贸煽儯⑶疫@個成績甚至超過了使用全部20個語言方向的小數(shù)據(jù)集和更大數(shù)據(jù)集的所有參賽隊伍在該16 個語言方向的平均得分?!?/span>
2017 年IWSLT 大賽吸引了世界各地多所機器翻譯領(lǐng)域的知名大學(xué)及研究所參加,包括英國愛丁堡大學(xué)(University of Edinburgh)、意大利Bruno Kessler 基金會(FBK)、德國卡爾斯魯厄理工學(xué)院(KIT)、日本京都大學(xué)(Kyoto University)、德國萊茵-威斯特法倫理工大學(xué)(RWTH)、薩爾大學(xué)以及德國人工智能德國研究中心(UDSDFK)等。
本次比賽的訓(xùn)練集和評測集都是主辦方提供的,所有參賽團隊在相同的數(shù)據(jù)基礎(chǔ)上比拼技術(shù),同時技術(shù)難度較往年也有較大提升,打破了以往一個模型解析1 個語言對的規(guī)則,需要用一個模型解析5個語種,20個語言方向。
口語機器翻譯評測結(jié)果
公開資料顯示,中譯語通成立于2013 年,是全球領(lǐng)先的大數(shù)據(jù)和人工智能企業(yè)。以“語言連接世界,數(shù)據(jù)驅(qū)動未來”為目標,中譯語通自主研發(fā)了覆蓋機器翻譯、語音識別、圖像識別、語義搜索、知識圖譜、大數(shù)據(jù)分析、大數(shù)據(jù)可視化等領(lǐng)域的先進技術(shù),構(gòu)建起“譯云”語言科技生態(tài)與“譯見”大數(shù)據(jù)生態(tài)。
自2013年至2016 年三年間,中譯語通在機器翻譯和大數(shù)據(jù)研發(fā)方面投入很大,機器翻譯研發(fā)累計投入已經(jīng)超過2億元,在大數(shù)據(jù)分析方面每年投入研發(fā)資金超過1 億元。目前,中譯語通的神經(jīng)網(wǎng)絡(luò)機器翻譯已經(jīng)實現(xiàn)了37個語種的翻譯,約1332 個語言方向,建立了50 億+句對超大規(guī)模平行語料庫。其中中俄、中韓、中西、中葡等十余個語言的機器翻譯已經(jīng)達到世界領(lǐng)先水平,并且在該領(lǐng)域已經(jīng)實現(xiàn)規(guī)?;拇怪鳖I(lǐng)域機器翻譯的場景化應(yīng)用。