媒體聚焦 來源:中譯語通日期:2018-09-10瀏覽次數(shù):4256
1秒鐘能夠干什么?譯出半句話還是1.6萬字的復(fù)雜文章?
1分鐘能夠干什么?看個(gè)劇情梗概還是中英文字幕齊備?
機(jī)器翻譯能否代替人工翻譯?關(guān)于這個(gè)問題,尚無定論。
但隨著機(jī)器翻譯水平不斷提高,這一天似乎又近了一步。起碼企業(yè)級(jí)應(yīng)用方面,快速需求和大量數(shù)據(jù)的門檻,似乎已經(jīng)將人工譯員攔在門外。
盡管谷歌、微軟等互聯(lián)網(wǎng)巨頭紛紛入局機(jī)器翻譯服務(wù)領(lǐng)域,但是垂直級(jí)機(jī)器翻譯由于對數(shù)據(jù)和算法要求極高,遲遲沒有巨頭涉足。
為了填補(bǔ)了這一領(lǐng)域的空白,中譯語通憑借豐富的語料數(shù)據(jù)和不斷迭代的算法率先推出MerCube,要知道,這是真正意義上的全球第一個(gè)企業(yè)級(jí)機(jī)器翻譯硬件。
AI魔方一出,誰與爭鋒!
2018年7月31日,中譯語通旗下一個(gè)名喚MerCube的AI魔方橫空出世,作為一款企業(yè)級(jí)人工智能服務(wù)器,想要為未來發(fā)展賦能。
中譯語通成立于2013年,2014年6月發(fā)布了中英機(jī)器翻譯引擎,成為了繼谷歌、微軟、百度之后國內(nèi)最早自主研發(fā)機(jī)器翻譯引擎的企業(yè)。
而后2016年,隨著機(jī)器翻譯水平發(fā)展,準(zhǔn)確度和速度大幅提升,中譯語通的NMT中英機(jī)器翻譯引擎上線,是國內(nèi)最早對外提供NMT服務(wù)的企業(yè)。
中譯語通CEO于洋介紹:“機(jī)器翻譯領(lǐng)域里都是大塊頭的玩家,在這個(gè)道路上能堅(jiān)持下來實(shí)屬不易,目前中譯語通已經(jīng)做到以37個(gè)語種覆蓋233個(gè)國家和地區(qū)官方語言中的224個(gè),對官方語種的支持覆蓋世界總?cè)丝诔^90%?!?/p>
萬事俱備只欠東風(fēng),2017年5月,在市場驅(qū)動(dòng)下,中譯語通開始打造MerCube的雛形。
To C競爭激烈,To B則是新的突破。雖然機(jī)器翻譯技術(shù)不斷革新,但是服務(wù)方式卻像被時(shí)光遺忘,從未有更新的痕跡。
面對這種情況,中譯語通相關(guān)負(fù)責(zé)人表示:“機(jī)器翻譯水平不斷提高、企業(yè)本地化部署需求以及安全性和速度等市場剛需驅(qū)動(dòng)下,中譯語通決心打造MerCube,將前端服務(wù)與定制化硬件引擎串聯(lián)?!?/p>
據(jù)悉,由于用戶量增多、對于安全性和保密性提出新的要求,各種雜牌硬件、CPU的穩(wěn)定度和適配度已經(jīng)無法滿足企業(yè)需求,所以企業(yè)級(jí)人工智能服務(wù)器應(yīng)運(yùn)而生。
而且在信息安全越來越被重視的今天,MerCube提供專屬的私有化部署方式,信息在受控環(huán)境下運(yùn)轉(zhuǎn),原文本、譯文本地化存儲(chǔ),從根源上解決了數(shù)據(jù)安全問題。
從軟到硬,深度定制
人工智能企業(yè)四要素:數(shù)據(jù)、算法、場景和硬件,多年來中譯語通深耕數(shù)據(jù)、算法,從軟件到硬件,定制化打造MerCube。
據(jù)了解,MerCube搭載了NVIDIA有史以來極其先進(jìn)的數(shù)據(jù)中心級(jí)GPU Tesla V100,其可提供比 CPU 服務(wù)器高30倍的處理能力。MerCube采用了NVIDIA? NVLink?技術(shù),提供更高帶寬與更多鏈路,可提升多 GPU 和多 GPU/CPU 系統(tǒng)配置的可擴(kuò)展性。單個(gè) NVIDIA Tesla V100GPU 即可支持多達(dá)6條 NVLink 鏈路,總帶寬為 300 GB/秒,這是 PCIe 3 帶寬的 10 倍。
以機(jī)器翻譯和語音識(shí)別為例,MerCube MT G4單臺(tái)處理能力可達(dá)到8000字/秒,MT G8單臺(tái)處理能力可達(dá)到16000字/秒,MerCube ASR可實(shí)現(xiàn)將1小時(shí)的音視頻在1分鐘內(nèi)識(shí)別、解析完成并導(dǎo)出文件。
機(jī)器翻譯可以說是目前中譯語通產(chǎn)品的核心,并基于此研發(fā)了網(wǎng)頁翻譯插件、文檔翻譯系統(tǒng)、字幕通、視頻解析軟件等產(chǎn)品與MerCube MT硬件可無縫對接,在保證安全性的基礎(chǔ)上解決用戶的全方位需求。
以文檔翻譯為例,一篇45000+字符的醫(yī)療學(xué)術(shù)論文用中譯語通的文檔翻譯只需幾秒鐘,要注意這是在不排除網(wǎng)絡(luò)卡頓的前提下得出的數(shù)據(jù)。而且,文檔翻譯付費(fèi)版的價(jià)格也只是每千字一元;但如果選擇企業(yè)級(jí)的應(yīng)用服務(wù),那么只需要支付硬件和應(yīng)用的錢就一次性搞定了。
此外,MerCube MT還提供定制化服務(wù),會(huì)結(jié)合用戶數(shù)據(jù)及自身通用數(shù)據(jù),提供專屬的機(jī)器翻譯引擎。除機(jī)器翻譯、語音識(shí)別外,MerCube還可將圖像識(shí)別、視頻解析、NLP算法、知識(shí)圖譜等人工智能算法和引擎內(nèi)置其中,并與硬件完美融合。
換句話說,MerCube是AI技術(shù)的可視化載體,可將翻譯引擎、語音識(shí)別引擎、NLP處理引擎、音視頻處理引擎靈活匹配,構(gòu)建用戶獨(dú)有的AI智能硬件產(chǎn)品,為用戶提供定制化的AI服務(wù)。超快的翻譯速度,完全可輕松應(yīng)對企業(yè)海量信息翻譯需求,極大地節(jié)省企業(yè)人力、財(cái)力支出。
正如中譯語通CEO于洋介紹,MerCube實(shí)際上是一個(gè)All In one的解決方案,在滿足企業(yè)業(yè)務(wù)需求的同時(shí),可以解決服務(wù)效率、數(shù)據(jù)安全性、模型適應(yīng)性等問題,是真正能夠在企業(yè)里成熟商用的解決方案。
目前,MerCube在醫(yī)療、金融、科技、政務(wù)等不同領(lǐng)域均有所應(yīng)用,中譯語通對比百度、微軟、谷歌等行業(yè)巨頭,由于發(fā)展重心不同,背靠中國對外翻譯有限公司,數(shù)據(jù)量天然占優(yōu),似乎未來發(fā)展更有想象空間。
眾所周知,高水平高質(zhì)量的語料積累,是機(jī)器翻譯的重要基礎(chǔ)之一,登記在冊的超過50億句對的平行語料,100億單語語料,每年還在以2億句對平行語料,5億單語語料的速度在增加,就是中譯語通最大的優(yōu)勢。
此外,字幕通、視頻解析也是中譯語通主打的服務(wù),現(xiàn)場演示中,幾十分鐘的視頻可以在1分鐘內(nèi)自動(dòng)添加中英文字幕。
不過,于洋表示:“在一些特殊的小語種中,一個(gè)句對平行語料的成本超過1塊錢。如此雄厚的積累,是我們的任何競爭對手都不具備的?!?/p>
百億規(guī)模,有待開發(fā)
據(jù)中譯語通方面介紹,一整套的MerCube從引擎、硬件到軟件價(jià)格不菲,但相應(yīng)的,企業(yè)海量信息翻譯需求得到滿足,從而節(jié)省的企業(yè)人力、財(cái)力支出則達(dá)到了另一個(gè)量級(jí)。
有業(yè)內(nèi)人士預(yù)測,目前企業(yè)級(jí)人工服務(wù)器的規(guī)模已經(jīng)接近10億,除去金融、醫(yī)療、科技等領(lǐng)域,尚有百億級(jí)的市場有待挖掘。而且短短幾天,MerCube近千臺(tái)的訂單似乎已經(jīng)能夠證明,企業(yè)級(jí)服務(wù)器可以為未來發(fā)展賦能。
iPhone自誕生開始,便憑借劃時(shí)代的操作和系統(tǒng),開啟了智能手機(jī)的時(shí)代,而MerCube也扮演著和iPhone類似的角色,高性能GPU、定制化應(yīng)用、高效精準(zhǔn)服務(wù)...每一項(xiàng)都在吸引著客戶,引領(lǐng)著未來。
據(jù)了解,目前MerCube在業(yè)內(nèi)暫無競品,畢竟比起復(fù)制其他企業(yè)的成功浪費(fèi)內(nèi)存,誰都會(huì)更喜歡引領(lǐng)市場、徜徉藍(lán)海吧!
(內(nèi)容來源:品途網(wǎng))
(商業(yè)合作:business@gtcom.com.cn)