精品人妻少妇嫩草AV无码专区,粉嫩XB粉嫩XB粉嫩XB

唐能翻譯君按語：

2013年底我和搭檔魏勇鵬創(chuàng)辦公司的時候，他說了兩件事：一是，谷歌機器翻譯幾乎不再聘請語言學專家了，由懂得統(tǒng)計、計算的計算機專家主理開發(fā)。二是，谷歌有世界上豐富的多語言語料數(shù)據(jù)，但對這種基于數(shù)據(jù)統(tǒng)計訓練而成的翻譯引擎來說現(xiàn)狀有點尷尬，更多語料能帶來效果不再明顯了，盡管谷歌的語料、用戶量和使用量都在日益增多。

在我們運營公司的兩年多時間里，遇到了很多客戶和投資人，他們問的一句話是：“你們機器翻譯能達到什么樣的準確度？”這個問題意味深長，我一般只能回答說：“在某些垂直領(lǐng)域，我們比谷歌翻譯要好?！边@句帶有挑釁意味的話讓聽者將信將疑卻無從反駁，因為Ta從未得到過無瑕的機器翻譯體驗——像科幻影視文學、類似《星際迷航》里展現(xiàn)的，那邊阿凡達星語說出來，這邊火星人聽進去，毫無停頓卡帶的痕跡。

行內(nèi)人用專業(yè)尺度評價機器翻譯的現(xiàn)實是這樣：美國商務(wù)部下屬的國家標準與技術(shù)研究所NIST舉辦的一項機器翻譯研究水平評測，采用BLEU(Bilingual Evaluation Understudy)標準。其原理是比較機譯結(jié)果和人譯結(jié)果的相似度，完全一致得分為1（當然不同的人的翻譯很難“完全一致”，所以得分1為理想值）。2008年NIST的英文-中文的機器翻譯評測結(jié)果，谷歌翻譯得分0.4142，微軟亞洲研究院提交的測評是0.4099，廈門大學得分0.2502；谷歌和微軟亞洲的中文-英文機翻得分分別是0.2999和0.2901，中科院自動化所的得分是0.2407。

2015年9月第十一屆全國機器翻譯研討會(CWMT 2015)上，中國超過10所科研所和大學參加了機器翻譯的評測。同樣以BLEU值為標準，英漢新聞平均得分接近0.35，漢英新聞則接近0.25，日漢新聞質(zhì)量很好——高分超過0.5；英漢科技則普遍超過0.35，高分0.43。國內(nèi)語種的機翻效果更好，藏漢政府文獻的很高分0.61，維漢新聞的很高分0.54。

囿于測試所選文檔和評測方法，該數(shù)值結(jié)果和普通人閱讀體驗有可能偏差很大。權(quán)當參考：機器翻譯中有40%左右的結(jié)果，用戶可以較為容易理解使用。和阿凡達電影場景的效果，和此時此刻用戶/投資人對人工智能產(chǎn)業(yè)的期待相比，還是弱爆了。不過，2013年谷歌翻譯每天的用戶量超過2億人、翻譯10億次，每天翻譯的文字相當于100萬冊圖書，超過全球?qū)I(yè)翻譯一年的工作量，他們用的就是BLEU值40%左右的機器翻譯。

“人工智能領(lǐng)域沒有取得任何進展，”英國理論物理學家戴維·多伊奇在其著作《無窮的開始》里說：“因為在其核心里有一個懸而未決的哲學問題：我們還不了解創(chuàng)造性如何運作。一旦解決了這個問題，編程實現(xiàn)人工智能將不是難事。圖靈發(fā)明了圖靈測試，希望繞開這個哲學問題。換句話說，他希望在解釋這項功能之前就實現(xiàn)這項功能。不幸的是，類似這樣的情形極為罕見?！保▓D靈測試由計算機科學和密碼學的先驅(qū)阿蘭·圖靈于1950年設(shè)計：如果電腦能在5分鐘內(nèi)回答由人類測試者提出的一系列問題，且其超過30%的回答讓測試者誤認為是人類所答，則電腦通過測試，它被認為具有智能。）

“現(xiàn)在我們談的比較多的是人機鏈接，就是把大腦和計算機相連，用機器擴展人類的思維能力。我覺得這一點利用目前的老式計算機是無法實現(xiàn)的，因為人腦在我看來更接近于量子計算機，我們?nèi)祟惻c電腦的區(qū)別在于，電腦你輸入什么，它輸出什么，先進的例外是它死機了。而輸入相同的信息，人類的輸出是不可預(yù)知的，這就是人類的自由意志。我認為人類的自由意志是以量子計算為基礎(chǔ)，是一種模糊的計算而不是邏輯計算。”中山大學天文與空間科學研究院院長李淼說。

按照中國人工智能泰斗、中科院院士張鈸教授的分析，人工制造的智能機器即使有了自主意識，也是機器的意識，比如“有一個機器人會做勺子，而且它像人一樣‘有意識’自主工作，這個機器人可能耗盡地球的資源來生產(chǎn)勺子，因而對人類產(chǎn)生威脅”。

雖然數(shù)據(jù)在增加，但是主要基于統(tǒng)計計算的人工智能不能滿足人的意志和情緒需求。至少在基于邏輯計算的機器翻譯領(lǐng)域，語料數(shù)據(jù)的增長與翻譯準確度不再成正比，讓機器理解人的努力嘗試卡在半山腰。

在用戶和投資人對人工智能有愛有期待的時候，這個夢醒得有點殘酷。不管所謂機器智能是否是真正的智能，在某些場景下，它已經(jīng)開始發(fā)揮價值。我的一個朋友、中科院自動化所的博士生黃國平講的話很有力量：“即使是現(xiàn)在的機器翻譯，用好了照樣震爆世界。”他的意思是：機器已經(jīng)做了40%、垂直領(lǐng)域的引擎能提供超過50%的有效結(jié)果，理論上很好的翻譯項目能提高50%的效率，機器的生產(chǎn)能力同樣令人乍舌。

可預(yù)見的時間里，機器翻譯一直都會不完美有遺憾。其實這也是一個好消息，它給人留了尊嚴和安全感，保留了翻譯職業(yè)，甚至為譯員提供了更多的商業(yè)需求和更多的工作崗位。

不人性的一面

我在翻譯生產(chǎn)中遇到了三個譯員（以下用化名），三個案例和機器翻譯的關(guān)系層次分野清晰。

23歲天秤座張林林姑娘，南京某大學英語系大四學生，參加譯后編輯（基于機器翻譯結(jié)果作人工優(yōu)化）培訓2個月，她的感受是“譯后編輯很大程度上提高了翻譯的效率，但是會對譯者的翻譯的風格和思維有一定影響和改變”，工作效率從初每小時完成2件任務(wù)提高到了3-4件，兼職月收入達到了3500元。

24歲水瓶座孫青青姑娘，河北某大學商務(wù)日語系畢業(yè)，對譯后編輯的感受是“比如有些句子比較難懂，句子結(jié)構(gòu)組織起來比較困難，機器譯文起到了好的提示作用”，培訓半年后轉(zhuǎn)為全職譯員，一小時穩(wěn)定完成4件，月收入超過1萬。

第三位是25歲的白羊座小伙子小韓，大連外語大學日語畢業(yè)生，他說“有的機器翻譯只需調(diào)整語序即可，跟純手動翻譯相比，極大地提高了翻譯效率和準確性”。他的效率是一小時完成5件，兼職做翻譯月收入9千元。

從受機翻結(jié)果影響，逐漸到以機翻結(jié)果為主做優(yōu)化，譯后編輯的譯員的工作方式和傳統(tǒng)人腦翻譯、詞典輔助的模式有很大區(qū)別。他們的工作流程發(fā)生了明顯變化，從90%的時間進行逐字逐句翻譯，轉(zhuǎn)變?yōu)槌^一半的時間來理解術(shù)語和機翻結(jié)果，真正動手“翻譯”句子段落的時間僅為過去的小一半。結(jié)果是“翻譯”時間越少的譯員，效率很高，收入也很高。

2015年第四季度，麥肯錫全球研究院發(fā)表報告《如何利用AI重新定義工作》，開篇的一句話就是“隨著體力工作和知識工作自動化的進步，許多工作至少在短期內(nèi)，會被重新定義而不是被消除”。我們在譯后編輯譯員身上看到的是機器翻譯并沒有改變翻譯職業(yè)，但是新的流程卻改變了譯員。譯員在工作中術(shù)語的選擇、詞句段落編排等過程在系統(tǒng)中都被記錄下來供機器學習，譯員是語言數(shù)據(jù)和系統(tǒng)的使用者，也是數(shù)據(jù)生產(chǎn)者。有效的狀況可以被描述為：譯員是機器翻譯的研發(fā)和生產(chǎn)的延伸，其思維和行為被技術(shù)化了。

好的一面，麥肯錫的報告說“到2025年將有50萬億美元的價值會被人工智能和機器人創(chuàng)造出來”，壞的一面則是有些譯員會覺得不適，不適應(yīng)的結(jié)果是拿不到好工資甚至新的翻譯工作不需要Ta，可能被批評為反人性。我自己倒是覺得不能說帶個大頭盔看VR的技術(shù)是人們喜聞樂見，而改變思維、工作習慣的譯后編輯是不人道的，就像上個世紀初把走路變成踩油門、把方向盤的開汽車一樣?！叭藱C鏈接”無法實現(xiàn)的時候，“人機結(jié)合”是人與機器之間有效的合作方式，也是一個更準確、讓大眾更安心的用詞。

與譯后編輯類似的場景，出現(xiàn)在醫(yī)療大數(shù)據(jù)的應(yīng)用里。醫(yī)生診斷時，能看到的是機器給出來類似的病例和對應(yīng)的診斷匯總，也許還給出狀況接近案例的診斷處方推薦。機器不會直接給人看病，醫(yī)生和譯后編輯譯員一樣選取Ta中意的參考再給出診斷。不過人們對此的擔心少很多，“醫(yī)生為自己的診斷書負責嘛，機器干不了這個事?！?

億級需求

新的互聯(lián)網(wǎng)翻譯還有一條路徑是屬于共享經(jīng)濟的社會化生產(chǎn)，國內(nèi)外的翻譯行業(yè)誕生了很多眾包翻譯服務(wù)平臺，但是效果堪堪，一直沒有實現(xiàn)期待中的結(jié)果。原因是眾包平臺為需求匹配到合適譯員的成本，高于網(wǎng)絡(luò)眾包生產(chǎn)的效率收益，生產(chǎn)過程和結(jié)果的非標準化帶來的工程管理成本更高了。

就在為眾包困局很困擾的時候，我與中國很大的非標服務(wù)眾包平臺豬八戒網(wǎng)的朋友有過幾次深入的交流，雙方達成的共識很特別：服務(wù)眾包的核心在于供應(yīng)端，而不是互聯(lián)網(wǎng)經(jīng)濟的主流思維“客戶一、需求至上”。豬八戒網(wǎng)的一個主要品類“建筑設(shè)計”，包括供應(yīng)商的招募、生產(chǎn)和質(zhì)量、客服等的運營管理交給了豬八戒與設(shè)計行業(yè)某上市公司的合資公司來打理。

翻譯也是一樣，個人、企業(yè)和機構(gòu)的需求時刻都存在，但是中國超過3萬家提供“翻譯”服務(wù)的公司，很大的年收入只有3億元，規(guī)模狹小甚至還不夠成為一個行業(yè)，而大部分的需求沒有被好好滿足，譯員該掙的錢掙不到。行業(yè)短板非常明顯：小規(guī)模、幾個兼職譯員的公司用師傅帶徒弟的作坊生產(chǎn)方式，能提供的服務(wù)能力有限，更談不上質(zhì)量、客服標準化。

由機器來統(tǒng)一基本勞作規(guī)范，完成部分翻譯量，組合大量譯員完成剩余優(yōu)化任務(wù)的模式，有望推進輾轉(zhuǎn)不前的眾包翻譯來完成行業(yè)的跳躍發(fā)展。發(fā)展動力的基礎(chǔ)是機器翻譯，其實更主動的是人(譯員)。譯員在理解和使用機器翻譯輔助軟件，改變翻譯習慣以更好使用機翻結(jié)果，不同學生的可塑性不一樣，導致工作效率和收入的差異。因此翻譯的人機結(jié)合催生了一個重要的學習培訓需求，其教學過程甚至是重新探索了譯后編輯這個職業(yè)的從業(yè)標準。

翻譯服務(wù)能否從小作坊升級到互聯(lián)網(wǎng)上的富士康? 我看不出不能的障礙在哪里。計算機技術(shù)工具&大數(shù)據(jù)學習，基于互聯(lián)網(wǎng)平臺管理、培訓和生產(chǎn)，以及中國少有的全語種外語教育體制和數(shù)量一的外語人才儲備，地利和人和都在了，下面看看市場需求的天時到?jīng)]？

全球化的深入不再是只有部分人出國觀光，從吃買玩，到投資學習工作，乃至生老病死都不會是局限在出生國家的事情。圣經(jīng)里上帝讓各族人說不同語言的設(shè)計制造了天成的剛需，多語言交流需求不是敢不敢想，而是能不能做的問題。它意味著產(chǎn)能巨大、穩(wěn)定和低成本的翻譯服務(wù)，滿足這一需求的新翻譯生產(chǎn)方式，一定是包含了機器翻譯軟件、基于互聯(lián)網(wǎng)的供需眾包和協(xié)作生產(chǎn)、以及譯員用以學習、分享的互聯(lián)網(wǎng)社區(qū)培訓平臺。

能不能讓淘寶、亞馬遜的商品全部被不同國家的顧客直接看懂，讓中國的股民了解所有紐交所、納斯達克股票交易的信息和后面的公司行業(yè)資訊，讓國內(nèi)外新發(fā)表的論文文獻同步多語言出版，讓美國很大的醫(yī)訊網(wǎng)站整站的優(yōu)質(zhì)內(nèi)容占領(lǐng)目前被莆田醫(yī)生籠罩的中文網(wǎng)絡(luò)？使用谷歌、有道免費翻譯工具自助閱讀的人越來越多，這顯然不會是互聯(lián)網(wǎng)社會大規(guī)模多語言交流的先進方式——如上面所說，缺點太明顯，對用戶的知識、技能挑戰(zhàn)過高，只是因為免費才可以容忍。

擁有行業(yè)和外語知識人士提供的專業(yè)翻譯服務(wù)的需求會更旺盛——只要價錢合適；更重要的是合格的翻譯能力才能對接有質(zhì)量要求的商業(yè)內(nèi)容，促成有利潤的商業(yè)項目。翻譯服務(wù)體量從每單幾百元、上千元，提升到每單幾千萬、上億元，成本則下降40%-80%。二十年的互聯(lián)網(wǎng)經(jīng)驗告訴我，一個互聯(lián)網(wǎng)項目億元的運營成本不可怕，投資人和運營人擔心的是每年數(shù)億元的投入能否帶來倍增的收益。翻譯僅僅是打破語言障礙的一步，進一步的知識管理和服務(wù)，是信息里蘊藏的更大金庫。

從這個邏輯來說，人機結(jié)合的翻譯花得起億級的錢，也掙得到10倍以上的收入和可觀的利潤，它在抄過來的路上。

本文轉(zhuǎn)自：英國《金融時報》中文網(wǎng)“商業(yè)”專欄，作者系商鵲網(wǎng)聯(lián)合創(chuàng)始人、首席執(zhí)行官鄒劍宇。本文僅代表作者觀點。