唐能翻譯牛:
術(shù)語(yǔ)提取和管理是翻譯工作中非常重要的一個(gè)環(huán)節(jié), 如何正確地提取術(shù)語(yǔ), 我們看看Tmxmall的一者君是如何說(shuō)的。
一者君在前幾期教程中介紹了如何利用MultiTerm新建術(shù)語(yǔ)庫(kù),添加、批量導(dǎo)入與導(dǎo)出術(shù)語(yǔ),那么如何在現(xiàn)有文檔中如何提取出術(shù)語(yǔ)呢?這就需要用到MultiTerm中的一款配套工具——SDL MultiTerm Extract。利用該款軟件,我們可以從翻譯文檔或翻譯記憶庫(kù)中根據(jù)自身的需要提取出術(shù)語(yǔ),構(gòu)建自己的術(shù)語(yǔ)表。下面我們以國(guó)務(wù)院2017年政府工作報(bào)告雙語(yǔ)翻譯記憶庫(kù)為例,為大家展示雙語(yǔ)的術(shù)語(yǔ)提取。
step
1
打開(kāi)SDL Multiterm Extract后,點(diǎn)擊File→New Project來(lái)新建項(xiàng)目,并選擇所要?jiǎng)?chuàng)建的項(xiàng)目類(lèi)型,為項(xiàng)目命名并選擇存放路徑,項(xiàng)目默認(rèn)存儲(chǔ)在SDL Multiterm Extract文件夾里的Extract Projects中。
單語(yǔ)術(shù)語(yǔ)提取項(xiàng)目:提取一個(gè)或多個(gè)單語(yǔ)文檔中的術(shù)語(yǔ)
雙語(yǔ)術(shù)語(yǔ)提取項(xiàng)目:從雙語(yǔ)文檔中提取出雙語(yǔ)對(duì)照的術(shù)語(yǔ)
翻譯項(xiàng)目:用來(lái)翻譯現(xiàn)有術(shù)語(yǔ)庫(kù)中的術(shù)語(yǔ),所以創(chuàng)建這個(gè)項(xiàng)目時(shí)本身要有術(shù)語(yǔ)庫(kù)
QA項(xiàng)目:這個(gè)項(xiàng)目可以幫助你檢測(cè)文檔或術(shù)語(yǔ)庫(kù)中術(shù)語(yǔ)的使用情況,評(píng)估和改進(jìn)這些術(shù)語(yǔ)翻譯的質(zhì)量。
詞典編譯項(xiàng)目:從雙語(yǔ)平行文本中提取出詞典。
我們?nèi)粘3J褂玫膭t是前兩種項(xiàng)目類(lèi)型;
step
2
點(diǎn)擊下一步,可以選擇術(shù)語(yǔ)庫(kù)。創(chuàng)建翻譯項(xiàng)目和QA項(xiàng)目時(shí)必須有術(shù)語(yǔ)庫(kù),而提取單語(yǔ)術(shù)語(yǔ)和雙語(yǔ)術(shù)語(yǔ)則無(wú)需選擇術(shù)語(yǔ)庫(kù),只需選擇源語(yǔ)言和目標(biāo)語(yǔ)言即可;
step
3
點(diǎn)擊下一步,點(diǎn)擊Browse添加待提取術(shù)語(yǔ)的文件;
step
4
點(diǎn)擊下一步,進(jìn)入排除術(shù)語(yǔ)的向?qū)Ы缑妗N覀兛梢赃x擇“Exclude termbase”,排除某個(gè)已有術(shù)語(yǔ)庫(kù)中的術(shù)語(yǔ),也可以選擇“Exclude file”排除自己動(dòng)手創(chuàng)建的排除詞匯或術(shù)語(yǔ)的文件。如果不希望排除,也可以直接略過(guò)此步驟。我們選擇排除MlutiTerm自帶的樣本術(shù)語(yǔ)庫(kù)基本詞匯;
step
5
點(diǎn)擊下一步,彈出“Term extraction settings”界面。這里可以根據(jù)自己的需要設(shè)置術(shù)語(yǔ)短、長(zhǎng)有幾個(gè)單詞,提取術(shù)語(yǔ)的很大數(shù)量,以及噪音值調(diào)整。Silence值越高,提取的術(shù)語(yǔ)數(shù)量相對(duì)較少,質(zhì)量越高;Noise值越高,則提取出的術(shù)語(yǔ)數(shù)量較多,質(zhì)量相對(duì)較低。我們這里舉例來(lái)將2個(gè)單詞以上5個(gè)單詞以下(包含兩個(gè)單詞和五個(gè)單詞的詞語(yǔ))的詞語(yǔ)提取出來(lái)作為術(shù)語(yǔ);并把噪音值調(diào)高,以便擴(kuò)大提取術(shù)語(yǔ)的范圍。
設(shè)置完成后,點(diǎn)擊“Stopword Lists”,加載原文和譯文的停用詞表;
停用詞指的是計(jì)算機(jī)進(jìn)行檢索時(shí)自動(dòng)過(guò)濾到的一些虛詞和非檢索詞,這些詞大多沒(méi)有實(shí)際語(yǔ)意。MultiTerm里為我們提供部分語(yǔ)種的停用詞表,而中文的停用詞表則需要我們根據(jù)需要自行去網(wǎng)上搜索。
step
6
點(diǎn)擊下一步,設(shè)置詞頻,然后點(diǎn)擊下一步至完成,完成項(xiàng)目創(chuàng)建。
step
7
確認(rèn)提取后,彈出確認(rèn)提取術(shù)語(yǔ)界面;系統(tǒng)過(guò)自動(dòng)基于上述制定的規(guī)則進(jìn)行初步術(shù)語(yǔ)提取。
step
8
初步提取完成之后,右擊鼠標(biāo),可對(duì)提取的候選術(shù)語(yǔ)進(jìn)行編輯并刪除無(wú)用、提取錯(cuò)誤的詞組;點(diǎn)擊“Concordance”還可以查看術(shù)語(yǔ)在翻譯記憶庫(kù)中的句對(duì)語(yǔ)境??稍谏戏健癋ilter”對(duì)術(shù)語(yǔ)進(jìn)行過(guò)濾顯示。
step
9
完成步驟之后,即可對(duì)術(shù)語(yǔ)進(jìn)行導(dǎo)出。點(diǎn)擊file→Export,選擇需要導(dǎo)出的格式??蛇x擇導(dǎo)出到現(xiàn)有術(shù)語(yǔ)庫(kù)中、xml術(shù)語(yǔ)庫(kù)文件及左右兩列(Tab delimited)的txt文本文檔,點(diǎn)擊下一步,選擇導(dǎo)出存放路徑。之后一路下一步直至完成即可。這樣,術(shù)語(yǔ)提取就全部完成了,可以將制作完成的術(shù)語(yǔ)導(dǎo)入術(shù)語(yǔ)庫(kù)或Trados中進(jìn)行使用了。
單語(yǔ)術(shù)語(yǔ)的操作流程與提取雙語(yǔ)的操作流程相同,只需在新建項(xiàng)目時(shí)選擇單語(yǔ)術(shù)語(yǔ)提取項(xiàng)目即可。
在翻譯記憶庫(kù)中提取雙語(yǔ)術(shù)語(yǔ)時(shí),還有更簡(jiǎn)單的方式哦。Tmxmall與語(yǔ)智云帆術(shù)語(yǔ)寶強(qiáng)強(qiáng)聯(lián)合,您只需訪問(wèn)Tmxmall在線對(duì)齊(http://www.tmxmall.com/aligner),選擇單文檔對(duì)齊將tmx文件導(dǎo)入,然后點(diǎn)擊“提取術(shù)語(yǔ)”,設(shè)置詞頻、源語(yǔ)言和目標(biāo)語(yǔ)言。系統(tǒng)會(huì)自動(dòng)根據(jù)智能算法為您提取術(shù)語(yǔ)哦。可直接在網(wǎng)頁(yè)上對(duì)術(shù)語(yǔ)進(jìn)行編輯與刪除。提取后的術(shù)語(yǔ)可選擇導(dǎo)出下載Excel表格、同步到Tmxmall私有云術(shù)語(yǔ)庫(kù)或術(shù)語(yǔ)寶中哦。
溫馨提示:術(shù)語(yǔ)提取頁(yè)面有可能被瀏覽器攔截,請(qǐng)?jiān)谔崛∏皩g覽器設(shè)置中“廣告過(guò)濾”關(guān)閉,谷歌Chrome瀏覽器在“設(shè)置-隱私設(shè)置-內(nèi)容設(shè)置”中選擇“允許彈出新彈窗”即可。
本文轉(zhuǎn)自:tmxmall(微信公眾號(hào)ID: tmxmall),歡迎前往訂閱!