語料標注一般用于說明語料作者
發(fā)布時間:2023-07-31 09:40:56
作者:唐能翻譯
分享至:
科技英語翻譯介紹語料標注一般用于說明語料作者和語料來源等相關(guān)信息,以及語料詞性和句法特征等語言特征的信息。Cristina Monti等學(xué)者(2005)分析了歐洲議會口譯語料庫(EPIC)的標注。他們認為EPIC的標注分為三大類:①語言層次標注(linguistic annotation)。音頻和視頻材料沒有標點符號,但EPIC根據(jù)說話者的音調(diào)和句法信息將音頻和視頻材料切分成意義單位(unit of meaning),并以“∥”作為意義單位切分的標記。②副語言層次標注(paralinguistic annotation)??谧g語料存在大量副語言特征,如停頓、沉默、填充詞和拼寫錯誤等。EPIC對這些特征均作標注處理。③超語言層次標注(extralinguistic annotation)。該類標注用于說明文件信息(如日期和語言等)以及說話者的姓名、性別和國籍等信息。
法語翻譯公司介紹語料之間的平行對齊是平行語料庫建設(shè)的核心所在,平行對齊質(zhì)量的高低直接影響語料庫質(zhì)量的好壞。Dorothy Kenny(2001:120)介紹了不同語言語料之間平行對齊的具體方法。在她看來,平行語料庫可以實現(xiàn)不同語言語料的句級對齊?;镜膶R方法是在源語文本和譯文的一句、第二句之間建立一種等值或?qū)?yīng)關(guān)系。其他語句以此類推。對齊關(guān)系的建立涉及給源語和目的語文本的每個句子標號,每個源語語句和譯文語句形成一種對應(yīng)互見關(guān)系。醫(yī)學(xué)英文翻譯公司介紹M.Izquiedo、K.Hofland和O.Reigem(2006)則強調(diào)源語文本和目的語文本之間的平行對齊處理應(yīng)注意以下個參數(shù):①錨點詞匯表(anchor word list),即重要的常用詞匯的雙語詞表;②專用詞匯和數(shù)字可作為對齊成分的標記。
在線下單
需要可靠的翻譯服務(wù)?具體咨詢,請致電唐能
+86 400-693-1088
+86 21-62793688
也可以輕松下單,快捷方便,唐能會有專業(yè)的翻譯客服主任在24小時內(nèi)聯(lián)系您
Copyright 2006-2012 Talking China - All rights reserved.