真人一对一直播,chinese极品人妻videos,青草社区,亚洲影院丰满少妇中文字幕无码

0
首頁 精品范文 同義詞詞典

同義詞詞典

時間:2023-05-30 10:46:17

開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇同義詞詞典,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。

第1篇

關鍵詞:《現代漢語詞典》第5版 同素異序同義詞 微觀體例 釋義問題 收詞標準

一、引言

在現代漢語詞匯系統中,同素異序同義詞以其詞素構件相同、詞素位序相反、義位相同或相近、成對出現等特征共同組成了一個詞匯子系統。根據異序之后的詞義關聯情況,該類詞匯子系統可以分為等義同素異序詞和近義同素異序詞兩小類。由于異序之后的詞頭往往分屬于不同音節,使得同素異序同義詞在按音序排列的詞典中往往分散排布,給相關詞條的釋義照應增添了難度。《現代漢語詞典》第5版(以下簡稱《現漢》)收錄了大量同素異序同義詞,在對相關詞條釋義處理時基本上能夠做到前后照應,相互關聯。對等義同素異序詞,《現漢》根據普適性高低和流通度強弱,一般采用主從釋義模式處理其釋義問題。將普適性高和流通度強的詞條設為主詞條,采用下定義或描寫說明釋義方式;將普適性低和流通度弱的詞條設為從詞條,采用同義詞釋義方式,即直接用主詞條來詮釋從詞條,屬于間接釋義,其具體釋義需要經過主詞條釋義的二次轉化。例如:

忌妒 (動)對才能、名譽、地位或境遇等比自己好的人心懷怨恨。

妒忌 (動)忌妒。

上述等義同素異序詞“忌妒—妒忌”采用了一主一從的釋義方式,《現漢》中如“離別—別離”、“并吞—吞并”、“巡查—查巡”等都運用了這種釋義方式。而對于同中有異的近義同素異序詞,《現漢》則采用了主從與平列混合釋義模式分別處理。例如:

蔬菜 (名)可以做菜吃的草本植物,如白菜、菜花、蘿卜、黃瓜、洋蔥、扁豆等。也包括一些木本植物的嫩莖、嫩葉和菌類,如香椿、蘑菇等。

菜蔬 (名)①蔬菜。②家常飯食或宴會所備的各種菜。

上述“蔬菜—菜蔬”屬于近義同素異序詞。其中,“蔬菜”釋義與“菜蔬”義項①構成主從關系,即“蔬菜”為主詞條,采用了定義加舉例的釋義方式,“菜蔬”為從詞條,采用了同義詞間接釋義方式。“蔬菜”釋義與“菜蔬”義項②則構成了平列關系,即“菜蔬”義項②與“蔬菜”釋義平行對等,為其詞義差別所在。

這種釋義體例具有一定的科學性。等義同素異序詞釋義中,主詞條采用下定義或描寫說明釋義方式,可以有效避免循環釋義(互訓),使釋義更為科學準確;從詞條采用同義詞間接釋義方式,可使釋義簡明扼要,能夠滿足辭書編纂經濟性要求。主從釋義模式和平列釋義模式共用,能夠準確揭示出近義同素異序詞同中有異的詞義特點。不過,在考察《現漢》同素異序同義詞的釋義情況時,我們發現,受限于該類配對詞條的分散排列,這種釋義體例并未得到全面貫徹,乖互疏漏現象時有發生。文章擬就相關問題展開探討,以期對辭書編纂工作有所助益。

二、《現漢》同素異序同義詞釋義問題

縱觀《現漢》中同素異序同義詞的釋義情況,其存在問題大致可分為體例不一、釋義失衡、釋義循環、收詞缺漏等類型。

1.體例不一

依據上述分析,同素異序同義詞的釋義體例主要有等義同素異序詞的主從釋義模式和近義同素異序詞的主從和平列混合釋義模式兩種。但是在考察《現漢》中相關詞條的釋義時我們發現,這種釋義模式并未得到全面執行,體例不一問題時有出現。例如:

商洽 (動)接洽商談。

洽商 (動)接洽商談。

裁剪 (動)縫制衣服時把衣料按一定的尺寸裁開。

剪裁 (動)①縫制衣服時把衣料按照一定尺寸剪斷裁開。②比喻做文章時對材料的取舍安排。

以上兩組同素異序同義詞的釋義都沒有嚴格遵守相關詞條釋義體例。“商洽—洽商”屬于等義同素異序詞,參照上述“忌妒—妒忌”的釋義體例標準,其釋義體例應為主從模式,但《現漢》采用了雙主釋義模式,違背了同類詞語釋義體例的一致性,其中從詞條“洽商”應采用同義詞釋義模式。“裁剪一剪裁”屬于近義同素異序詞,比照上述“蔬菜一菜蔬”釋義體例,此處“剪裁①”義項可以簡化為同義詞“裁剪”。《現漢》中如“察覺—覺察”、“呈報—報呈”、“蔭庇—庇蔭”等同素異序詞詞條的釋義都存在類似問題。

2.釋義失衡

等義同素異序詞的釋義應該保持前后一致,平衡照應。“相關的或同一類的詞語釋義方式,要盡可能一致,釋義內容和措辭要相互照應,義項分合、排列也要平衡。”(韓敬體1993)對于等義同素異序詞,辭書編纂時通常采用主從釋義模式,既是出于經濟性考慮,也是為了避免相關詞條釋義時出現分歧。但是,由于《現漢》中等義同素異序詞的主從釋義體例未能一以貫之,部分詞條釋義仍采用了雙主釋義體例,即對相關配對詞分別釋義,結果導致部分配對詞條的釋義出現了失衡現象。例如:

庖代 (書)(動)替別人做他分內的事。

代庖 (書)(動)替別人做事。

樸質 (形)純真樸實;不矯飾。

質樸 (形)樸實;不矯飾。

感傷 (形)因有所感觸而悲傷。

傷感 (形)因感觸而悲傷。

上述下劃線部分是三對等義同素異序詞釋義失衡所在。其中“庖代一代庖”配對詞來源于成語“越俎代庖”,源成語釋義為“……一般用來比喻超過自己的職務范圍,去處理別人所管的事情”。比較而言,“庖代”釋義更切合原義,而“代庖”釋義中少了必要的限制,顯得不夠嚴謹,配對詞雙主釋義出現了失衡現象。至于“樸質—質樸”與“感傷—傷感”兩對詞條釋義,內容和措辭都有失照應。《現漢》中如“聚集—集聚”、“蕩滌—滌蕩”、“雛雞—雞雛”等類似同素異序同義詞詞條的釋義也都存在同樣問題。

第2篇

關鍵詞:

中圖分類號: TP391.3 文獻標識碼:B 文章編號:2095-2163(2011)01-0051-05

0引言

詞語相似度計算[1-2]研究的是采用怎樣的方法來計算或比較兩個詞語的相似性。詞語相似度計算在智能檢索、文本聚類、文本分類、自動應答、機器翻譯等領域都有廣泛的應用。在不同的應用中,詞語相似度有不同的用途,例如,在基于實例的機器翻譯中,詞語相似度能夠表示文本中兩個詞語的可替換程度;在信息檢索中,利用詞語相似度能夠提升信息檢索的準確率和召回率;在問答系統中,答案和問句的符合程度可以通過計算兩者含有詞語之間的相似度來衡量。本文將研究詞語相似度計算在英文輔助寫作系統中的應用。

1英文輔助寫作系統

英文輔助寫作系統是一個英漢雙語的例句檢索系統,用戶可以使用中英文雙語檢索自然語言處理領域英文論文中的地道例句,同時獲得例句所屬論文的相關信息(作者信息、論文題目、論文的來源),為寫作英文學術論文的用戶提供幫助。用戶可以輸入想要表達的中英文詞組和短句,系統會為用戶查找與輸入相似的自然語言處理領域的文章中的地道的英文例句,用戶可以通過觀察和學習檢索到的例句,組合出地道的、滿足需要的英文表達。該英文輔助寫作系統主要功能如下:

(1)英文短語搭配推薦生成

主要針對兩個詞的query輸入,給出語義相似的搭配推薦。用戶可以比較推薦的搭配和輸入,選擇出更地道的英文表達。系統短語搭配參考結果頁面如圖1所示。

(2)翻譯推薦生成

建立中譯英的統計機器翻譯系統,其中語言模型的語料選用的是ACL Anthology抽取的共1716418句的語料,可以體現出更地道的英文表達。翻譯模型的語料采用的是CNKI的摘要,這是個大規模的雙語平行語料。對用戶的每個中文查詢詞,后臺的在線機器翻譯系統進行翻譯,返回前十的nbest的結果,以供用戶選擇。同時用戶輸入的中文query后返回的英文檢索結果是按照評分最高的翻譯進行檢索獲得的結果。系統翻譯候選結果頁面如圖2所示。

(3)同義詞推薦和單個輸入的搭配推薦

① 同義詞推薦:利用WordNet生成單個詞query的同義詞推薦,包括其可能的四種詞性的同義詞推薦,分別為名詞的、動詞的、形容詞的和副詞的。

② 單個輸入的短語搭配推薦

與(1)的短語搭配參考類似,只是需要其短語搭配生成的步驟。這里短語搭配推薦可能有很多,不便于在頁面全部顯示,所以按照其在檢索庫中的精確匹配次數進行排序,只取前五個搭配在頁面顯示。同義詞和短語搭配推薦的結果均按照其在檢索庫中的精確匹配次數排序后以降序的順序顯示。系統單個輸入的同義詞推薦和常用搭配推薦結果頁面如圖3所示。

(4)例句檢索庫:檢索的語料來源于ACL Anthology[3]從1979年至今的所有論文中有相關信息(題目、作者等)的文章的句子。文章總數8 173篇,總句子規模有1 716 418句。語料庫特點是句子都是地道的英文表達。

用戶在實際使用該系統時,輸入的檢索詞往往不能準確地檢索到所需的例句,因為用戶初始是不知道地道的英文表達的,這就導致用戶可能需要進行多次檢索,才能檢索到最理想的例句,也可能一直檢索不到,這將影響到用戶使用的滿意度。因此,需要給用戶提供查詢的相關詞提示功能,幫助用戶更快更好地使用該系統。該檢索系統的相關詞提示功能有多種,包括同義詞推薦,兩個詞相似搭配推薦、單個詞常用搭配推薦等等。筆者在本文中主要研究在該系統背景下的同義詞推薦生成方法。

在該檢索系統的實際運行過程中,發現用戶在使用同義詞推薦功能時,主要關注同義詞推薦的第一個詞是否是在自然語言處理領域中與查詢詞最相似的詞。考慮到這一用戶需求,首先利用語義詞典WordNet生成通用領域的同義詞候選集,然后進行特定語境環境下的詞語相似度計算,對同義詞候選集進行排序,為用戶提供高質量的同義詞推薦功能。

2相關研究

2.1WordNet

英文WordNet[4]是普林斯頓大學認知科學實驗室開發的一部在線詞典數據庫系統,是基于英文的詞匯語義網絡系統。WordNet本質上是一個詞匯概念網絡,描述的是概念間的各種語義關系,WordNet中也規定了動詞、形容詞和副詞的語義知識表示規范,其核心都是synset(同義詞集合)以及概念之間的各種關系。

2.2詞語相似度研究現狀

國內外對詞語語義相似度的計算方法大體可分為兩類:基于統計的詞語語義相似度計算方法[5-6]和基于語義詞典的詞語相似度計算方法[7-9]。

基于統計的詞語語義相似度計算方法是經驗主義方法,是把詞語相似度的研究建立在可觀察的語言事實上,而不僅僅依賴于語言學家的直覺。這種計算方法是建立在兩個詞語語義相似當且僅當這兩個詞語語義處于相似的上下文環境中這一假設的基礎上,通過利用大規模語料庫,將詞語的上下文信息作為語義相似度計算的參照依據。

基于語義詞典的詞語相似度計算方法是基于語言學的理性主義方法,是利用語義詞典,依據概念之間的上下位關系和同義關系,通過計算兩個概念在樹狀概念層次體系中的距離來得到詞語間的相似度。

3同義詞推薦的生成方法

首先通過語義詞典WordNet生成用戶查詢詞在通用環境下的同義詞候選集,然后利用基于上下文向量的特定語境下的相似度計算方法,計算同義詞候選集中每個詞與目標詞在自然語言處理領域語境下的相似度值,最后將同義詞候選集按照相似度值以降序關系排列顯示給用戶。

3.1同義詞候選集生成

WordNet是一個英語詞匯及其詞法關系的數據庫,同時也是一個英語詞典。由于WordNet包含了語義信息,所以有別于通常意義上的字典。WordNet根據詞條的意義將其分組,每一個具有相同意義的字條組稱為一個synset(同義詞集合)。WordNet為每一個synset提供了簡短、概要的定義,并記錄不同synset之間的語義關系。WordNet的開發有兩個目的:其既是一個字典,又是一個辭典,但比單純的辭典或字典都更加易于使用,而且支持自動的文本分析以及人工智能應用。PyWordNet通過一些專門的工具方法將WordNet數據公開為一組 Python 數據結構。PyWordNet 被組織成四個詞典,分別對應 WordNet 2.0 的四個部分――名詞、動詞、形容詞和副詞。詞匯的單詞形式是主鍵,每個記錄都包括含義(sense)、同義詞組(synonym set)、注釋(glosse)和指針(pointer)。

本文通過pyWordNet提供的接口訪問WordNet數據庫,從而獲得用戶查詢詞的同義詞候選集列表。此時獲得的同義詞候選集列表是通用環境下的同義詞,而且被認為與查詢詞的相似度都是相同的。但在特定語境環境下,這些同義詞與查詢詞的相似度會出現不同,考慮到在向用戶推薦時,需要把與目標詞相似度最高的詞排在最前以供用戶優先選擇,因而需要計算這個同義詞集在特定語境環境下與目標詞的相似程度。

3.2特定語境環境下的相似度計算方法

3.2.1上下文詞語同現向量(CWCV)

特定語境環境下語義相似度計算方法建立在兩個詞語語義相似當且僅當這兩個詞語語義處于相似的上下文環境中這一假設的基礎上。為了計算兩個詞語之間的語義相似度,需要從語料中統計詞語的上下文信息。在本文中,為每一個需要計算語義相似度的詞語構造上下文詞語同現向量(CWCV)。

CWCV的定義:一個詞語的上下文環境中含有豐富的有關該詞的語義信息,在不同的上下文中一個詞語往往具有不同的語義,因而可以用在上下文環境中與目標詞以某種關系同現的、所有詞語構成的向量來表示目標詞語,這個向量就是CWCV。

3.2.2詞上下文向量的生成

(1)通過簡單的淺層句法分析,將訓練集中所有文本的每一個句子都分解為若干個句法組,刪除不太重要的句法組后,標記其中的核心詞和修飾詞。

(2)以一個關鍵詞為中心,以句子為共現單位,通過對訓練集內該詞語的上下文詞語進行統計,得出該詞語的詞上下文向量。用同樣的方法得到其它關鍵詞的詞上下文向量。

利用上述方法生成的詞上下文向量矩陣為:TCV [i] [j] =?邀Cij?妖,其中,i和j的取值范圍為[1.. n],Cij為小于1的實數,表示第i個詞語ti與第j個詞語tj之間的上下文關系;第i行的值集合(Ci1,Ci2,…,Cin)即為第i個詞語ti的詞上下文向量,表示訓練集中的n-1個詞語與ti之間的上下文關系,可以看作是ti在訓練集中的語義描述。

詞上下文向量生成算法的主要步驟如下:

步驟1:用淺層句法分析工具將訓練集中所有文本的所有句子都分解為句法組,只保留名詞句法組和動詞句法組,每個保留下來的句法組內進一步刪除名詞、動詞、形容詞之外的其它類型的詞語,并區分出其中的核心詞和若干個修飾詞。

步驟2:設置并初始化詞上下文向量矩陣TCV[n] [n]。

步驟3:生成矩陣,具體算法為:

for(i=0;i<訓練集中的句子總數;i++)

for(j=0;j<句子中的詞語個數;j++)

?邀

wij=第i個句子中的第j個詞語;wik=第i個句子中的第k個詞語;

if(wij和wik位于同一組且具有修飾關系或位于不同的句法組但都是核心詞)

R=1; else R=α;

noij=wij在向量空間特征集中的序號;noik=wik在向量空間特征集中的序號;

TCV[noij][noik]=TCV[noij][noik]+R;

?妖

步驟4:對TCV中每一個不為空的向量都進行規格化。

3.2.3基于詞上下文向量的詞語相似度計算

在上述詞上下文向量矩陣的基礎上計算任意兩個詞語之間的相似度,具體方法是:給定兩個詞語,從詞上下文向量矩陣中分別提取各自對應的詞上下文向量,直接計算這兩個向量之間的余弦系數并將其作為詞語之間的相似度值,計算結果保存到相似度矩陣中。詞語相似度矩陣Sim的計算公式如下:

其中,Sim為下三角矩陣,i≥j,TCV[i]、TCV[j]分別為詞語ti和tj的詞上下文向量,Sim[i][j]為詞語ti和tj之間的相似度,TCV[i][k]、TCV[j][k]分別為詞語ti和tj的詞上下文向量第k維的權值。

4系統相關實驗

由于詞語相似度是一個主觀性很強的概念,現在還沒有一個合適的詞語相似度計算測試集,所以在本課題中的測試集來源于ACL Anthology隨機選取的100個單詞。文中通過人工觀察的方法對這100個單詞的同義詞集相對于查詢詞進行排序,將該排序結果設定為參考排序,然后與系統排序進行比較。由于人工觀察的方法主觀性太強,同時用戶在使用時主要關注與查詢詞最相似的詞是否排在第一位,所以設定當人工觀察排序結果中最相似詞排在系統排序中的第一位且系統排序與人工排序最多有一個順序不一致時,認為系統排序結果基本正確,并記錄這100個單詞的人工判定的最相似詞在系統排序結果中的位置。

這里設定的baseline方法是只使用WordNet產生的同義詞獲選集的方法。

文中采用以下指標對算法進行評價:

(1)準確率(precision)的評測公式如下:

其中,N■表示的是測試的單詞總數,當人工觀察的最相似詞排在系統排序中的第一位且系統排序與人工排序最多有一個順序不一致,此時認為系統排序結果正確。Ncorrect為系統排序結果判定為正確的個數。

(2)排序倒數(Reciprocal Ranking,RR)是算法返回結果中正確結果出現位置的倒數,平均排序倒數是多次計算的RR的結果的平均值,利用如下公式:

其中,N表示測試單詞總數,ni表示對于第i個查詢單詞的人工判定的最相似詞在系統排序結果中位置ni。

(3)查詢輸入在例句檢索系統中精確匹配次數可以直接反映該輸入在自然語言處理中常見程度。例如,單詞“show”在該例句檢索系統中精確匹配的次數是14 539,而單詞“give”在該例句檢索系統中精確匹配的次數是6 625。第一個詞明顯比第二個詞在自然語言處理領域中更常見。因此可以自動地通過精確匹配次數來評價同義詞候選集中的每個詞的常見程度。由于用戶主要關注同義詞推薦的第一詞,所以分別記錄測試集中每個詞的同義詞推薦在使用本文方法的排序和使用baseline方法的排序中第一個詞的精確匹配次數A和B,然后兩兩進行比較:當A>B時,本文方法的個數增加1;當B>A時,baseline方法的個數增加1;當A=B時,本文方法和baseline方法個數不變。最后計算這兩種方法的獲勝比例。暫稱該方法為C評價方法。實驗結果如表1所示。

通過表1的準確率可以看出,本文的方法相比于baseline方法可以很好地選擇出查詢詞的最相似詞。通過MRR值可以看出,本文的方法相比于baseline方法可以對相似詞語與查詢詞的相似程度給出一個合理的排序,即可以給檢索系統提供一個準確的待擴展詞的相似度排序。通過C評價方法,發現在100個測試詞中,本文方法的獲勝比例為44%,而baseline的方法的獲勝比例只有16%,這說明本文方法產生的同義詞推薦中與目標詞最相似詞的常見程度遠大于baseline的方法。

在ACL Anthology語境下的相似度排序舉例說明,對查詢詞cite的動詞形態在WordNet的相似度和本文相似度如表2所示。

單詞cite的通用環境下的同義詞為refer、name、mentio- n、advert,在WordNet的相似度計算下,其相似度均為1.0,不能區分出與目標詞 cite 的最相似詞和獲得相似程度的排序。而本文相似度在這里得到了較好的效果,單詞refer在該語境下是與單詞cite最相似的詞,大量觀察下這符合ACLAnthology使用情況。同時觀察出單詞advert在ACL Anthology沒有出現,這說明在通用領域下的同義詞可能在特定語境環境下與目標詞完全不相似,兩者不可替換。

5結束語

詞語相似度計算在自然語言處理、智能檢索、文本聚類、文本分類、自動應答、詞義排歧和機器翻譯等領域都有著重要的應用價值。本文將詞語相似度計算的知識應用到英文輔助寫作系統中,結合了語義詞典WordNet和基于上下文的特定語境環境下的相似度計算的方法生成有序的同義詞推薦。本文的方法在準確率、MRR以及本文設定的C評價這三個指標上遠優于只使用WordNet的方法,同時本文的方法在準確率的評價中達到73%,基本滿足用戶的需求。

參考文獻:

[1] TURNEY P D. Similarity of Semantic Relations[J]. Computation- al Linguistics Journal,2006,32(3):379-416.

[2] 秦春秀,趙捧未,劉懷亮. 詞語相似度計算研究[J]. 信息系統,2007,30(1):105-108.

[3] http://aclweb.org/anthology-new/.

[4] 普林斯頓大學認知科學實驗室. WordNet[EB/OL]. http://wordnet. princeton.edu/.

[5] BROWN P,PIETRA S D,PIETRA V D, et al. Word sense dis- ambiguation using statistical methods[C]// Proceedings of the 29th Meeting of the Association for Computational Linguistics(ACL-9 1),Berkley,C.A.,1991:264-270.

[6] DAGAN I,LEE L. Similarity-based models of word cooccurrence probabilities [J]. Machine Learning. Special Issue on Machine L- earning and Natural Language,1999.

[7] 劉群,李素建. 基于《知網》的詞語語義相似度計算[J]. Comput- ational Linguistics and Chinese Language Processing,2002,7(2): 59-76.

第3篇

摘要:

在對外漢語詞匯教學中,單音節同義詞的辨異較為困難。本文以三組單音節同義詞為例,從漢字的本義著手,比較其本義或引申義之間的區別,以期為單音節同義詞辨異提供一條新思路。

關鍵詞:

單音節同義詞;本義;辨異

同義詞,指詞義相同或相近的一組詞。把握同義詞之間的異同,對于準確表達有著重要的意義。是否能選擇合適的同義詞來進行準確、得體的口頭和書面交際,不但是衡量漢語母語者,也是衡量留學生漢語水平的一個重要標準。

1對外漢語同義詞教學研究之現狀

近年來,對外漢語教學界對同義詞的研究方興未艾。這些研究認為,對外漢語同義詞辨析與對內漢語同義詞辨析的范圍、方法等都有所不同,提倡應基于中介語的現實,著手研究留學生易混淆詞的詞義、色彩、用法等方面的差異[1]。不過,目前的研究大多還集中在同義詞辨析角度的探討上,辨析的對象多為雙音節同義詞,從分析漢字本義的角度來進行單音節同義詞辨析的探討尚不多見。實際上,單音節詞的辨析較雙音節詞更為困難,因為單音節詞由一個語素(書面形式為一個漢字)構成,缺乏其他語素的支撐,不能藉由一定的語境來區別詞義,而留學生需要掌握的單音節同義詞又大多很常用,因此,單音節同義詞的辨析應引起足夠的重視。對外漢語同義詞教學研究的重要成果主要表現在一些同義詞辨析工具書的出現。這些工具書多按使用頻度、交際功能選取詞條,標注詞類、列出搭配、說明用法、展示例句,具有較強的實用性,但也存在一些不足,如內外界限不明、重語法輕詞匯、常用性原則不徹底等,尚不能完全滿足對外漢語教學的需要[2]。有的詞典還有錯誤。以“向—對”的辨異為例,某近義詞詞典先說明二者均為介詞,然后舉例:我們學校的大門向東。(我們學校的大門對東。)句子的正誤判斷并沒有錯,但是,此處的“向”并非介詞,而是動詞。一本專為外國人學漢語編寫的工具書出現這樣的錯誤,令人遺憾。因此,對外漢語教師不能完全依賴工具書,有時需要自己去深入思考,解決問題。

2辨異

古代漢語中,單音節詞很多,表現在書面上,就是一個漢字,因此所謂字義,多即詞義。隨著語言的發展,很多單音節詞產生了多個與其本義密切相關的引申義。有的引申義系輾轉引申而來,與本義的關系比較模糊,但是,不管它們之間的關系看起來多么遙遠,其內在的引申脈絡都是有跡可循的。這個脈絡是從漢字本義入手進行單音節同義詞辨析的基礎。因此,借助本義分析來進行單音節同義詞辨析,是可行的,也是可靠的。我們選取了易混淆、較常用的三組,來闡釋我們的辨異思路。它們分別是:1)名詞:道—路(實詞)2)動詞:交—付(實詞)3)介詞:向—對(虛詞)

2.1“道—路”辨

“道”“路”二詞各有多個義項,但在“道路”義上同義。《說文》云:“路,道也。”[3]很多合成詞和固定短語證實了這一點。例如,“小道”即“小路”,“鐵道”即“鐵路”,“條條大路通羅馬”也可說成“條條大道通羅馬”。“道”和“路”還可構成聯合型合成詞“道路”。不過,二者之間還是存在著一些差異。例如,不能把“馬路”“高速路”說成“馬道”“高速道”,也不能把“人行道”、“(占用了)兩條車道”說成“人行路”、“(占用了)兩條車路”。可見,“道”、“路”并不等同。“道—路”之間的差異到底是什么?許慎的說解極簡,倒是段玉裁在“路”字下解釋道:“《釋宮》:‘一達謂之道路。’此統言也。《周禮》:‘澮上有道,川上有路。’此析言也。”[4]段玉裁的意思是,若不加區別(“統言”),則如《爾雅•釋宮》所言,“道”就是“路”。如果細分(“析言”),那就像《周禮》里所說的,“澮”上的叫“道”,“川”上的叫“路”。《周禮》卷十五有對古代河渠道路規制的說明:“凡治野,夫間有遂,遂上有徑。十夫有溝,溝上有畛。百夫有洫,洫上有涂。千夫有澮,澮上有道。萬夫有川,川上有路,以達于畿。”[5]鄭玄對“徑畛涂道路”的寬度做了詳細的解釋:“徑畛涂道路,皆所以通車徒于國都也。徑容牛馬,畛容大車,涂容乘車一軌,道容二軌,路容三軌。”[6]簡而言之,“徑畛涂道路”是各種寬度的道路,均可“通車徒”,其中“路”最寬,可容三輛車通行,“道”可容兩輛車通行。時至今日,“徑畛涂道路”所代表的事物仍然存在,但名稱有所改變,今天人們用“村道、鄉道、縣道、省道、國道”來區分級別、寬度各異的各種道路。從詞匯學的角度來看,“徑、畛、涂”已不是詞,而變成了語素,只能構詞,所構合成詞的使用頻率也很低,但“路”和“道”還很常用,且常混用。很多通路,既可叫“道”,也可稱“路”,如“大路/大道”、“羊腸小路/羊腸小道”;甚至不在陸地上的某種抽象的通道,也可稱“道/路”,如“水道/水路、航道/航路”。盡管如此,從詞義范圍看,“路”比“道”更大,可作為所有道路的統稱,使用頻率更高。一切大路小路,村道乃至國道,都是“路”。現代出現的道路新形式,一般都叫“路”,如“馬路”“高速路”。現在給道路命名,一般稱“××路”,如“朝陽北路”、“清華東路”等。二者的區別還表現在,雖然道路一般叫“××路”,但“路”上人為劃分出的兩條或更多的通路卻應叫“道”,如“雙向6車道”、“最內側車道”;人為規定或劃設的、有專門用途的通路,也應叫“××道”,如“盲道”“人行道”“綠色通道”,人、車等行進在“路”上,應各行其“道”。這一點,與《周禮》中“路”比“道”更寬的規定遙相吻合,顯示了文化傳承的力量。

2.2“交—付”辨

漢語教材在解釋“交”“付”時,一般都會用“give”。因為英文釋義相同,留學生會認為二者同義,造出“明天我要付作業”“交小費”這樣的錯誤語句。“交”“付”都有“交給”義。《現代漢語詞典》指出,“交”即“把事物轉移給有關方面”,比如“交作業”是把寫好的作業向老師“轉移”[7]。但是,“付”也有“轉移”義,如“付款”“付小費”等,錢款也是從一方向另一方轉移,“付”還能和“交”組成聯合型合成詞“交付”,這說明二者詞義很接近。那為什么不能說“付作業”“交小費”呢?我們嘗試從它們的本義著手去尋找答案。《說文》云:“交交,交脛也。從大,象交形。”[8]“交”的字形與“大(大)”很接近,以“大”為基礎,下面兩條腿相交叉。段玉裁解釋說:“‘交脛’謂之交,引申之為凡交之稱。故爻下曰:‘交也。’……凡兩者相合曰交,皆此義之引申假借耳……《小雅》:‘交交桑扈’,箋云:‘交交猶佼佼,飛往來皃。’”[9]段玉裁的意思是,“交”的本義是兩叉,引申開去,凡是事物相交叉、有往來都叫“交”。“交”參構的合成詞(如“交戰”“交流”“交換”等)確實都隱含著這個意思。再看“付”。《說文》云:“付,予也。從寸持物以對人。”[10]即“用手拿著東西給別人”。可以看出,雖然都有“交給”義,但“付”是一方“持物”給人,“交”則強調雙方的交錯往來。一般說來,“付小費”取決于被服務一方的意愿,而且一旦給了,不會返還或找贖,沒有往來,因而用“付”。而作業是老師布置的,是要求,學生完成之后再“交”給老師,是回應,有來有往;“卷子”是老師發給學生考的,學生答完“交”給老師,也有來有往,因此,只能用“交”。“交—付”的這一區別在“交賬—付賬”這一對詞上表現得特別清楚。“付賬”只是單純地“給錢”,而“交賬”是“(完成他方要求的賬務工作后)移交賬務”[11],是對他方要求的回應。此外,“付”涉及的對象均為錢款,而“交”涉及的對象更為廣泛,但均為對對方要求的回應。我們列出了“交—付”的常見搭配,詳見表1。問題隨之而來:“交學費”和“付學費”為什么都可以說?我們以為,二者立足點不同。“付學費”只是單純地“給付”,而“交學費”則隱含著學生按照學校的要求去“交納”學費的意思,是學生對學校要求的回應。

2.3“向—對”辨

實詞的辨異可以從本義著手,虛詞也不例外。現代漢語里有很多單音節虛詞,使用頻率很高,如:在、以、把、將、被、比、和、跟、據、按、為等。這些詞只有語法意義,教學本已不易,辨異更為困難。但它們多由古代漢語中的實詞(多為動詞)虛化而來,其本義是實在而清晰的。因此,分析其本義,理出其引申義列,對其虛詞義的辨異,是有幫助的。“對”和“向”是留學生最早接觸的兩個介詞。二者有時可互換,有時卻不能。例如:

1)√他對我笑了笑。|√他向我笑了笑。

2)√請代我向老張問個好。|×請代我對老張問個好。《現代漢語詞典》指出,“對”是引進動作的對象的,“向”是指明動作的方向的。這樣的解釋很專業,對留學生來說,則嫌抽象。“向”和“對”的介詞義均從其本義引申而來,我們嘗試從其本義出發,來比較其引申義的不同。“對”字本從丵從口從寸,從丵從士從寸的字形出現較晚。許慎在解釋“對”從“士”的原因時說:“漢文帝以為責對而為言,多非誠對,故去其口,以從士也。”[12]可見“對”的本義是“面對面地答問”,動詞,如“公問之,對曰……”(《段于鄢》)。這個本義保留在一些合成詞或成語中,如“對答如流、叨陪鯉對”等。從這個本義引申出“面對面地”義。這個意思也保留在一些合成詞里,如“對質”、“對峙”等等。在“面對面地”的基礎上進一步引申,就出現了“對”的介詞義項“朝著”。這個義項把“面對面地”這個特點也帶了過來。如:

3)當窗理云鬢,對鏡貼花黃。(《樂府詩集•木蘭詩》)詞義的引申途徑一般都是從具體到抽象。“面對面地答問”是具體的,“面對面地”較虛化,“朝著”義就更抽象了。再看“向”。其本義為“北出牖也”[13],即朝北的窗戶,小篆寫作“向”,像墻上挖出的窗洞,《詩•豳風•七月》里有“穹窒熏鼠,塞向墐戶”的詩句。由“窗戶”義引申出“方向”義。再由“方向”義引申出“朝著”義,變成介詞了。“向”的引申義列也是逐漸虛化的。“窗戶”義是具體的,“方向”義就較為抽象了,只表示一個大概的朝向。再由“方向”義引申出介詞義項“朝著”,詞義就更虛了,且未必是“面對面”的。而這,正是“向”和“對”最重要的區別。回到句1)和句2),問題就比較清楚了。句1)中,“他”既可以是與“我”“面對面地”,也可以是大致朝著“我”的方向,“笑了笑”,因此,用“對”和“向”均可。而句2)中,“我”托第三方問候“老張”,“老張”并不在場,與“我”不是“面對面”,但“問好”這一動作的方向獉獉是“老張”,故而只能用“向”,不能用“對”。再如:4)長江向東海奔流而去。長江河道九曲十八彎,只是大致朝著東海的方向獉獉,因此只能用“向”,不能用“對”。

2.4體會

今天的某些單音節同義詞,其本義可能相近(如“道—路”“交—付”),也可能毫不相干(如“向—對”)。本義接近的,可通過分析本義來直接比較二者的差異。本義毫不相干、僅因某一組引申義較接近而成為同義詞的,可通過梳理其引申義列來達到辨異的目的,因為引申義或顯或隱、或多或少都帶著其本義的痕跡。立足于本義的引申義之間的比較,區別更清晰。因此,對外漢語單音節同義詞辨析要有歷時的眼光,從詞源義出發的同義詞辨異,效果更好,更有說服力。

3結語

對外漢語教學的同義詞辨異,不論是辨析對象的范圍,還是辨析的方法,都與漢語本體研究有所不同,要緊密結合學習者的認知特點來進行。由于學習者漢語水平的限制,辨析時應務求簡單易懂。魯健驥早就指出:“在教學上使用的,不是對比的過程,而是對比的結果。這就是說,給對等詞也好,詞語例釋也好,都必須體現對比的成果,但并不是要我們在教材和課堂教學上從研究的角度向學生展示怎樣進行對比。”[14]教師對于同義詞的區別要知其然,更要知其所以然,對它們的詞義、用法、色彩等方面的區別要了然于胸,這是教師的基本功;但是,呈現給學生的,不能是繁復細致的辨析過程,而應該是辨異的結果。如果某組同義詞有多個區別,也不要對留學生和盤托出,而應以解決當前的問題為度,以免學生消化不良,產生畏難情緒。單音節同義詞的辨析也是如此。在給學生講解時,要用他們能接受的淺易的語言,輔以精當的例句,才能取得良好效果。任何方法都不是萬能的。從漢字本義著手進行辨析,只是單音節同義詞辨異之一途,是我們解決實際教學工作中的困難的一種粗淺嘗試,尚有待更多的辨異實例來充實、完善。

參考文獻:

[1]張博.同義詞、近義詞、易混淆詞:從漢語到中介語的視角轉移[J].世界漢語教學,2007(3)

[2]周上之.對外漢語的詞典與詞法[J].漢語學習,2005(6)

[3][4][8][9][10][12][13]段玉裁.說文解字注[M].上海:上海古籍出版社,1988

[5][6]阮元.周禮注疏[M].北京:中華書局,1980

[7][11]中國社科院語言研究所詞典編輯室.現代漢語詞典[M].北京:商務印書館,2009

第4篇

一、莫斯科語義學派的釋義方法及原則

以Ю. Д. Апресян為代表的莫斯科語義學派主張采用“元語言釋義方法”對詞匯語義單位進行注釋。

莫斯科語義學派的語義元語言是縮略的、統一的自然語言,由相對簡單的詞、詞法形式和句法結構構成,它們的數量比對象語的詞匯總量要少很多,元語言的所有單位應滿足稱名與意義單一對應的要求,即在元語言中不應該有同義詞和同音異義詞,一個語言單位只表示一個意義,一個意義只用一個語言單位表示。元語言的詞匯組成是逐級擴展的,從最簡單的語義單子(семантический примитив)[1]到在此基礎上形成的過渡語義單位。

“如果在語言中沒有通過詞匯語義單位Ll,L2,……Ln來解釋詞匯語義單位L,那么詞匯語義單位L是語義單子。”(Апресян 1994)即語義單子是只參與解釋其他語言單位,自身不能被進一步分解為兩個或兩個以上其他的語義元素。例如:“做”“想”“能”“知道”“在”“客體”“數量”“時間”“空間”“好”“壞”“不”“或者”等。語義單子是元語言詞典的詞匯基礎。過渡語義元素,即比語義單子復雜的某些意義,通過少量步驟的語義分解能夠簡化為語義單子。例如:“應該”“準備”“企圖”“開始”“停止”“繼續”等,如開始P=到時刻t之前不存在P,在t之后存在P;停止P=開始不P;繼續P=不停止P。在語義元語言中我們用英文字母X,Y,Z等表示詞項的配價變項。

按照莫斯科語義學派的理論,語言詞典的描寫單位不是詞,而是詞匯語義單位,即帶有所有詞法、句法和詞匯組合特征信息的詞的一個義項。釋義是采用縮略、統一的限量語義元語言以命題表達式的形式系統描寫詞匯語義單位在所有用法中的意義。這里我們主要論述“元語言釋義方法”最重要也最獨特的四個原則――命題表達式、語義分解、系統性和全面性。

1.命題表達式原則

釋義解釋的不是孤立的標題詞項,而是包含標題詞項的命題形式,即由標題詞項和其語義配價變項(X,Y,Z)組成的表達式。莫斯科語義學派認為,語義配價是謂詞語義單位(動詞、形容詞、部分名詞等)所描寫情景的必需參與者,與該謂詞釋義中的變項相對應。例如,詞典中釋義的對象不是詞“感謝”,而是“X為Z感謝Y”;不是詞“治療”,而是“X用W治療Y的疾病(身體部位)Z”;不是“心”,而是“X的心”。這樣的釋義不僅解釋了關鍵詞的意義,而且反映了關鍵詞組合關系的述謂表達式。這種采用命題表達式形式的釋義能同時反映關鍵詞的語義、句法屬性。

2.語義分解原則

語義分解原則可以有效地避免循環釋義問題。循環釋義在詞典釋義中比比皆是。莫斯科語義學派則認為,釋義是通過對初始詞匯意義進行逐級的語義分解得出語義單子。例如,“X為Z感謝Y”的釋義為:“X認為,Y對X做了好事Z,X認為自己有義務用言語或是善意的行為補償Z”。(Апресян 1974)再如,Ю. Д. Апресян(1974)對“愛”的釋義為:“X對Y的愛:X對Y有感情,Y對于X是令人高興的并且Y使X產生愿望――想和Y有聯系或者對Y做出好的事情。”語義分解與系統性原則相結合能夠揭示同義詞、近義詞和反義詞之間意義的相同與差異。

3.系統性原則

系統性原則要求不同的詞匯語義單位中相同的義素應給出相同的定義。例如,俄語“追趕”的釋義為:“A和B在同一方向移動,A和B之間的距離在縮短,并且A位于B的后面”, 而“落后”的釋義為:“A和B在同一方向移動,A和B之間的距離在增加,并且A位于B的后面。”(Апресян 1974)在上述釋文中,義素“縮短”和“增加”在其他相同的義素背景下明確地顯示出它們意義間的異同。這樣的釋義既能保證描寫的系統性,又能使讀者對近義詞、反義詞的異同一目了然。

4.全面性原則

全面性原則要求釋義描寫詞匯語義單位在所有用法中的意義。首先來看《現漢》對“習慣”的釋義:“①動常常接觸某種新的情況而逐漸適應。”在句子“我習慣早起早睡”和“我習慣了街上的嘈雜”中,《現漢》的釋義只適用于后者。實際上,“習慣”作為動詞應包含兩個意義:一是自身的行為變成習慣;二是主體對外界的因素習慣。再看Ю. Д. Апресян的注釋:“習慣1:在一段時期多次重復某種行為或某種狀態,結果做這件事或處于這種狀態成為主體行為或生活的標準。習慣2:在對自己來說不尋常的條件下度過一段時間后,結果這種條件成為標準或是不再被認為是不尋常的。”可以看出,Ю. Д. Апресян對“習慣”的釋義更精確、更全面。

莫斯科語義學派的元語言釋義方法和原則能夠使詞典中的釋義更加系統、全面、科學,避免邏輯上模糊的、循環的語義釋義,使對語言單位的解釋從模糊到清晰、從抽象到具體、從復雜到簡單。此外,注釋能同時反映出詞的語義、句法屬性并清晰揭示出相關同義詞、近義詞及反義詞的異同。

莫斯科語義學派的學者們采用元語言釋義法編寫了多部詞典,其中影響最大的是由И. А. Мельчук和А. К. Жолковский編寫的《現代俄語詳解組合詞典》(1984)及Ю. Д. Апресян主編的三卷《新編俄語同義詞解析詞典》(1997,2000,2003)。這兩部詞典的共同特點是積極性、系統性、全面性,詞典以詞的義項為單位對其語法、句法、語義、搭配等特征進行整合描寫。《現代俄語詳解組合詞典》可供人機兩用,其形式化特點更突出;而《新編俄語同義詞解析詞典》不是按照字母順序,而是按照義類原則排列,例如,詞典將表示言語行為的同義詞列、表示情感和心理狀態的同義詞列等排列在一起。值得一提的是,Ю. Д. Апресян是莫斯科語義學派中將元語言系統性用于詞典編纂的最具代表性的學者。

二、動詞“等”的釋義分析

動詞“等”在《現漢》中只有一個義項,即“等候;等待”。我們采用莫斯科語義學派元語言的釋義方法和配價理論把動詞“等”劃分為以下六個義項。等1的釋義如下:

X在Z等1Y=X知道或者認為,X需要的人或者涉及X的某種事件Y應該到來或發生,X處于準備狀態,通常位于Y應該到來或發生的地方Z。

該釋文中的X,Y,Z是“等1”的語義配價,其中,X為“主體”,為表人的動物名詞短語;Y為“客體”,通常為表示人、工作、交通工具、事件的名詞短語或小句:Z為“處所”,為表示處所意義的介詞短語。例如:他在宿舍等朋友;孩子們在站臺等公共汽車;許多操著外地口音的群眾演員在這兒等活兒;他已家徒四壁,無力負擔昂貴的手術費了,只好在家等死;父親在門口等我回來與他聊天呢。[2]

等2的釋義:X等2Y=X知道或者認為,X需要或者涉及X的某種事件或時刻Y應該或者可能發生,X處于準備狀態。

等2只有X(主體),Y(客體)兩個語義配價, X為表人的動物名詞短語或表交通工具的非動物名詞;Y為表事件、信息或時刻的名詞短語。例如,他在等機會;我在等他的電話(信、答復);汽車在等信號;士兵們等著首長下達指令。

等2與等1的區別在于,等2的釋文中沒有“X位于Y要發生的地方Z”,即處所意義,等2更強調主體對于客體的準備狀態。

等3的釋義為:X等3Y=Y自信地認為,Y需要或者涉及Y的某種事件X會在不久的將來發生。

等3同樣有X,Y兩個語義配價,但是主體X為表機會、夢想、勝利、未來、職位或結局等抽象意義的非動物名詞,而客體Y為表人的動物名詞。例如,這可能是一個新的開始,我的夢想就在不遠的地方等著我;他深信,市長的位置正等著他。

等3的意義強調Y認為事件X在不遠的將來一定會發生的主觀態度。

等4的釋義為:X在T時間等4Y=X邀請Y在某時間T做某事,X想要Y來并自信地認為,Y一定會來。

等4有X,Y,T三個配價,其中,主體X和客體Y均為表人的動物名詞。例如,明天我等你;星期六兩點我們等你喝茶。

等4與等1的區別在于:等1只是一種表示“等待”的單純動態行為,有“主體”“客體”“處所”三個配價;而等4不僅僅是一種動態行為,更強調主體期待并相信客體一定會到來的自信的心理狀態,等4通常不說“在哪里等某人”,而說“在某時間等某人”,因為其處所配價通常是被邀請人已知的信息,因此等4有“時間”配價,沒有“處所”配價。

等5的釋義為:X等5Y=X想要事件Y發生。此時“等”表示“想要、盼望”的意義。

等5有X,Y兩個語義配價,X為表人的動物名詞短語,Y多為表示時間意義的名詞短語。例如,她一生都在等著這一時刻――冠軍時刻;以前過春節的時候,人們做很多好吃的,給孩子發紅包,每個孩子一年就等這一天。

等6的釋義為:X等6Y=某種工作或事情X需要Y去做。等6的主體配價X多為表工作或事情的非動物名詞短語,客體配價Y為表人的動物名詞。例如,天亮后我起身要走,因為今天還有一部戲等著我;每個擦肩而過的人都是行色匆匆,仿佛什么非辦不可的事在等著他們。

我們把動詞“等”劃分為這六個義項的依據是:首先,通過元語言釋義我們可以看到這六個義項的意義是不同的,有細微的差別;其次,在不同義項中,“等”的配價是不同的,即使有些義項中“等”的配價相同,對主體、客體等配價的要求也是不同的;最后,為了體現詞典釋義的全面性原則,將“等”在所有用法中的意義列出來。

三、結論

循環釋義和釋義不全面的現象在詞典釋義中普遍存在,莫斯科語義學派以語義元語言做工具,以詞的義項為單位,采用包含配價變項的命題表達式形式進行釋義的方法以及系統性、全面性等的釋義原則,能夠幫助我們發現許多原來沒有注意到的詞的新義項,清晰揭示出相關同義詞、近義詞及反義詞的異同,使詞典釋義更加系統、全面、科學。由于元語言釋義法的釋文會比較長,因此這種方法可能更適用于詳解詞典或學習詞典。迄今為止,我國還沒有用類似莫斯科語義學派的釋義原則采用限量的釋義元語言進行注釋的詞典。如果借鑒莫斯科語義學派的釋義原則與方法,采用科學篩選的限量釋義元語言進行注釋,編寫一部漢語詳解詞典或漢語詳解學習詞典,無論對本國還是外國學習漢語的人來說,都會大有裨益。

附注

[1]目前對該術語(英文semantic primitive)有多種譯法:“語義基元”“語義原詞”“語義原語”“語義原子”“語義公因數”“語義單子”“語義原生意義”等,本文采用“語義單子”這一譯法。

[2]本文的漢語例句均來源于北京大學CCL語料庫檢索系統(網絡版)。

參考文獻

1.安華林.漢語語文詞典編纂理論與實踐新探.語言文字應用,2006(2).

2.李行健主編.現代漢語規范詞典.北京:外語教學與研究出版社,語文出版社,2010.

3.中國社會科學院語言研究所詞典編輯室.現代漢語詞典(第5版).北京:商務印書館,2005.

4.Апресян Ю Д. О языке толкований и семантических примитива

х.Изв.АНСССР. Сер. Лит. И яз.,1994(4).

5.Апресян Ю Д. Лексическая семантика. Москва:Наука,1974.

6.Апресян Ю Д. Новый объяснительный словарь синонимов русского языка. выпуск I Москва:Языки славянской культуры, 1997.

第5篇

語義韻律(Semanticprosody),又名語義協調、語義滲透,Sinclair在其《相信文本》(TrusttheText)中,提出將弗斯(Firth)的語音學理論中的韻律概念運用到詞語搭配上,用來觀察詞語之間的意義分享和滲透問題。語義韻律雖然是一種微妙的,近乎隱含的,又似乎還處于語感之外的語義成分,但是它卻是實實在在的存在于語言的運用之中的,能夠使語句產生一種氣氛,這對于表現說話人或寫作者的態度、傾向大有作用,是言語交際中重要的語義參與成分。同時語義韻律又是一種詞語搭配現象,是指某些詞由于經常同具有某種語義特征的語言單位共現而產生的一種語義色彩,這種色彩可能是積極的、令人愉快的,也可能是消極的,但是大多數是中性的,所以,詞匯搭配在語篇中往往會形成三類語義韻:即積極語義韻(positiveprosody)、消極語義韻(negativeprosody)、中性語義韻(neutralprosody),在積極語義韻里,節點詞(nodeword)所引的詞匯幾乎都帶有強烈的或者鮮明的積極語義特征。在消極語義韻里,節點詞搭配的的幾乎都有消極的語義特點。而在中性語義韻中,搭配的語義特征既有積極含義的詞項,也有消極含義的詞項。

語義韻律理論給對外漢語詞匯教學的啟發

1、語義韻律理論在對外漢語詞匯教學中可用于詞匯搭配教學

語義韻律研究通過語言單位間的組合關系來探討語言單位之間語義的相互影響,對確定詞匯的意義及用法具有一定的指導意義。漢語學習者在學習詞匯過程中,經常使用一些合乎漢語語法卻不地道的詞語組合,比如,很多漢語學習者會說出“挨表揚”這樣的短語運用語義韻律理論,我們不難發現“挨”一般與“罵”、“打”“批評”消極詞語搭配。如果教師在講“挨”這個詞的用法的時候,運用語義韻律理論就比較容易讓學習者理解。漢語學習者才可能在漢語詞匯搭配運用過程中,說出自然、地道符合漢語表達習慣的詞匯搭配,從而避免出現像“挨表揚”這樣符合漢語語法但不地道的異常搭配。

2、語義韻律理論在對外漢語詞匯教學中可用于同義詞的辨析

同義詞在對外漢語詞匯教學中有其特殊性和重要性,漢語中存在數量極多的同義詞,同義詞由于意義相似和重合,極易讓漢語學習者引起理解和運用的困惑,是漢語詞匯學習的一個難點。尤其是中高年級的漢語學習者經常遇到同義詞的辨析,他們經常在語言使用過程中對同義詞不能夠細致區分。傳統的詞義辨析,是對同義詞的詞目意義逐條分析。在詞典中遇到對詞語的解釋,一般用同義詞互訓解釋是很常見的現象,這種解釋對于母語使用者來說能夠“使用”,但是對于漢語學習者來說則會產生很大的麻煩。比如“挑”和“選”這兩個詞,在《現代漢語詞典》(商務印書館)里的解釋:“挑”的解釋是“挑選”,“選”的解釋也是“挑選”,所以這個解釋會讓漢語學習者很迷惑,他們可能認為這兩個詞語的意義一樣,這兩個詞也可以用在同樣的語言環境里,但是一般來說,“挑”除了和一些表示中性意義的詞語搭配外,比如“挑蘋果”“挑衣服”,還會和一些帶有消極語義韻的詞語搭配,比如“挑毛病”“挑刺”等,但是“選”這個詞一般只和表示中性意義的詞語搭配。如果使用語義韻律理論搭配則會對近義詞的辨析有一定幫助,可以避免漢語學習者在近義詞辨析過程中出現偏誤。

3、運用語義韻理論可以提高漢語學習者運用漢語的交際能力

對于中高水平的漢語學習者來說,如果他們知道漢語本族語使用異常的詞語搭配,并非是因為漢語本族語使用者語言能力的欠缺,而是為了創造一定的修辭效果、或者制造幽默效果。這類學習者,在有一定的語義韻律知識作鋪墊情況下,就能夠在欣賞漢語文學作品的時候,體會文章的修辭意味,在和中國人交流的過程中,也能夠體會到漢語本族語使用者在話語中所隱含的意思,保證交流的順利進行。漢語學習者的異常的詞語搭配與他們詞匯能力的欠缺和母語遷移有很大關系。所以教師應該鼓勵漢語學習者進行一定量的漢語閱讀,而且在學習漢語詞匯的過程中教師應該鼓勵學生用漢語詞典,而不用或者盡量少用雙語詞典,避免在詞典使用過程中出現詞語的誤導受到母語的負遷移影響。

語義韻律在對外漢語詞匯教學中的不足

語義韻律理論搭配需要進行大量的語料庫分析,甚至需要對中外語言的詞匯進行大量對比,這是一個非常復雜的工作。在國內,語義韻律是一個新興的課題,語義知識的獲得需要語言學習者從大量真實的語言材料中進行歸納。漢語學習者在學習中獲得的詞匯知識往往僅限于詞匯意義的了解,而且由于記憶力的限制,漢語學習者不可能把學習過的詞匯材料全部牢記在大腦里并進行歸納,進而去掌握詞匯的語義韻律。另一方面,語義韻律的研究尚未成熟,語義韻律的描述不能靠語言的直覺,必須借助語料庫才能使實現,這需要對語料數據庫進行觀察和分析。在詞匯教學的時候,教師可以把從語料庫檢索到的語料呈現給學生,讓學生進行觀察和分析這些語料,從而歸納出詞匯的意義、用法和語義韻知識,用語料庫進行詞匯教學,可以讓學生自己發現和了解語義韻知識,并且培養學生研究問題的能力。但是,這又會有新的問題的出現,語料庫詞匯教學在對外漢語詞匯教學中應投進多長時間?進行語料庫教學在哪個水平的漢語學習者中適用?

第6篇

【關 鍵 詞】HNC概念表述;“詞群-詞位變體”理論;同義詞群建構;詞義描寫。

【作者簡介】馮 麗,武漢大學文學院2008級博士研究生,研究方向:語言學及應用語言學。

一、引言

黃曾陽先生創立的HNC(Hierarchical

Network of Concepts)理論,用概念聯想脈絡構筑了自然語言表述與理解的理論框架。它設計了基元概念、基本概念和邏輯概念三大語義網絡以實現對抽象概念的類聚[1]。但這些概念的網絡,即使在HNC的最低層也仍以抽象概念居多,并未延伸到表達具體概念的詞語及其語義內涵。

一個完整的概念網絡不應止于抽象概念,而應該從抽象概念繼續深入,延伸至表達具體概念的具體詞語并揭示和處理語義(詞義)的所有內涵。詞語是概念的載體,語義是概念的內容。對于概念的研究需落實到詞義上。但迄今為止,揭示詞義內涵仍是一個難點。這個難點“HNC未解決,其他流派也未及解決”[2]。鑒于此,蕭國政先生提出了“詞群-詞位變體”理論,構建具體概念的同義詞群。一方面,實現具體概念的類聚;另一方面,揭示各個概念的內涵及其語義特征。以期完善語義網中詞匯語義內容的表述系統,實現HNC概念聯想脈絡到詞匯語義的延伸和對接。

本文的研究是針對HNC局部聯想——詞匯層面的聯想所進行的詞匯語義研究。這是武漢大學蕭國政先生帶領的團隊將“詞群-詞位變體”理論與HNC理論相結合的系列研究之一。

二、HNC中的概念表述系統

HNC建立的關于詞匯層面的局部聯想脈絡體現為一個概念表述體系。它將概念分為抽象概念和具體概念,并側重表達抽象概念。

1.抽象概念的表述。HNC理論通過{v, g, u, z, r}五元組(分別表示{動態,靜態,屬性,值,效應})來表達抽象概念的外部特征;用網絡層次符號來表達抽象概念的內涵[3]。例如,HNC中對“思維活動”這一概念節點的表述:

8行 思維活動

80 思考vg,思維g,想法r

800 概念r,觀點z

“思考,思維,想法,概念,觀點”都是表示“思維活動”的抽象概念。其中,字母表示各個概念的外部特征。“vg”表示“思考”這個概念既有動態性,又有靜態性;沒有“v”的都表靜態。“思維”“概念”“想法”“觀點”的區別是:“思考”“思維”是“思維活動”的起點,“概念”“想法”“觀點”是結果。在結果中,z又是r的取值[4]。即由始到終產生的效應r和結果z。

數字是HNC的網絡層次符號,它們表示抽象概念的內涵。“8”表明這些詞都是概念網絡中“8行”表“思維活動”的概念。數字相同說明概念處于同一個層級。“80”行是“8行”的下層概念。“800”所表達的概念則處于80行的下一層級,即“想法”包括“概念”和“觀點”。

可見,HNC對抽象概念的表述是內外結合,比較全面。也在一定程度上實現了對表達同一抽象概念詞語的類聚,并分層表述。但這只顯示出這些概念在網絡中所處的位置,并沒有表明其語義內涵及它們之間的意義差別。

2.具體概念的表述。由于具體概念的表現十分復雜,難以使表達規范化,所以HNC理論對具體概念不做解釋,而是采取向抽象概念的基元概念和基本概念掛靠的方法表達。例如:

上表中,p,w,pw,w9是HNC理論中用于表示具體概念不同類別的符號(P:人,w:物,pw:一般人工物,w9:現代產品)。

要表達“夫妻”這一具體概念,需將“人”這一類別掛靠到4行(關系)之下表示“結合”的概念基元411節點上。“交通工具”這一具體概念,需由“一般人工物pw”向基元概念中表示“物自身轉移”的22b概念節點掛靠,等等。

掛靠表述雖是一種粗糙和近似的表示方法,但其重要意義在于它在具體概念與抽象概念之間建立了一種關聯,并把這種關聯用符號顯性地表示出來,有利于語義距離的計算[5]。但HNC對于日常交際中常用的具體概念及其下位概念尚未涉及和標注。例如,HNC中 “交通工具”的表述:

pw22b 交通工具

pw22b9 空中交通工具

pw22ba 海上交通工具

pw22bb 陸上交通工具

[其中,22b9:空中,22ba:海上,22bb:陸上。HNC的層次符號集由0-13表示,其中,10-13用小寫abcd表示(16進制)]

這些HNC的最底層概念并未延伸到人們日常使用的具體概念(如:飛機、船、車等)及更具體的下位概念(如:直升機、戰斗機等),也未對這些概念的語義內涵進行分析和描寫。

可見,無論HNC中的抽象概念還是具體概念均需向下延伸,與表達具體概念的詞語及其語義聯系起來,才能使這一網絡更加完備。

正如黃曾陽先生所說:概念層級網絡(HNC)的設計為計算機理解自然語言的語義提供了有力的手段。當然,在工程實現上首先要完成對自然語言詞匯語義的描寫,這是一項浩大而艱巨的工程,但這個瓶頸問題跟過去相比已有了本質的不同,過去缺乏語義描寫的完備手段,現在手段已備,剩下的只是工作量的問題[6]。

要完成這個工程浩大的任務,逐個地描寫詞語的語義似乎不太現實,而如果將表達同一概念的同義詞聚合起來,分組描寫則是完成這一目標的有效途徑。“詞群-詞位變體”理論就是實現這一目標的一種指導方法。

三、“詞群-詞位變體”理論

“詞群-詞位變體”理論[7]是蕭國政先生提出的一種新的同義詞群構建理論。其目的是為了建構帶有精細詞義結構,能夠揭示具體概念的區別、聯系等語義內容的一種人機共享的詞匯語義表述系統。

1.“詞群-詞位變體”理論的主要思想。“詞群-詞位變體”理論認為:概念是無限的,但是任何一種語言用詞位表達的概念是有限的。詞位有基點詞位和非基點詞位之分,一種語言的詞義系統是以基點詞位及其變體構成的同義詞群體系。如果用∑表示詞群體系,S表示詞群,W0表示基點詞位,W1,W2,W3……Wn表示詞位變體,則它們之間的關系如下:

∑={S1,S2,S3……Sn}; S={W0,W1,W2,W3…W n}

一個面向語言知識與語言推理的特定詞義的同義詞群,一方面是一張網的一個概念節點,另一方面它又像是帶有多個觸角的局域網或子網。由一個個同義詞群構成詞群體系。這個以詞義為綱、以詞形為目的詞匯語義概念的總集合,對應的是交際及計算機信息處理中由詞表達的全部概念。

該理論之所以稱為“詞群-詞位變體”理論,是因為該理論建構詞群和詞群體系的方式和途徑是發掘和確認詞位變體,并且通過研究詞的意義構成以及意義相同、相近或類同的詞之間的關系達到這一目標。即“詞群”是由“詞位變體”所組成的集合。

2.“詞群-詞位變體”理論中的幾個概念。蕭國政先生指出:“詞位既指詞的某個基本意義與特定語音形式或文字形式結合形成的個體,也指詞的一個基本意義與不同語音形式或文字形式結合形成的若干個體的集合。”[8]即“詞位”有兩層含義。其一指作為詞匯單位的詞本身;其二指這個詞及其不同變體構成的集合。之所以認為同義詞群能夠與HNC的概念節點銜接,正是因為詞位具有個體性和集群性特點。HNC的概念節點大多表現為個體詞位(如“夫妻”),而同義詞群是集群詞位(如“夫妻”詞群)。無論是個體詞位還是集群詞位,它們表達的是同一個概念。

“詞位變體是詞位在具體被運用時所出現的一種變化形式”[9]。它在同義詞群建構中指概念義相同、所指相同,而形式不同的同義詞,也稱“變體詞位”。我們在言語中實際運用的正是詞位的各種變體。

“基點詞位”是一個能夠代表詞群概念義的詞位。其他變體詞位的發掘和確認都需以此為參照標準。因此,在建構同義詞群時,“基點詞位”宜選用現代漢語標準用語中的基礎常用詞,而不是方言詞或生僻詞。同義詞群就是以基點詞位為典型代表,以變體詞位為其成員的同義詞組成的集合。如“夫妻”同義詞群(集合){夫妻,夫婦,伉儷,伴侶,兩口子,兩公婆,老兩口,小兩口……}中,“夫妻”是基點詞位,集合中的其他成員是“夫妻”的變體詞位。

確定了基點詞位,一個同義詞群中所有變體詞位的語義內涵都可用“基點詞位+區別性特征”描寫。這可使詞義描寫大為簡化。

詞義描寫指對詞語語義構成的描寫。詞義與概念義并不完全對等。詞義包括兩部分:基本詞義和附加意義。而概念義大致相當于基本詞義[10]。因此,語義構成的描寫應包括基本義和附加義兩部分。基本義即詞群的概念義,是共性部分;附加義表示區別性特征,是一詞區別于他詞的個性差異。基本義和附加義分別描寫可清晰地顯示同義詞之間的同與異。

四、各種位義關系的同義詞群建構

具有相同的概念義是同義詞群建構基礎。根據概念的位義關系,我們可建構各種同義詞群。如果一個概念包含另一個概念,它們之間是上下位關系,我們可建構“上位同義詞群”和“下位同義詞群”;若兩個概念是并列的同位關系,則可建構“同位詞群”;當下位概念還包括分類更細的具體概念時,它們又可構成下位同義群的子詞群,簡稱“下位子詞群”。

1.上位同義詞群。本文以“夫妻”為例建構詞群。在HNC系統中,“夫妻”是末層節點。實際上,它包含下位概念“丈夫”和“妻子”。相對來說,“夫妻”是上位概念。在言語交際中,這一概念常常用其他詞語表達。我們可將概念和所指相同,表現形式不同的其他變體與“夫妻”歸入同一個詞群。

根據維基百科的解釋:夫妻或夫婦是指男性和女性經過一定儀式(婚禮)或法律程序確立婚姻后的關系。伉儷則是對別的夫妻的稱呼。古漢語和書信把自己和配偶謙稱為“愚夫婦”,把對方及其配偶尊稱為“賢伉儷”[11]。

根據上述定義,“夫妻”的語義構成可描寫為:夫妻[+男女二人+合法婚姻關系]。其同義詞有“夫婦,伉儷,伴侶,兩口子,兩公婆,老兩口,小兩口”等。由于“夫妻”一詞是現代漢語常用標準用語,既可用于口語又可用于書面語,我們以此為基點詞位建構其同義詞群。詞群中因地域、年齡、語體不同而存在的各種形式便是“夫妻”的變體詞位。這些變體都可用“基點詞位+區別性特征”描寫。如:

基點詞位及其語義構成:夫妻=[+男女二人+合法婚姻關系]

變體詞位及其語義構成:

夫婦=[夫妻+前可加丈夫名+書面語]

伉儷=[夫妻+前可加丈夫名+事業有成+可相匹敵+書面語+褒義]

伴侶=[夫妻+或夫妻一方+書面語]

兩口子=[夫妻+北方方言+口語]

兩公婆=[夫妻+南方方言+口語]

老兩口=[夫妻+北方方言+口語+老年]

小兩口=[夫妻+北方方言+口語+青年]

用“基點詞位+區別性特征”這種描寫方法,既可使描寫簡潔明了,又凸顯了各詞語之間的細微差異。如:“兩口子”和“兩公婆”的差異僅在于前者是北方方言,后者是南方方言。

2.下位同義詞群。當某個概念包含具體的下位概念時,可建構下位同義詞群。如上述“夫妻”包括“丈夫”和“妻子”兩個下位概念。

“妻子”,又叫老婆,古代又稱娘子、夫人,是男女婚姻中對女性的稱謂,與丈夫相對應。“丈夫”,又叫老公,古代又稱相公、夫君、外子,是男女婚姻中男性一方[12]。據此它們的語義構成可描寫為:

妻子[+男女+婚后+對女方的+稱謂]

丈夫[+男女+婚后+對男方的+稱謂]

“丈夫”的同義詞有“丈夫,先生,老公,愛人,孩子他爸,老頭(子),當家的,夫君,配偶”等。“妻子”的同義詞有“妻子,太太,老婆(子),愛人,孩子他媽,媳婦,堂客,夫人,賤內,內人,配偶”等。它們分別構成“丈夫”和“妻子”的同義詞群。在這兩個下位詞群中,“丈夫”和“妻子”分別是兩個詞群的基點詞位。

“妻子”的同義詞群描寫如下:

基點詞位及其語義構成:妻子=[+男女+婚后+對女方的+稱謂]

變體詞位及其語義構成:

堂客=[妻子+中南方言]

媳婦=[妻子+北方方言]

孩子他媽=[妻子+北方方言+面稱]

內人=[妻子+謙稱]

老婆(子)=[妻子+口語俗稱]

愛人=[妻子+北方方言+尊稱+愛稱]

夫人=[妻子+尊稱]

太太④=[妻子+丈夫姓](④指該詞語在《現代漢語詞典》第五版中的第④個義項[13])

“丈夫”與“妻子”是同位關系,二者的語義構成之差異僅在于“男方”或“女方”,其同義詞大致與“妻子”相對。由于篇幅所限,“丈夫”的同義詞群可參照“妻子”詞群建構,在此不加贅述。

3.同位詞群。同位詞群是由兩個以上同位關系概念構成的詞群組成的。當二者的詞群分別構建完成后,同位詞群自動產生。如“丈夫”和“妻子”詞群共同構成“夫妻”的下位詞群。

此外,“丈夫”和“妻子”這兩個同位概念還存在特殊的“同稱變體”。即無論“丈夫”還是“妻子”,它們的變體稱謂相同,如“配偶,愛人,那口子,老伴……”它們的語義構成可描寫為:

配偶=[丈夫或妻子+多用于正式文件+書面語]

愛人①=[丈夫或妻子+口語+尊重]

那口子=[丈夫或妻子+北方方言+口語+隨意]

老伴=[丈夫或妻子+老年+口語]

4.下位子詞群。從“妻子”這一概念的歷時使用情況看,其下位概念還可分出其他小類,這些小類構成的詞群稱為下位子詞群。

在一夫多妻時代,“妻子”還有“原配(元配),正室①,二房,小老婆”等稱謂。這些稱謂主要指一夫多妻制結構中,明媒正娶,有合法婚姻關系的女性配偶(妾①、姨太、陪房等不受法律保護的不在此列)。其中有的地位低于第一個“妻子”。它們的語義構成可描寫為:

原配/元配=[妻子+第一個+舊稱]

大老婆=[妻子+原配的俗稱+舊稱]

正室①=[妻子+明媒正娶+地位同原配+舊稱+書面語](正室①可以是原配,也可以是續弦,但地位如正妻。)

二房=[妻子+第二個+地位較低+舊稱+書面語]

小老婆=[妻子+第二個或以后+地位較低+舊稱+口語]

(文中①指該詞語在《現代漢語詞典》第五版中的第①個義項[14])

由于這些詞語是舊時代的產物,可稱為“舊稱變體”。需指出的是,這里的“小老婆”與現代漢語中的“小老婆”語義有較大差異。解放前,法律允許有錢人三妻四妾。“小老婆”也是明媒正娶,是法律認可的。但解放后法律規定一夫一妻制。現代漢語中的“小老婆”是不被法律認可和保護的第三者。所以,有必要說明是“舊稱”以示古今之差異。

還有一類是原配亡故后,再娶的“妻子”,如“繼室”,也稱“繼配”“填房”等。這些都屬于正妻。只是“填房多為年輕寡婦或大齡姑娘,或為翁婿關系密切,長女出嫁后亡故,以次女續配”[15]。它們的語義構成可描寫為:

繼室/繼配=[妻子+原配亡后再娶+地位同原配+舊稱]

填房=[妻子+原配亡后再娶寡婦/大齡姑娘/妻妹+地位同原配+舊稱]

以上同義詞群構建,不僅將分布零散的同義詞聚合在一起,細致地描寫了每個具體概念的語義內涵,清晰地揭示了同義詞之間的同與異。同時也清晰地繪出了“夫妻”這一概念的位義關系圖(見下圖)。

五、結語

“詞群-詞位變體”理論與HNC理論一脈相承,是HNC理論的發展和延續。這一理論指導下建構的詞群是帶有精細詞義結構,能夠揭示具體概念的區別和聯系的一種詞匯語義表述系統。與HNC中的概念表述系統形成互補。

同義詞群建構為語義內涵的揭示和描寫提供了方法。在進行詞語類聚的同時,對比同義詞,揭示了詞語的詳細語義內涵;用“基點詞位+區別性特征”描寫詞群中的各個變體,清晰地顯示了同義詞之間此義跟彼義的聯系與區別。解決了以往同義詞對比中描寫過于粗略的問題。這些不僅為詞匯語義系統的建構提供了途徑、方法和依據,而且對完成計算語言學的工具網絡與自然語言語義的對接和映射,以及建立人機共享的詞匯語義表述系統有著積極的意義。

(本研究得到武漢大學“985 工程”二期拓展項目《語言科學技術與當代社會建設跨學科平臺》《基于特征概念特征的漢語語義網的理論探索與技術實現》的項目基金資助。項目編號:985yk006)

注釋:

[1][6]黃曾陽:《HNC(概念層次網絡)理論——計算機理解語言研究的新思路》第8頁,[北京]清華大學出版社1999年版。

[2][4][10]蕭國政、肖 珊:《從概念基元空間到語義基元空間的映射——HNC聯想脈絡與詞匯語義結構表述研究》,載《華東師范大學學報》2011年第1期。

[3][5]黃曾陽:《HNC理論概要》,載《中文信息學報》1997年第4期。

[7][8]蕭國政:《動詞“打”本義的結構描寫及其同義詞群建構——一種人機共享的“詞群-詞位變體”研究初探》,載《第七屆中文信息處理國際會議論文集》第3-9頁,[北京]電子工業出版社2007年版。

[9]高名凱:《論語言系統中的詞位》,載《北京大學學報》1962年第1期。

[11][12]據http://。

第7篇

關鍵詞 術語詞典 知識組織 用戶交互 術語計算 數字出版

一、引 言

術語詞典是面向專業領域提供知識服務的重要工具。然而,現有術語詞典的編纂還存在一些問題。例如,術語詞典的知識內容大多較為簡略,主要提供釋義、英文翻譯等內容,對于深層知識的組織和描述需要提高。術語詞典的編纂自動化程度偏低,不少術語詞典的編纂仍然沿用傳統的手工方式,術語搜集、整理、分類、排版、校對流程主要由人工完成,缺乏必要的自動化輔助工具。這些簡單重復的手工勞動極易出錯而且效率低下,導致術語詞典編纂滯后于科技的發展和語言事實的變化,且難以實現資源共享。(解海江,章黎平 2010;馮志偉 2006;趙剛 2011;張愛樸 2012)如何從知識組織的角度對術語知識進行深度描述,進而設計半自動化的術語詞典編纂系統,是當前術語詞典研究領域的重要課題,無疑具有十分重要的意義。(王惠臨,吳丹,石崇德 2006;賴茂生,屈鵬,謝靜 2009)

從本質上來說,術語詞典編纂是進行知識生產的重要環節,是詞典學、術語學、圖書情報學、計算語言學等多個學科的前沿交叉領域。術語詞典編纂系統的設計首先要以知識組織為依據,準確揭示術語背后的各類知識,形成統一、規范的知識表示框架,這需要詞典學、術語學和知識組織理論的相關成果。其次,術語詞典實現半自動化編纂、提高知識生產的效率,需要積極吸收計算語言學在語料庫建設、新詞發現、術語計算等方面的成果。最后,術語詞典編纂帶有濃厚的知識工程特征,需要以工程管理的觀點,實現知識的共建共享、交互式協同與動態更新等。

本文首先對術語的知識表示框架進行描述,突出知識組織的內聚性和關聯性。再對術語詞典輔助編纂系統的功能模塊進行設計,借助知識組織科學、計算術語學、計算詞典學的成果,研究術語詞典編纂自動化的相關技術,并對術語詞典編纂中的相關機制進行討論。

二、相關研究

知識組織 (Knowledge Organization,簡稱KO)是對人類知識進行有序化處理的過程,通過一定的描述方式揭示知識之間的邏輯關系。隨著人類知識的迅猛增長,人們吸收了圖書館學、情報學、計算機科學、知識工程學、現代語言學、認知心理學等學科的成果,編制了百科全書、敘詞表、分類表、本體、術語列表等各種知識組織工具,為術語詞典的編纂提供了豐富的經驗。在國際上,國際術語信息中心TermInfo(http:∥infoterm.info)、國際知識組織協會ISKO(http:∥)等將術語與知識組織緊密聯系,召開學術會議,使術語與知識組織的結合日益緊密。

術語詞典編纂系統的設計要以知識組織為依托,形成較為規范的、半自動化的知識生產流程。術語詞典是提供專業知識服務的工具,需要對術語所指稱的客觀事物或知識內容進行深度揭示。因此,術語詞典編纂要求編者不但要有語言知識,而且更重要的是要有專業知識。術語詞典注重的是術語的概念,且以語詞來表達這些概念,一般按照主題順序排序。術語的概念范疇、范疇成員之間的關系是術語詞典研究的一個重點,術語詞典編纂以術語學和詞典學為基礎理論,應用知識組織、計算語言學的基本方法和技術,經過詞匯收集、術語規范、知識描述、知識鏈接等,形成人機兩用的知識資源。(Zeng Marcia Lei 2008;宋培彥 2012;傅愛平,吳杰,李蕓 2009)

術語詞典編纂的研究在國內外學術界得到了廣泛的關注,在理論研究和具體實踐方面取得了豐富的成果。西方國家已有大量術語詞典出版并熱銷,例如《美國國防部軍語及相關術語詞典》(U.S.Department of Defense Military Language and Related Terminology Dictionary)、《簡明牛津文學術語詞典》(The Concise Oxford Dictionary of Literary Terms)等。我國自20世紀90年代至今,已出版了《膜技術術語辭典》《涂料術語詞典》《新編美國軍事術語詞典》《英漢法律縮略語詞典》等。在此期間,還研制了一些雙語詞典輔助編纂工具,例如,商務印書館與南京大學聯合開發的“CONULEXID詞典編纂系統”、上海交通大學陸汝占教授等開發的“漢語詞典編纂一體化環境”、廣東外語外貿大學詞典學研究中心開發的“基于微觀數據結構的雙語詞典生成系統”(簡稱DICTGenerator系統)等,這些系統主要用于語文詞典的輔助編纂,一定程度上實現了編纂的半自動化,對于術語詞典的編纂也有較大的啟發意義。不過總體而言,術語詞典的知識組織架構、編纂流程和相關技術有特殊之處,需要進行深入研究。(赫迎紅 2006;王際洲 2010)

三、術語詞典知識組織結構

術語詞典的知識范圍較寬,具有較強的學科專業性特征。不同專業的術語詞典由于應用領域、編制思路、技術手段不同,其知識描述方式也有較大的差異,歸納已經出版的術語詞典可以發現,術語詞典最重要的結構元素是詞目詞及其釋義,圍繞詞目可以擴展到其他相關知識屬性。術語詞典知識組織結構模型如圖1所示。

本模型對術語知識進行結構化處理。詞典由詞條構成,詞條是詞典的基本單位。術語知識可分為五部分:詞目、同義詞、釋義、范疇和知識鏈接。下面對這些內容分別進行介紹:

(1)詞目。詞目的選擇必須覆蓋術語詞典的學科知識體系,選詞立目要受詞典的性質、規模、預定的服務對象等多種因素制約,考慮收詞的均衡性和使用頻度,提供準確、規范的專業術語。同時,術語詞典中的詞目具有語言學屬性,往往表現為詞、詞組(可以為固定搭配或自由搭配)或字符(例如:O代表氧、A72代表72號汽油)。(葉其松 2010;何瑞清 2011;亢世勇,王興隆,謝曉艷 2012)詞目是知識概念的載體,用于表示特定的專業概念。詞目一般選擇術語的規范名稱,對于部分容易引起歧義的術語可以通過注釋進行處理。為了便于使用術語,往往還需要加注外語翻譯(英語、日語、俄語、拉丁語等多個語種)。對于部分罕用的術語詞目,必要時需要注明拼音。

(2)同義詞。同義詞是指向同一概念的多個術語的統稱,在術語詞典中用“亦稱”“又稱”“又名”“亦譯”“舊譯”等來標注。一般術語詞典將縮略語也視為其同義詞。

(3)范疇。綜合性的專業詞典中標注該術語所屬的具體專業分類。例如,對于“層次分析法”這個術語,在運籌學、語言學中都有出現,但意義差別很大,可以通過術語的范疇加以區分,消除歧義。

(4)釋義。釋義是術語詞典的核心內容之一,用于對術語知識進行深度的揭示和描述,如對其形狀、構成、成分、特性、用途等進行詳細解釋。釋義主要是描述性的,通過下定義、舉例子、畫圖表等方式,對術語的內涵和外延進行描述,幫助用戶了解術語的知識內容。對于不便用語言描述的定義,可以通過圖片、表格等進行詮釋,幫助用戶掌握術語知識。

(5)知識鏈接。在電子詞典和網絡詞典中,術語之間的相互鏈接更為便利,可以將具有相關性的各類知識點進行有效的關聯,幫助用戶進行知識發現和查閱,例如圖片、圖表、公式、音頻、視頻等可以用更專業、更形象的方式進一步揭示術語知識。在網絡環境下,術語鏈接具有更強的動態性特征,基于語義實現跨領域、跨介質的知識關聯。

采用上述術語知識描述結構,可以形成人機兩用的知識資源。它將傳統的非結構化的文本信息轉換為以詞條為核心的樹形結構,清晰顯示數據結構各個部分的關系,為術語詞典的描述提供了一個相對統一的模型,這就為術語知識的共享和術語詞典輔助編纂系統的研制提供了相對穩定的框架。例如《膜技術術語辭典》的詞條“鎳鐵蓄電池”:

鎳鐵蓄電池 nickeliron accumulator;Edison accumulator

又稱愛迪生蓄電池。堿性蓄電池的一種。負極為鐵,正極活性物質為氧化高鎳,以金屬鎳為導電材料,30%氫氧化鉀水溶液為電解質。電池中反應為:

Fe+Ni2O3+3H2OFe(OH)2+2Ni(OH)3

工作電壓約為1.3V;實際能量密度10~20(W?h/kg)。廣泛應用于汽車、電車和實驗室等方面和啟動、牽引動力。

轉換為樹形結構表示,如圖2所示。

四、系統總體設計

術語詞典輔助編纂系統是進行詞典編纂的技術平臺,包含了術語收集、審核、更新維護等傳統功能,實現無紙化的數字出版,提高術語詞典的質量可控性。(章宜華 2004,2007;Landau 2001)借助網絡環境下的海量文獻資源和計算機自動處理技術,實現術語的半自動挖掘、推薦和更新,有利于縮短詞典編纂周期、降低詞典編纂成本、減輕專家工作強度、提高術語詞典質量。同時,采用用戶交互機制,使專家的主導作用與普通用戶的廣泛參與相結合,實現在線、實時的知識互動,將知識生產過程從封閉式的、少數精英模式擴展到開放的、普通大眾模式,有利于增強詞典的用戶體驗,形成良性的互動編制模式。

系統以流程管理為主導,以語料挖掘與術語計算、用戶協同與交互為支撐,主要包括詞條采集、詞條編審、詞典生成、詞典更新、語料管理、語料挖掘、工作管理、用戶協同與交互模塊等。如圖3所示。

(1)流程管理。包括詞條采集、詞條編審、詞典生成和詞典更新四個模塊。系統中涉及詞條采集人員和各級編審人員、學科專家,可以根據權限進行控制。詞條采集主要是錄入詞條的所有信息,包括詞形確定、范疇、拼音、外文、釋義等,在詞條提交到一審之前,采集人員具有添加、刪除、修改詞條的權限。詞條編審包括一審、二審、三審,這三個級別是循環迭代的過程,本層次審核不合格的詞條可返回上一級修改,也可在本層自行修改,但是三審(三審人員具有專家級別)后的數據不允許任意修改,作為最終信息存入術語詞典數據庫中作為詞典腳本,經過人工校驗合格后可自動生成術語詞典批量出版。

(2)語料挖掘與術語計算。語料庫是以一定的標準存放真實存在的語言材料,可采用專業文獻數據庫、學術網站等為基礎制作語料庫,為術語詞典編纂提供資源。語料管理指對語料庫中的語篇文本、例證數據、聲音數據、圖形文件等進行系統管理,對語料文件進行導入、轉換、入庫、導出、瀏覽、查詢、編輯、備份存儲及更新等操作,由于在術語詞典數據庫中的正文均以句子為記錄單位,語料管理還可以對原始數據進行詞頻統計,為詞目的確立提供可量化的數據基礎。術語計算技術是術語詞典編纂的重要技術手段。例如,采用機器學習方法,從語料庫中自動發現新詞,為編纂人員推薦新的術語語詞;以可視化的手段監測術語的流通度,通過統計詞頻及語詞的生命周期,推薦規范的術語語詞作為詞典立目參考,以可視化方式(縱軸為頻率,橫軸為使用生命周期)的形式顯示出術語的使用規律;利用計算同義詞模塊自動識別詞目詞的同義詞,供人工參考選取合適的同義詞。

(3)用戶協同與交互模塊。術語詞典編纂是一項復雜的知識工程,需要眾多的專業人員參與。Web2.0技術為實現用戶之間的交互和協同工作提供了便利條件。用戶(專家用戶或一般用戶)可以為術語詞典補充新概念、新術語,或糾正詞典中的問題術語信息,經由編審人員審核后及時修改。用戶協同與交互模塊為用戶提供了開放的平臺,將大眾智慧融入到詞典知識的生產過程中。

五、結 語

術語詞典編纂需要較為通用的知識組織模型,為詞典編纂系統的設計提供框架。進而,將知識組織研究中的用戶交互、動態更新、術語計算等理念引入到詞典編纂過程中,設計具有半自動化功能的術語詞典輔助編纂系統。這種設計將流程管理、術語計算、用戶交互等進行適度的融合,有助于提高術語詞典編纂的質量和效率。將現有的專業文獻數據庫作為粗語料庫,方便編纂人員進行詞匯選擇、量化分析和知識抽取,提高工作效率。將詞典數據按照知識組織的語義結構進行多維鏈接,形成多媒體表現形式,幫助用戶理解不同概念之間的關系,提高知識學習效率。加強術語計算、科技語料庫建設等方面的研究,形成面向術語的自動處理方法和技術,是需要進一步加強研究的課題。(張東,王惠臨 2010;馮志偉 2008)

參考文獻

1.馮志偉. 術語學中的概念系統與知識本體. 術語標準化與信息技術,2006(1).

2.馮志偉. 一個新興的術語學科――計算術語學. 術語標準化與信息技術, 2008(4).

3.傅愛平,吳杰,李蕓. 漢語語文詞典的詞條結構模型. 辭書研究,2009(2).

4.赫迎紅. 淺談大型漢英詞典的詞條和義項設立. 辭書研究,2006(2).

5.何瑞清. 術語多元化、通俗化的限度與詞典編纂的對策――以“法人”英譯名為例. 北京:術語標準化與信息技術,2011(4).

6.亢世勇,王興隆,謝曉艷. 我國計算機輔助詞典編纂系統初步調查研究. 辭書研究,2012(3).

7.賴茂生,屈鵬,謝靜. 知識組織最新研究與實踐進展. 圖書情報工作,2009(2).

8.宋培彥. 術語知識表示模型研究. 情報理論與實踐, 2012(8).

9.王惠臨, 吳丹, 石崇德. 語言技術和知識技術――知識服務的重要技術基礎. 圖書情報工作,2006(9).

10.王際洲. 專業術語詞典編輯的幾點思考――以軍事術語詞典為例. 科技信息,2010(32).

11.解海江,章黎平.詞典編纂理念的二度轉向. 辭書研究, 2010(6).

12.葉其松. 術語、專業詞匯與詞典. 辭書研究, 2010(2).

13.張愛樸. 從《新編英漢語言學詞典》的編纂看專科詞典學的重要性. 辭書研究,2012(1).

14.張東,王惠臨. 關于建立中國國家科學技術語料庫的思考. 圖書情報工作,2010(6).

15.章宜華. 計算詞典學與新型詞典.上海:上海辭書出版社,2004.

16.章宜華. 關于計算詞典學理論框架的探討. 辭書研究,2007(6).

17.趙剛. 略論國內大型漢英詞典編纂和出版中的一些問題. 編輯之友,2011(4).

18.Landau S L.The Art and Craft of Lexicography. Oxford:Oxford University Press,2001.

19.Zeng Marcia Lei. Knowledge Organization Systems. Knowledge Organization,2008(2―3).

(宋培彥,李靜靜 中國科學技術信息研究所信息資源中心 北京 100038)

第8篇

1、拼讀記憶法

根據單詞音標的音節記單詞,即在學習英語單詞時,我們首先從元音著手,找出所學單詞有幾個元音字母組合,分別發什么音,再根據輔音字母的發音,以及在單詞中的拼讀規則。這樣根據音節去記字母,根據字母去記單詞。例如:December一詞中,有三個元音字母,都是e,前一個字母發[i],率二個發[e],最后一個e與r構成字母組合er發[?],因此,我們就可以這樣去記De[di]---cem[sem]---ber[b?]December[di'semb?]

2、分類記憶法

將同音詞、同義詞、反義詞等收集在一起,同時背記。

①同音記憶,即同音異形詞,如:father(父親)---farther(較遠的);son(兒子)---sun(太陽)等等。

②同義詞記憶,如:ask,beg,request,hope,wish,want等等。記憶同義詞時,還要記住它們的區別。

③反義詞記憶,如:take---bring,clever---dull,close---open等等。

3、聯想記憶法

就是通過原有的信息產生聯想,形成一串一串的記憶,如:由coat相到所有衣著類的單詞;由orange想到水果類及顏色單詞;由rice想到食物類的單詞;由book想到文具類單詞;由bike想到交通類單詞;由Monday想到星期、月份、年、季節等單詞;由hand想到有體各部位器官;由can想到所有的情態動詞及其用法等,如此種種。

4、構詞記憶法

掌握一些構詞法知識,可以大大地增加自身的詞匯量。英語構詞法主要有以下三種情況:

①派生法。如常用的前綴in-,im-,un-,dis-等表示否定含義:possible---impossible,like---dislike;后綴-er,-or,-ist等表示人:teach---teacher,visit---visitor;后綴-y,-ly,-ful等表示形容詞詞性:cloud---cloudy,use---useful等等。

②復合法。如:black(黑色的)+board(木板)blackboard(黑板),class(班)+room(房間)classroom(教室)等。

③轉化法。如:water(n.水)water(v.澆水),lift(v.舉起)lift(n.電梯)等。

5、詞組記憶法

在英語中詞組的使用比較廣泛,很多都是固定搭配,只有少數的單詞跟不同的單詞搭配構成不同意義的短語,這就需要善于積累,掌握其不同詞義的不同用法。如:take away,take back,take in,take off,take over, get up, get off, get into…;let in, let town, let out, let off等等。

6、歸納對比記憶法

如在講授序數詞時,把阿拉伯數字1-13寫在黑板中間一列,讓學生將相應的基數詞寫在左邊,右邊相應地學一個序數詞就寫一個序數詞,并在旁邊寫出相應的縮寫形式。

one 1 first 1st

two 2 second 2nd

three 3 third 3rd

four 4 fourth 4th

five 5 fifth 5th

… … … …

然后在對比中找出規律,進行歸納:在基數詞與序數詞的對比記憶中,只有幾個特殊的序數詞,如:first,second,third,fifth,twelfth,twentieth….ninetieth,(即從二十起至九十整十的序數詞改y為i加eth構成序數詞),而其他都是在基數詞后加-th。

7、朗讀記憶法

即通過反復朗讀,按照讀音規則記憶單詞。如:bike(自行車),shop(商店)等詞符合讀音規則,通過反復朗讀就能記住。有些詞也可通過閱讀英語文章、小說等來記憶,但要注意難度要適宜。這樣不僅培養語感,而且能為聽、說、寫等打下基礎。

8、勤查詞典法

第9篇

關鍵詞:搜索引擎;推薦;系統

中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)22-5370-03

基于社會計算的個性化推薦系統的搜索引擎是系統開發的一個重要環節,該搜索結果質量直接關系到系統的性能,從而直接影響到系統的整體性能。本系統中解析的文檔類型以html文檔為主,采用Lucene搜索引擎,獨立于運行平臺的方式,實現了文檔的解析和索引的創建。

1 Lucene搜索引擎簡介

1) Lucene

Lucene 是一個出色并且是開源的全文搜索引擎。他并不是一個完整的全文檢索應用,但是它提供了大量的 API ,可以方便能夠高效快捷地地對全文創建索引,最主要的是,他可以對現有的在各種各種的系統增加全文檢索的功能,官方也一直維護、更新版本,使用越來越方便,深受廣大編程者和用戶的青睞。

Lucene是一個高效的、 可擴展的全文檢索庫, 僅支持純文本文件的索引(Index)和檢索(Search), 并不處理從其他格式的文件中抽取純文本文件, 或從網絡中抓取文件。簡單地說, Lucene實現兩個功能,分別是索引和檢索。索引所做的工作是為各種各樣的文檔構建Lucene 所能夠識別的索引文件。

Lucene作為一個非常優秀并且開源的全文搜索引擎,不僅性能高,架構清晰,擴展性強,而且其建立索引后的文件格式也獨立于應用平臺,從而使索引文件能夠跨平臺共享,對任意可轉換為文本格式的數據都能夠進行索引和搜索。例如html網頁、本地中的ppt,txt,pdf等等都可以對其建立索引。

首先, Lucene集成了多種文檔解析器, 能夠對大部分主流文本文件 如:html, pdf, MS Word, Text File等等進行解析, 抽取純文本內容。由于Lucene只能索引純文本, 所以必須借助于上述各種不同功能的解析器對各種不同類型的文檔進行解析。

然后, 使用Lucene的分詞器(Analyzer),對提取出的純文本內容進行索引, 并生成索引項,以供做搜索之用。

最后, Analyzer把生成的信息寫入索引文件之后。搜索所做的工作是使用反向索引找出與用戶請求相匹配的文本內容并返還給用戶。 因為,Lucene 默認情況下不對用戶輸入的搜索關鍵詞進行分詞處理。所以,這部分不重點討論搜索的內容,相關內容在下面的章節中講解。

2) 引擎結構

Lucene搜索引擎對系統的要求不高,既可以運行在Windows系統上,也可以運行在Linux系統上。搜索引擎使用的一般是集中式。把多個服務器的網絡資源通通下載到本地,目的是為建立索引和文本搜索做準備,這就是集中式的處理方法。如果按照按結構分,Lucene引擎結構可由搜索器、 索引器和檢索器等組成。

搜索器就是網絡機器人(網絡蜘蛛)。利用這種爬蟲程序,在遵從機器人排除協議的前提下,從某個網頁開始,提取URL網址,如此循環,不斷地提取到新的 URL 網址,同時取出相應 URL 的資源。

索引器的則是利用下載的到的各種網絡資源,提取各種資源的索引項,為生成文檔庫的索引表做準備。

檢索器主要任務是通過辨識用戶的查詢需求,在文檔庫中進行快速匹配查找并且檢索出相應的文檔,之后就是對文檔進行相關性排序,并提供一個網頁鏈接供用戶操作。所以,,一個出色的搜索引擎如果把這三個部分都做得好,用戶的使用需求就一定可以得到滿足。

3) 解析網頁和索引入庫

把網頁中的元素標記( Token) 及其標記之后的內容提取出來,目的的是利于入庫,這就是網頁的解析。一個字段都要有一個Token與之相對應。可以理解為此字段的內容就是Token 的內容。

使用的實現方法:自定義一個 Parser 解析類,接著實現網頁文件流的讀入,然后把這個流解析成以字符串格式輸出,為下一步處理做準備,最后循環提取 Token 及其相關內容。提取每一個Token 的目的是給不同的 Token 加上不同的權值。這樣在搜索出結果的時候,就可以根據不同的權值來排序。提取 Token便可以入庫:

2 Lucene分詞器

1) Lucene分詞簡介

lucene將關鍵詞出現頻率和關鍵詞出現位置分別作為詞典文件(Term Dictionary)、頻率文件(frequencies)、位置文件 (positions)保存。其中詞典文件不僅保存有每個關鍵詞,還保留了指向頻率文件和位置文件的指針,通過指針可以找到該關鍵詞的頻率信息和位置信息。

Lucene特點是關鍵詞是按字符順序排列的,其內部沒有集成使用B樹結構,所以可以用二元搜索算法快速定位Lucene的關鍵詞。

Lucene中也使用了field(域)的概念,用于表達信息所在位置。如標題、內容、url等等。需要指出的是這些域(field)是可以自定義設置的。在索引文件中,每一個field(域)的信息也記錄在詞典文件中,每個關鍵詞都有一個field信息,因為每個關鍵詞一定屬于一個或多個field。 關鍵詞沒有在field(域)中出現,就意味著用戶想要找的內容沒有出現在數據庫中。

為了減小索引文件的大小,Lucene對索引使用壓縮技術。首先,對詞典文件中的關鍵詞進行了壓縮,關鍵詞壓縮為,例如:當前詞為“廣東省東莞”,上一個詞為“廣東省”,那么“廣東省東莞”壓縮為。

其次大量用到的是對數字的壓縮,數字只保存與上一個值的差值,目的是減小數字的長度,進而減少保存該數字需要的字節數。例如當前文章號是1279(不壓縮要用3個字節保存),上一文章號是1273,壓縮后保存6(只用一個字節)。使用壓縮技術的好處就是提高搜索的速度和效率。需要指出的是,Lucene3.5版本后,不需要手動處理索引文件,當索引的文件大到一定的程度之后,Lucene會自動的壓縮索引文件。

2) Lucene分詞原理

a. 建立倒排索引。同時記錄關鍵詞在文章中出現頻率和出現的位置。如何用普通的順序匹配算法,不建索引,而是對所有文章的內容進行字符串匹配,這個過程將會相當緩慢,當文章數目很大時,時間往往是長到無法忍受的。

b. 獲得文章/記錄中的關鍵詞,并對關鍵詞進行處理。如:lives,livinglive

3 IKAnalyzer分詞器

1) IKAnalyzer分詞簡介

對信息進行索引前,需要要對關鍵詞進行分詞。英文使用空格和標點來分隔單詞 而中文使用表意文字,不能通過空格和標點來進行分詞。Lucene 自帶的分詞器,有StandardAnalyzer, StopAnalyzer ,SimpleAnalyzer,WhiteSpaceAnalyzer。這些分詞器要么是單字分詞 要么采用停用詞分詞,要么采用簡單的分詞,要么是按空格分詞。

但是,它們并不能有效地解決中文分詞的問題。目前中文分詞算法工具包大致包括paoding、imdict、mmseg4j、IK。其中最常用的是IKAnalyzer,下面我大致介紹一下這個中文分詞器,結構圖1所示。

2) IKAnalyzer特點

IKAnalyzer支持多子處理器語言分析模式:中文、數字、字母,并兼容日文、韓文。它采用“正向迭代最細粒度切分算法”的算法,支持細粒度和最大詞長兩種分詞方式,速度最大支持80W字/秒,即1600KB/秒。此外,它擴展lucene的擴展實現,采用歧義分析算法優化查詢關鍵詞的搜索排列組合,提高lucene檢索命中率。同時,它具有較小的內存占用,優化詞庫占有空間,用戶可自定義擴展詞庫。

IKAnalyzer由org.wltea.analyzer.IKSegmentation和org.wltea.analyzer.lucene.IKAnalyzer兩大主要類組成,其中,org.wltea.analyzer.IKSegmentation是IK分詞器的核心類,真正分詞的實現類。而org.wltea.analyzer.lucene.IKAnalyzer則是IK分詞主類,基于Lucene的Analyzer接口實現。

4 基于Lucene的IKAnalyzer分詞器

1) paoding、mmseg4j和IKAnalyzer

目前流行的幾大開源分詞器主要有:paoding、mmseg4j、IKAnalyzer,它們三個都是基于JAVA語言開發的,各有優劣,具體如下:

mmseg4j:有兩種分詞方法,Simple和Complex,目前 complex 1200kb/s左右,simple 1900kb/s左右,但內存開銷了50M左右。采用MMSeg算法,代碼復雜度是2500行左右代碼。有英文文檔,原理比較簡單。有自帶搜狗的詞庫,支持自定義詞庫,不支持自動檢測。 自帶詞庫16W個。Lucene和solr的支持:支持Lucene2.4、solr1.3。

Paoding:采用基于“不限制個數”的詞典文件對文章進行有效切分算法,使能夠將對詞匯分類定義,代碼復雜度是7000行左右代碼。1秒可準確分詞100萬漢字。支持不限制個數的用戶自定義詞庫,自動檢測詞庫的更新。自帶詞庫22W個。

IKAnalyzer:每秒80W字。采用正向迭代最細粒度切分算法,代碼復雜度是4500行左右代碼,有一個中文使用手冊,支持自定義詞庫,不支持自動檢測。 自帶詞庫27W個。

根據上面介紹,結合本系統特點,本系統采用基于Lucene的IKAnalyzer分詞器。

2) 自定義同義詞分詞器

Lucene分詞機制:索引過程和查詢過程都用到了一個關鍵工具分詞器analyzer。它將要被索引的內容以流的形式讀入,經過詞語切分、過濾干擾詞等一系列處理,最終輸出一個語匯單元流、每個語匯單元攜帶了一個文本值和它的一些元數據,原文本從起點到終點的偏移量、語匯單元類型和position incremen。

同義詞索引原理:索引器將語匯單元寫入文件時會丟棄每個語匯單元的起點偏移量和終點偏移量。位置增量是語匯單元攜帶到索引文件的唯一附加元數據。這個值的意義是當前單詞與前一個單詞的位置偏移量。當這個值為 0 是表示當前單詞與前一個單詞被索引到同一個位置上。但是 Lucene 對中文語言處理能力十分有限,無法中文語義分詞只能將一句話機械性的分成單字或雙字 。例如: 用單字分詞會將“我來自廣東” 切分成 :“我” “來” “來” “自” “廣” “東”。顯然,這種情形為每個字添加同義詞索引是沒有意義的 因此 需要一個功能更強大的中文分詞器來支持。

本系統采用堆棧的形式來保存同義詞的詞組或單詞。如(“中國”,“大陸”),(“我”,“咱”)等等都可以是同義詞。自定義同義詞分詞器使用四個類來實現。

MyDefinedSameAnalyzer類主要是加載的搜狗中文分詞器。使用棧來定義過濾器是MyDefinedSameTokenFilter類。DefinedSamewordEngine類是一個接口,使用接口有利于程序的擴展。DefinedSimpleSameword類是定義同義詞字典,并判斷如果有同義詞就返回true

3) 自定義停用詞過濾分析

在關鍵詞處理過程中,有可能會經常出現沒有意義的詞。如,“是”,“來”等等。除此之外,停用詞分析器StopAnalyzer也已經把沒有意義的英文單詞收錄到停用詞表中。默認情況下,這個表被用來濾詞用戶輸入關鍵詞中的詞匯,還可以過濾掉一些特定字符,如&,*等,也會把英文的大寫字母自動轉換成小寫字母。

還有就是,當搜索系統需要屏蔽掉一些用戶輸入的中文敏感詞的時候,就得把敏感詞自動的過濾掉。這個時候就得使用lucene強大的停用詞分析器。由于Luene自帶有停用詞分析器StopAnalyzer,這使得要過濾掉停用詞就變得非常簡單。而且使用Lucene3.5的版本,也支持中文分詞。

自定義一個停用詞表就可以過濾掉自己設定的中文或者英文的敏感詞。默認情況下,Lucene會把系統自帶的英文停用詞加載在停用詞分析器中。TokenStream讀流屬性中的數據即讀出數據。另外,停用詞分析器StopAnalyzer自動把數字給過濾掉了,所以要實現數字的搜索需要經過特別的處理。具體的處理過程可以參考GxjtController類的searchcont( )函數的代碼部分。

為了實現該功能,搜索的關鍵詞要先經過過濾器處理,再經過同義詞的處理。

參考文獻:

[1] 馮斌.基于 Lucene 小型搜索引擎的研究與實現[D].武漢:武漢理工大學,2008.

[2] 楊馥顯,劉嘉勇.基于JSP的數據庫開發技術研究[J].通信技術,2011,44(3):51-53.

第10篇

關鍵詞:高興;快樂和開心; 對外漢語;同義詞教學

在漢語本體研究中,語言學家從不同的角度對同義詞進行過研究,有關于同義詞定義界定的研究,有關于同義詞辨析方法的研究,也有關于同義詞和近義詞區別的研究。(劉叔新,1987)認為,同義詞,就是指詞的意義相同或意義相似(近)的詞。(石安石1961)認為,同義詞,正確地說,應該是概念相同但詞義有所不同的詞。而在語言學界把同義詞的界定分為廣義和狹義,廣義上的“同義詞”是意義相同或相近的詞,這包括等義詞和近義詞;而狹義的“同義詞”僅指意義相近的詞,只包括近義詞(黃伯榮、廖旭東,1999)。

一、本文同義詞的界定

同義詞是現代漢語詞匯中一種非常特別也十分重要的詞,無論在漢語本體研究或者教學中還是在對外漢語詞匯教學過程中,同義詞都有著重要的作用和意義,歷來同義詞的研究和教學也是一個富有爭論的熱點話題。本文采用《現代漢語》第五版黃伯榮、廖序東先生的定義作為標準和參照:意義相同或相近的詞組成的語義場叫做同義詞場,同義義場中的各個詞叫做同義詞。根據這個定義,我們可以知道,只要有一個義項相同或者相近,我們都可以把它們稱為同義詞。如“高興”、“快樂”、“開心”這三個詞,在“一種興奮的、愉快的感情”這個義項上可以處于同一同義義場,我們可以把這三個詞歸類為同義詞。

二、“高興、快樂和開心”句法、語義分析

“高興、快樂和開心”這三個詞都可以表示一種高興、愉快的情感,在漢語中很多情況可以通用,但是對于留學生來說,要掌握好這三個詞的用法十分困難。首先我們來看《現代漢語詞典》(第5版)中對這三個詞的定義:

【高興】

①形:愉快而興奮。聽說你要來,我們全家都很高興。

②動:帶著愉快的情緒去做某件事;喜歡。他就是高興看電影,對看戲不感興趣。

【開心】

①形:心情快樂舒暢。大伙兒在一起,說說笑笑,十分開心。

②動:戲弄別人,使自己高興。

【快樂】形:感到幸福或滿意:快樂的微笑;祝您生日快樂。

(一)句法上區分

《現代漢語詞典》(第五版)對“高興”有兩種詞性標注,一種是用做形容詞,一種用做是動詞;對“開心”標注也是兩種詞性;而“快樂”只有一種詞性。動詞的語法功能是做謂語和狀語為主。作為動詞的“高興”表示的是情感、意向的心理活動或心理狀態,稱為心理活動動詞。“高興”通常后面會有具體的事情或者一次經歷。如:“他就是高興看電影,對看戲不感興趣。”

這個句子,“高興”修飾后面的動詞“看”,表示一種心理活動狀態或者是一種情感的使然。從語法上來說,作為動詞的“高興”后加動詞做狀語,修飾后面的動詞。如:小明高興看書,對上網沒有興趣。

“開心”做動詞的時候帶有一種貶義色彩,帶有一種不好的意味,蘊含一種調侃的語氣。如: 不要拿他開心了, 他什么都不知道。

“開心”用做動詞,也是做不及物動詞,后面不能帶賓語,一般加“了”或者“的”這樣的語氣詞,表示一種語氣,不像“高興”后還有動詞,動詞后面還有賓語成分。而“快樂”就沒有動詞這一詞性。

所以從動詞的角度來看,就非常容易區分,“高興”指的是一種好的事情或者經歷,而“開心”做動詞后面經常指的是一些不好的事情或者經歷,通常帶有一種調侃的語氣,“快樂”不能用作動詞。

再看三個詞做形容詞,形容詞的功能就是充當定心結構的定語、謂語或者補語。這三個詞都可以做定語,如:

他不抽煙,不喝酒,偶爾遇上高興的事情,便喝幾口啤酒。

每周兩次與家人聚會,也是最開心的時刻。

幼兒期是各種能力發展的關鍵期,成人要為幼兒創設能充分表現自己和體驗成功快樂的機會與條件。

例句都是做定語的情況,似乎不能區分它們之間的不同,彼此之間都可以互換,也就是說從語法角度形容詞詞性上很難區分它們的不同,因為這三個后都可以接名詞做定語,表示一種好的情況或者事情。所以區分這三個詞,需要從語義角度進行細致分析。

這三個詞除了可以用做動詞、形容詞,還有可以用做名詞的情況。

生活處處有快樂,讓我們一起尋找快樂、探索快樂、擁有快樂吧。

我不想讓別人看見我的痛苦,只想讓他們看到我的快樂。

上面這些句子中,一般不用“高興”和“開心”,經常用“快樂”,這些句子中的“快樂”都是用做名詞,這些句子“快樂”表示一種抽象的東西,有一種名物化的趨勢。

(二)語義上分析

從語義上,這三個詞都可以歸為“高興”類,表示一種興奮喜悅的情感。根據心理學理論,高興是“盼望的目的到達后繼之而來的緊張解除的情緒體驗”。留學生也會經常用到這三個詞,也會經常出現錯誤,語法上很好區分,而真正在語義上的不同,是導致他們出現錯誤的原因。

在《(漢語水平) 詞匯等級大綱》中“高興”屬甲級詞,“快樂”屬乙級詞,“開心”屬于丙級詞匯。留學生最先學習的是“高興和快樂”,而在漢語實際的運用中也是“高興和快樂”比較常見。但是,在學習過程中,留學生經常會出現下面這樣的偏誤:

那時候,我一邊快樂,一邊擔心。(高興)

我對聽流行歌曲的看法是贊同的,因為音樂可以給人帶來高興。(快樂)

見到你我很快樂。(高興)

這三個句子,在句法上都是正確的,但是在語義上有同。第一句有“那時候”這個時間節點,表示一時的感情,應該用“高興”,而第二句做“帶來”的賓語成分,只能用“快樂”,而第三句表示見面時的問候語或者打招呼,只能用“高興”。例如:

他認為經商是一種很好的職業,因為經商可以過正經而快樂的生活。

他們很逗,總是用活潑快樂的心情面對人生。

上面這些句子“生活、心情”,這些對象都是一些抽象的、表示一段持續時間比較長的一種狀態或者感覺,只能用“快樂”而不能用其他的兩個詞。而“高興”出現的語言環境如下:

他經常露出不高興的表情、不理采別人、諷刺、挖苦別人。

他臉上流露出高興的神色。

我們可以看出,上面這些句子,“高興”后面所修飾的“表情和神色”都是一個短暫的時間里呈現出來的狀態,沒有持久性。“高興”還有另外一種用法,一般用做交際禮貌用語、問候語、慰問和國際交流,或者初次見面,或者演講講話中,表示一種欣慰和內心深處由衷的發自內心的感情,當然這種感情也是短暫性的,同時,這也是一種比較正式的場合用語,表示一種友好和對彼此的尊重。如下面的例子:很高興見到你,很高興認識你。

“開心”這個詞屬于丙級詞匯,對留學生來說,接觸的比較晚,更多的出現一些口語交際中,大部分用于過去發生的一些事情,對過去的事情一種心理感受。

在公司發展中最開心的一件事情是什么?

每次因為父親的工作調動而轉學的時候就是我最開心的時候。

上面這些句子,“開心”表示是對過去的事情一種心理的感覺,現在回憶起來心情很好,當然這種感覺可以是短暫性的也可以是持續性的。

三、偏誤的分析和教學策略設計

我們可以根據留學生的習得情況進行分析,然后進行教學方法策略的設計,更好地讓學習者,盡快掌握學習好這三個詞的用法,能夠正確的運用到實際交流中去,真正學會它們。

學習者混淆這些詞語的原因是多方面的,其中一個主要原因可能他們根本沒有意識到這些詞語存在語義差異,這個才是關鍵點。我們來看下面的例子:

我很寂寞的時候,常常想起我很高興的家庭。

現在,他沒有以前那嚴格了,一般都是高興的父親。

上面二句話中的“高興”應該換成“快樂”。后面所修飾的“家庭”和“父親”所呈現出來的狀態應該是持續性的,而不是一時的,所以應該用“快樂”更加合理。而留學生剛學漢語,可能不明白時間長短所帶來的一些變化和影響,他們只知道這兩個詞都是表示一種很好的心情或者事情。根據上面的分析,“高興”表示是短時間內產生或者帶來的結果。

根據“高興”和“快樂”的句法分析和語義分析及出現的語言環境,我們可以在教學過程設計一些教學策略和方案。

首先上,在意義上認識這兩個詞最基本的意思,有一個感性的認識和理解。第一步我們可以給出這兩個詞在漢語中最常見的例句用法,在例句中去理解和體會:

快樂的生活 祝你生日快樂很高興認識你 高興的樣子

根據上面的語義分析,“生活、人生”都是一種長期時間才能看到或者感受到的事物,屬于持續時間段的感情,而“生日快樂”這種用法屬于漢語語言特有的一種祝福語,這樣的習慣表達和“高興”的用法,“很高興認識你”類似,表示一種初次見面打招呼的用法,而“高興”的其他用法“樣子、表情”都是說話人當時產生的一種感情或者呈現出來的狀態。所以這兩個詞首先可以告訴學習者,從時間長短來分析,長時間就是“快樂”,短時間用“高興”,這樣比較容易接受。了解了一些最常見的用法和表達之后,我們可以通過更多的練習加以鞏固。

從意義和常見的用法上分析了解了“高興和快樂”的區分之后,我們來看“開心”,“開心”對第二語言學習者來說是一個很晚才學習的詞,同樣我們可以給出一些關于“開心”的常見搭配短語:

玩得開心 一件開心的事情 開心的時刻

“開心”一般用于一件比較具體事情或者經歷上,大部分都是發生在過去的事情,也是立足于一個時間點。如:

那是她十余年來最開心的一次。

賽后她得意地說:“這是我打得最開心的一場球。”

這些句子都是表示發生在過去的事情,所以我們在教學過程中告訴學習者,一般表示發生在過去的一件事或者一種經歷用“開心”。

基于上面從句法、語義和語用上對“高興、快樂和開心”三個詞進行了一些分析和對比,同時結合漢語同義詞辨析的方法和角度,我們可以在教學中設計一種教學方法模式:

(一)意義上進行分別分析論述:“高興”表示一種即刻產生的感情狀態,“快樂”是一種長時間可以持續的感情狀態,“開心”一般表示發生是過去的一個時間點上的感情狀態。

(二)句法成分上:三者都可以做形容詞,“開心和高興”還可以做動詞,“快樂和高興”還可以做名詞。

(三)時間節點上:高興:現在(短時間);快樂:過去、現在、將來(長時間);開心:過去(短時間、長時間)

四、結論

本文對“高興、快樂和開心”從基本的語法、語義和語用等方面進行了一些大致的分析和比較,得出了一些基本的教學和習得方法。要想更好的教好漢語詞匯,讓學習者更好更快的學會這些同義詞的用法,掌握它們之間的區別,需要將本體研究和對外漢語教學實踐結合起來,做到相互融合,本體研究給教學提供理論支撐,教學實踐中發現一些新的問題,再運用本體的知識去解決,最后做到相得益彰,真正促進對外漢語詞匯教學的發展和進步。

參考文獻:

[1]黃伯榮,廖序東.現代漢語[M].北京:高等教育出版社,2011.

[2]孫德金.對外漢語詞匯及詞匯教學研究[M].北京:商務印書館,2006.

[3]周琳.CSL學習者“高興類”形容詞混淆特征及探因―以“高興、快樂、愉快”為例.

第11篇

 

外來詞、古詞與詞義的保守性英語詞匯具有“世界性詞匯”

 

的特點。這主要表現在它的發展過程中向其它語言直接借用了大量詞匯,其中%以上的英語詞匯是從拉丁語詞匯派生或直接借用來的舊J。除此之外還從羅曼語族(如法語)中借用了大量詞匯。每本法律英語詞典都收入了拉丁語和法語詞匯。如(簡明英漢法律詞典)(1993)第l頁就有14個拉丁語詞匯和收稿日期:2002一10—28/個法語詞匯。這足見古詞和外來詞在法律英語中所占的比例,所起的作用。

 

.1外來詞自兒54年英國開始了金雀花王朝后,法國人就成了英國統治者.法語則成為英國官方語言,并在宮廷、法院和學校中廣泛使用。僅在1250一1400年間大概就有10000個法語詞匯直接進入(10an directly)英語詞匯中,其中75%一直沿用至今”J。這一時期具有代表性的法律詞匯有:

 

法庭,審判臺),assize(巡回審判),巡回法庭),pIea(抗辯),suit(訴訟,訟案),原告),defendant(被告),judge(審判員,法官),advocate(辯護者),attorney(律師),法案),petition(請愿),complaint(控告),in—審訊),summon(傳票),hue and cry(追捕犯人時的叫喊聲,通緝令),indictment(告發,控告),jury(陪審團),juror(陪審員),panel(全體陪審員),felon(重罪犯),evidence(證據),證詞)’bail(保釋金,保釋人),ransom(贖金),裁決),sentence(宣判),decree(政令,法令),award(判決,判決書),fine(罰款),因犯罪而遭沒收的東西),punishment(懲罰),prison(監獄),pillory(頸手枷),sue(控訴),辯護),implead(控告,起訴),accuse(控告),de—宣誓證實),arrest(逮捕).warrant(逮捕狀,搜查令),imprison(監禁),convict(宣判……有罪),amHce(懲罰),arson(縱火),larceny(偷竊),adujtery(通奸),sIander(誹謗),Iibei(誹謗罪),innocent(無罪)等。

 

拉丁語從公元597年傳進英國起就已滲入英語中,特別是到了古英語時期的14、15世紀,拉丁語詞匯又大量直接或間接進入英語,但主要是法學等專業領域”J。這一時期有許多拉丁語詞匯進入英語且一直沿用至今。如:homi—殺人),custody(拘留),immune(免除的),合法的),prosecute(對……起訴),鎮壓),testimony(證詞)。<牛津英語詞典出Dictionary)也記錄了部分詞匯進入英語的時間。如:orbiter(仲裁人;年),veto(否決,1629年)等。如:

 

①This is a“∞i(借自拉丁語)contract.這是一個準合同。

 

②出,葫,如”f(借自法語獲得的這種判決就是人所熟知的對被告的不應訴判決。

 

古詞法律英語古詞是指古英語時期(公元—1100年)和中古英語時期(公元1100一年)的英語詞匯,而在這兩個時期從拉丁語、法語和希臘語中借用的外來法律詞匯70%仍沿用至今。一些詞匯在現代英語中,尤其是在現代英語口語中已不再使用,但在法律文書,或正式的司法場合仍在使用。古詞ye是的復數“你們”,在普通英語中已經不用了,但在法庭開庭時仍沿用hear ye“靜聽”(宣讀、審判),或用古詞。yez“靜聽”。這里的hear ye實際上相當于現代英語中的listen up!古詞卵th相當于現代英語中的say。這在普通英語中早已不用了,但在法庭上仍用sayeth。如:

 

。t相當于現代英語中的“宣誓口供人沒有任何要說的了”。

 

中古英語中he一,there_和where_可以和表示方位與原因指向的詞構成復合詞,以表示加強和確定之含義。如:古詞, thereunder(under that),,wherefore(why),herein(in this docu—,therein(in that clause)。因此,莎士比亞筆下的句子“wherefore art thou Romeo?”就不是“where are you,Romeo?”,而是“Oh,,Why must you be Romeo?”

 

中古英語詞said(aforeSaid)在法律英語一般用作定冠詞(the)和指示代詞(this或幽at)。

 

oresaid是said的變體,二者用法相同,均無實義,只是aforesaid經常和法語來源的英語詞一起連用。如:Peter promise5;。

 

.(彼得打算存一筆錢。這筆錢的年利率是10%。)句中的said可以用the或來代替。這種用法明顯地與普通英語的用法不同。

 

法律英語詞義的保守性是指詞義的不易改變性。法律英語詞義的保守性源于人們對權威標準的信仰。公民對一國法律的信仰是如此,信徒對宗教教義的信仰亦是如此。就如同<圣經)或<可蘭經)是宗教最權威的來源一樣。一國的法律、法令和判決書是法律合法性的來源。

 

助動詞與詞義的權威性普通英語的助動詞do和shaIl在法律英語中具有某種程度的古語含義,賦予了獨特內涵,使法律英語詞句更具權威性。

 

.助動詞do在普通英語中,一般用于問句,而在法律英語中只用于肯定陳述句,但并不象普通英語中那樣含有強調或對比的含義。

 

所表示的是緊跟著的動詞所產生的法律概念或所修飾的法律關系,或者相當于普通英語中的特此),并暗示這一行為動作將會實際履行。下面的例旬就是很好的說明。

 

①We the people of the United States do o卜肌我們美國人民為美國制訂和確定了這部憲法。

 

②The state of Califo『nja do enacc as f。l—.加州依下例規則制定法律。

 

③我承諾誠實地向警察報告事實。@)l do mominate mr husband,Black Smi出我特別指定我的丈夫布萊克·史密斯作為我遺愿的執行人。

 

這四個例句中的do均無實義,且含有古英語的特質。例句①一②中的do就只表示其動詞后的法律概念更具權威、更具神圣性。例句③一④中的do表示說話者鄭重其事,并且一定能執行和完成這個動詞所指的內容。

 

.在普通英語中shau是典型的表示未來的情態動詞,傳統語法規定shaH只能用于第一人稱,否則用will會更合適。在美國英語中一般不用shall表示將來,幾乎已被廢棄,所以表示將來的唯一情態動詞只能用will。在法律英語中shau并不表示將來,而有著與普通英語完全不同的含義。現分別解釋如下:

 

①shall表示某種命令或某種法律義務,相當于普通英語中的must“必須”。如:

 

,some。ne who quali—一個被指控為性騷擾的人必須在特定的時間到警察局長或地方法官那里去登記。

 

這里所用shall并不表示對將來事件的預測,而是設定了被告人必須進行登記的義務。

 

使整個句子更具法律權威性。

 

③shalI可表示法律上的正式“宣告”、“宣布”。如:

 

這部法律被正式宣布為加利福尼砸州的刑法典。

 

③shall可用于表述合同條款.表述~定要做到的事。表示“一定會”(promise to)或“將會”(will orto beto)。

 

…...出版商應當預付作者稿酬,這筆稿酬是按合同規定的總稿酬中的一部分。

 

這里shall為合同中的一方設定了給付報酬的義務。句中的笫一個shall指“一定會”;第二個shall是指一種“承諾”或一種正式“聲明”,但沒有“命令”的含義。

 

總之,sha】l在法律英語中的含義并不一定就限于這三種情況。弗雷德里克·保爾斯認為被廣泛運用于法律英語的真正原因是被看作是具有法律權威特征的一種象征。…法律術語與詞義的精確性法律術語(Terms of Legal Art)是法律英語最突出的特點之一。法律術語一般指某些詞匯或詞組只在法律這一特殊領域或法律職業中使用,而且這些詞匯或詞組的含義約定俗成,不同于普通英語(Ordillary En91ish),具有相對的穩定性。法律英語中的“法官顧問”

 

源于拉丁語)沿用至今,而不說。

 

其目的主要是為了保持這個詞義在法律英語中的“原汁原味”和精確。美國法律語言學研究權威梅林可夫認為法律術語是法律語言中一小塊相對精確(precision)的區域【4 J。就這一點我們可以選用《英漢雙解法律詞典)【51中的詞目解釋加以佐證。

 

①cy—pre’s doctrine:”盡可能近似原意法則”

 

普通英語解釋為:

 

。pu‘.a court can apply the fun如一種規則,如慈善機構將資金用于一個原本并非是它打算的目的,法院可將這筆資金盡量靠近慈善機構原來打算的目的。

 

②precedent:“判例,先例”

 

普通英語解釋為:(something,, which bas h印,早些時候發生的某事,如判決可作為現在應做什么的導向或指南。

 

③subrogation:“代位權”

 

普通英語解釋為:

 

山er pers。

 

。n’s liabiIities)一種法律原則,某人取代另一個人,取得那個人的權利并為他的債務承擔責任。

 

從詞典中引證的三個詞目說明法律術語言簡意賅,只需一個詞或幾個詞就能準確無誤地表述一個法律概念。法律術語來自一般用語和習俗。如:silk專指“英國女王的法律顧問”。

 

美國法律英語中的“祖父條款”或“不追溯條款”。法律術語不同于科技術語。法律術語是由權威的法院或立法機關或法學家闡述界定的。如income(收入)是一個關于稅收方面的專用詞,但它的內涵在法學界中,尤其被法院廣泛地界定和闡述了很多年。司法判例和成文法的解釋將會使法律術語更加精確。

 

普通英語與法律英語的詞義關系在英語語言的發展過程中,詞義的演變十分復雜。總體來說英語詞義是在“共時性變化”

 

和“歷時性變化”(di—“ges)的交替變化中發展演變。法律英語的發展不可能脫離普通英語的發展。法律英語詞義自然而然是從多義的普通英語詞匯中分離出來的。有的詞義具有特色性很強的法律英語詞義,而獨立于普通英語。由于英語詞匯在其發展演變過程中借用了大量外來詞,因而也出現了大量的同義詞。

 

一詞多義與同形異義英語中多義詞(polysemic words)占絕大多數,而單義詞(monoSemic words)是極少數。一詞多義的根源是詞義的概括性和詞義的演變”j。法律英語詞義就是這樣從多義詞中分離出來的。如:

 

普通詞義 法律詞義…n 王冠 王權君主的節杖 君權獎品 判決書講aInt 訴苦 控告棒 法院”y 躊私 侵犯版權這些例詞一般都有二條以上的普通英語釋義,這里只舉出其中的一條釋義與法律詞義作對比。這說明法律英語詞義存在于普通英語的多義詞中。與這種觀點相反的是美國學者彼得·特爾斯馬(Peter M Tiersma,1999:111)在他的新作<法律語言>(I,egaIlanguage)中認為這類法律詞匯看上去象普通詞匯,而實際上又有許多詞義明顯不同的詞是“同形異義法律詞”

 

。monyms)。我們知道同形異義通常是指兩個或兩個以上詞的形式相同而詞義不同的語言現象”J。如:

 

熊和bear(;.)忍耐。若按這一標準來劃分就根本不存在“同形異義法律詞”。特爾斯馬提出這一新觀點,不外乎強調法律英語詞的專業性和相對普通英語詞義的獨立性、穩定性。阻下這些例子足以說明他的觀點:

 

普通詞義行動氣憤避免考慮簡潔的延續儀器箱子移動通知政黨懇求禱告句子服務法律詞義訴訟加重罪行撤消對折訴訟案件摘要訴訟延期法律文件案倒動議案解約通知當事人抗辯訴訟法庭判決傳票送達不論是強調一詞多義,還是主張同形異義.二者都說明法律英語詞義是普通英語詞義的一部分,但又具有自己相對專業特色和穩定性。

 

.2同義詞同義詞(synonyms)通常指的是部分同義詞,也就是基本意義相同或相似的詞”J。在任何一組同義詞中,法律英語文體一般選用釋義嚴謹,詞義穩定的正式書面用詞。下面是一組同義詞的對比分析普通英語詞(奉旗語) 法律英語詞(外來詞) 中文釋義 …d app—mately 太概要求哪mence 開始建筑物‘ pn。r 較早郵【l te帥inate 終止㈣e 續起贈送促進印Pdse 通知涉及需要示范停止使用咖一。ym朋t 工作法律語言是嚴肅語言,重點在于陳述事實與細節,闡明法律概念和法律關系。所以即便是在法律英語中有多個同義詞的情況下,法律文書還是盡可能少用同義詞,以避免用詞多樣化所引起的歧義。比如:我們可以邀請朋友到我家(residence),然后問他對我們新家(domi—看法如何。在法律上只認定一個居住地的事實。因而沒有必要用不同的詞來表述。再說法律英語中的同義詞仍有約定俗成的差異。必須根據上下文慎用同義詞。比如:

 

美國憲法中的“信賴條款”),就不可用或full credit取代。sufficient consider—對價)就不可用adequate c0璐ideration(等值回報)取代。

 

法律英語詞匯中美國與英國語言的差別在英美司法體系發展變化的過程中,美國的語言發展已有自己的特色。18世紀美國獨立戰爭后,美國人民的民族主義也表現在語言方面…1。韋伯斯特等人積極提出確立“美國語言”的主張,并于1828年編輯出版了<美國英語詞典>。至此,美國語言開始一條獨立發展之路。英美語言與英美法律交織發展的過程中,形成了法律語言,但英美法律語言仍存在差異。

 

.1語匯空缺語匯空缺(1exical gaps)是由于語言的民族、地域、歷史、政治等因素深刻的內在聯系,使一種語言的某些詞匯在另一地域的另一種語言里找不到對應的詞。英國的司法體系是以王權為基礎發展完善的,而美國的司法體系是在以議會為中心的基礎上形成的聯邦與各洲兩級司法體系,加之各自的法律文化傳統不同,因而不可避免地出現法律詞匯空缺現象。

 

①美國法律英語詞匯,英國法律英語詞匯空缺。如:assembly(議),assemblyman(議員).總統),vice-president(副總統),presi—總統的),congress(國會),senator(參議員),lynch(私刑),Kukluxklan(三K黨)。

 

②英國法律英語詞匯,美國法律英語空缺。

 

如:Lords(上院),Lord(上院議員),議院中的大法),民訴法).court of King’s Bench(王室法院),Privy council(樞密院),suit。r(審判),總督),chancellor(大法官)。

 

.2詞匯的拼寫差異美國法律英語詞匯的簡化現象是美國英語區別于英國英語的主要特征。這種簡化現象一是通過讀音與拼寫同時變化的,如:copper:

 

英)警察;cop:(美)警察。二是只有拼寫變化,沒有讀音變化。如:honour:(英)承兌;h。rlor:

 

美)承兌。法律英語中不同拼法的英國英語與美國英語常用詞匯對照如下:

 

英國英語 美國英語 中文釋義日doptor 收養人印ce『 a∞中tor 承兌人哪t ackn。wledgm印t 債務承認人。que check 支票。pper c。p 警察 def咖 def蛐 被告,辯護律師。fknse 罪過,犯法草稿。草案。 pr%’

 

訴訟業務呷即‘ 】udgment 裁定,判決鋤mo progr鋤 程序.3詞匯的語義差異法律英語詞匯的語義變化主要表現在同一概念在英國英語和美國英語中分別用不同的詞匯表達。

 

①同一概念,英美英語中用不同的詞匯表達。如:

 

中文釋義 英國英語 美國英語慈善信托 cha^table trust cb撕table cQrpor帕大監獄 pemt饑na珂黑手黨m曲 M甜執法官 lawm姐流氓h00dlum ga“舒有限責任公司律師費barrister,s k 咖②同一詞匯,英美英語中有不同的解釋。

 

如:

 

英語詞匯 英國英語 美國英語地方法規 公司章程一·at;on 巴律師協會 律師協會—te 上院 參議院曲乜血n 議會議員 國會法規專家一 海事法院執行法官法院執行法官“eut廿l曲t 副總督 副州長。unsekr 參贊,顧問 咨詢律師盯7 pls面 大法官法庭 衡平法庭ⅫGene同 副檢察長 副司法部長檢察總長 司法部長 e㈣ 營業瓿 (資壹,貨物)周轉金小結法律英語詞義的保守性、權威性和精確性是由多方面原因交織而形成的。一方面法律本身要求用詞嚴密準確,才顯示出法律的神圣和權威性,另一方面是由于拘謹的外來詞和語義約定俗成的古詞、術語長期沿用,加強了這些詞匯的神秘感和權威性。司法領域里循環沿用同一法律詞匯的另一個原因是為了交流表達簡便,在法律文件起草,法規解釋和調查取證中更加經濟。于是,幾十年乃至幾百年前生硬的法律詞匯和術語得以延續,而且事實上一字不改。

第12篇

[關鍵詞]記憶理論 認知 有意再現 分析器 詞典

在英語學習過程中,學習者往往要記憶大量的詞匯。在初、中級階段,英語教師一般強調要多多地進行重復練習,增加詞匯重現的頻率。但通過這種方法記憶的詞匯在頭腦中保持的時間不會太長,不經常重復就會遺忘,而且遺忘率極高。“英語太難學,英語單詞太難記了”。學生們總是提出這樣的抱怨。學英語、記單詞是否有捷徑?為什么學生總有這樣的苦衷?經了解,問題結癥是學生們在學習和記憶上沒有掌握好方法,死記硬背較為普遍。針對這一情況,筆者在教學中注意運用記憶理論,引導學生學習和記憶,取得了一定的效果,筆者談談自己的做法。

一、引導學生明確記憶的目的,加強有意記憶

按照記憶的目的性、意識性的程度,記憶可分為有意記憶和無意記憶兩種。有意記憶是具有自覺目的、采取一定的記憶方法,在必要時還要做出某些意志努力的一種記憶。無意記憶與有意記憶恰恰相反,它是沒有自覺目的、沒有采取任何記憶方法,也不需要做出任何意志努力的一種記憶。學習英語,記憶單詞,主要運用有意記憶。因為對記憶的材料有無明確的目的,對記憶的效果有直接的影響。目的越明確具體,記憶的效果就越好。這是因為目的的明確具體,能提高大腦皮層有關區域的興奮性,興奮的神經組織蛋白質結構發生變化,能使建立的暫時神經聯系得到鞏固,留下的“痕跡”越加深刻。根據這一原理,筆者在英語教學中注意引導學生抓住學習重點,要求他們每次課都需找出重點單詞、重點句型、重點段落,并有意地反復學習、加強記憶。通過加強有意記憶,學生們普遍反映記憶英語單詞、句型和課文比以前容易多了。

二、要求學生理解課文,加強理解記憶

在有意記憶中,按照記憶方法又可把它分為機械記憶和理解記憶兩種。有些材料,它們本身是有意義的,反映了客觀事物的內在聯系。我們對材料的內容進行充分的研究,了解它們的本質和特點,通過理解去記憶它們,這種記憶方法叫理解記憶。理解記憶是靠聯想去記記憶材料的。有些材料,它們本身沒有什么內在聯系,或者材料本身有一定的內在聯系,但我們對其意義不甚理解。例如,年代、人名、地名、數據、公式等。對這樣的材料,只能“死記硬背”,這種記憶方法叫機械記憶。機械記憶是靠重復去記憶材料的。實踐證明,在學習中運用理解記憶的原理去識記材料可以記得快、準確和牢固。而運用機械記憶的原理去記憶材料,既費勁而且不鞏固。這是因為理解是記憶的基礎,理解記憶能明確目的,增加記憶的興趣,強化記憶的意志。因此,在課文教學中,筆者要求學生盡量理解課文的內容,找出課文的層次結構,在理解的基礎上對課文進行有意記憶。這樣,被記憶的材料就更牢固、不易遺忘。

三、引導學生在記憶過程中,做到“認知”和“有意再現”相結合

在學習cognition這個英語單詞后,如果再看到這個單詞時,能夠認識它,這叫做“認知”。學習cognition這個單詞后,自覺地、有意識地去回想這個單詞的拼法和讀音,使它在頭腦里再出現,這叫做“有意再現”。如果在記憶過程中能做到“認知”和“有意再現”相結合,比單純“認知”的記憶效果好得多,保持時間也長。這是因為人們對任何材料的記憶,都表現出不平衡性,某些部分記得牢些,另一些部分記得差些。因此,筆者引導學生在背誦一段英文文章時,先要求他們把這段文章看幾遍,然后,合上書本看自己能否背下來,對背不出的內容,再看,然后再背。此法可以幫助學生增加有意記憶,使大腦皮層更為興奮,易于形成記憶所必須的暫時神經聯系。而單純的“認知”是一種單一的刺激,容易使大腦某區的神經細胞負擔過重和疲勞,產生抑制現象,使大腦記憶功能減弱。

四、引導學生運用多種分析器來參加記憶

實驗證明,大腦皮層接受觸覺、嗅覺、動覺等各類細胞都具有“記憶作用”。如果在記憶某種材料時,能同時調動多種分析器都來為記憶服務,就會大大增強記憶效果。這是因為用這種方式記憶材料時,可以把眼、耳、口、手等多種感覺通道利用起來,接受來自不同感覺器官的信息,在大腦皮層留下很多“同一意義”的痕跡,使大腦皮層的視覺區、聽覺區、動覺區等建立多通道的暫時神經聯系,然后,經過大腦把各種感覺到的材料進行加工,使它們在大腦皮層留下深刻的痕跡。無疑,用這種方法記憶,要比單純的用耳聽、用眼看、用嘴讀或用手寫的記憶效果好。它將大大地加強人們的記憶和延長保留記憶的時間。根據上述記憶的規律,筆者要求學生在學習時,盡可能調動多種分析器來參加記憶活動。讀書時做到眼看、口讀、耳聽、手寫,同時還用腦思考。總之,大腦接受外界的信息越多、越廣泛,它的效能就越高,學習效果就越好。轉貼于

五、引導學生借助詞典,利用聯想手段強化詞匯記憶

筆者認為,對于那些認為“英語單詞太難記了”的學生而言,采用同義詞/反義詞詞典強化詞匯記憶的方法—語境聯想記憶法和專題聯想記憶法比較管用。類屬詞典和同義詞詞典/反義詞詞典一般都是按照主題編排的,同一主題或語義場的詞匯都會匯聚在一起,通過各種語義關系構成聯想的網絡。這兩種方法都基于聯想手段,通過聯想網絡將詞匯牢牢地維系在一起,從而達到強化記憶的效果。這里介紹兩種借助同義詞詞典記憶詞匯的方法。

1.語境聯想記憶。語境,簡言之,就是語言使用的環境。在實際使用中學習詞匯,往往可以形成語境聯想。這一方面,可以將語言學習與外部世界直接掛起鉤來,具有較強的直觀性;另一方面,可以保證在使用詞匯時準確得體。向語境學習詞匯的最佳辦法是去有關語言的國度里耳濡目染。但是,對于絕大多數學習者來說,這是不太可能的。不過,學習者可以從越來越多的英語電視、電影中捕捉詞匯,也可以從大量的英語商品廣告、標簽、包裝、各式各樣的英語說明中采擷語詞,它們是很有益的直觀教材,是從生活中學習語言的有效辦法。另一方面,學習者也可以將學到的語詞帶到環境中去,讓它們與客觀世界對上號,這樣既可以鞏固記憶,又可以培養“觸景生情”的習慣和能力。無論是從語境中學習詞匯,還是將詞匯學習帶到語境中去用,借助類屬詞典都可以事半功倍。學習者可以借助類屬詞典或同義詞詞林之類的詞典對有關話題的詞匯進行一番考察,摘錄其中比較常見的詞語,略加歸類,然后根據情景集中識記,仿佛置身其中。

2.專題聯想記憶。所謂專題聯想就是圍繞一個中心題目展開聯想,把相互關聯的詞語匯編起來。借助專題聯想,可以培養記憶的整體感和相關性,產生由此及彼的效果。在平時的學習中,學生不可能同時接觸到某個專題的所有常見的表達。不過,語言學習者在進行語言學習之前頭腦中就有了若干專題集,只要把學到的語詞逐漸引入到這些專題集里,便可以為專題聯想記憶提供契機,此時再借助類屬詞典或同義詞詞林之類的詞典,就可以將每個語詞集中的詞項系統化,形成同類語詞網絡,達到強化記憶的效果。讓我們看一看英語中“法”的聯想。在英語中,表示“法”的詞有law和statue。由“法”可以聯想到“法案”(bill)、“法則”(law, rule)、“法令”(decree)、“憲法”(constitution)等。有法就得“遵守”(abide by,observe,respect),但總有人會“違反”(break, offend, transgress,violate)法律而構成“犯罪”(commit a crime),淪為“犯人”(criminal,offender)。受到“起訴”(bring a lawsuit, prosecute, sue)后,他們要在法庭“court”里接受“法官”(judge)的“審判”(trial)。審判期間,“被告”(defendant, the accused)和“原告”(prosecutor—刑事案,plaintiff—民事案)均可聘請“律師”(lawyer, solicitor—英國英語,attorney—美國英語)為自己辯護。最后,法官根據“陪審團”(jury)的意見“判”(judge)“有罪”(guilty)或“無罪”(innocent),并“量以刑罰”(sentence)。由此可以聯想到“犯人”(criminal)的世界“監獄”(jail, prison)。我們還可以從另一個角度展開聯想,即法的“制定”(draft, draw up, lay down, formulate, make)、“批準”(ratify)、“通過”(pass)、“頒布”(issue, promulgate)。對于不合理的、過時的法律要予以“取締”(cancel)、“廢除”(abolish, annul, repeal),等等。除聯想手段外,還可以采用其他幾種行之有效的單詞記憶技巧,如音標拼讀規則法、詞根詞綴構詞法、歸類法、辨析法、位置法、首字母縮略詞法、諧音法、關鍵詞法、全身心反應法等。

六、要求學生及時復習,與遺忘作斗爭

有記憶就有遺忘。記住材料,就是暫時神經聯系的形成并留下痕跡。暫時神經聯系形成之后,由于內抑制發展的結果,它便會逐漸地被抑制起來或消失掉,這就是遺忘。但我們學習知識不能只保持幾秒鐘,也不僅僅是幾分鐘,更不是遺忘它,而是要長時間地記住它,以便隨時運用。要與遺忘作斗爭,就要了解遺忘的規律,并科學地分配復習時間,這對于牢固地記憶知識是十分必要的。遺忘的規律是:在記憶某些材料之后,很快地便開始遺忘,但是遺忘的速度是不均衡的,開始時忘得多而快,以后便逐漸忘得少而慢。現代科學實驗證明,遺忘最快的時候是在記住該材料的頭一、兩天之內。根據遺忘的這一規律,筆者要求學生記憶某些英語單詞或上完英語課之后,就及時地復習,即在頭一兩天之內復習一次,然后隔一段時間復習一次,間隔時間先密后疏,隨著記憶得到鞏固,間隔時間逐步延長,復習次數也逐漸減少。這樣,學過的知識就不易遺忘了。有時,我們記憶的材料容易遺忘,不是因為大腦里留下的痕跡已經消失,而是由于前攝抑制或后攝抑制的干擾所致,使我們回憶不起來有關材料。因此,在復習過程中,要想方設法避免或減少這種前后抑制的干擾,提高復習效果。根據這一原理,筆者要求學生在復習時注意做到:(1)盡可能不要把內容繁難或相近的科目安排在相鄰的時間內進行記憶或復習;(2)在復習各種材料之間,需要有一個短暫的休息時間。這樣,一方面,可以避免前后復習的材料之間相互干擾,另一方面,可以消除大腦的疲勞;(3)每天睡覺前,回憶一遍當天復習過的材料,這樣可以避免干擾,對加強記憶的鞏固性是非常有益的。總之,在英語教學中,教師要注意運用記憶理論,指導學生學習,能起到事半功倍的效果。

參考文獻

[1]伍謙光.語義學導論[M].長沙:湖南教育出版社,1997.

[2]陸國強.現代英語詞匯學[M].上海:上海外語教育出版社,1983.

主站蜘蛛池模板: 浏阳市| 儋州市| 桃江县| 庆元县| 洛扎县| 沿河| 平顶山市| 砀山县| 中江县| 武鸣县| 本溪市| 永春县| 高要市| 玛曲县| 临沭县| 大关县| 华阴市| 曲水县| 合江县| 东兰县| 卫辉市| 萍乡市| 新绛县| 车致| 阿克陶县| 密山市| 井陉县| 萨迦县| 黄浦区| 专栏| 富平县| 福建省| 城市| 宜黄县| 固安县| 那曲县| 多伦县| 宜良县| 余姚市| 班玛县| 文登市|