時間:2023-05-29 17:45:13
開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇計算機畢業論文設計,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。
一、選題
1、選題未通過者,可參照已過學生的課題進行修改(只能做參照,不得出現重復)。工科畢業設計要有具體的解決內容及相關解決方案,不要求多高深,但求實在。
2、選題需要修改者,切記論文課題不要是文科或科普性(如計算機發展史、淺談××、淺析××等),也不要太大或者太泛泛(如網絡信息安全與防范、網絡信息安全的技術探討等)。建議題目格式為“基于××技術的××系統設計與開發”。
二、摘要
1、論文摘要一定要根據論文課題內容圍繞展開,需要提出問題及解決成果,研究手段、方法、過程等可不闡述。
2、論文摘要要寫得高度概括、簡略,不要寫論文選題的緣由。
三、正文
1、選題及論文摘要通過者可直接撰寫論文正文;選題及論文摘要未通過者,先進行修改后方可再撰寫。切記不要像文科作文一樣泛泛而談,一定要有問題的提出,相關技術介紹,系統設計,詳細設計以及最后的成果。
2、論文嚴禁抄襲,避免“復制+粘貼”行為。我們會用專門的軟件進行,重復率高于20%的一律視為不合格。
3、論文正文不少于6000字,必須嚴格按照模板格式要求,注意字體、行間距、圖表、頁眉頁腳、排版等。
4、務必在3月5日前完成畢業論文正文初稿,論文指導老師會通過“畢業論文設計平臺”線上對畢業論文作出修改要求,同學們必須時刻關注,進行修改。
1.論文類型:
不同的院系,不同的指導教師對本科畢業論文有不同的指導方法,在計算機系,本科畢業論文通常以下面四種類型:
1.1完成一個不太大的實際項目或在某一個較大的項目中設計并完成一個模塊(如應用軟件、工具軟件或自行設計的板卡、接口等等),然后以工程項目總結或科研報告、或已發表的論文的綜合擴展等形式完成論文。
1.2對一個即將進行的項目的一部份進行系統分析(需求分析,平臺選型,分塊,設計部分模塊的細化)。例如對一個大中型企業管理信息系統中的財務部分進行調研,分析和設計等,這類工作可以沒有具體編程,但應得到有關方面的初步認可,有一定的工作量。例如打印后有30頁以上的報告。
1.3對某一項計算機領域的先進技術或成熟軟件進行分析、比較,進而能提出自己的評價和有針對性創見。例如XML目前是因特網上新涌現的標記語言,它較HTML有許多無可比擬的優點,其中XML-QL是基于XML提出的一種新型查詢語言,分析總結這一新型查詢語言并探索它的實現途徑是十分有意義的工作。再如對自由軟件數據庫系統MySQL,分析總結其在Web應用上的特色,并能將有關技術用于自己研制的系統中。這類工作要注意把分析和實驗相結合,不要只停留在消化上。消化是前提,吸收和轉化才是工作的重點。
1.4對某一個計算機科學中的理論問題有一定見解,接近或達到了在雜志上發表的水平。例如,解決了一個眾所周知的問題,糾正了某雜志上理論的錯誤且提出解決修正方案,或自己提出有意義的模型,定義,且有定理、命題、或性能比較、分析、測試報告等。
一般而言,第四種較難,在若干年指導本科生畢業論文經驗中,只有兩位學生采用此形式寫出了好的論文,據悉,這兩位學生都順利進入了博士生序列。
2.選題:
2.1有科研項目的老師通常愿意從項目中選取本科生能完成的模塊,交給學生做,然后以第一種形式寫成論文。教師熟悉項目,項目有實用背景,一般而言,多數學生經過努力都能完成。但有些科研項目太難,或涉及保密內容,或本科生不容易完成,在這種情況下,教師可能會讓已保送為研究生,或確定留校的學生作這類題目。
2.2學生自選題目,有些學生已聯系好畢業后的工作單位,工作單位要求學生作某方面的項目,或已交給學生某方面的項目,經過指導教師認可,認為可作出合格的畢業論文,則可作這方面題目。這種方式下,學生積極性高,責任心較強,學以致用,一般論文的質量較好且成文后篇幅較大。
2.3教師根據社會需求,選擇題目。例如,院系行政需要教學,科研和研究生信息管理系統,有的教師指導幾位學生分別作大學院系行政管理子系統,博士生碩士生學籍管理子系統等等,有可能開始作出的軟件還不很完善,但有了雛形,經過修改后,一般是能夠應用的。有的系統經過下一屆本科生畢業實習的改進,就可以實用了。一些對路的、有用戶的軟件還有可能進一步發展為產品
3.論文的組織安排:
依據上述的論文類型,由于各類工作特點的不同,在搜集整理論文的素材、組織安排論文的結構方面,應有所不同,做到有的放矢。
3.1系統實現型論文:重點收集整理系統體系結構,程序模塊調用關系,數據結構,算法,實驗或測試等內容,論文結構一般安排如下:
(1)引言或背景(概述題目背景,實現情況,自己開發的內容或模塊)一般談課題意義,綜述已有成果,如”誰誰在文獻某某中做了什么工作,誰誰在文獻某某中有什么突出貢獻“,用“但是”一轉,分析存在問題,引出自己工作必要性、意義和價值、創新點和主要思想、方法和結果。然后用“本文組織如下:第二節第三節....,第四節....."作為這段結束。
(2)系統體系結構(強調系統的整體性,突出自己工作在整體中的位置)。(3)主要實現功能的描述(包括模塊調用關系,數據結構,算法說明,依據內容多少此部分可安排兩到三節)。
(4)實驗或測試。
(5)總結。
3.2應用開發型論文:
重點收集整理應用項目的背景分析,需求分析,平臺選型,分塊,設計部分模塊的細化,使用的開發工具的內容。論文結構一般安排如下:(1)引言(重點描述應用項目背景,項目開發特色,工作難度等);
(2)項目分析設計(重點描述項目的整體框架,功能說明,開發工具簡介等)(3)項目實現(重點描述數據庫設計結果,代碼開發原理和過程,實現中遇到和解決的主要問題,項目今后的維護和改進等,此部分可安排兩到三節);
(4)總結。
3.3分析比較型論文:
重點收集整理有關的最新論文或軟件,分析比較心得,實驗數據等內容。論文結構一般安排如下:引言(重點描述分析對象的特點,分析比較工作的意義,主要結果等);分析對象的概括性描述,分析比較的主要結果(如果是技術分析,給出主要數據,如果是軟件分析,給出代碼分析結果,實驗過程等);分析比較的評價和系統應用(可以給出基于分析比較的結果,提出某些設計實現方案,和進行一些實驗工作;最后是結論。
3.4理論探索型論文:
重點收集整理問題的發現,解決問題所用到的基本知識,解決問題的獨特方法,定理證明,算法設計和分析。
論文結構一般安排如下:
(1)引言(重點描述要解決的問題的來源,難度,解決問題的主要方法等);
(2)基本知識(解決問題涉及的基本定義,定理,及自己提出的概念等);
(3)推理結論(給出問題解決方案,包括定理證明,算法設計,復雜性分析等);
(4)結論。上述論文結構的安排和劃分不是絕對,可依據各自工作的實際情況,采用某一種或某幾種混合的方式指導自己論文的寫作。但無論采用什么樣的結構,一定要作到心中有數,貫穿一條邏輯線索切不可泛論成文或堆砌成文,時刻突出自己的工作內容。
4.論文格式及目錄系統:
每個作者有自己的風格,格式不必強求一致,但科技論文不能象寫小說劇本那樣,一般不能用倒敘,插敘,不設懸念,不用意識流,多線索方式等。例如,可在下列格式基礎上適當修改:科技論文目錄體系一般不用中文的“一二三”,而用下列的編排方式題目扉頁|___摘要(中英文,200-300字為限)|___正文目錄1.前言(背景,動機,前人工作)|___1.1。。。。|(1)(a)(b)(c)|(2)(a)(b)(c)|___1.2。。。。2.項目框圖及本工作在項目中的地位
3.項目特色(特殊功能,困難
4.方案選擇(前人方案,現可選方案,為什么選這一方案)
5.實現技術數據結構程序片段:
6.特殊問題解決方法:
|__6.1問題1|__6.2問題2|__......
網絡營銷是一種以消費者為導向,強調個人化的營銷方式
網絡營銷最大的特點在于以消費者為主導。消費者將擁有比過去更大的選擇自由,他們可根據自己的個性特點和需求在全球范圍內尋找滿足品,不受地域限制。通過進入感興趣的的企業網址或虛擬商店,消費者可獲取產品的更多的相關信息,使購物更顯個性。
這種個性消費的發展將促使企業重新考慮其營銷戰略以消費者的個性需求作為提品及服務的出發點。但是,要真正實現個性營銷還必須解決龐大的促銷費用問題。網絡營銷的出現則為這一難題提供了可行的解決途徑。企業的各種銷售信息在網絡上將以數字化的形式存在,可以以極底的成本發送并能隨時根據需要進行修改,龐大的促銷費用因而得以節省。企業也可以根據消費者反饋的信息和要求通過自動服務系統提供特別服務。
網絡營銷具有極強的互動性是實現全程營銷的理想工具
傳統的傳統的營銷管理強調4P(產品、價格、渠道和促銷)組合,現代營銷管理則追求4C(顧客、成本、方便和溝通),然而無論那一種觀念都必須基于這樣一個前提:企業必須實行全程營銷,即必須由產品的設計階段開始就充分考慮消費者的需求和意愿。
遺憾的是,在實際操作中這一點往往難以做到。原因在于消費者與企業之間缺乏合適的溝通渠道或溝通成本太高。消費者一般只能針對現有產品提出建議或批評,對尚處于概念階段的產品難以涉足。此外,大多數的中小企業也缺乏足夠的資本用于了解消費者的各種潛在需求,他們只能憑自身能力或參照市場領導者的策略進行產品開發。
而在網絡環境下,這一狀況將有所改觀。即使是中小企業也可以通過電子布告欄、線上討論廣場和電子郵件等方式,以極底成本在營銷的全過程中對消費者進行即時的信息搜索,消費者則有機會對產品從設計到定價(對采用理解價值定價法的企業尤為重要)和服務等一系列問題發表意見。這種雙向互動的溝通方式提高了消費者的參與性與積極性,更重要的是它能使、企業的決策有的放矢,從根本上提高消費者滿意度。
網絡營銷能滿足消費者對購物方便性的需求,提高消費者的購物效率
現代化的生活節奏已使消費者用于外出在商店購物的時間越來越短。在傳統的購物方式中,從商品買賣過程來看,一般需要經過看樣棗選擇商品棗確定所需購買的商品棗付款結算棗包裝商品棗取貨(或送貨)等一系列過程。這個買賣過程大多數是在售貨地點完成的,短則幾分鐘,長則數個小時,在加上購買為購買商品去購物場所的路途時間、購買后的返途時間及在購買地的逗留時間,無疑是大大延長了商品的買賣過程,使消費者為購買商品而在時間和精力上作出很大的付出。同時,擁擠的交通和日益擴大的店面更延長了消費者購物所耗費的時間和精力。然而,在現代社會,隨著生活節奏的加快,使得人們越來越珍惜閑暇時間,越來越希望在閑暇時間內從事一些有益于身心的活動,并充分地享受生活。在這中情況下,人們用于外出購物的時間越來越少。
國際互聯網絡的產生和迅速普及已成為人類社會迸人信息時代的重要標志。如果說單臺計算機相對于人類的關系還僅限于工具的角色,那么,網絡化后的計算機系統則已成為人類社會生活不可或缺的有機組成部分。當越來越多的人借助于計算機而進入這個網絡時,這個無形的網絡也就把所有進人網絡的人們聯系在了一起,從而建立了一種人與人之間的新型關系。網絡世界的出現所帶來的不僅僅是信息處理與傳輸技術的革命,其更深遠意義和影響還在于它已經或者正在引起整個社會組織架構及其制度安排的深刻變革。而這種變革必將引起作為企業管理信息系統組成部分的會計信息系統的一場革命。會計領域之內和之外的許多人都多多少少地感覺到了這場革命,但對于這場變革的方向、形式和未來前景卻是仁者見仁、智者見智。本文擬就此闡述作者自古的見解,權作拋磚引玉。
一、制造業企業生產與管理的沿革
在工業社會乃至以前的社會申,會計信息系統可以說是企業最主要甚至是唯一的信息系統。它的這種唯一性決定了它在企業組織管理架構中的相對獨立性和封閉性。作為一個相對獨立和封閉的系統,在過去500余年的發展歷程中,它逐步積累和形成了一套相對完善和成型的財務信息''''處理程序和方法體系。以電子計算機的發明為起點的現代信息技術的誕生,改變了會計系統用以處理信息的工具紙張、筆墨和算盤,但并未觸及會計信息處理的程序、方法和規則的變革。然而,以互聯網絡技術為代表的現代信息傳輸技術的革命,在客觀上便提出了實現企業信息集成的要求。這種信息集成,一方面有賴于網絡通訊技術自身的發展,另一方面也取決于企業其他生產與管理領域的自動化或信息化程度。。在過去100年的發展歷程中,人類在這兩個領域都已取得了巨大的成就。
就制造業企業而言,人類不斷解放自身勞動的過程,也是一個不斷實現生產和管理自動化的過程。手工業時代的產品,是由生產工人親手做出來的,我們稱之為手工產品或手工藝品。工業革命把人類從手工勞動中解放出來,產品不再是由手工而是由機器來生產。工人只需要站在機器旁邊,產品的加工制造便可以由機器來完成,我們稱這類生產為機械化生產。由機器而不是手工生產出來的產品,我們稱之為工業產品。計算機數字控制機床的出現和使用,第一次引入了生產自動化的概念。它不僅使得產品的生產過程變得更為簡單和更容易控制,而且也使得產品的加工可以比機械化生產更為復雜和精確。但這時的自動化還僅限于單臺的機器而不涉及企業的整個生產過程,所以,我們稱這類生產為半自動化生產。數控機床和機器人技術的合并使用開始使得企業生產過程變得無人化,而網絡技術在企業生產盧管理領域的廣泛滲銹,則把企業的各個部分都集感為一個相互聯系的整體,從而使得企業的許多甚至全部生產與管理工作都可以在完全無人工介人的情況下完成,我們可以稱這類生產為智能化生產。在智能化生產的環境中,產品幾乎完全是由智能化的機器生產出來的,不僅生產工人已勿需站在機器旁邊,而且,從理論上說,整個企業都可以實現無人化,盡管我們現在還不知道應當怎樣來描述這類產品,但也許只有"知識產品"的稱謂最合適,因為它是用人類既有的知識而不是勞動生產出來的產品,是用人類已創造的科學技術成果生產出來的產品。
由于企業生產和管理的自動化或智能化能夠帶給企業更多的生產成本節約和更高的顧客滿意度,所以,它便成為追求利潤最大化的企業所追求的目標。而企業生產與管理的不斷自動化或信息化,難以避免地把企業的各種生產與管理活動集成在一起,通過信息這個神經系統來配置企業的所有資源(不僅僅是財務資源)和協調企業各個方面的作業。因此,在這一環境下所構造的會計信息系統已不可能再是孤立的、封閉的信息系統。
二、會計信息系統在計算機集成制造(CIM)環境中的地位
計算機集成制造(ComputerIntergratedmanufacturing)是現階段企業生產與管理自動化(或信息化)的一個基本框架。它通常由四個部分的信息系統組成:"計算機輔助設計(Computeraideddesign,簡稱CAD)、,計算機輔助制造(computer-aidedManufacturing,,簡稱CAM)、制造資源計劃(ManufacturingResourcesPlanning,簡稱MRPII)、和電子數據互換(ElectronicDataInterchange,簡稱EDI)。其中,CAD和CAM技術也許更多的是側重于企業的生產技術方面,而MPPII和EDI技術則更多的涉及到企業的管理領域。
(l)CAD系統。CAD系統可以說是產品設計發展史上的廣次革命。這一技術最初只是
何于60年代早期的航空工業,但隨后便迅速擴展至其他工業領域,并且進一步向新產品制造過程的設計與評價領域延伸,從而導致了工作過程和步驟的具體化。高級的CAD系統可以同時用于設計產品和程序。"經理人員"借助干CAD系統,可以評價產品的技術可行性并進而確定"制造可行性"。由于CAD技術有效地縮短了產品設計時間,從而使企業能夠迅速對市場化作出反應,并且能夠根據客戶的特殊需要,量身定做。當CAD系統與外部通訊網絡(EDI)連通時,生產企業便可與其供應商和客戶分享其具體的產品設計方案。
(2)CAM系統。CAM系統主要用于監督和控制生產工藝過程。它通過程序控制、數字控制和機器人裝備的使用,實現生產工藝過程的無人化。信息技術時代以前的企業自動化,通常所尋求的目標只是采用具有通用目的的機床,如鉆床、車床、刨床等,旨在能夠有效地提高工力的勞動效率;而如今的CAM技術則是通過對整個生產過程的控制,不僅使產品的實物生產程序變得更為精確、高速和控制。而且還可以通過自動化完全取代人類的勞動。
(3)MRP和MRPII系統。MRP也稱原材料需求計劃(Materialrequirementsplanning)或物料管理系統。其功能包括探索單個的工作定單以形成二個BOM,然后提前確定存貨需求。其目的旨在縮小批量生產時的存貨占用量。而MRPII不僅僅局限于存貨管理,而是將好幾種甚至企業所有的商業活動集成在一個系統內,所以,它也可稱之為壬種再工程技術(ReengineeirngTechique)或再造技術。它是協調整個企業活動的一個系統或者更確切地說是一種理念,一種哲學。該系統包括執行生產計劃,提供反饋和控制的全過程。
MRPII將自動為所要生產的產品產生材料定單、同時把產品的生產安排到主要生產計劃中,并根據機器和勞動力情況形成一個粗略的生產能力計劃;然后根據適時制(JIT)標準,自動生成包括原材料供應時間表在內的材料需求計劃,為工廠設計最終的生產能力計劃,管理原材料和產成品等存貨。MRPII集產品設計、按順序進入的工廠生產程序、會計信息、ABC成本系統于一體,從而使得能夠在控制成本和保持盡可能低的存貨水平的同時,建立、溝通和有效地執行生產計劃。當MRPII與外部網絡技術聯系在一起時,企業便可自動地收到銷貨定單和現金收入,自動發送購貨定單并向供應商付款,以及收發相關的運輸憑證等。(4)EDI系統。很多公司為協調銷售和生產經營并保持原材料流動的不間斷,通常都會與其顧客和供應商簽定貿易伙伴關系協議。通過這些協議,公司便為再造商業程序或使其完全
自動化處理奠定了基礎。這種完全自動化的商業程序通常是借助于被稱為電子數據互換(EDI)的系統來實現的。它通常的定義是:計算機可處理商業信息按標準格式在公司間的交換。從定義中我們可以發現:第一,EDI是一種公司間相互努力的結果,一家單個的公司是不
可能自己使用EDI技術的。第二,交易是由貿易伙伴的信息系統自動處理的。在一個純粹的EDI環境中,完全不需要人的介人去授權或批準交易的發生。第三,交易信息是以標準格式傳送的。所以,企業內部各種不同的系統都可進行接口并執行交易。
EDI系統的關鍵點主要在于EDI標準,也就是以標準的格式傳遞信號。EDI技術在過去的發展之所以顯得比較緩慢,最根本的原因在于缺乏一個單一的標準體系。目前在國際范圍內普遍流行的標準主要有兩個:一個是美國國家標準協會的(AmericanNationalStandardInstitut)ANSIX.I2;另一個是行管、商業和交通系統通用的EDIFACT(EDIforAdministration,CommerceAndTransport)。
就目前的發展而論,EDI技術在處理購銷貨定單方面可以說已表現得非常成功,但在收付款項方面還略顯不足。原因之一在于企業的收付款項需要借助于銀行這個中介來完成。由于在購貨與銷貨過程中因產品質量、運輸毀損等多方面的原因可能使收款額度與付款額度之間出現差異,"而要轉換有關付款的解釋通常會導致大量的記錄產生,目前有關E由標準還不能很好的解決這一問題,所以,這在二定程度上影響了EDI技術在電子錢款轉移EFT,ElectronicFundsTransfer)方面的廣泛應用。通過上述對彷M系統的描述,我們大致可以勾勒出如下三個初步印象:
第一,現代信息技術的發展在硬件和軟件兩個方面已經可以使一個企業實現拿自動化的生產和經營,也就是產生真正意義上的無人工廠。所不足的虐,無人工廠的存在不僅取決于單個企業自身,還取決于企業運作的整個外部環境,也就是說,無人工廠還難以在周邊企業尚未實現無人化的情形下單獨存在。但除EDI系統之外的其他幾個子系統在企業中的運用則可以不受周邊環境的影響。
第二,全自動化工廠或無人工廠是一個實現了高度計劃化的工廠。當一個又一個企業實現了高度計劃化以后,整個社會的經濟運作也就自然而然的形成高度計劃化。在這個意義上說,計劃經濟并不是一個毫無可取之處的經濟制度安排。但它實現的前提必須是以強大的信息系統作支撐。我們以前的計劃經濟在某種程度上之所以說是失敗,關鍵就在于我們缺乏一個強有力的信息系統,從而使計劃經濟制度的優點受到局限,而其缺陷和漏洞卻暴露無遺。我們有理由相信,隨著信息技術的不斷發展與完善,企業的自動化程度也會越來越高,社會資源的計劃配置方式也會越來越顯示出它的優越性。這在一定程度上支持了馬克思早在100年以前的預見。
第三,信息時代的到來為中國的繁榮富強再次提供了不可多得的歷史性機遇。因為在很多信息技術的利用和發展方面,西方發達國家與我們幾乎又站在了同一起跑線。相對于其他領域的技術差距而言/信息技術在目前是最沒有差距或差距最小的一個領域。
三、網絡時代的財務與會計變革
計算機集成制造不僅使企業生產領域里的分工開始失去其嚴格的界限,而且也使管理領域的分工開始變得模糊起來。由此可見,網絡化雖然不是使個體失去個性化的特點,但個性化的特點卻只有借助于與整個網絡的協調才能夠體現。因此,如上所述的計算機集成制造絕對不僅僅只是一個自動化的概念;它對企業商業活動的組織;職能機構的設置、各部門、崗位的人員配置與職責分工無疑都已產生革命性的影響。沒有適應高度信息化或網絡化要求的革命性變革,就不可能贏得網絡時代的競爭優勢。
1.引言
當電子計算機1946年問世的時候,人們就提出了機器翻譯的想法,并且在1954年進行了第一次機器翻譯試驗。然而與后來的各種語言信息處理研究和應用(語言信息檢索、文本自動分類、自動文摘、信息提取等等)相比,機器翻譯卻是進展最慢的。學者們傾其大半生精力、商家投入為數可觀的資金,經歷五十多年不懈的研究和開發,得到的成果或者產品卻常常不能令人滿意。
原因是什么呢?從語言研究的角度來說,機器翻譯系統分析、理解和生成自然語言的能力都還不到位,處理不了的語言現象很多:有的是句子結構層次弄錯了,有的是結構關系弄錯了,有的是成分之間的語義關系弄錯了,有的是詞義辨識錯了,還有的錯誤是源語和目標語之間的對比差異造成的。下面是機器翻譯處理漢語動結式不成功的幾個例子(來自三個機器翻譯系統)。
先看生成的情況,機器翻譯目前還很難生成漢語的動結式,所以我們很少在漢語譯文里見到含有動結式的句子。對于下面這個英譯漢的例子,三個系統都不能翻譯成“他把地掃干凈了”:
Hesweptthefloorclean.
*他干凈地掃地了。
*他清掃清潔的地板。
*他清掃地板干凈。
再看漢語動結式翻譯成英語的例子,它們可以說明目前機器翻譯系統分析和理解漢語動結式的能力:
他踢壞了三雙鞋。*Heplaysthreepairsofevilshoes.
*Hekickedthreepairsofshoesbad.
*Himkickspoil3pairsofshoes.
這段路把媽媽走累了。*Thewaymakemothertiredafterthewalk.
*Thissectionofwaywaswalkedmothertired(ly).
*Thisroadmotherwalktired.
大家吃膩了剩菜。*Everybodyhasfeddedupwiththeleftovers.
*Thateverybodyategreasy(ly)surplusvegetable.
*Alleat,isloathetoleavevegetable.
下面我們只討論動結式的生成問題,其中不包括以下三種情況:1)補語用“得”字連接的;2)補語虛化的,如:“抓住”、“買著”、“看完”、“辦成”等;3)補語和動結式的賓語有固定搭配關系的,如:“說走了板”、“看愣了神”、“苦出了頭”等等。
2.機器翻譯中的動結式問題
為了說明機器翻譯如何處理動結式述語結構,我們需要先看看機器翻譯的過程。下圖說明了機器翻譯的原理,也是機器翻譯的整個過程。
附圖
圖1機器翻譯的過程
顯然,這是一個理想化的機器翻譯過程。從S到I再到T的過程是中介語言的翻譯策略,中介語言通常是某種獨立于源語和目標語的邏輯表達式。如果是英譯漢,對英語的分析和理解要從表層深入到底層,得到描述句子意義的中介語言邏輯表達式。同樣地,漢語也要從底層到表層一步一步生成。分析時從表層到底層走得越深,生成時從底層回到表層的過程也就越復雜。因此,需要分別對這兩種語言的句法和語義系統作深入的研究。實際上目前大部分機器翻譯系統都作不到這個程度,常見的翻譯策略是直接法或轉換法,或直接和轉換相結合的混合方法。我們可以通過一個英譯漢的例子對直接法、轉換法和中介語言法這三種翻譯策略作一個比較:
Yougetgoodreceptiononyourradio.(摘自某產品說明書)
譯句1你得到好的接收在你的收音機上。
譯句2你用你的收音機得到好的接收。
譯句3你的收音機接收情況良好。
在機器翻譯系統中,用直接法可以得到譯句1;用基于句法的轉換法,再加上一些語義關系的分析,能得到譯句2;譯句3是基于理解的,用中介語言法有可能作到。顯然,前一節關于動結式英譯漢和漢譯英的例子,都不是基于理解的翻譯。
動結式的結構形式簡潔,語義關系復雜,在漢語里是很有特點的一種結構。呂叔湘先生(1986)曾用它說明漢語句法的靈活性。人們在從各種角度論述動結式述補結構的時候,常常會提到它在對外漢語教學當中是個難點。同樣,在機器翻譯中它也是個難題。在漢語翻譯成外語的系統里,難的是如何分析和理解動結式述補結構。在外語翻譯成漢語的系統里,難的是如何生成含有動結式的句子。
我們在這里只討論生成的情況。在這種情況下,源語(例如英語)往往沒有相當于漢語動結式的結構形式,也很難用轉換規則把英語的某些結構形式與漢語動結式聯系起來。所以除非用個別處理的辦法,采用直接法和轉換法翻譯策略的系統很難生成漢語的動結式譯文。要讓系統有生成動結式的能力,就要按中介語言法的思路,增加分析的深度,理解源語句子要表達的意思(各個成分的概念意義、成分之間的關系意義,句子的句式意義,等等),然后根據意義表達的需要,選擇動結式的一種結構形式,再生成表層的句子。目前我們對漢語的研究還不足以支持這樣的生成過程。所以在現有的機器翻譯系統輸出的漢語譯文當中,很難找到地道的含有動結式述補結構的句子。于是就有了下面的譯文:
Hehasmadethequestioncomplicated.他已使問題復雜化。(他把問題搞復雜了。)
Thechildrenhavehadenoughtoeat.孩子們已吃了足夠。(孩子們吃飽了。)
這樣的譯文對機器翻譯來說就算不錯了,只是念起來有些別扭,有點“機器味兒”。
3.動結式的生成過程
機器翻譯譯文生成的任務是從要表達的意義出發,經過選擇詞語、確定詞語間的語義關系、確定目標語句子的句法結構等步驟,最終輸出與源語言句子在意義上等價的表層字符串。對于動結式的生成,有以下幾步:
(一)確定要表達的意思(四)整合語義結構
(二)選擇詞語、分派語義角色(五)選擇句法表現形式
(三)判斷合法性(六)處理表層詞語
3.1制定要表達的意思
漢語動結式述語結構表達的是一種“動作—結果”事件。比如要生成的意思是:小王讀了這篇文章,結果小王懂了這篇文章。在漢語生成開始之前,機器翻譯系統用中介語言邏輯表達式表示要生成的譯文是什么意思。一般來說,如果這個表達式里面有兩個謂詞結構,并且二者之間有“動作—結果”關系,就可以進入漢語動結式的生成過程。
中介語言邏輯表達式是從源語(譬如英語)分析得到的,源語中的述謂結構和“動作—結果”關系會在表達式中有所體現。但這并不是判斷能否生成漢語動結式的惟一依據。我們在上一節提到,英語往往沒有相當于漢語動結式的結構形式,也很難用轉換規則把英語的某些結構形式與漢語動結式聯系起來,這是就句法結構來說的。實際上,由于英、漢語之間在“動作—結果”關系表達上的差異,(注:戴浩一(2002)指出:“動作—結果”基模雖然在漢、英語中都存在,但是在漢語中占主導地位,而在英語中占次要甚至邊緣地位。而且,這個基模在兩個語言對客觀情況的構建上也因經驗的概念化不同而呈現不同的形式。)在從源語分析得來的語義表達式里,可以用漢語動結式生成的“動作—結果”關系有時是隱含的,與此相關的述謂關系也有不同的表現形式。比如:
英語對動作對象的描寫在漢語中有時可以表達成動作的結果:
Shemarriedthewrongperson.她嫁錯了人。
Heenteredthewrongdoor.他進錯了門。
漢語中動詞的結果補語在英語中有時是說明動作的狀態和程度的成分:
電視看久了。towatchTVforaverylongtime.
我英語學晚了。ItwasverylatewhenIstartedtolearnEnglish.
還有,致使“動作—結果”事件發生的某些因素在漢語里常常可以充當動結式的一個論元角色,(注:袁毓林(2001)稱其為外來的致事。)而在英語里它們往往充當其他成分:
那場可怕的暴風雪凍死了不少人。Manypeoplefrozetodeathintheterriblesnowstorm.
沙發把你坐懶了。Youarebecominglazyonthesofa.
所以我們需要一組規則,在要生成的語義表達式里判斷有沒有應該用漢語動結式表達的述謂關系。在這組規則里,除了兩個謂詞結構及其顯性的“動作—結果”關系符合判斷條件以外,還應該有能夠識別和提取隱含的“動作—結果”關系及其述謂結構的條件。這就需要研究英語和漢語在表達“動作—結果”關系時的差異。這種差異有時在某種類別下表現出來,有時又很個性化,只跟具體詞語有關。目前機器翻譯系統還沒有找到這樣的規則。所以我們就暫時只能看到“她嫁給了錯誤的人”和“他進了錯誤的門”這樣的譯文。
3.2選擇詞語
選擇詞語需要有一部用于信息處理的漢語詞典,告訴我們詞語
和它們的意義,以及它們的用法(比如,謂詞的配價結構及其論元的限制條件)。對于前面的例子,需要先在詞典里選出“小王”、“讀”、“懂”、“文章”這些詞,然后根據詞語的意義和邏輯關系為它們分派語義角色。這些詞在中介語言邏輯表達式里是實體和謂詞。“了”、“結果”、“這”等是算子或關系,把它們轉成詞匯形式還需要另外的分析和處理。詞語選擇和語義角色分派的結果可以表示成樹形圖或特征集合等形式。
附圖
圖2詞語選擇和角色分派的結果
Agen表示施事,Pred表示謂詞,Pati表示受事,Cont表示內容,Expe表示經驗者(當事)。
即使有一部詳盡的詞典,要讓機器根據意義選擇詞語也不是一件容易的事情。我們經常需要在幾個同義詞或近義詞當中進行取舍。比如,漢語的“看”有read的意思,用它來表達我們要生成的意思比“讀”更地道。根據什么樣的規則選擇“看”,不選擇“讀”?目前漢語詞匯和語義的研究還不能形式化地回答這個問題。機器翻譯系統只好先根據詞語搭配的優先關系來判斷。一種作法是,借助描寫詞語概念的語義詞典,用統計語言模型計算語義相似度,讓計算機學會表示和比較詞語搭配的優先關系。但是,用這種工程化的方法并不能繞過漢語研究的作用,因為一個統計語言模型能否達到比較好的處理效果,很大程度上取決于采用什么樣的語言學知識作為參數。
3.3判斷合法性
經過詞語選擇和角色分派,得到了圖2表示的兩個謂詞結構。這一步的任務是,判斷能不能用動結式述語結構表示這兩個謂詞結構及其關系。具體說就是,“看”和“懂”能不能合成“看懂”,并且表示中介語言邏輯表達式要求的“動作—結果”關系。因此合法性的問題關系到哪些動詞和哪些形容詞(或動詞)能夠組合成符合漢語習慣的動結式。
如果給機器翻譯系統提供一個詞表,列出一批動結式的詞語,而“看懂”又剛好在這個詞表里,那么判斷這件事情就比較容易。譬如,在動詞“學”的兩個義項(“學習”和“模仿”)下面,《漢語動詞用法詞典》(孟琮等,1999)列舉了8個動結式實例,《中國語補語例解》(侯精一等,2001)列舉了12個。這兩部詞典是面向人的,如果給機器翻譯用就還需要收錄更多的實例。比如“學懂”、“學膩”,等等(我們在本文的第四部分列舉了“學”下面84個可能需要生成的動結式實例)。實際上,詞表只適用于小范圍的實驗型翻譯系統。動結式述語是一種自由結構,是根據說話的需要臨時造出來的,因此應該是不勝枚舉的。
我們可以這樣想,“學”是一種認知行為,“懂”、“明白”等詞語表示認知活動的效果,因此可以當“學”的結果補語。但人們也常說“這孩子學歪了”、“把身體學垮了”。“歪”和“垮”又根據什么是“學”的結果補語呢?這些補語該用什么條件來生成?我們將在第四部分進一步討論這個問題。
如果這一步判斷的結果是不能生成合法的動結式,那么就需要回到上一步,重新選擇詞語,直到找不到符合預定的語義要求的詞語為止。
3.4整合語義結構
作為一個述謂性的結構整體,動結式有自己語義上的支配成分,包括論元成分和附加成分,我們把這些語義關系的和統稱為語義結構。在這一步,我們需要根據動詞和補語各自的語義結構,確定動結式整體的語義結構,主要是配價結構(價語的數量和性質)。
動結式的配價結構不等于其構件(動詞或補語)的配價結構,也不簡單地等于二者之和。動結式的配價與其構件的配價之間有沒有對應關系?如何從動詞和補語各自的配價結構得到動結式的配價結構?袁毓林(2001)、郭銳(1995)和王紅旗(1995)都曾經作過研究,在解釋成因的同時,尋找動結式對其構件原有的論元進行選擇的控制規則。在一定范圍內應用這些規則,我們可以從動詞和補語的配價結構推算出動結式的配價結構。包括價語的數量:動結式是一價的、二價的,還是三價的;以及價語的性質:動結式述語結構中各個論元的語義角色是什么(主要分為主體格(主論元)、客體格(賓論元))。對于前面的例句,我們就可以得到,動結式“看懂”是二價的,它的兩個論元是“他”(主體格)和“文章”(客體格)。價語的數量和性質是下一步選擇句法結構的主要依據。在動結式生成的整個過程中,漢語語法學者提出的論元整合規則是可以直接影響生成算法的規則,這樣的結論在目前的漢語語法研究中還為數甚少。機器翻譯十分重視這一組規則的作用,也期待著對它更加深入的研究和完善。(注:譬如,袁毓林(2001)提出的準入規則在論元整合結果為等價的情況下是有效的,也是可操作的,對增價的情況雖然有處理的規則,但是計算機不大容易操作,對減價的情況還沒有提出有效的處理辦法。)
3.5選擇句法表現形式
這一步要做的是,選擇什么樣的句法手段去表現動結式的語義結構。動結式有很多表層結構類型,李臨定(1986,181-204頁)曾歸納了五類句型:
(1)N[,1]VC媽媽急哭了
(2)N[,1]VN[,2]VC他走路走累了
(3)N[,1]VCN[,2]我點亮了油燈
(4)N[,1]VN[,2]VCN[,3]他拍桌子拍疼了手
(5)N[,1]把N[,2]VCN[,3]火把他的衣服燒穿了幾個洞
前四類還各有四種可能的表層變換形式(“把”、“被”、“得”字句及其他)。到底應該選取哪一種生成我們的句子呢?這是如何在語義結構和句法結構之間尋找對應關系的問題,我們打算在第五部分就這個問題作進一步的討論。
3.6處理表層詞語
選定了句子的表層結構和語序以后,剩下的事是用詞匯手段表達某些句法或語義范疇。比如:時、體、否定、指代、有定、數量,等等。然后輸出最后生成的結果。對于我們的例子就是:“他看懂了這篇文章”。句子里的“了”、“這”和“篇”是在這一步生成的。
機器翻譯生成漢語動結式時,在句子表層要處理的問題很多,每一個問題也都很復雜,比如時體成分、否定成分的語序等,需要作專門的研究。
3.7操作過程的控制
需要說明的是,上面各個步驟的操作并不是無條件依次進行的。當在某一步無法得到確定的結論時,應該中止動結式的生成過程。
4.動詞和結果補語的組合關系
動詞和結果補語的組合應該是基于語義的。要想離開詞表的限制,判斷哪些動詞和哪些形容詞(或動詞)可以組合成符合漢語習慣的動結式,就需要從語義上研究動補之間的組合類型和規則。顯然,這件事情不是機器翻譯力所能及的。在這里我們只能先從個例入手,看看單音節動詞和單音節形容詞作動詞“學”的結果補語的情況,或許能夠從中看到這個問題的困難所在。
動詞“學”的意思是“學習”或“模仿”。在《現代漢語語法信息詞典》(注:由北京大學研制的用于信息處理的電子詞典,其中有按義項收錄的14479個動詞,2856個形容詞。通過檢索每個詞的屬性,我們可以知道哪些動詞可以帶結果補語,哪些形容詞、動詞可以作結果補語。)(俞士汶,1998,以下稱《語法信息詞典》)中,列出了可以作結果補語的單音節形容詞204個,(注:馬真等(1997)列出了可以作結果補語的單音節形容詞153個。)單音節動詞112個。經過一一搭配測試,其中有54個形容詞和30個動詞能作“學”的結果補語。這樣我們就從《語法信息詞典》中一共得到了84個可能的動結式實例。然后按照《知網》(注:用于自然語言處理的知識系統,由董振東等研制。以從大量詞語中提取出來的“義原”為基本描述單位,采用一種結構化的描述語言來描述概念與概念之間,以及概念的屬性與屬性之間的關系,包括上下位關系、同義關系、反義關系、對義關系、部件與整體關系、材料和成品關系、屬性和宿主關系,以及屬性值和屬性的指向關系、時間和角色關系。互聯網網址:)(董振東等,2001)的定義為每一個實例的補語作語義類別標注,再作聚類分析,整理出“學”的結果補語的六個語義類別。其中A、E、F三類作補語的是形容詞,B、C、D三類作補語的是動詞,分別列在下面(括號里面是《知網》定義的義原)。
A.人的客觀屬性(智能、舉止、年齡、外貌、品性、經濟狀況)
A1.[智能]學笨了學昏了學蒙了學癡了學蠢了學土了學呆了學木了學乖了學傻了
A2.[舉止]學刁了學歪了學賊了學油了學浮了學狠了學犟了學俗了學倔了學皮了學酸了學混了學摳了
A3.[年齡]學老了
A4.[經濟狀況]學富了學窮了
A5.[品性]學差了學廢了學好了學黑了學壞了學糟了
A6.[外貌]學俏了
B.人的主觀感受(態度、感知)
B1.[態度]學煩了學夠了學慣了學迷了學惱了學膩了學怕了
B2.[感知]學懂了學乏了學會了學累了學通了學忘了
C.人的狀態和行為(狀態、行動)
C1.[狀態]學病了學成了學瘋了學垮了學虧了學蔫了學瘸了學死了學癱了學啞了學暈了
C2.[行動]學哭了學跑了學散了學走了
D.事物的狀態(狀態)
學丟了學沒了
E.事物的特性(特性)
學反了學活了學偏了學淺了學深了學雜了學窄了學足了
F.事
件的特性(特性)
學遍了學遲了學重了學錯了學對了學多了學久了學濫了學全了學少了學透了學晚了學早了
可以看出,“學”和它的結果補語之間在概念意義的組合上遵循一定的規律。能否根據這些規律,用計算機可操作的方法,在一定范圍內判斷詞表以外的動結式實例是否合法?比如,《語法信息詞典》沒有把“精”列入可作結果補語的形容詞當中,但是“學精了”是個合法的動結式實例。計算機可以這樣來確認它的合法性:根據《知網》,“精”的定義是[智能>靈](“>”的右部是左部的下位概念。下同),在A1類[智能>愚/訥/智/靈](“/”表示“或”的意思。下同。)的范圍內。同樣,與“精”定義相同的“鬼”、“靈”、“巧”,雖然也沒有被《語法信息詞典》指明可作結果補語,但計算機仍然能夠判定“學鬼了”、“學靈了”和“學巧了”是合法的動結式實例。
對于動補之間的語義組合,結果補語的概念意義是在動詞概念意義的制約下起作用的。我們再來看與“學”有對義關系(Converse)的動詞“教”。“學”和“教”都表示認知行為,前者是使自我認知,后者是使他人認知。因此有可能要求相似的結果補語。實際上,“學”的結果補語基本上都可以作“教”的結果補語。(注:盡管各自的語義指向可能不同,比如:“學笨了”和“教笨了”。這與動詞的配價結構有關。在機器翻譯生成動結式的過程中,由“整合語義結構”這一步處理。)它們或者表示認知行為對其主體(“學”的施事、“教”的與事)產生的效果:改變主體的客觀屬性(智能、舉止、年齡、外貌、品性、經濟狀況)、主觀感受(態度、感知)、狀態和行為;或者表示認知行為對其涉及的事物產生的效果:改變涉及對象的狀態、性質(長短、寬窄、深淺、多少、正反、美丑);或者表示認知行為本身的特性(度量、頻率、程度)。不同的“動作—結果”關系產生了不同的動補組合關系,要把它們研究清楚,整理成規則,是一件非常復雜的事情。
即使有了基于詞語概念意義的規則,也還不能完全解決問題。在《知網》中,與“懂”有相同定義的單音節動詞還有“認”、“審”、“識”、“通”、“悉”、“曉”、“知”。除了“通”以外,其余的都不能作“學”的結果補語。與“精”定義相同的雙音節形容詞“聰明”、“機靈”、“伶俐”、“乖巧”可以作“學”的結果補語,而同樣定義的“聰穎”、“聰慧”卻不行。這說明影響動詞和結果補語組合關系的因素不僅僅是詞語的概念意義。那么,到底還有哪些因素可以作為判斷動結式合法與否的條件?如何把這些條件變成計算機可以操作的規則?我們現在還不得而知。
5.從語義結構到句法表現形式
在動結式的整個生成過程中,選擇什么樣的句法手段來表現其語義結構是比較復雜的一步。人們常說,漢語句法結構和語義結構之間的聯系比較松散,或者說句法成分和語義成分的配位很靈活,一種結構形式經常表示多種意義,一種語義內容也可以用多種結構形式來表示。這就給機器翻譯的漢語生成帶來很大的困難。對于動結式表層句法結構的選擇,我們目前能用到的條件非常有限,所以能生成的句型也很有限。
5.1使生成目標受限
通過整合語義結構我們得到了動結式的配價結構,價語的數量可以幫助我們選擇句型。如果動結式是一價的,選擇有一個體詞性成分出現的句型;是二價的,選擇包含兩個體詞性成分的句型。至于在同屬一類句型的多個表層結構形式中間應該選擇哪一個,還需要更細致的條件和規則。下面討論如何把動結式組成成分之間的語義關系作為選擇的條件。
為了簡化討論的過程,我們在這里只考慮二價動結式的情況(略去“媽媽急哭了”、“他看書看花了眼”、“他扔進屋一塊石頭”等)。這樣,討論的范圍就限制在只含有兩個體詞性成分的表層結構形式里面。呂叔湘(1986)曾經按照補語跟主語或賓語的語義關系,把動結式述補結構分成15類(略去“得”字句等),其中有兩個體詞性論元成分出現的共9類(包括用“把”和“被的句子),分屬以下三種語義關系格式,其中S是V的主體格。(注:在本節討論的范圍內,主體格包括施事、當事;客體格包括受事、內容。)
附圖
綜合上述各種情況可以看出,二價動結式的六種語義結構可以用以下五種表層結構形式來表達。下面的討論將在這個范圍以內進行:
表層結構1:SVCO
表層結構2:S“把”OVC
表層結構3:O“把”SVC
表層結構4:O“被”SVC
表層結構5:S“被”OVC
我們注意到,同時與二價動結式的六種語義結構有對應關系的只有表層結構1(SVCO),所以可以把它當作生成動結式表層的首選。可是進一步觀察就會發現,在用表層結構1表
達某些語義結構時會受到限制。譬如語義結構Ⅱ,我們可以說“大家吃膩了剩菜”,卻不能說“我丟怕了錢包”,也不能說“他看傻了那幅畫”。能說與不能說應該有條件來控制,O和C之間的語義關系可能是一個控制條件,但是目前還沒有確切的規則可用。
在這種情況下,只好先避開表層結構1,選擇2和3。經過初步實驗我們看到,就表達命題意義來說,用表層結構3表達語義結構Ⅱ,用表層結構2表達語義結構Ⅰ、Ⅲ、Ⅳ、Ⅴ、Ⅵ,受到的限制最少。這樣,討論的范圍又縮小到了兩種表層結構形式。問題就變成了:如何找到用這兩種句法形式表達六種語義關系格式的控制條件。我們把這種逐步縮小問題范圍的做法叫作使生成目標受限,實際上這是對復雜問題的一種妥協。也就是對二價動結式,放棄生成所有的表層句式,尋找盡可能簡單和有效的控制條件,先用部分表層結構形式表達其多種語義格式。
5.2生成表層結構的控制條件
從語義結構生成表層結構的主要控制條件是動結式組成成分之間的語義關系。
對于二價動結式的組成成分S、O、V、C,如果S是V的主體格,而且:
(一)如果S、O、V、C相互之間滿足下列五個條件之一,則可以用表層結構2表達:
1.(O是V的客體格)且(O是C的主體格)且(C是一價的)
2.(S是C的主體格)且(O是V的客體格)且(O是C的客體格)
3.(O是C的主體格)且(V和C都是一價的)
4.(S是C的主體格)且(O是C的客體格)且(V是一價的)
5.(O是V的客體格)且(C是V的修飾成分)
(二)如果S、O、V、C相互之間滿足條件6,則可以用表層結構3表達:
6.(O是V的客體格)且(S是C的主體格)且(C是一價的)
表層結構2和3都是“把”字句。關于“把”字句,很多學者從各種角度作過研究。張伯江(2000)曾根據句式語法的觀點指出,除了組成成分的作用以外,“把”字句的整體意義當中還有句式意義的作用。因此,生成的時候還應當考慮上述控制條件能否符合“把”字句句式意義的要求。我們注意到,動結式與“把”字句似乎有一種自然的聯系。“把”字句中V的“處置”意義、C是“把”后面賓語產生的變化等句式意義與動結式的句式意義基本相似。(注:在動結式的表層結構2中,賓語是O;在表層結構3中,賓語是S。)另外,為了體現“把”字句里動作過程的完整性,我們在生成過程的最后一步(處理表層詞語)規定,“把”字后面排斥否定謂語形式。根據我們的觀察和實驗,在二價動結式述語結構的五種表層形式中,“把”字句在語義表達的適應性上比較好,常常能夠包容除語義關系之外的其他一些選擇控制因素。譬如,補語是雙音節的動結式一般不宜選擇表層結構SVCO,但“把”字句不受這個限制。再如,用“把”字句來表達“你把坑挖淺了”這一類含有動結式的句子,正好能夠表示其偏離預期結果的意思,比用其他表層結構更合適一些。“把”字句在動結式生成中為什么會有這樣的表現?這不是機器翻譯能夠解釋的問題。
現在再來看我們要生成的例句:“小王讀了這篇文章,結果小王懂了這篇文章”。經過“動作—結果”述謂關系的判斷、詞語選擇、合法性判定和語義結構整合,我們得知,它可以生成一個二價的動結式述補結構,其中各個組成成分之間的語義關系是:
SVO&SCO
這種語義結構符合控制條件2(S是V和C的主體格,而且O是V和C的客體格)。因此為它選擇的表層句法形式是:
S“把”OVC
再經過表層詞語的處理,最后生成:
小王把這篇文章看懂了。
6.余論
戴浩一(2002)在論述漢語語法的哲學基礎時指出,語法現象是概念系統概念化的結果。他從宏觀角度提出了從概念結構到漢語句法和詞匯形式的過程,說明在這個過程中起作用的是漢語的概念化原則。應該說,機器翻譯從中介語言邏輯表達式生成動結式譯文的過程就是這樣一個實例。從“動作—結果”述謂關系的判斷、詞語選擇、合法性判定、語義結構整合、直到句法形式選擇和表層詞語處理,我們需要的是具體的、可操作的句法化、詞匯化的原則和規則,這樣才能從生成機制上找到動結式的構成條件。多年來,漢語語法一直比較重視動結式述語結構的研究,在結構層次、結構關系、句法功能、語義關系、配價結構,還有組成成分的特征和性質等問題上有許多論述。只是研究結論多數是面向人的,能為漢語信息處理和機器翻譯所用的還不多。比如,關于動結式是如何形成的,人們大多從歷時的角度,指出它的來源是古代漢語的使動用法。而機器翻譯需要的是從共時的角度找到動結式形成的控制條件,告訴計算機,在什么情況下,哪些動詞和哪些形容詞(或動詞)可以組合成、以及怎么組合成符合漢語習慣的動結式述語結構。還有,如何從要生成的句子意思里找到“動作—結果”關系及其述謂結構?如何根據要表達的意思選擇合適的詞語?如何從動詞和補語的配價結構推算出動結式的配價結構?如何從動結式的語義結構選擇它的句法表現形式?以及如何在句子表層處理時體成分、否定成分、指代關系、數量關系?在沒有找到解決這些問題的有效規則以前,機器翻譯系統還只能采用某些權宜之計來生成漢語的動結式。
在強調規則的作用的同時,我們也看到統計語言模型的方法近年來越來越多地應用在語言工程中,出現了基于實例的和基于統計的機器翻譯系統。在人們對語言和翻譯的機制還缺乏系統的了解,還沒有一種適合信息處理的語言理論可以應用的時候,統計語言模型可能會起到某種依靠“量”來獲取“質”的作用。它的前提是,大量語言現象的統計規律能夠確切地反映語句的構造規律和言語過程的認知規律。而實際上,這還是有待證明的觀點。更何況統計語言模型需要建立在語言學知識的基礎上,一個語言模型能否達到比較好的處理效果,很大程度上取決于我們能為它提供什么樣的語言學知識作為參數。計算的任務是獲取參數之間的統計學規律,參數才是建立模型的根本。目前統計模型方法在機器翻譯系統中效果不佳,其主要原因應該不是模型本身的計算能力有限,而是能夠提供給模型的關于機器翻譯的知識太少。漢語語法研究目前還沒有發掘出足夠的這一類知識,或者是還沒有把它們系統地、結構化地組織起來。這一點對基于規則的方法來說,同樣也是亟待解決的問題。
從機器翻譯系統總體設計的角度說,漢語動結式的生成包括兩個方面的問題。一個是根據哪些語言知識來生成,這與漢語研究有密切關系;另一個是怎樣實現生成的過程,這是把問題形式化和設計算法的事情。我們討論的內容只涉及第一個方面,目的是通過對動結式生成過程的描述,看看它需要哪些語言學知識的支持。實際上,我們談到的生成過程還相當粗略,提出的問題也僅僅是一小部分。曾經有人(白碩,1996)說過,繼說本族語言的人和說非本族語言的人之后,計算機的出現給語言研究帶來了一個新的參照物。它將幫助人們認識到一些在舊的參照物下很難揭示出來的語言現象和規律。希望我們提出的這些問題也能成為這樣的一種“參照”。
【參考文獻】】
1白碩1996《語言研究中的實用主義》,《計算機時代的漢語和漢字研究》,北京,清華大學出版社。
2戴浩一2002《概念結構與非自主性語法:漢語語法概念系統初探》,《當代語言學》第1期。
3董振東等2001《知網和漢語研究》,《當代語言學》第1期。
4郭銳1995《述結式的配價結構與成分的整合》,《現代漢語配價語法研究》,沈陽等主編,北京大學出版社。
5侯精一等2001《中國語補語例解》(日文版),北京,商務印書館。
6黃昌寧等主編2001《自然語言理解與機器翻譯》,北京,清華大學出版社。
7Hutchins,W.J.1993《機器翻譯:過去、現在、未來》,臺灣,致文有限公司。
8李臨定1986《現代漢語句型》,商務印書館。
9——1980《動補格句式》,《中國語文》第2期。
10陸儉明1990《“VA了”述補結構的語義分析》,《漢語學習》第1期。
11呂叔湘1986《漢語句法的靈活性》,《中國語文》第1期。
12馬希文1987《與動結式動詞有關的句式》,《中國語文》第6期。
13馬真等1997《形容詞作結果補語情況考察》,《漢語學習》第1期。
14孟琮等1999《漢語動詞用法詞典》,北京,商務印書館。
15王紅旗1995《動結式述補結構配價研究》,《現代漢語配價語法研究》,沈陽等主編,北京大學出版社。
16翁富良等1998《計算語言學導論》,北京,中國社會科學出版社。
17俞士汶1998《現代漢語語法信息詞典》,清華大學出版社。