時間:2023-06-05 10:17:48
開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇模式識別技術,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。
存在于時間和空間中可觀察的事物,如果可以區別它們是否相同或相似,都可以稱之為模式(pattern)。而針對現代信息科技的狹義領域內,模式可以說是為了能讓計算機執行和完成分類識別任務,通過對具體的個別事物進行觀測所得到的具有時間和空間分布的信息。從這些大量的信息及數據出發,模式識別(Pattern Recognition)便是用計算機實現人對各種事物或現象的分析,描述,判斷,識別的過程。模式識別技術的發展是從1929年G. Tauschek發明數字閱讀機開始的,直到20世紀70年代,一些發達國家開始將模式識別應用到刑事偵查部門。隨著科技的不斷進步,模式識別在刑事科學技術方面的應用越來越廣泛,發揮的作用也越來越大,從某種意義上說模式識別促進了偵查和刑事技術手段的發展。
一、模式識別系統
模式識別是解決如何利用計算機對樣本進行模式識別,并對這些樣本進行分類。執行模式識別的計算機系統被稱為模式識別系統。一個完整的模式識別系統,由數據獲取、預處理、特征提取、分類決策和分類器設計5部分組成。可以分為上下兩部分:上半部分完成未知類別模式的分類;下半部分完成分類器的設計訓練過程。
1.數據獲取及預處理
數據獲取是通過傳感器,將光或聲音等信息轉化為計算機能夠識別的電信息的過程。為了更準確有效的讀取信息,對由于信息獲取裝置或其他因素所造成的信息退化現象進行復原、去噪,從而加強信息的利用率,這個過程就是預處理。
2.特征提取
由于數據獲取部分所獲得的原始信息數據量相當龐大,為了將這種維數較高的模式空間轉換為維數較低的特征空間,從而實現分類識別,得到最能反映分類本質特征的向量,這個對特征進行抽取和選擇的過程即為特征提取。
3.分類器設計和分類決策
分類器設計的主要功能是通過訓練來確定判決規則,它屬于訓練過程的一部分,其主要目的就是針對訓練樣本來按其判決的規則進行分類,以建立錯誤率最低的標準庫。分類決策便是以分類器設計所建立的標準庫為標準對特征空間的待識別對象進行分類,這樣不僅能夠使錯誤識別率降到最低,還能極大的提高數據利用率,最大程度的減少客觀的信息損失。
二、模式識別在刑事科學技術中的應用
近幾年,作為新生現代科技手段,模式識別技術被廣泛應用于生活中的各個領域,如:字符識別、醫療診斷、遙感控圖、環境監測、語音識別和產品檢測等。模式識別技術極大的提高了人們的工作和生活質量,不斷推動著社會的發展。在刑事科學技術方面,模式識別已經處于舉足輕重的地位,特別是在指紋識別、人臉識別、虹膜識別等生物識別技術方面極大的提高了刑事偵查水平,為尋找犯罪證據和破獲案件提供了強有力的技術手段支持,促進了刑事科學技術現代化建設。
1.指紋識別
由于指紋具有唯一性、方便性和終身不變性,我國早在兩千年前就曾使用指紋來破案。替代了傳統的人工識別指紋的方法,指紋識別技術已成為目前刑事偵查部門進行認定識別工作的主流技術,同時也是證據鑒定和偵查破案的有力保障。
如在20年前漳州商業大廈電梯殺人一案中,現場的線索少之又少,唯一有價值的線索是民警通過仔細勘查所提取到的一枚殘缺指紋。在當時指紋識別技術還未完全成熟的年代,僅僅通過這枚殘缺指紋找到兇手是相當困難的。然而,隨著指紋識別技術的成熟,這件在當時看來無法破解的謎案,卻在2011年全國公安系統的“清網行動”中發現08年嫌疑人于上海斗毆的指紋與95年殺人案的殘缺指紋認定同一。20年前的謎案被輕松告破,嫌疑人蔡某偉終被緝拿歸案。
指紋識別系統是一個典型的模式識別系統,其主要分為指紋數據獲取、指紋區域分割、指紋圖像預處理、特征提取和匹配五個過程。憑借著可靠性強、速度快、操作簡便等優點,指紋識別技術將繼續作為刑事科學技術里進行生物識別的主要技術手段不斷成熟發展。但是,小幾率的錯誤識別和模糊難成像等問題仍是指紋識別技術進行改進需要考慮的首要問題。
2.人臉識別
人臉識別是目前模式識別領域中被廣泛研究的熱門課題,相比傳統的身份識別方式,人臉識別憑借著其身具有的安全性、保密性和方便性等優勢,在近幾年來得到了飛速發展并廣泛應用于社會中的安全和經濟領域。目前,人臉識別技術已經成為刑事科學技術工作中較為成熟的鑒定技術之一,在刑事偵查實際工作中,人臉識別技術落實到身份認證、視頻監控、視頻資料分析等具體工作上,使得在進行布控排查、人像識別、犯罪嫌疑人認定以及門禁等方面都得到了良好的應用效果。
關鍵詞:模式;模式識別;模式識別的應用
1 引言
人們在觀察事物或現象的時候,常常要根據一定需求尋找觀察目標與其他事物或現象的相同或不同之處,并在此特定需求下將具有相同或相似之處的事物或現象組成一類。例如字母‘A’、‘B’、‘a’、‘b’,如果從大小寫上來分,會將‘A’、‘B’ 劃分為一類,‘a’、‘b’劃分為另一類;但是如果從英文字母發音上來分,則又將‘A’、‘a’劃分為一類,而‘B’、‘b’則為另一類。人們也可以正確地區分出它們,并根據需要將它們進行準確歸類,當然, 前提條件是人們需要對‘A’、‘B’、‘a’、‘b’一般的書寫格式、發音方式等有所了解。人腦的這種思維能力就構成了“模式識別”的概念。那么,什么是模式?什么是模式識別呢?
2 模式和模式識別
從以上的例子可以看出,對字符的準確識別首先需要在頭腦中對相應字符有個準確的認識。當人們看到某物或現象時,人們首先會收集該物體或現象的所有信息,然后將其行為特征與頭腦中已有的相關信息相比較,如果找到一個相同或相似的匹配,人們就可以將該物體或現象識別出來。因此,某物體或現象的相關信息,如空間信息、時間信息等,就構成了該物體或現象的模式。Watanabe定義模式“與混沌相對立,是一個可以命名的模糊定義的實體”。比如,一個模式可以是指紋圖像、手寫草字、人臉、或語言符號等。廣義地說,存在于時間和空間中可觀察的事物,如果可以區別它們是否相同或相似,都可以稱之為模式;狹義地說,模式是通過對具體的個別事物進行觀測所得到的具有時間和空間分布的信息;把模式所屬的類別或同一類中模式的總體稱為模式類(或簡稱為類)。模式識別則是在某些一定量度或觀測基礎上把待識模式劃分到各自的模式類中去。計算機模式識別就是是指利用計算機等裝置對物體、圖像、圖形、語音、字形等信息進行自動識別。
模式識別的研究主要集中在兩方面,一是研究生物體( 包括人) 是如何感知對象的,二是在給定的任務下,如何用計算機實現模式識別的理論和方法。前者是生理學家、心理學家、生物學家、神經生理學家的研究內容,屬于認知科學的范疇;后者通過數學家、信息學專家和計算機科學工作者近幾十年來的努力,已經取得了系統的研究成果。
3模式識別的方法
現在有兩種基本的模式識別方法,即統計模式識別方法和結構(句法)模式識別方法。統計模式識別是對模式的統計分類方法,即結合統計概率論的貝葉斯決策系統進行模式識別的技術,又稱為決策理論識別方法。利用模式與子模式分層結構的樹狀信息所完成的模式識別工作,就是結構模式識別或句法模式識別。
4.模式識別的應用
經過多年的研究和發展,模式識別技術已廣泛被應用于人工智能、計算機工程、機器學、神經生物學、醫學、偵探學以及高能物理、考古學、地質勘探、宇航科學和武器技術等許多重要領域,如語音識別、語音翻譯、人臉識別、指紋識別、手寫體字符的識別、工業故障檢測、精確制導等。模式識別技術的快速發展和應用大大促進了國民經濟建設和國防科技現代化建設。
4.1 字符識別
字符識別處理的信息可分為兩大類:一類是文字信息,處理的主要是用各國家、各民族的文字( 如: 漢字,英文等)書寫或印刷的文本信息,目前在印刷體和聯機手寫方面技術已趨向成熟,并推出了很多應用系統;另一類是數據信息,主要是由阿拉伯數字及少量特殊符號組成的各種編號和統計數據,如:郵政編碼、統計報表、財務報表、銀行票據等等,處理這類信息的核心技術是手寫數字識別。
4.2 語音識別
語音識別技術技術所涉及的領域包括:信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等等。近年來,在生物識別技術領域中,聲紋識別技術以其獨特的方便性、經濟性和準確性等優勢受到世人矚目,并日益成為人們日常生活和工作中重要且普及的安全驗證方式。而且利用基因算法訓練連續隱馬爾柯夫模型的語音識別方法現已成為語音識別的主流技術。該方法在語音識別時識別速度較快,也有較高的識別率。
4.3 指紋識別
我們手掌及其手指、腳、腳趾內側表面的皮膚凹凸不平產生的紋路會形成各種各樣的圖案。而這些皮膚的紋路在圖案、斷點和交叉點上各不相同,是唯一的。依靠這種唯一性,就可以將一個人同他的指紋對應起來,通過比較他的指紋和預先保存的指紋進行比較,便可以驗證他的真實身份。一般的指紋5個大的類別:左旋型(leftloop),右旋型(right loop),雙旋型(twinloop),螺旋型(whorl),弓型(arch)和帳型(tented arch),這樣就可以將每個人的指紋分別歸類,進行檢索。指紋實現的方法有很多,大致可以分為4 類:基于神經網絡的方法、基于奇異點的方法、語法分析的方法和其他的方法。
4.4細胞識別
細胞識別是最近在識別技術中比較熱門的一個話題。以前,對疾病的診斷僅僅通過表面現象,經驗在診斷中起到了主導作用,錯判率始終占有一定的比例;而今,通過對顯微細胞圖像的研究和分析來診斷疾病,不僅可以了解疾病的病因、研究醫療方案,還可以觀測醫療療效。如果通過人工辨識顯微細胞診斷疾病也得不償失,費力費時不說,還容易耽誤治療。基于圖像區域特征,利用計算機技術對顯微細胞圖像進行自動識別愈來愈受到大家的關注,并且現在也獲得了不錯的效果。但實際中,細胞的組成是復雜的,應該選擇更多的特征,建立更為完善的判別函數,可能會進一步提高分類精度。
參考文獻:
[1] 邊肇祺,張學工等編著. 《模式識別》(第二版). 北京:清華大學出版社,2000.
[2] 王碧泉,陳祖蔭. 《模式識別理論、方法和應用》. 北京:地震出版社,1989.
【關鍵詞】模式識別;特征提取;遺傳算法;支持向量機
0 引言
模式識別誕生于20世紀20年代,是對表征事物或現象的各種形式的信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程。該學科主要研究使機器通過學習能做以前只能由人類才能做的事,具備人所具有的、對各種事物與現象進行分析、描述與判斷的部分能力。模式識別所研究的理論和方法在很多科學和技術領域中得到了廣泛的重視,目前已成功應用于指紋識別、印刷體字符識別、語音識別、車牌識別、人臉識別、手寫體字符識別、自動文本分類、多媒體數據挖掘等領域。
本文基于統計模式識別方法來研究車輛識別問題。對待定的區域應用特征提取、特征選擇的方法提取統計特征,根據統計模式識別原理對候選車輛區域行識別確認。特征提取采用PCA(主成分變換法),特征選擇采用遺傳算法,分類器設計是SVM(支持向量機)。
1 統計模式識別方法
基于統計方法的模式識別系統由四部分組成:數據獲取、預處理、特征提取和選擇、分類器設計和分類決策。
1.1 數據獲取與預處理
數據獲取就是通過一定的技術和手段對個別事物進行觀測,從而獲取該事物的時間和空間分布信息。這里需要將各種測量的量轉換成計算機可以直接處理的數據。測量到的信號通常有一維信號,二維信號和邏輯信號。預處理階段就是要將數據獲取階段所引入的噪聲進行濾除,并對數據獲取階段所造成的信號退化進行復原,并為下一步特征提取提供必要的基礎。
1.2 特征提取與特征選擇
通常情況下,在數據獲取階段獲得的數據量是相當大的。直接應用這些數據進行模式識別,數據量大,計算復雜。當向量維數達到一定維數時,就必須采取一定的措施能使系統能夠處理這些數據和正常工作,即特征降維,模式識別中稱為特征提取和選擇。一般來說,特征提取和選擇是模式識別系統中關鍵的一步,其好壞直接決定了模式識別系統的性能。
1.2.1 主成分變換法
主成分分析方法是應用最廣泛的一種特征提取方法之一,它是一種統計學方法,在信號處理、模式識別、數字圖像處理等領域得到了廣泛的應用。主成分分析基本思想是提取出空間原始數據中的主要特征,減少數據冗余,使得數據在一個低維的特征空間被處理,同時保持原始數據的絕大部分的信息,從而解決數據空間維數過高的瓶頸問題。
所謂主成分就是原始數據的m個變量經線性組合后得到的變量,該變化使得其變換后的變量方差為最大(第一主成分)的部分。各個主成分之間是相互線性無關的(正交的)從第一主成分往后,主成分按方差大小的順序排列。
1.2.2 遺傳算法
遺傳算法是建立在自然選擇和遺傳變異基礎上的自適應概率性搜索算法,在該算法中,染色體是二進制字符串編碼,每一編碼字符串為一候選解,這種染色體有多個,即有一群候選解。染色體像生物進化一樣有繁殖、交叉和突變三種現象,這些現象稱為遺傳算子。在每一代中,保持一定數目M為定值的解群,經過對各解的適應度值計算,使解群中的各個解得到評價,各個解的適應度值的大小作為染色體復制機會大小的先決條件。
遺傳算法中有一個很重要的概念,稱為適應度函數。如何將遺傳算法中的不斷進化的染色體與現實問題中的優劣選擇相聯系是該算法成功的關鍵。一般的方法是構造一個與現實問題相聯系的適應度函數。
1.3 分類器
從數學觀點來看,分類決策就是找出決策函數。當已知待識別模式的完整的先驗知識時,可據此確定決策函數的數學表達式。如果僅知待識別模式的定性知識,則在確定決策函數的過程中,通過反復訓練、調整,以達滿意的決策函數表達式,從而作為決策分類的依據。
支持向量機是一種基于統計的學習方法,它是對結構化風險最小化歸納原則的近似,由于其出色的學習性能,使得SVM具有較好的推廣能力。其原理是針對二值分類問題提出的,其核心思想是將結構風險函數引入到分類中。支持向量機通過引入結構風險函數恰恰能完成這個任務,從而提高了機器學習的泛化能力。這些特點使支持向量機能有效地克服高維問題。
2 實例分析
為了檢驗各個主成分變換特征提取方法和支持向量機分類器對車輛檢測的識別率和有效性,我們進行了對比實驗:特征提取和特征選擇的方法與不同分類器方法進行組合測試。
為了檢驗本論文中提出的車輛檢測方法,我們進行了實驗測試。道路取景的來源國內城市道路。實驗中選用的訓練樣本為3000,其中車輛為1500,其余為背景樣本。
利用前文描述的方法,獲得的特征提取器為:
T=[t(1),t(2),t(3)]
其中,特征向量為:
t(1)=(-0.5346,-0.0804,-0.8329,0.0444,-0.0794,-0.0224,
-0.0652,0.0317)
t(2)=
(-0.2102,0.8256,0.0754,0.4899,0.0516,0.0196,0.0355,0.0872)
t(3)=(-0.0812,-0.5261,0.1491,0.8244,-0.0161,0.0933,
-0.0048,0.0754)
同時增加了其它分類器配合進行測試,選用的分類器有KNN(K最鄰近結點算法)、QDF(二次判別方程)、COS(基于樸素貝葉斯分類器)。測試樣本為600,其中車輛300,背景300。測試結果為:SVM的車輛識別率為85.3%,背景識別率為94%;KNN的車輛識別率為82.6%,背景識別率為76.6%;QDF的車輛識別率為42.6%,背景識別率為79.3%;COS的車輛識別率為52%,背景識別率為97%。
通過對實驗數據的分析,可以得出,特征提取的算法中,采用主成分變換法進行特征提取是所實現的特征提取算法中性能較優。同時,SVM分類器具有是具有最高的識別率。所以最終選擇的是主成分變換法、遺傳算法支持向量機的車輛識別算法組合。
3 結論
本文分析并實現了基于車輛統計特征的車輛識別算法。算法包括三個部分:特征提取,特征選擇,和分類器設計。利用特征提取方法(PCA)對待確定的區域應用特征提取的方法提取統計特征,應用遺傳算法對特征提取階段的結果進行選擇,其選擇結果用于訓練SVM分類器。最后應用訓練好的SVM分類器進行分類識別檢測。此外,還將此算法與其它車輛識別算法進行比較,實驗結果表(下轉第183頁)(上接第99頁)明,基于車輛統計特征的車輛識別算法不僅具有較好的有效性,而且能有效的提高識別率和降低誤識別率,具有很好的應用前景。
【參考文獻】
[1]邊肇祺,張學工.模式識別[M].2版.北京:清華大學出版社,2007.
關鍵詞:CDIO;工程教育;主動學習;經驗學習
作者簡介:袁立(1978-),女,河北邢臺人,北京科技大學自動化學院,副教授;李曉理(1971-),男,遼寧沈陽人,北京科技大學自動化學院,教授,博士生導師。(北京 100083)
基金項目:本文系教育部第五批高等學校特色專業建設項目“自動化CDIO特色專業建設”(項目編號:TS2422)的研究成果。
中圖分類號:G642.0 文獻標識碼:A 文章編號:1007-0079(2013)04-0051-02
CDIO是由美國麻省理工學院、瑞典皇家技術學院、瑞典查爾姆斯技術學院、瑞典林克平大學等四所大學從2000年起合作研究探索的一種新型的工程教育模式。CDIO教育模式力圖培養學生能夠在現代的、基于團隊的環境下構思(Conceive)—設計(Design)—實施(Implement)—運行(Operate)復雜、高附加值的工程產品、過程和系統,讓其成為成熟、有責任感的人。[1]CDIO改革有三個總體目標,即教育學生,使他們能夠更深層次地掌握技術基礎知識,不是通過被動的聽講過程獲取知識,而是讓學生自己構建他們的知識,面對和糾正自身的錯誤理解;教育學生能夠領導新產品、過程和系統的創造與運行,在此過程中培養學生的個人能力和人際交往能力,個人能力包括工程推理和解決問題的能力、科學探索、系統思維和批判性及創造性思維,人際交往能力包括交流溝通和團隊工作能力;第三個目標是使學生能夠理解和研究技術發展對社會的重要性和戰略影響。可以看出,CDIO模式注重扎實的工程基礎理論和專業知識的培養,并通過貫穿整個人才培養過程中的團隊設計和實踐環節的訓練,從而培養既有過硬的專業技能又有良好綜合素質的國際化工程師。[2]
作為高等工程教育的一種新的教育理念,CDIO模式受到越來越多工程學科的重視。北京科技大學(以下簡稱“我校”)自動化專業在2009年以自動化專業工程化、鋼鐵流程自動化為工程背景和專業特色加入了CDIO項目。“模式識別”課程是模式識別與智能系統學科的基礎課,是一門基礎理論與工程實踐相結合的課程。本課程主要討論統計模式識別的分類和識別基本原理、方法。要求學生掌握統計模式識別的基本概念、基本識別原理和方法,了解其發展動態,有效地運用所學知識和方法解決實際問題,為研究新的模式識別的理論和方法打下基礎。[3,4]那么如何在該課程的教學過程中培養學生的綜合素質,滿足學科學習和能力學習的雙重目標,成為需要迫切思考的問題。本文在深入研究和分析“模式識別”課程現有教學模式的問題和不足的基礎上,探索將CDIO教育理念引入該課程,進行教學設計、規劃教學方案、確定教學手段、安排教學內容和考核方式,以促進學生綜合能力的培養。
一、“模式識別”課程傳統教學模式中存在的問題
“模式識別”課程從應用角度來看,屬于人工智能、機器學習的領域,從學術內涵角度來看是進行數據處理、信息分析的學科。該課程在縱向上與概率論、數理統計密不可分,在橫向上注重與數字圖像處理、信號處理、通信原理等專業課程有關聯。可見,該課程對于鞏固已學知識、開展后續專業課學習及未來工作具有積極的指導意義。
該課程內容本身比較抽象性,其概念、原理和方法都隱藏在數學符號中,講課過程中學生往往會感到枯燥、難懂。教師的講解和學生的學習難度都比較大,理論知識學完后學生對于其實際應用有時仍是一頭霧水。傳統教學模式下存在以下一些問題:在教師的授課環節中,往往以教師的授課為中心,而不是以學生為主體,這種重“教”輕“學”的模式不利于學生對基礎知識的掌握;課時的安排上,總課時(32學時)中28學時為理論授課,4學時為實驗。在實驗環節中,學生上機動手編程,根據課上內容設計相應的分類器實現。這種課時安排不利于充分開展工程項目實踐活動,使學生失去了了解模式識別在工程項目中真實應用的機會,限制了其對專業技能的掌握;在實驗環節中,實驗內容的安排基本上以個體為單位的驗證性實驗為主,缺乏多人合作的設計性、綜合性及創新性的實驗,不利于學生團隊協作能力、批判思考能力、綜合解決問題能力及創新能力的綜合培養。
可見,以上重理論輕實踐、強調個人學術能力而忽視團隊協作精神、重視知識學習而輕視開拓創新的培養模式與CDIO理念還有很大差距。
二、基于CDIO的“模式識別”課程教學改革探索
針對目前“模式識別”課程教學中存在的問題對原有的課程體系進行改革,以適應CDIO教育模式下的人才培養目標。我校按照CDIO教學大綱的標準來進行教學設計和教學活動的安排,進行如下一些主要的變革:
第一,從教學內容的安排上進行改革。在教學過程中優化、精選教學內容,確保教學內容相對穩定而又不斷地更新,保持內容的先進性。對基礎理論部分如貝葉斯決策理論、線性與非線性判別函數、近鄰法和集群、聚類分析、特征提取與選擇等知識單元,將主要精力放在精講、訓練與總結這三個環節,對重點、難點講深講透。此外,還根據模式識別領域最近的發展,引入最新科技成果,為學生適當補充統計理論與支持向量機、流行學習理論和稀疏編碼理論等知識。另外,還從橫向上注重與同一層次相關課程(如“數字圖像處理”)的關聯性,使學生把從不同課程上學到的知識整合起來,為將來從事工程項目活動打下基礎。
第二,從教學方式上進行改革。傳統授課方式的一般模式是:教授、復述、周作業、期末一個小的設計項目和最終筆試。要改變這種以教師為中心的教學方式,按照CDIO專業計劃中提倡的一體化學習的思想來完成教學任務。為了考試而死記硬背理論知識會使學生對學習內容理解膚淺,缺少長期學習的積極性。所以在教學中采用主動學習方式使學生直接參與思考和解決問題的活動,讓學生思考概念,特別是新的想法,并要求他們做出明確地反應,使他們明白學到了什么和怎樣學習的。
主動學習方法在課堂教學中有許多靈活的手段,比如授課疑點卡、概念問題、小組討論等等。授課疑點卡通過收集課堂上的反饋來測定學生在理解方面的不足。針對學生提出的問題,教師可以在課程的網頁上回答,也可以在下次課的開始時回答。對學生來講,寫下問題的過程有助于他們組織思路并進行更有效地學習;對教師來講,這些疑點卡能及時糾正學生的錯誤的理解,并幫助教師改進后續的內容。概念問題是一個多項選擇題,用來收集學生對課堂上的反饋,從而了解學生是否理解教學內容并糾正學生的誤解之處。教師在課前把“模式識別”的重要概念以及通常可能的錯誤理解準備成問題,在課堂上適時提出來,學生通過舉手來回答即可。根據回答情況,學生可進行討論或由教師進行點評。小組討論:對于一些相對簡單的內容,讓學生提前預讀,在課上采用分組討論、學生講解、教師總結的方式進行。
第三,采用經驗學習法為學生創造建立信心的機會。工程教育的CDIO教學模式正是基于經驗學習理論的。經驗學習讓學生能夠在模擬工程師角色和工程實踐的環境中進行教學活動。對大多數學生而言,學習和理解理論的動力就是應用理論并與實踐相結合。通過實踐學習能激發他們更大的積極性,并使他們認識到所學的知識是有用的,學習積極性的提高使他們對所學的知識和即得能力更有信心。其結果是讓學生有能力勝任未來工程師的角色。
常用的經驗學習方法就是基于項目的學習。在授課過程中增加模式識別應用項目的內容,如字符識別、車牌識別、人臉識別、膚色分割、圖像檢索等,通過項目講解幫助學生回顧所學的知識,并將理論與實際相結合,使學生學會分析和解決實際問題的方法。另外,還將教師從事的與“模式識別”相關的科研項目介紹給學生,拓展學生的知識面。從實際效果來看,有些學生對實際工程案例和科研工作很感興趣,主動申請“模式識別”方向的本科創新項目和發表學術論文。
對于一些典型的“模式識別”工程項目,學生分團隊后選擇某個工程項目,以團隊合作方式收集和整理有關信息資料,提出解決方案,研究結束后做出演示系統并在課堂上進行講解。
第四,對學習效果的評估方法進行改革,采用多種方法來收集學生在課程學習期間和學習之后等不同時期的學習證據,全面了解學生的學習成績和學習態度有何轉變。第一種方式仍然是傳統的筆試。第二種是口試,可以用于概念問題來判定學生對知識的理解層次。口頭考核能從深層次上反映學生對概念的理解和應用,因為現實中工程師每天都會應用基礎概念進行理性表述,這種方式可以評估學生進行理性表達的能力。第三種是表現評分,通過學生在口頭演講和團隊工作等特定任務中的表現情況來進行評估。第四種是項目審查,對團隊完成的項目進行評估。模式識別項目主要是從分類性能上對學生完成的項目進行評估。
結合CDIO教育模式,通過以上四方面的改革,能夠創設積極的學習情景,激發課堂活力,調動學生的積極性和主動性。這套新的教學體系可以用圖1來描述。
三、結束語
本文在CDIO工程教育模式下,探討了如何對傳統“模式識別”課程教學方法進行改革,提出了一種新的教學體系。近兩年的授課結果表明,新授課體系在CDIO模式下對激發學生學習興趣、明確學習方向、轉變學習態度、提高專業基礎水平和團隊合作意識及提高教學效果等方面發揮出了明顯的積極作用。
參考文獻:
[1]顧佩華,沈民奮,陸小華.重新認識工程教育——國際CDIO培養模式與方法[M].北京:高等教育出版社,2009.
[2]陸鑫,任立勇,王雁東.CDIO模式下軟件工程專業課程的教學評價方式[J].計算機教育,2011,(16):64-67.
目的: 探討模糊k最近鄰算法運用于葛根類藥材模式識別的可行性。方法:選擇6種化學成分的含量,對不同產地的多種葛根類中藥的藥理抗內毒素活性建立了模糊k最近鄰規則識別模式。結果: 模糊k最近鄰規則對葛根類中藥的藥理抗內毒素活性識別正確率達100%,優于經典k最近鄰法與Bayers判別法。結論:模糊k最近鄰算法可用于中藥模式識別研究。
【關鍵詞】 模糊k最近鄰算法; k最近鄰算法; 模式識別; 葛屬
模式識別技術是一種借助數學方法和計算機技術來對樣品的內部規律及隱含性質進行分析的綜合技術,包括判別分析、聚類分析、機器學習等多種方法。該技術已經廣泛應用于各個領域,隨著中藥現代化進程,該項技術逐漸在中藥領域深入應用。k最近鄰法已被廣泛應用于模式識別的分類器設計,所謂k最近鄰法(KNN)就是取未知樣本的k個近鄰,看這k個近鄰多數屬于哪一類,就把其歸于哪一類,在分類過程中KNN是采用簡單多數投票法來確定未知樣本的分類[1]。問題是,當學習樣本類別分布不均的時候,如果僅考慮排序后的k個最近鄰而忽視樣本間的不同距離,勢必會降低KNN的分類精度[2]。模糊k最近鄰算法(FuzzyKNN,FKNN)就是將模糊理論與k最近鄰法相結合的一種監督學習技術,它有效解決了上述問題,它將未知樣本與k個最近鄰的距離模糊化,并為每個類別都設置了相應的隸屬度,而不象KNN那樣簡單的將未知樣本的歸類定為“屬于”或者“不屬于”[3]。FKNN已被成功的應用于多個領域,在蛋白質結構預測[3]及文本分類[2]都有著不錯的性能,本研究將FKNN應用于中藥的模式識別,目前國內尚未見報道。
1 FKNN算法的原理及實現
本研究的FKNN算法[4]不同于聶生冬等[5]將模糊c均值聚類與KNN簡單結合,而是在KNN的基礎上結合模糊理論進行歸類決策實現的,其具體算法安排如下:
⑴ 設已知樣本集合P={p1, p, …pn},n為已知分類的樣本數,c代表分類數,u代表一個c×n的矩陣;
⑵ 確定未知樣本的最近鄰數k的值;
⑶ 選擇歐式距離范數d作為距離測度;
⑷ 對每個未知樣本x:
① 計算n個距離d=d(x,pj),并對其進行排序:
pi∈P,且x P
d(1)≤d(2)≤d(3) ……≤d(k)≤d(k+1) ≤…≤d(n)
其中d(1)到d(k)是未知樣本x的k個最近鄰與x的距離。
② 在u中找出對應于k個最近鄰距離的k個列{uj},其中j=1,2, ……k。
③ 利用上一步從u中獲得的k個列{uj},計算[4]:
ui(x)=kj=1uij1d(x,pj)2m-1 kj=11d(x,pj)2m-1
其中m為模糊權重調節因子,對于z=1,2, …,c,如果ui(x)=max{uz(x)},z≠i,則x屬于第i類。取下一個未知樣本轉到(4)繼續,上述算法不是迭代過程,每個未知樣本都必須按照上述算法處理一遍。
轉貼于
2 中藥葛根類藥材的模式識別
中藥模式識別通常是根據中藥所含化學成分的整體進行分類或描述,識別該中藥的真偽與優劣。葛根為豆科植物野葛或甘葛藤的干燥根,全世界已知的葛屬植物大約有18種,我國是葛屬植物的原產地之一,分布極其廣泛,葛屬植物有9個種和2個變種,其中7種與藥用有關,研究結果表明,不同葛屬植物中藥用成分異黃酮含量和組分差異顯著。曾明等[7]對8個來源共17個藥材樣本的葛屬植物的總黃酮X1、葛根素X2、大豆苷X3、大豆苷元X4、3’甲氧基葛根素X5及多糖X6,6個化學成分進行了測定[6],并測定了相應的抗內毒素活性強度,按照文獻[8]方法對各藥材的抗內毒素活性強度進行分類,強度較弱者記為1,強度較強者記為2,結果見表1。本研究運用模糊k最近鄰算法以6個化學成分的含量為輸入變量,藥理活性強度分類為目標類別建立模式識別模型。
從表1原始數據隨機選取5個作為未知數據進行測試,剩余12個作為已知數據進行學習,將各數據進行歸一化處理后,運行FKNN算法,算法實現語言為MATLAB。對于FKNN,k值對分類器的性能有顯著影響,表2是不同k值下FKNN的分類精度。由表2結果可見當k值大于等于7時,FKNN具有最好的分類精度,對未知數據集及整個數據集的識別正確率都達到了100%,在本例中k取7進行建模識別,識別結果見表1。我們也嘗試用經典KNN法對數據進行分類,結果見表3,可見,在相同k值下FKNN都要比KNN表現出更好的分類性能。就本例數據而言,無論我們怎么調整參數,KNN法的分類精度都不能令人滿意。張漢明等[8]也對同樣的數據進行了Bayers判別分析,結果回判的識別正確率也僅有88%與94%。
表1 17個藥材樣品的化學與藥理模式數據(*為測試數據)(略)
表2 不同k值下FKNN的分類精度(略)
表3 不同k值下KNN的分類精度(略)
3 結果與討論
FKNN作為一種監督學習技術,將對每一個未知樣本進行相同的算法處理,且由于其算法不是迭代過程,因此也不存在不收斂的現象。另外,對于模糊權重調節因子m的取值,理論上可以是任意的,根據文獻[4],本研究取值m=2,我們也對m在[1,3]范圍內,以0.1為步長考察了不同m值對FKNN分類精度的影響,結果發現并無差異。在m=2,k=7時FKNN對17種葛根類中藥的藥理抗內毒素活性識別正確率達100%,識別精度要優于k最近鄰法及文獻[8]的Bayers判別法,FKNN可以用于中藥的模式識別研究。
【參考文獻】
1 Jiawei Han,Micheline Kamber. 著. 范明,孟曉峰,等譯. 數據挖掘概念與技術. 北京:機械工業出版社,2001:209.
2 Shang Wenqian,Qu Youli,Huang Houkuan,etal. Fuzzy knn text classifier based on gini index. Journal of Guangxi Normal University:Natural Science Edition,2006,24(4):87~90.
3 Rajkuar Bondugula,Ognen Duzlevski,Xu Dong. Profiles and Fuzzy knearest neighbor algorithm for protein secondary structure prediction. AsiaPacific Bioinformatics Conference, 2005:85~94.
4 J. M. Keller,M. R. Gray,J. A. Givens. A fuzzy knearest neighbor algorithm. IEEE Trans on SMC, 1985,15(4):580~585.
5 聶生東,聶斌,章魯,等. 基于模糊k近鄰規則的多譜磁共振腦圖像分割方法的研究. 中國生物醫學工程學報,2002,21(5):471~477.
6 曾明,張漢明,鄭水慶,等. 葛屬植物根的異黃酮類成分分析. 第二軍醫大學學報,1998,19(2):189~190.
7 曾明,張漢明,鄭水慶,等. 葛根及同屬植物根的抗內毒素作用比較. 中國中藥雜志,1997,增刊:178~179
關鍵詞:模式識別;圖數據;圖匹配;核方法
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2014)20-4802-02
The Research of Graph Matching Based on Kernel Method
LI Yin-hu
(Department of Information and Control Engineering Institute, Xi’an University of Architecture and Technology, Xi’an, 710055, China)
Abstract: With the development of computer technology and network technology,our word is full of large number of data. It is a challenge thing that how to recognize and analyse these data. In the field of computer, graph is a flexible data structure and Learning graph that structured data is becoming an important problem. This article focuses on kernel method to settle down the pattern recognition problem and put forward an efficient kernel method to solve pattern recognition problem. Experimental results demonstrate the effectiveness and feasibility of the proposed algorithm.
Key words: pattern recognition; graph data; graph matching; kernel method
模式識別伴隨著計算機技術和網絡技術的快速發展,在許多領域得到了成功應用如數據挖掘、文獻分類、財政、多媒體數據庫的組織和檢索、生物(比如根據人的物理特征,如人臉、指紋等識別人)、醫學(醫學圖像分析)。其中圖的頂點表示對象的各個組成部分,圖的邊表示各組成部分之間的關系,以這樣的表達方式圖就可以很容易地捕捉到物體的關系與結構信息。因此,基于圖的描述是一種非常有效的表達方式。而當前模式識別領域中大多數工具卻不能直接以圖為其處理對象,這嚴重影響了基于圖方法的發展。研究復雜模式分析和分類方法是有必要而且有意義的。其中基于核方法的學習方法是一種比較新的學習方法,它是從統計學習理論中發展出來的,并且有效地克服了傳統模式識別方法的局部極小化和不完全統計分析的缺點。
現實世界中的數據往往具有數據量多、高維、動態、不完全(缺值)、不確定(包含噪聲)以及稀疏性等特性。對于從事模式識別、信號處理以及數據挖掘的研究者來說,核方法是一個強有力的分析工具。該文主要研究并實例化了一種核方法來模式識別中的圖匹配問題,也就是通過在一個圖中匹配另一個圖中的某個相似的子結構來計算兩個圖的相似性的過程。
1 核方法
在近幾年的機器學習和數據挖掘領域中,核方法成為一種非線性數據處理的新方法。它避免了神經網絡和決策樹中典型的局部極小化問題和過擬合問題。因此,它可以看成是經典線性方法的擴展,也可以認為它等效于使用非線性映射將樣本變換到希爾伯特特征空間,隨后在該空間中實施線性特征抽取的方案。
定義1(圖核)圖G1和G2間的核函數K (G1, G2)稱為圖核。映射?將原始空間中的圖映射到高維甚至無窮維向量空間(特征空間)中去,使得
K (G1, G2) = < ? (G1), ? (G2)>
由于映射?的選取,如 ? (G)的分量可以是兩圖中某一公共子路徑的條數等,核k:G×GR可以看成是兩個圖G1和G2間的相似性度量。
核方法作為一種非線性方法可以解決這些問題。這將使得原來用于向量表示的標準算法也適合圖,它可以把統計模式識別和結構模式識別有機地結合起來。
2 圖核
一般常見的圖核可分為三大類:基于路徑的核方法如隨機游走核、最短路徑核;基于有限規模子圖的核方法;基于樹模式的核方法如樹模式圖核、快速子樹核、Weisfeiler-Lehman圖核等。本節重點深入研究快速子樹核和Weisfeiler-Lehman圖核及其在解決圖匹配問題時的算法復雜程度。
定義2 (快速子樹核)圖G和圖G’之間快速子樹核
通過分析比較,兩圖之間的快速子樹核的計算復雜度是[O(n2h4d)],其中包括n2個節點對的比較和在[O(4d)]范圍之內,鄰居節點的所有匹配次數。重復h次,其中h是一個多分類因子而不是指數。以k1為起是點,經過kh-1到kh遞歸地計算子樹核。
定義3(Weisfeiler-Lehman圖核)圖G和圖G’之間的WL圖核定義為:
其中Si(v)為節點v在第i次迭代中的多分類標簽集,f是一個映射標簽壓縮函數,對于所有的[i≠j],集合[f(si(v))|v∈V?V']和集合[f(sj(v))|v∈V?V']是不相交的。S0(v)是在標簽圖v和非標簽圖中的初始標簽并且[f(s0(v))=s0(v)]。
3 實驗論證
3.1 數據準備
實驗數據集主要包括MUTAG, NCI1,NCI109,ENZYMES,D&D。其中MUTAG是一個根據是否對革蘭氏陰性菌鼠傷寒沙門氏菌有突變作用的含有188個突變芳香和雜環硝基化合物。NCI1和NCI109分別代表兩組平衡的化學混合物數據集,它們來自于非小細胞肺癌細胞和卵巢癌細胞系。ENZYMES 是一個具有三層結構的蛋白質數據集,它包含從酶蛋白質數據庫中獲取的600個蛋白質酶。這種情況下的主要任務是正確給每個蛋白質添加一個6層結構的類。D&D是一個包含有1178個蛋白質結構的數據集。每一個蛋白質可以看做一個圖,圖中的節點表示氨基酸,兩個節點之間的邊小于埃則可以用一條邊連接。所有節點在數據集中是被標記的,預測的任務則是區分蛋白質結構中的酶與非酶。
數據集中節點數、邊數和度數的分布表1所示。
3.2 仿真實驗
圖是一種特殊的結構化數據表達形式,許多經典的學習算法不能用于圖形數據的分析。因此,本實驗主要圍繞對圖形數據的分析展開尋找適合圖形數據后續分析的向量表示方法,以擴大傳統學習算法在圖形數據中的應用。實驗硬件環境是Intel Core 2 雙核CPU 2.2GH,內存2G。軟件環境是美國The Math Works公司推出的Matlab軟件,其中支持向量機SVM的實現采用的是Libsvm工具箱。實驗方法采用十倍交叉進行,其結果如圖1所示。
4 結束語
本文針對模式識別中的圖匹配問題,主要研究了通過核方法來解決現實世界中的模式識別與分類問題。接著對兩種圖核的實例快速子樹和與Weisfeiler-Lehman圖核進行深入深入研究和分析外,著重探討了其在解決大規模、復雜、高維數據上所具有的優越性。從實驗結果可以看出,這兩種圖核解決模式識別問題時具有的高效特點,且Weisfeiler-Lehman圖核比快速子樹具有更優的匹配精度和更少的運行時間。隨著經濟社會的高速發展,在生物、數據挖掘領域越來越多的圖數據(如分子結構、蛋白質交叉網絡)變得越來越多。核方法將會受到更多學者們的青睞,希望今后能構造出分類精度更高效果更好的圖核來解決其他領域中的分類和識別問題。
參考文獻:
[1] Shervashidze N, Borgwardt K. Fast subtree kernels on graphs. In Neural Information Processing Systems, 2009.
[2] John S T, Nello C. Kernel methods for pattern analysis[M]. China machine press,2005.
關鍵詞: 旋轉機械; 故障分析; 診斷; 局限性
中圖分類號: th165 文獻標識碼: b 文章編號: 1009-8631(2013)01-0038-01
1 引言
旋轉機械如:汽輪機、發電機、離心壓縮機、風機等,是工業部門中應用最為廣泛的一類機械設備,在電力、能源、交通、國防及石油化工等領域發揮著無可替代的作用。隨著科學技術的發展,旋轉機械正在向大型化、綜合化(在同一臺設備中多種技術的應用)、連續化(從投料到產品整個過程的連續化)、自動化(操作、檢測等的非人工化)、嚴格化(如技術指標嚴格化)的方向發展,造成設備構造復雜,零部件之間的聯系更加緊密。在設備復雜化的同時,發生故障的潛在可能性和方式也在相應增加,且故障一旦發生,就可能引起連鎖反應,導致設備甚至整個生產過程不能正常運行乃至破壞,輕則造成巨大的經濟損失,重則導致災難性的人員傷亡和社會影響。近年來,國內外因設備故障而引起的災難性事故仍時有發生,如2003年,國內某鋼鐵企業高線初軋機因一齒輪箱主輸出軸軸承破碎,造成設備緊急停機68小時,直接經濟損失1500萬元以上。2001年阜新電廠2號機組斷軸事故的發生,給電廠帶巨大的經濟損失。1988年我國秦嶺電廠zoomw汽輪發電機組因振動引起的斷軸毀機事件。災難性事件的不斷發生,使人們認識到對大型機械裝備實施在線監測與故障診斷的必要性。
2 現行故障識別與診斷分析方法簡介
當前,故障識別與診斷決策過程中采用的方法較多,按照它們隸屬的學科體系,大體可分為三類:基于控制模型故障診斷、基于模式識別故障診斷及基于人工智能故障診斷。它們具體的診斷方式如下:
2.1基于控制模型的故障診斷。對于一個旋轉機械系統,若通過理論或實驗方法能夠建立其模型,則系統參數或狀態的變化可以直接反映該系統及其動態過程,從而為故障診斷提供依據。基于控制模型的故障診斷方法主要涉及到模型建立、參數與狀態估計和觀測器應用等技術。其中,參數與狀態估計技術是該方法的關鍵"參數估計的參數包含兩類:第一,系統參數,即描述系統動態特性的參數。基于系統參數估計的故障診斷方法與狀態估計方法相比較,前者更有利于故障的分離,但是它也存在不足之處:求解物理元件參數很困難;系統故障引起系統模型結構和參數變化的形式是不確定的,目前還缺少有效的方法。第二,故障參數,即用于描述系統出現的故障時信號自身特性的參數。其基本思想是:對故障系統構造適當形式的包含有可調參數的狀態觀測器,并使其處于零狀態"當系統發生故障時,用觀測器中的可調部分來補償故障對系統狀態和輸出的影響,使得觀測器在系統處于故障狀態下仍然保持零狀態觀測誤差,此時觀測器中可調部分的輸出即為故障參數的估計結果。使用該方法的優點是可對故障信號進行在線建模,但是當系統出現強非線性時,目前仍無有效算法。
2.2基于模式識別的故障診斷。故障診斷實質上是利用被診斷系統運行的狀態信息和系統的先驗知識進行綜合處理,最終得到關于系統運行狀況和故障狀況的綜合評價過。如果事先對系統可能發生的故障模式進行分類,那么故障診斷問題就轉化為模式識別問題。當系統的模型未知或者非常復雜時,模式識別則為解決故障診斷問題提供了一種簡便有效的手段。基于模式識別的故障診斷方法主要分為統計模式識別和句法模式識別兩大類,它們在旋轉機械故障診斷領域中得到廣泛應用。基于bayes分類器的統計模式識別法是旋轉機械故障診斷中一種經典方法。
2.3基于人工智能的故障診斷。基于人工智能故障診斷的研究主要分為兩類:基于知識(符號推理)的故障診斷和基于神經網絡(數值計算)的故障診斷。首先,基于知識的故障診斷大致包含兩種情況:基于淺知識的專家系統和基于深知識的專家系統。前者是以領域專家和操作者的經驗知識為核心,通過演繹推理來獲取診斷結果。其特點是利用領域專家的知識和經驗為故障診斷服務,但是這種方法具有較大的局限性,如知識集不完備,過于依賴領域專家等。而后者則要求診斷對象的每一個環節具有明確的輸入輸出表達關系,診斷時首先通過診斷對象的實際輸出與期望輸出之間的不一致,生成引起這種不一致的原因集,然后根據診斷對象領域中
第一定律知識(具有明確科學依據知識)及其內部特定的約束關系,采用一定的算法,找出可能的故障源。它比前者具有更大的優越性,但其搜索空間大,推理速度慢。其次,基于神經網絡的故障診斷作為一種自適應的模式識別技術,人工神經網絡以其全新的信息表達方式、高度并行分布處理、聯想、自學習及自組織等能力和極強的非線性映射能力使它滲透到科學技術的各個領域。人工神經網絡在機械故障診斷中的應用主要集中在三個方面:一是從模式識別角度應用神經網絡作為分類器進行故障診斷;二是從預測角度應用神經網絡作為動態預測模型進行故障診斷;三是從知識處理角度建立基于神經網絡的診斷專家系統。如采用徑向基函數網絡、概率神經網絡和自適應特征映射網絡作為分類器對旋轉機械故障進行研究。
3 現行故障信號診斷分析方法的局限性
大型旋轉機械在運行過程中易受到噪聲、速度突變、結構變形及摩擦的變化等因素影響,尤其是在發生故障的情況下,從機械設備測得的振動信號往往表現出非線性非平穩特征,深入考慮目前用于旋轉機械振動信號處理的前述方法,對于全面提取旋轉機械振動特征信息而言仍然存在著一定的局限性:首先fft譜分析僅反映了振動信號整體的統計特性,頻譜中無法體現非平穩時頻細節,且頻譜分辨率受到限制;其次、arma時序模型雖然可以推廣應用于某些非線性、非平穩振動信號的特征提取,但應用中建模復雜、階數選擇和計算量之間矛盾等問題,制約了該方法的實用性,不宜在大型旋轉機械狀態監測和故障診斷中應用;對于短時傅里葉變換通過對信號的分段截取來處理時變信號,是基于對所截取的每一段信號認為是線性、平穩的。因此,嚴格地說,短時傅里葉變換是一種平穩信號分析法,只適用于對緩變信號的分析;最后,小波變換雖然在機械故障診斷領域得到了成功應用,但由于存在小波基等參數的選擇敏感性、非自適應性等特點,制約了小波變換的應用性能。此外,小波變換本質上是窗口可調的傅立葉變換,其小波窗內的信號則視為平穩狀態,因而沒有擺脫傅立葉變換的局限。
參考文獻:
關鍵詞:神經網絡 圖像識別 企業應用
中圖分類號:TP183 文獻標識碼:A 文章編號:1007-9416(2016)10-0124-01
1 神經網絡的發展、應用及其特點
現代計算機的應用前提下,計算和信息處理能力均較高,但感知能力和馱踴肪持械吶卸夏芰均不如人類,并且短期內難以實施。特別是,缺乏在特定環境的學習和適應能力,只能按照一定的程序進行分解及工作、執行。本世紀初,人們對于人類大腦的工作方式已經有了一定程度的了解,有著非常大的規模的基本單元,被稱為神經元,這些經過高度復雜的統一結合,形成復雜的、非線性、平行處理的信息綜合處理系統,這和當代的計算機處理方式是完全不同的。單個的神經元的反應速度比起類似計算機的基本單元邏輯反應時間,是毫秒級別的。
1.1 圖像識別及分類技術概況
隨著計算機技術和數字圖像處理技術的發展,為了滿足當前迫切需要,通過對機器視覺設備所獲得的圖像識別和分類,己成為當前的迫切需要。研制機器的視覺系統是圖像識別的最終目的。因此,他們自行區別分類是可能的。通過一些手段使各類圖像的重要顯性數據通過一定的數值來表示出來,除了對圖像進行數據化處理之外,通常特征范圍的提取工作也是必要的。但反應某一類特征時,計算工作的繁雜、內容的龐大,為計算帶來了很大壓力的同時,產生了不精確的可能,難免有一些誤差。所以進一步的工作量需要對特征進行選擇與處理,減小特征值的誤差而保留圖像特征信息,這種找出比原來特征數目少而精的綜合指標的方法稱之為特征選擇。
1.2 神經網絡應用于圖像識別技術的現況
在世界范圍內掀起了探索和研究神經網絡的熱潮,來自發展了的學習算法。目前國內外研究較多的有字符識別技術、車牌識別技術、臉部識別技術、各種紙幣識別技術、印章識別技術及對一些軍事目標的識別等方面。人工神經網絡的發展己滲透到各種研究領域,特別是在模式識別的圖像分類技術方面,所取得的應用也日益增多。
2 圖像識別原理簡介
2.1 圖像識別系統
圖像模式識別系統的三個重要組成部分,有如下三種,第一是圖像有關信息的采集和收集,他等同于對被研究對象的深入了解和調查,取得有關數據后,進行整體的加工、修改、歸納、整合,并且進一步提出反應其點的一些潛質。最重要的一部分特點是將類似空間的映射量折射到空間中。相當于人類的感性和理性認識的轉換,并作出結論的過程。圖像識別系統如圖1所示。
2.2 模糊模式識別法
模糊特征,本質就是根據一定的模糊化規則,經過多重加工后,將圖像的一個特征或者一組特征分成多個模糊變量,使每個模糊變量能表達原特征的一部分特性。這些新的模糊特征取代原來的特征進行模式識別,提高了分類器的性能。
2.3 人工神經網絡模式識別法
圖像輸入預處理特征提取神經網絡識別識別結果。
3 神經網絡圖像識別系統設計
3.1 網絡分類器的設計
新的性能指標函數,通過反復使用,可以在保證網絡誤差盡可能小的情況下使網絡具有較小的權值,使得網絡的有效權值盡可能少,這實際上相當于自動縮小了網絡的規模。
3.2 樣本的選擇及組織
選擇標準且合理的樣本,對提高網絡的學習速度、使網絡具有良好的識別精度都有著舉足輕重的作用。本實驗中,樣本的選擇可以遵循以下原則,當網絡用于分類屬性時,首先選取各類的樣本進行訓練,在使網絡的總體性能不高時,另一方面可以大幅度提高訓練程序速度,避免網絡陷入癱瘓。如此反復,結果會使網絡產生振蕩。要使網絡對模式的旋轉、伸縮等具有不變性,因為網絡并不具有不變識別的能力,所以就要選擇各種可能情況的樣本,這樣可以保證網絡具有比較高的識別率。
4 傳統企業應用技術分析
無限制地共享數據和業務處理是企業應用集成(EAI)是指企業內部和企業之間的任何相連的應用之間。公共對象請求體系結構(CORBA)、分布式組件對象模型(DCOM)和遠程方法調用是傳統的系統集成方式。目前用的比較多的集成方式是 Web Services。
5 結語
本文首先綜述了人工神經網絡的發展、應用、特點和神經網絡應用于圖像識別技術的現況。重點介紹了目前在目標識別中用的最多的前饋神經網絡模型及其采用的算法的同時,介紹了圖像識別原理和幾種模式識別常用的神經網絡模型。
隨著有關研究的不斷深入、計算機運行技術、數字圖像處理技術的發展,對機器視覺設備信息操作,所獲得的圖像識別和分類已成為當前的迫切需要。
目前所做的工作離實用要求的距離還有很大的距離。不過,結合企業實際情況設計了基于ESB的企業應用集成技術。這一課題必然會得到較好的解決。
參考文獻
[1]袁建國,高亮,劉向軍等.需求鏈管理的研究.中國機械工程,2003,14:89-93.
[2]孫晉文,肖建國.企業應用集成與基于Web Services 的構架應用.計算機工程與應用,2003,8:25-29.
收到日期:2016-09-02
關鍵詞:云計算;安全性;可信云;安全云
中圖分類號:TP393 文獻標識碼:A 文章編號:1007-9599 (2012) 15-0000-02
1 引言
隨著網絡帶寬的提升、移動互聯網的不斷發展、數據中心對于全新的結構和管理理念的需求,以及各行業對于IT需求的增長和相關技術的不斷成熟,基于云計算的各種應用在社會的眾多領域不斷被推廣展開。很多企業和機構都部分或全部應用云計算技術來部署其信息系統并提供相關服務,如今云技術已經滲透到國家關鍵部門應用中。基于云計算的應用使得用戶能夠最大限度的利用計算、交互、存儲乃至應用等IT資源,靈活的計算能力和高效海量數據管理分析方法,更方便的獲取各類信息服務。然而盡管云計算系統功能強大,且可無限虛擬服務資源、可按定制服務需要進行交付服務計算,但假冒電子簽名、木馬攻擊與病毒損毀、電子簽名的抵賴等都在威脅著互聯網云計算的安全性。因此從云計算誕生以來,國內外的眾多學者便對云的安全性進行了很多研究。
2 云計算安全性的相關概念
2.1 云安全概述
云安全(cloud secarity)是一個綜合的概念和問題。研究的是云計算過程涉及的環境、流程、技術、管理、服務(service)等各個層面的安全問題,如果單純從某一層面去定義,無意是片面的。云安全領域研究的努力目標是達成安全云或安全云計算。
2.2 云計算服務的安全現狀
在云計算被企業接受使用的同時,一直困擾網絡用戶的安全性問題也被提上云計算使用用戶的日程上來。安全性是一個很受爭議的問題。根據IBM的調查顯示,阻礙用戶選擇使用云計算的一個重要的原因就在于云計算的服務質量以及數據安全性、私密性。在這項調查中,48%的企業認為在使用云計算時數據的可用性和可靠性是很重要的,33%的企業用戶認為云計算的法規限制是值得關注的。而在這些使用云計算的企業用戶中80%的企業認為云安全是企業的第一優先考慮因素。而縱觀Gartner、ENISA、CSA、IBM X-Force安全組織的調查報告可以發現,云計算的安全性問題涉及很多方面,其中包括:用戶數據存取權限的管理;數據存放的物理位置管理,云計算的濫用、優先權問題、訪問權限問題以及法規的適用性等。因此,在云安全問題方面,云安全技術不但要考慮技術層面的問題,還要關注管理、流程、法規等層面。
云安全面臨的技術危機包括以下幾個方面:假冒電子簽名、偽造和變造電子簽名、電子簽名的抵賴、木馬攻擊和病毒損毀等。近些年來,云服務提供商頻頻出現各種不安全的事件。
云安全通過網狀的大量客戶端對網絡中軟件行為的異常監測,獲取互聯網中木馬、惡意程序的最新信息,推送到服務端進行自動分析和處理,再把病毒和木馬的解決方案分發到每一個客戶端。云安全的策略構想是:使用者越多,每個使用者就越安全,因為如此龐大的用戶群,足以覆蓋互聯網的每個角落,只要某個網站被掛馬或某個新木馬病毒出現,就會立刻被截獲。據統計,云安全可以支持平均每天55億條點擊查詢,每天收集分析2.5億個樣本,資料庫第一次命中率就可以達到99%。借助云安全,現在每天阻斷的病毒感染最高達1000萬次。
3 可信云安全技術
雖然云計算產業具有巨大的市場增長前景,但對于使用云服務的用戶而言,云計算存在著多方面的潛在風險和各種安全問題.在客觀分析了當前云計算領域發展中面臨的安全挑戰問題基礎上,總結了云安全領域的最新研究進展,最后指出了云安全領域的主要研究方向.云計算與可信計算技術的融合研究將成為云安全領域的重要方向.
可信云安全技術采用的技術路線是互聯信息的可信云技術和安全云技術。這兩項技術的支撐是可信模式識別技術、可信密碼學技術、可信融合驗證技術。可信云安全技術還涉及云用戶端制作技術、云服務中心制作技術以及可信計算技術、云安全技術。
3.1 可信云技術
可信云技術及其可信根計算認證技術包括:針對可信云用戶加密、解密密鑰和算法的管理進行可信密碼學技術計算;針對可信云用戶端的用戶身份進行可信模式識別技術計算;針對可信云、端互動的“零知識”挑戰應答認證進行可信融合驗證技術計算。
3.2 安全云技術
安全云技術包括:形成結合傳統模式識別技術及行為密鑰技術兩大技術的可信模式識別技術;形成基于傳統密碼學技術并具有系列連續變換的可信密碼學技術;形成結合“云端零知識證明”技術的可信融合驗證技術。
3.3 可信云安全技術的關鍵技術
可信云安全的技術即可以是可信云技術、安全云技術的組合使用,又可以是兩者的獨立使用,可信云安全的關鍵技術支撐是:可信模式識別技術、可信密碼學技術、可信融合驗證技術,包括系統軟、硬件及其應用層、驅動管理層、物理邏輯層,形成可信根計算認證的內容。
(1)可信模式識別技術。鑒于傳統模式識別技術因為“拒識率”和“誤識率”的缺陷而導致的認證誤判,可信模式識別技術將傳統模式識別技術和模式識別行為密鑰技術相結合,從而使得可信云用戶端只需要到可信云服務數據中心下載該可信云用戶端軟件即可達到零“拒識率”和零“誤識率”以及防范假冒登錄等功能。
(2)可信密碼學技術。傳統密碼學在當今社會面臨的危機是安全通信定義與密碼學技術固有屬性的矛盾沖突,加密方法的可認證性依賴于密鑰的可認證性,而密鑰的安全性又依賴于密鑰的隱密性,在非對稱密鑰算法中,常用的一些算法又是潛在的攻擊手段。可信密碼學技術則對傳統密碼學技術結合點“拓撲群”變換運算技術進行擴展,從而具有了用戶密鑰管理和可信驗證的功能。
(3)可信融合驗證技術。可信融合驗證技術將傳統的融合驗證技術作為一個子集,采用可信模式識別技術和可信密碼學技術,結合“云端零知識證明”方法,具有云、端互動“零知識”挑戰應答認證功能,并可實現云、端PKI技術的功能。
3.4 可信云安全的非技術手段
在云計算的使用過程中除了技術方面的因素會阻礙云計算的推廣,還有一些非技術方面的因素,例如:云計算供應商與用戶之間是否具備嚴格的安全保密協議,云服務商與用戶的權利義務等等。針對這些因素,可信云安全可以采用一些非技術手段去加強云安全:選擇信譽好、有公信力的公司作為云服務提供商,保障云端用戶的數據安全;對于云計算的實施流程進行安全規劃,每一個步驟都明確人員的權與責、制定合理的管理機制及響應辦法;安排專職人員負責防護系統、安全審核、定制安全基礎設施等。
3.5 可信云安全的發展歷程
伴隨著網格技術、云計算技術、物聯網技術等的混合發展,可信云安全技術經歷了三個階段:可信計算與云安全技術初級發展階段、可信計算與云安全技術高級發展階段、可信云安全技術發展階段。在可信云安全技術發展階段可信計算被應用在云計算數據中心內網,可信模式識別技術、可信密碼學技術、可信融合驗證技術在云、端互動中實施。
4 結語
云計算自提出以來,因其依靠基于互聯網的強大計算能力,使得成千上萬的終端用戶都能夠云端互動、有效連接,同時依靠強大的管理平臺和超級計算模式去實施多種應用,而安全性問題則是用戶選擇云計算的一大阻礙。因此,云計算的安全性研究對于云計算的推廣應用有著極為重要的意義。物聯網通信時代即將到來,而云計算技術、云安全技術也必將會隨著這場技術變革逐漸完善。
參考文獻:
[1]吳吉義,平玲娣,潘雪增.云計算:從概念到平臺[J].電信科學,2009,12:23-30
[2]朱近之.智慧的云計算[D].電子工業出版社,2011,4
[3]Armbrust M.Fox A,Griffith R,et a1.Above the Clouds:A berkeleyview of cloud computing,2009[2010-l1-11]
[4]李虹,李昊.可信云安全的關鍵技術與實現[M].北京:人民郵電出版社,2010,6
[5]王舒榕.基于云計算平臺的安全性及信任模型研究[D].南京郵電大學碩士論文,2011,2
【關鍵詞】機車滾動軸承;故障診斷;特征提取;模式識別
滾動軸承是機車行走部件中應用最為廣泛的機械零部件,滾動軸承的好壞直接影響到列車行走的安全。因此,滾動軸承故障診斷的研究成為至關重要的研究點。基于數據驅動的滾動軸承故障診斷的研究步驟分為:信號的采集;信號的低通濾波、離散化和降噪等預處理;故障特征提取;故障的模式識別與分類。本文主要介紹故障的特征提取和故障的模式識別與分類方法。
1 機車滾動軸承故障診斷機理
由于機車車輛長時間工作在惡劣的天氣和環境下,運行中會存在著滾子與滾道不夠,而且長時間處于高負荷、重載的運行狀態下,運行時間長,會出現滾動軸承的溫度上升、軸承的表面出現腐蝕和裂痕以及滾動體松動等,這些都是由滾動軸承的非正常磨損而造成的故障。而由軸承安裝不當造成的嚴重后果也不少,但滾動軸承的具體故障形式有:疲勞剝落、磨損、塑性變形、腐蝕、斷裂、膠合、保持架損壞。任何一種故障現象如果按其發生在滾動軸承的位置來分的話,可以分為:外環故障、內環故障、滾動體故障和保持架故障。
2 機車滾動軸承故障特征提取方法
傳感器采集到的機車滾動軸承振動信號往往是連續的而且含有大量的白噪聲,為了更好的分析滾動軸承的振動信號,從而有效的診斷滾動軸承的故障,首先應該振動信號進行離散化和低通濾波等預處理。為了提高信號的信噪比,目前采取的方法有時域平均法、小波濾波降噪法和AR模型提取故障脈沖沖擊信號法等。在進行預處理之后,將對振動信號進行故障特征提取,目前特征提取的分類方法沒有統一的形式,大致從以下幾個方面進行考慮:
2.1 時域分析法
時域分析法是在時間域對振動信號進行分析的方法,也是最早提出的特征提取方法,目前廣泛應用在機車軸承故障診斷儀器設備以及在線監測診斷系統中。主要是提取時域特征量,分為有量綱與無量綱。其中有量綱包括:均值、均方根值、峰值和峰峰值;無量綱包括:峰值因子、峭度(歸一化的四階中心矩)、偏度(歪度)和裕度指標。其中峰值和均方根值應用比較廣泛,通過多次試驗證明,時域特征量的優點表現為計算簡單,只需幾個特征量就能診斷滾動軸承有無故障,但其缺點為:缺乏早期報警能力、不能準確診斷滾動軸承的故障的具置,而且不同的特征量所能反映的軸承的故障形式也不同。只能對機車軸承故障做出初步的診斷。
2.2 頻域分析法
為了更加準確的描述滾動軸承故障的具置,提出了頻域分析法。頻域分析法是將傳感器采集到的時域振動信號轉換到頻域,再提取其信號的頻域特征。而軸承信號的頻域特征主要表現為其故障頻率,可以根據軸承的參數以及軸承的旋轉頻率確定軸承的外環故障頻率、內環故障頻率以及滾動體故障頻率。通常是采用不同的頻域分析方法來確定軸承振動信號的振動頻譜、功率譜或者是包絡譜的故障特征頻率處的峰值來確定軸承的故障頻率。目前采用的方法有:1)快速傅里葉變換(FFT):將信號從時域變換到頻域,獲取信號的頻域信息,提取其振動故障頻率;此方法只適用于于平穩信號的處理。2)Hilbert變換、經驗模式分解(EMD):由于滾動軸承振動信號是一種典型的非線性、非平穩振動信號,而Hilbert變換、經驗模式分解能較好的分析非線性、非平穩信號,彌補了FFT的不足。通過獲得原始信號的Hilbert的包絡譜,從而實現振動信號的Hilbert的包絡解調,從高頻的固有頻率中分離出低頻的故障頻率。3)高階譜、雙譜分析:高階譜是分析非高斯信號的有力工具,能完全抑制高斯噪聲,檢測二次相位禍合,是提取軸承故障特征信號的有力工具;但是高階譜對非高斯信號的處理能力較差,而雙譜分析方法是處理旋轉機械中大量的非高斯信號的有力工具,特別是在理論上能夠完全抑制高斯噪聲的干擾,從而解決了軸承振動信號的非高斯性。
2.3 小波域分析法
小波分析法是目前分析非平穩信號的有效方法,廣泛應用于機車滾動軸承故障特征提取中。它是一種典型的時-頻域分析方法,能將信號分解到不同的頻帶上,在不同頻帶范圍內反映原始振動信號的信息。目前小波域特征提取的方法主要為:1)小波歸一化能量特征提取方法:將振動信號進行小波或小波包變換,然后對其不同尺度下的分解系數進行信號重構,對重構信號的幅值進行歸一化處理;或者將小波變換的分解系數、小波包變換的節點系數歸一化處理作為表征滾動軸承的運行狀態信息。2)小波域的頻譜分析法:利用正交小波基將軸承故障振動信號變換到時間-尺度域,對高頻段尺度域的小波系數進行包絡細化譜分析,檢測機車滾動軸承故障的不同故障頻率,有效識別軸承的故障模式。3)混合小波特征提取方法:小波變換與統計分布模型相結合的方法,首先將振動信號進行小波分解重構,對重構信號建立對應的統計分布模型,求取模型的參數作為滾動軸承的特征向量;小波AR參數模型、小波域高斯分布模型參數等。
除以上介紹的特征提取方法之外,還有分析非線性特征的Wigner分布算法,利用二維、三維的Wigner分布圖對滾動軸承進行故障診斷;奇異值分解技術和為了降低特征參數的維數,尋找更有效的特征參數,縮短智能模式識別器的訓練時間,可采用主元分析方法(PCA)對特征參數進行降維處理。
3 機車軸承故障智能診斷技術
機車軸承故障智能診斷是指結合信號處理方法,將提取的特征量訓練故障模式識別分類器,利用分類器測試滾動軸承故障,識別去屬于哪種故障類型。目前應用最廣泛的識別方法有:神經網絡、專家系統、灰色系統理論、模糊理論、高斯過程、支持向量機、最小二乘支持向量機等。本文具體介紹神經網絡和支持向量機故障識別方法:1)神經網絡:神經網絡具有獨特優點,如容錯、聯想、推測、記憶、自適應、自學習和處理復雜多模式,因此,對于突發性故障或其他異常現象,可以利用神經網絡的聯想、推測及記憶對其進行推理和診斷。由于神經網絡具有很強的魯棒性和容錯性,能對不十分準確和含有噪聲的數據進行處理,但其具有陷入局部最小值的缺點。2)支持向量機:支持向量機是統計學模式識別方法的一種,它較好地解決了小樣本、非線性和高維模式識別等實際問題,而且只需要較少的樣本對模型進行訓練。因此,SVM的研究成為目前熱點研究問題。但是SVM也存在著計算復雜、怎樣選擇和優化核函數的問題,如今計算機水平的不斷提高計算復雜問題已經解決,但怎樣選擇和優化核函數仍然成為研究的熱點。而為了更好的提高SVM分類器的性能,提出了最小二乘支持向量機分類器。
4 展望
目前仍然找不到一種通用而有效的特征提取方法應用于機車軸承故障診斷中。而且大部分的智能診斷還處于離線狀態研究中,因此,在今后的研究中應該找到一種通用而且有效的特征提取方法實現滾動軸承故障的在線監測和診斷,更進一步能實現故障的預測。
【參考文獻】
[1]吳俊偉.Laplace小波在機車軸承故障診斷中的應用研究[D].北京:北京交通大學,2009.
[2]項斌.基于小波包與支持向量機的機車軸承故障診斷研究[D].甘肅:蘭州交通大學,2011.
【關鍵詞】BP神經網絡;數字識別;價值
一、數字識別研究的實用價值
1.數字識別應用在大型數據統計。在大型的數據統計(如:工業普查、農業普查、三產普查、人口普查等)中,輸入數據量特別大,曾經的手工輸入,耗時、耗資、需要的人力大。如今在類似工農業普查及人口普查工作中,數字識別技術已解決了效率優先的根本問題。
2.數字識別應用在金融等領域。金融等領域中涉及到大量的數字運用,因此,數字識別在其中的優勢尤為凸顯。伴著國家經濟的迅猛發展,越來越多的各種金融票據需要人們予以快速有效的處理。所以,使用系統自處理,顯然可以節省大量的人力、物力和財力。比較上面涉及到的統計報表處理,在金融領域的實踐難度較大,究其原因有三:其一是金融領域的各種票據要求識別精確度更高;其二是在表格處理過程中經常涉及到多種表格需要同時處理,這樣一來,必須要求一個系統能同時有效地處理多種表格;其三是因為在日常的工作過程中,數據處理無時無處不在,書寫字符過程中必須盡量按常規習慣,這顯然提高了識別及預處理核心算法的要求。
3.數字識別應用在身份證字符識別。數字字符識別與身份證字符識別有很多共同點,身份證字符識別將數字字符直接運用在身份證字符識別中,可以做到資源的有效共享。也可以配合公安機關對每一個人的身份進行有效監控,這樣,一些不法分子在違法犯罪之后將寸步難行,從而有效的維護了社會治安。
二、數字識別研究的理論價值
1.阿拉伯數字有其明顯的優越性,因為它是世界各國唯一被通用的符號,所以,在對數字識別的研究上,與世界各國的文化背景毫無關系,所以,在數字識別的研究領域,為世界各國的研究人員提供了一個平等的施才舞臺。同時,各研究專家、有識之士可以在此領域予以有效探討,共同進步。
2.數字識別中,其識別類別數不大,這樣有利于我們做更深層次的分析及檢驗某些新的理論。比如:人工神經網絡(ArtificialNeuralNetworks)――其中有較大一部分的ArtificialNeuralNetworks模型及算法全以數字識別當成全面的實踐平臺,檢驗其中理論的有效性,評議各方法的優勢和不足。
3.雖然人們研究數字的識別歷時已久并已獲取了眾多成果,但是直至今天為止,系統的識別能力還遠不及人腦的認知及判斷能力,所以,高精度的數字識別研究依然是一個難度相當高且待進一步深入研究的重大課題。
4.數字字符的識別方法研究能進一步外延到很多相關問題的研究中,并且對一些相關問題的研究具有重要的借鑒作用。例如:在英文二十六個字母擴展成的拼音文字的識別就是一個很好的個案。實際上,在字符識別領域的研究中,很多學者已經把數字識別和英文字母識別放在一塊進行比較研究。
三、神經網絡的數字識別的研究優勢
對于曾經風靡的傳統模式識別,如今人們對其低正確率的識別方法已深感不滿,涉及到巨額經濟的賬目核算等問題時,低正確率的識別方法甚至讓人惶恐不安,早在二十世紀中期誕生的神經網絡使模式識別的發展產生了引領和推動作用,發展前景廣闊。這些年來,模式識別領域對剛發展起來的神經網絡理論給予了人們的高度關心和注意,究其原因主要是傳統模式識別方法不如神經網絡方法好,神經網絡較傳統模式識別方法具有很多的優點,比如:神經網絡方法對新樣本訓練效果的自適應性、學習能力良好,同時,任意拓撲結構的模式空間能被其非線性及多層網絡結構能劃分,且神經網絡的容錯能力、推廣能力讓神經網絡在模式識別的使用中具有較高的識別效率,神經網絡的運算速度很快。
四、數字識別研究的發展趨勢及現實意義
在國內外研究現狀資料及現實調查顯示,很多基于數字識別的研究都取得了突破性的進展,提出并解決了數字識別的正確率問題,然而,數字沒有上下文關系,每個單字的識別都事關重要,而且數字識別經常涉及到財會、金融領域,其嚴格性更是不言而喻的。因此,用戶的要求不是單純的高正確率,更重要的是極低的、千萬分之一以下的誤識率。此外,大批量數據處理對系統速度要求又相當高,許多理論上很完美但速度過低的方法顯然是行不通的,因此,研究高性能的數字識別算法是一個亟待解決且具有相當挑戰性的重大現實課題。
神經網絡具備有學習能力高、泛化能力強、快速并行實現等諸多特點,用于解決以上問題具有一定指導性意義。由Rumelhart所涉及到的多層前饋神經網絡模型,因利用了誤差反傳的BP學習算法,被稱為BP網絡。由于其高度的非線性映射能力,BP網絡的應用極廣。為此,基于神經網絡的數字識別系統設計研究將對社會、經濟發展及科技進步具有重要的現實意義。
參考文獻:
[1]許穎泉.用神經網絡進行數字圖象識別研究[J].應用科技,2008(24).
【關鍵詞】版面分析;模式識別;應用
1 模式類區分方法[1]
對于圖文混排的復雜度高的文檔圖像一般采用自底向上的版面分析策略,在通過連通區搜索算法(包括二次分析)獲得版面全部連通區信息后即面臨文本區域和圖像區域的連通區信息區分問題。為方便討論,依模式識別理論我們稱文本區域和圖像區域的連通區為不同的模式類對象。由于文本區域和圖像區域不能出現交疊(這種交疊情況我們結合后續相同模式類對象合并過程稱為合并或聚類風險),但試驗表明即使在剛剛獲得版面全部連通區信息,即在尚未展開后續合并等處理過程就已經存在文本區域和圖像區域交疊的情況,或者說存在合并風險問題。所以有理由說合并風險將是伴隨相同模式類對象合并過程始終的。由于問題的復雜性,受二分法思想啟發,我們把問題逐步分解,即確立圖文分解的方法。
對于一個待分析圖像文檔,我們將圖像中的圖像模式類對象:邊框線和標題在原圖像中濾除,同時將所提取的文字圖像部分就其在文檔中區域信息(該信息由對原圖像的連通區搜索得到)規范化為圖像文檔,即作為原始文檔的伴隨圖像。由于生成伴隨圖像,初步排除圖像模式類對象的干擾,從而就其文字圖像的版面分析的復雜度大為降低[2-3]。
需要說明的是這僅是初步做到圖文分解,就是說在伴隨圖像中仍可能存在圖像模式類信息,為此我們采取“漸進合并,特征凸現”的策略在后續處理中解決(對此將作另文詳述);另一方面的關鍵問題是仍無法保證對不同圖像模式類對象(如文字、圖像甚至表格)分析的互不干擾性,而這一點正是我們要求系統所能體現出的智能性,它是由聚類穩定性算法保證實現的。
2 輔助功能模塊的運用
承前所述,隨著并行合并過程進行,由于對模式類對象是采用“漸進合并,特征凸現”的策略,模式類對象的確定要建立在一定前提條件上,即要待其模式類特征從不明顯到明顯之后,但在此過程完成時會有相互沖突情況產生。盡管上述算法的采用極大提高了系統的版面分析質量,但必須佐以其他功能模塊的運用來處理這種更復雜的情形。該模塊的功能將分別不同情況實現:1)擇取強勢特征模塊,該情況下將保留取強勢特征對象同時舍棄異類對象;2)折中退讓,該情況下將根據沖突的情形做單方面的退讓,如可以是文本類對象退讓圖像類對象(簡稱“文退圖”)等,由于該情況較復雜,鑒于篇幅作者只做一般情形解釋。
3 結論
對于模式類區分方法可以做策略層面的理解,這對于整個版面分析系統的質量是舉足輕重的,但沒有其他方法的輔助則很多具體問題仍不可得以完善和解決,因為版面分析要面臨很多復雜的模式識別問題。本文正是探討通過兩者的融合從而是系統最終能體現出智能性的特點,進而獲得實際應用的價值。
【參考文獻】
[1]周長嶺.中文OCR中的版面分析算法初探[C]//第六屆全國漢字識別學術會議論文集,重慶,1996:137-142.