時間:2023-06-08 11:17:57
開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇數字圖像處理綜述,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。
【關鍵詞】視覺測量 數字圖像處理 開放性實驗
【中圖分類號】G642 【文獻標識碼】A 【文章編號】1006-9682(2012)10-0001-03
一、引 言
數字圖像處理作為一門學科大約形成于20世紀60年代初期,并首次在航空航天領域取得了成功應用。數字圖像處理技術的發展除了與計算機技術、信息技術的快速發展密切相關以外,還得益于其在航空航天、工業、生物醫學、軍事、通信工程、商務、環境、林業等諸多領域的廣泛應用,正是這些應用需求,促進了數字圖像處理技術的深入研究和快速發展。“數字圖像處理”課程是隨著計算機和信息技術發展應運而生的一門新興課程,已成為信息類專業本科生的重要專業課。通過該課程的學習,要求學生掌握數字圖像處理的基本概念和原理,能夠對圖像進行各種處理,如圖像增強、圖像運算、圖像編碼、邊緣檢測等,為圖像通信、模式識別、計算機視覺以及其他交叉學科等工程領域的應用奠定基礎。
“數字圖像處理”課程的理論教學很抽象,僅僅通過理論教學學生很難掌握數字圖像處理的基本原理。如果把數字圖像處理的廣泛應用引入課堂理論教學,將具體知識點與其在實踐中的使用相結合,同時為學生提供邊學邊實踐的機會,不僅可以提高學生的學習興趣,加深對抽象理論知識的理解,增強其動手實踐的能力,還可以拓展學生的視野,與目前學科前沿技術相銜接。
二、視覺測量技術
在現代三維測量新技術中,視覺測量是由計算機視覺、圖像處理、模式識別等多學科交叉結合而形成的科學。圖1所示,視覺測量是一種非接觸性測量手段,以數字圖像作為信息載體,對被測目標進行成像,通過提取多個像面的二維像點信息,標定相機內、外參數,并重建、優化被測目標的三維信息,實現測量。視覺測量基于嚴謹的理論和現代的硬軟件設施,可以達到相當高的精度和可靠性,便于對大型工件、設備的尺寸、位置、三維輪廓等進行高精度測量,而且移動方便,可快速靈活地構建適于不同測量對象的系統,進行現場測量。目前,視覺測量技術已經廣泛應用于建筑工程、航空航天、汽車制造、生物醫學、考古等各個領域。[1~5]因此,視覺測量技術正在深入工業生產和社會生活的各個領域,研究和應用新的基于光學、數字圖像和視覺信息融合的三維測量方法,既具有重要的理論意義,又具有重大的實用價值,應用前景非常廣闊。
根據視覺測量的基本原理,利用數字圖像處理技術獲取的二維信息是視覺測量中相機標定、三維重建等環節的基礎,對于系統的測量精度、穩定性等方面具有決定性的影響,是視覺測量領域的關鍵技術。在長期的數字圖像處理課程教學以及視覺測量研究工作中發現,可以將視覺測量中關于數字圖像處理的應用內容引入課堂教學中,與具體理論知識相結合,加深學生對于課程理論的理解,使其接觸到科學研究的前沿內容。此外,通過設置開放性實驗等環節,引導有興趣和能力的學生進行實踐能力的培養,使學到的知識“活”起來。
三、視覺測量與數字圖像處理課程的融合
為了改善數字圖像處理課程的教學效果,提高教學效率,將視覺測量技術與數字圖像處理課程相融合,本文主要在教學方法和教學手段改革、視覺測量需求與理論知識點結合、實踐動手能力提高等方面進行了研究。
1.教學方法和教學手段改革
為了貫徹學生是教育主體的教育思路,使學生學會學習,并充分激發學生的創新能力和素質培養,促進學生個性的發展,同時有利于師生彼此促進共同進步的原則,針對數字圖像處理課程的特點,采取了以下措施:
(1)重視數字圖像處理課程的基礎理論教學。數字圖像處理內容豐富,應用靈活廣泛,但學生在掌握某些具體應用技術時感到理解困難。因此,在實際教學上,首先需要注重相關的基礎理論教學。[6]例如,數字圖像的本質是數字信號,所以在課程前期階段,專門有針對性地復習和講解了信號分析與處理方面的基本理論,包括數字信號處理的常用方法、離散傅里葉變換和快速傅里葉變換、離散余弦變換等,這些理論在數字圖像處理課程中有具體應用。這不僅有利于對數字圖像處理內容的掌握,也可以反過來加深對相關理論的理解。另一方面注意授課內容的精選,內容不在于多,而在于少而精,突出重點,使學生在有限學時內有最大的收獲。例如,在頻域空間進行圖像增強時,不能將頻域空間的所有方法都對學生講授,而是突出講解了關于頻域空間與時域空間處理之間的關系,針對頻域圖像平滑介紹一種低頻濾波器,分析其原理和特點。這樣不僅節省了教學時間,而且重點突出,同時也引導學生查閱其他相關方法,讓他們自己去動腦思考,提高其思維能力。
(2)完善和改革課堂教學方法。在課堂教學過程中,我們始終重視啟發式教學,遵循“提出問題”、“啟發式思考”、“解決問題”的教學過程,使用“問題教學法”引導學生去思考、分析問題,激發學生學習的積極性,提高教學效果。課堂開始時,根據授課內容,提前向學生拋出相關問題,在講課過程中則圍繞該問題講解課程內容,最后提出問題的解決方法。例如,在講解“直方圖均衡化圖像增強技術”一節內容時,首先向學生展示了兩幅曝光不足和曝光過量的圖片,并且為了提高學生的學習興趣,認識數字圖像處理的實際應用,圖片取自于視覺測量、航空交會對接定位等領域的實際圖片,向學生提問,“如果實際應用中,由于環境光的影響,拍攝到了這樣的圖片,應該怎么辦?”課堂講解過程中,隨著直方圖、直方圖增強技術的理論、直方圖均衡化方法等內容的展開,使學生逐漸理解并掌握直方圖均衡化方法,最后,給學生演示了直方圖均衡化方法的實現,并看到了利用該方法對圖片增強前后的圖片效果。這種啟發引導式的課堂教學方法,取得了良好的效果。
(3)傳統和現代化教學手段相結合。隨著計算機、通信技術應用的迅速普及,國內高校的課堂教學已普遍采用了多媒體技術,利用計算機、投影儀、幻燈機等現代化教學設備,結合計算機輔助教學(CAI)展示教學內容。這些現代化技術的確為課堂帶來了很多豐富多彩的教學手段。數字圖像處理是以圖像為處理對象,其輸出的形式主要以圖像和圖形為主,該課程也十分適宜將教學內容制成課件,采用多媒體計算機開展現代化教學。借助多媒體,使學生較直觀地看到各種圖像的處理需求、處理過程、處理效果等,這是普通教材和參考資料所無法比擬的。因此,我們針對課堂教學需求,進行了多媒體課程教學資源建設,如教學大綱、教學日歷、授課教案和課件等通過多媒體平成,便于講課,同時也便于學生課后的復習。例如,將視覺測量原理、過程等,通過多媒體課件的形式演示出來,相比較口頭介紹等方法具有更加直觀的效果。除了多媒體教學手段,傳統的板書式教學作為補充手段也在數字圖像處理課程中得到應用,主要用在課堂教學內容框架展示、理論推導等方面。
2.視覺測量與理論知識點結合
為了提高算法對于目標特征的識別效果,視覺測量通常采用圓形或方形特征點(圖2),在獲取的圖像中對特征的成像位置進行識別和精確定位。視覺測量對于圖像處理的要求主要包括圖像預處理、特征粗定位、特征精定位等內容,對應數字圖像處理課程中的圖像增強、邊緣檢測、特征識別、幾何運算等知識點。[7]
圖2 視覺測量常用特征點
(1)圖像預處理。圖像預處理的主要方法包括彩色圖像灰度化、圖像增強等,為此,在講解彩色圖像內容時,介紹了RGB、HSI等彩色模型以及不同彩色模型之間的轉換,并引出如何將彩色信息轉換成灰度信息。通過分析彩色表示模型,建立了彩色到灰度圖像的轉換。
向學生展示常用視覺測量圖像效果的基礎上,為了減少圖像噪聲的影響、提高圖像識別效果,提出改善圖像質量的目標,需要進行圖像增強。結合圖像增強中常用的直方圖增強技術、空域和頻域圖像增強方法在視覺測量圖像處理中的實際應用,給學生展示直觀的處理效果,加深對圖像增強方法的理解。
(2)特征點粗定位。數字圖像處理的邊緣檢測是該課程比較重要的一部分內容,邊緣檢測中包含了多種方法,便于學生對不同邊緣檢測算法的作用效果有直觀印象,將各種算法應用于視覺測量圖像征點的邊緣檢測,并有針對性地選擇相應參數,使學生不僅學習了各種邊緣檢測算法的使用,也看到了算法的特點。
根據視覺成像的特點,圓形特征點成像后一般為橢圓,所以,利用邊緣檢測得到的邊緣像點數據,講解用邊緣點進行指定特征識別的方法,如基于Hough變換的特征檢測方法。為了引導學生思考,采用啟發式講課方法,講解了Hough變換檢測直線的方法,引出如何用Hough變換檢測像面上的圓或橢圓,并鼓勵有能力的學生實現相應算法。
(3)特征點精定位。特征點精定位的目的是在實現特征點粗定位的基礎上,對圓形特征點中心在像面上的精確坐標進行定位。精確定位主要設計到數字圖像處理中的點運算,但需要考慮采用的具體定位算法,如灰度重心法、加權灰度重心法、橢圓擬合法等。引導學生通過文獻資料查找和實現相關定位算法,并且與國際領先的專業軟件進行定位精度對比。通過比較,可以使學生發現不同算法之間的區別,并分析不同的原因。進一步,引導學生嘗試對定位算法做一定的改進,這種改進,不需要從算法根本上做出很大的創新,只是從某一方面進行微小的變化,使其能夠適合特定的應用需求。例如,如果對視覺測量像面上特征點定位采用加權灰度重心法時,通過調整加權系數,得到不用的效果,從而分析加權系數對于定位精度的影響,并據此得出適用于該需求的結論。
四、開放性實驗
長期以來,“數字圖像處理”課程教學主要采用課堂理論教學,教學內容也多為經典的內容,很難反映課程內容的時代特征。實驗教學是高等教育的重要組成部分,是抽象思維與形象思維、傳授知識與訓練技能相結合的過程,在人才培養中具有課堂理論教學環節不可替代的作用,對培養理工科大學生的創造性是不可缺少的。雖然目前大多數課程都設置了實踐環節,但也普遍存在著很多問題,[8]例如,實驗課成績占課程成績比例小,學生對實驗的重視度不夠,存在著抄襲他人實驗結果和報告的現象;實驗模式單一,實驗內容陳舊、呆板,多為驗證性實驗,缺乏創新性和挑戰性,學生完全處于被動狀態,最終導致實驗不認真,敷衍了事,所學的知識和操作技術遺忘快;不能保證每個學生都有充分的時間和機會做實驗,個別學生逐漸養成依賴心理,最終只有一部分學生得到了鍛煉;理論課與實驗課教學老師分離,造成理論和實踐環節脫節等。
針對目前“數字圖像處理”課程實驗的現狀,根據視覺測量像面特征點定位需求,開設相關開放性實驗項目“視覺測量特征點提取定位實驗”,實驗要求學生結合數字圖像處理課程知識理論,對視覺測量采集的數字圖像進行處理,提取相關特征點。針對視覺測量中常用的特征點(圓形、方形)進行自動檢測,并實現高精度定位,主要實驗內容包括:圖像預處理、特征點粗定位、特征點精定位、算法設計與實現、實驗結果分析等。
教師在開放性實驗項目中承擔的角色主要是方案設計和實施過程中的指導、監督,對方案的具體實現方法不做限制性要求,主要由學生結合課堂教學內容以及查閱文獻資料來設計并完成。為了提高項目完成的效率,教師可以通過適當的引導為學生指出主要方向。
對于單個學生來說,這樣的實驗項目有些困難,“團隊合作”也是新時期對科技人才素質的要求,所以可以通過建立項目小組的方式開展實驗。小組成員將實驗內容進行分工,每人負責不同的部分,通過相互合作、幫助,完成整個實驗項目。通過這種形式,也在某種程度上鍛煉了學生的團隊合作意識和合作方法。
五、結束語
通過將視覺測量領域研究成果引入“數字圖像處理”課程,并在教學方法、教學手段、教學內容、開放性實踐等方面的改革和嘗試,逐步做到科學研究成果與課堂理論教學的有機結合,不僅豐富了課程的教學內容,提高了學生的學習興趣,加深了對理論知識的理解,而且使學生接觸到科學研究的前沿領域,開拓了視野,對創新能力的培養鍛煉等方面也具有重要意義。
參考文獻
1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme
-try[M]. New York: John Wiley & Sons,2001
2 胡安文、季錚、盛慶紅.基于近景數字視覺測量的飛機表面模型重建[J].地理空間信息,2004(6):23~25
3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006
4 劉常杰、邾繼貴、葉聲華.汽車白車身機器視覺檢測系統[J].汽車工程,2000(6):373~376
5 彭三城、孫星明、劉國華.三維人體自動測量技術綜述[J].計算機應用研究,2005(4):1~5
6 Wang Jun, Dong Mingli, Liang Bo. A fast target location method for the photogrammetry system[C].Proc. of SPIE-ISMCM, Beijing,2011
關鍵詞:網絡 ASP ACCESS
中圖分類號:G6 文獻標識碼:A 文章編號:1674-098X(2013)03(b)-0-01
1 研究背景
2003年4月,中國教育部了《關于啟動高等學校教學質量與教學改革工程精品課程建設工作的通知》,提出精品課程是具有一流教師隊伍、一流教學內容、一流教學方法、一流教學管理等特質的示范性課程。經過幾年的推行實施,國家精品課程在數量上已具有一定規模,質量上也在逐年提高,但是在課程資源等方面仍然存在不足之處:(1)課程資源庫建設。在《國家精品課程評價指標體系》中,課程資源主要是通過教學內容和教學條件兩大項來評價,他們是課程的核心部分,是教學信息設計、組織與呈現等教學設計思想的具體化表現。經過這幾年的努力,課程資源建設模塊逐漸約定俗成,絕大多數課程均有課程介紹、教學大綱、教學安排、授課錄像和試卷習題等,而實驗/實踐稍差,學習/教學指導、電子教材和素材庫等最為薄弱;(2)課程資源類型。精品課程充分發揮現代教育技術強大功能,采用各種多媒體技術來呈現教學信息,如音/視頻、PowerPoint、Word、Flash等,課程資源類型可以分為演示型、過程型、交互型、管理型和評價型5種,但是現在絕大多數課程都不重視過程型和交互型資源的建設,更是忽略知識管理型和評價型資源的建設[1]。
2 需求分析
精品課程網站的設計與開發,充分發揮計算機在呈現信息、提供聯系、激發動機、學習評價方面等方面優勢,彌補了教師、課本、視聽媒體的不足;計算機作為使用者收集和組織信息、探究與批判性思考、合作與交流的工具,能很好的激發學習者的學習動機,促進有意義學習的發生;另外,精品課程的設計與開發,突破了時空限制,具有傳播范圍廣的特點,任何人、任何時間、任何地點都可以按各自的興趣選擇任何課程進行學習??傊氛n程網站的設計很好的適應了當今世界國際化、信息化、知識化等特征的要求,學習者能更好的實現自主學習。《遙感數字圖像處理》是一門專業基礎課,是以理論聯系實踐為主,注重運用,重視上機實踐的一門課程。對于這樣一門操作性較強的課程,設計與開發它的精品課程網站是非常有必要的?!哆b感數字圖像處理》精品課程網站的設計與開發依托了校級《遙感數字圖像處理》精品課程的建設,面向遙感數字圖像處理專業的學生,旨在輔助學生完成對本門課程的自主學習,實現學習效果的最優化,其目的是為了讓學生通過學習,打牢遙感數字圖像處理的基礎知識,進而可以運用到實踐中。通過該課程的學習,使學生樹立正確的遙感數字圖像處理的概念,培養學生良好的計算機實踐習慣,實事求是的科學態度和嚴謹細致的工作作風,為后繼課程的學習和將來參加社會生產實踐打下基礎。
3 主要技術簡介
3.1 ASP技術簡介
ASP是Microsoft Active Server Pages的簡稱,是服務器端腳本編寫的環境,可以創建和運行動態、交互的Web服務器應用程序,即可以組合HTML頁、腳本命令和Web頁和基于Web的功能強大的應用程序。ASP不是一種語言,它所使用的語言是Javascript或VBScript,或者是這兩種語言的結合體。總的來說,ASP具有以下的特點:(1)使用簡單易懂的腳本語言(Javascript或VBScript等),結合HTML就可以快速開發出各種各樣的應用程序;(2)不需要編譯,容易編寫,而且代碼在服務器端直接執行;(3)ASP源程序在服務器端被執行后,將執行結果返回給客戶端,從而提高了源程序的安全性;(4)可使用服務器端腳本來產生客戶端腳本;(5)由于ASP程序在服務器端執行,因此只要客戶端使用的瀏覽器可以執行HTML代碼即可。這樣便最高限度地保證了ASP程序的通用性;(6)可以使用VB等多種編程語言來開發ActiveX服務器組件來擴充服務器端程序的功能;(7)使用普通的文本編輯器即可對ASP程序進行設計、修改;(8)ASP提供了幾種內置對象使得腳本功能更強大,在其他方面,這些對象完成從瀏覽器中檢索或向瀏覽器發送信息的功能??傊珹SP是目前網頁制作技術中最容易學習、靈活性也最大的工具之一。更重要的是它擁有非常好的可擴充性。像標準的HTML文件一樣,ASP包含可以被Web瀏覽器顯示并解釋的HTML標簽。通常放入HTML文件的Java小程序、閃爍文本、用戶端腳本、用戶端ActiveX控件都可以放入Active Server Pages中[4]。
3.2 ACCESS技術簡介
Microsoft Office Access(前名 Microsoft Access)是由微軟的關聯式數據庫管理系統,是 Microsoft Office的主要成員之一。Access能夠存取 Access/Jet、Microsoft SQL Server、或者任何ODBC兼容數據庫內的資料。Access 數據庫由七種對象組成,它們是表、查詢、窗體、報表、宏、頁和模塊。
表(Table)―是數據庫的基本對象之一,是創建其他對象的基礎。表由記錄組成,記錄由字段組成,表用來存貯數據庫的數據,因此又稱數據表。
查詢(Query)―查詢可以按索引查找到需要的記錄,按要求篩選記錄并能連接若干個表的字段從而組成新表。
窗體(Form)―窗體提供了一種方便的瀏覽、輸入及更改數據的窗口。還可以創建子窗體顯示相關聯的表的內容。窗體也稱表單。
報表(Report)―報表的功能是將數據庫中的數據匯總,然后打印,以便
分析。
宏(Macro)―宏相當于DOS中的批處理,用來自動執行一系列操作流程。Access列出了一些常用的操作以方便用戶選擇,使用起來十分便捷。
模塊(Module)―模塊的功能和宏相似,但其操作比宏更加精細和復雜,用戶可根據自己的需求編寫程序。
頁―是特殊的直接連接到數據庫中數據的一種WEB頁。通過數據訪問頁可將數據到Internet 或Intranet上,而且可以適用瀏覽器進行數據的維護和操作。
參考文獻
[1] 許坦,石.精品課程發展現狀綜述[J].中國電化教育,2007(5):244.
[2] 何克抗,李克東.教育技術學研究方法[M].北京師范大學出版社,2006.
關鍵詞:CCD、軌跡、圖像處理
視覺在人類生活中起著非常重要的作用,人們每天都通過眼睛采集大量的信息,這些信息經過大腦的處理,成為人們認知和理解世界的基礎。機器人視覺信息主要指CCD攝像機采集的二維圖像信息。視覺信息能否被正確、實時地處理直接關系到機器人對障礙物的避碰、對路標的識別以及對路徑的跟蹤,對系統的實時性和魯棒性具有決定性的作用。視覺信息的處理技術是移動機器人研究中關鍵的技術之一。為了簡化視覺信息處理,通常把移動機器人的工作環境分為結構化道路環境和非結構化道路環境。結構化道路的檢測相對來說較易實現,其檢測技術一般都以邊緣檢測為基礎,輔以Hough變換、模式匹配等,并利用最小二乘法對應于道路邊界的線條,得出道路的幾何描述。由于非結構化道路的環境復雜、特征描述困難,使得非結構化道路的檢測及信息處理復雜化。
近年來,機器人視覺導航技術有了很大的發展。移動機器人的工作環境可能比較復雜,因此,提高圖像識別的準確性以實現移動機器人的準確定位是移動機器人完成其導航任務的首要前提;同時,由于移動機器人在導航過程中需要實時的采集并分析圖像信息,從而實現對作業環境的識別以進行準確的路徑跟蹤。因此,如何在提高圖像識別的準確性的同時達到較好的實時性是移動機器人視覺技術的一個發展方向
1.圖像處理
數字圖像處理,是對數字圖像信息進行加工以滿足人的視覺心理或應用需求的行為,數字圖像處理的英文名稱是"Digital Image Processing'',通常所說的數字圖像處理是指用計算機對圖像進行的處理,因此也稱為計算機圖像處理。圖像處理就是用一系列的特定操作來改變圖像的像素,以達到特定的目標,比如使圖像更清晰,或者從圖像中提取某些特定的信息等。
CCD攝像頭的主要工作原理具體而言,就是攝像頭連續地掃描圖像上的一行,輸出就是一段連續的電壓視頻信號,該電壓信號的高低起伏正反映了該行圖像的灰度變化情況。當掃描完一行,視頻信號端就輸出低于最低視頻信號電壓的電平(如0.3v),并保持一段時間。這樣相當于,緊接著每行圖像對應的電壓信號之后會有一個電壓"凹槽",此"凹槽"叫做行同步脈沖,它是掃描換行的標志。然后就需要跳行,跳過一行后(因為攝像頭是隔行掃描的方式),開始掃描新的一行,如此下去,直到掃描完該行的視頻信號,接著就會出現一段場消隱區。此區中有若干個復合消隱脈沖,其中會有個脈沖遠寬于(即持續時間長于)其它的消隱脈沖,該消隱脈沖又稱為場同步脈沖,它是掃描換行的標志。場同步脈沖標志著新的一場的到來,不過,場消隱區恰好跨在上一場的結尾部分和下一場的開始部分,要等到場消隱區過去,下一場的視頻信號才真正到來。攝像頭每秒掃描25幅圖像,每幅又分奇、偶兩場,先奇場后偶場,故每秒掃描50場圖像。奇場時只掃描圖像中的奇數行,偶場時則只掃描偶數行。
選擇一款具有全電視信號輸出的黑白CCD圖像傳感器,用LMl881進行信號分離,結合A/D采樣,實現了視頻信號的采集。在總線周期為400M的情況下,每行采集72個有效數據,攝像頭每場信號有320行,其中第23到310行為視頻信號。我們從中均勻采集了24行,最后得到一個24×72的二維數組。
CCD采集的原始數據包含了黑線的位置信息,為了穩定可靠地提取這一信息,有一下幾種方法:
(1)二值化算法
算法的思路是:設定一個閾值value,對于視頻信號矩陣中每一行,從左至右比較各像素值和閾值的大小。若像素值大于等于閾值,則判定該像素對應的是白色道路;反之,則判定對應的是目標指引線。記下第一次和最后一次出現像素值小于閾值時的像素點的列號,算出兩者的平均值,以此作為該行上目標指引線的位置。該算法的思想簡單,具體實現時還可以一旦檢測到左邊緣后就退出該行掃描,這樣上面的流程圖將變得更加簡潔。但是這種提取算法魯棒性較差,當拍攝圖像中只有目標指引線一條黑線時,還能準確提取出目標指引線。但當光強有大幅度的變化,或圖像中出現其它黑色圖像的干擾時,并且離機器人比較近的黑線比較的明顯,離機器人越來越遠時黑線越來越淡,該算法提取的位置有可能與目標指引線的實際位置偏離較大。
(2)直接邊緣檢測算法
算法的思路是:設定一個閾值,對于視頻信號矩陣中每一行,從左至右求出相鄰兩像素值的差值(左減右)。若差值大于等于閾值,則判定下一個的像素點對應的是目標指引線的左邊緣,以此像點作為該列的特征點,記錄下此像素點的列號,作為該行上目標指引線的位置。當然,可能出現差值始終小于閾值的情況,此時一種方法是令該行上目標指引線位置為0,通過進一步濾波或擬合來修正;另一種方法是讓該行上目標指引線位置和通過上一場視頻數據求得的位置一樣。
該算法較二值化方法而言,抗環境光強變化干擾的能力更強.同時還能削弱或消除垂直交叉黑色指引線的干擾。因為該算法在視頻信號矩陣中是由左至右來尋找目標指引線的左邊緣的,所以當黑色圖像出現在目標指引線左方時,該算法無法排除干擾,而當其出現在右方時,則可以排除干擾。
(3)跟蹤邊緣檢測法
這種算法跟直接邊緣榆測算法一樣,也是尋找出目標指引線的左邊緣,仍然用左邊緣的位置代表目標指引線的位置。但跟蹤邊緣檢測從視頻信號矩陣每行中尋找左邊緣的方法與直接邊緣檢測法不同。
因為目標指引線是連續曲線,所以相鄰兩行的左邊緣點比較靠近。跟蹤邊緣檢測正是利用了這一特性,對直接邊緣檢測進行了簡化。其思路是:若已尋找到某行的左邊緣,則下一次就在上一個左邊緣附近進行搜尋。這種方法的特點是始終跟蹤每行左邊緣的附近,去尋找下一列的左邊緣,所以稱為"跟蹤"邊緣檢測算法。
在首行邊緣檢測正確的前提下,該算法具有較強的抗干擾性,能更有效地消除垂直交叉黑色指引線的干擾,以及指引線外黑色圖像的影響,始終跟蹤目標指引線。
另外,較之前兩種算法,跟蹤邊緣檢測算法的時間復雜度更低,因此效率更高。但值得注意的是第一行的左邊緣位置對整個目標指引線的搜尋影響 很大,一旦它的位置和實際導引線偏差較大,就會產生一連串的錯誤,這是不可容忍的。
通過比較本系統選擇了效率更高,更可靠的跟蹤邊緣檢測法。流程圖如圖所示:
2.結論
本文中圖像處理和路徑信息識別的方法,并對不同時刻不同位置采集到的圖像的處理效果進行比較研究,結合實際環境中的圖像特點,確定出適合于本研究的圖像處理算法。提出了改善路徑信息辨識速度和精度的方法。
參考文獻:
[1]張文志,呂恬生.基于改進的遺傳算法和模糊邏輯控制的移動機器人導航[J].機器人.2003,
25(1):1
[2]邱茂林,馬頌德,李毅.計算機視覺中攝像機定標綜述[J].自動化學報.2000,26(1):44-45
[3]吳文琪,孫增圻.機器視覺中的攝像機定標方法綜述[J].計算機應用研究.2004,21(2):4-5
關鍵詞:圖像;拼接技術;綜述
中圖分類號:TP391 文獻標識碼:A文章編號:1007-9599 (2011) 11-0000-01
Image Stitching Technology Overview
Cai Jian
(Nanjing University of Aeronautics and Astronautics,Nanjing210016,China)
Abstract:Today,more and more high-resolution digital images for domestic,industrial,medical and defense technology applied.With computer vision,image processing technology,using an ordinary camera computer digital image composition as a large high-resolution images of the image stitching technology came into being.
Keywords:Image;Stitching technology;Overreview
而在人們的實際生活應用中,所需要的目標場景往往超出普通數碼相機、監控攝像機等的視角范圍。這些相機,往往在增大視角會降低采集圖像的精度,而提高精度又只能窺豹一斑。因此,為了得到應用所需的高分辨、大視角的圖像,人們不得不使用廣角鏡頭和全景拍攝相機,這加大了生產、生活的成本,且使用技術不為一般人所能熟悉。所謂圖像拼接技術,就是將數張有重疊部分的圖像(可能是不同時間、不同視角或者不同傳感器獲得的)拼成一幅大型的無縫高分辨率圖像的技術。圖像拼接的流程大致分為:獲取待拼接的圖像,進行圖像預處理,圖像重疊區域配準,圖像的無縫融合,輸出所得拼接圖像。其中,圖像配準和圖像融合是圖像拼接成功的關機,是拼接的關鍵技術。因此,國內外學者多圍繞此兩項技術展開研究和討論。
圖像配準是圖像融合的基礎,而且圖像配準算法的計算量一般非常大,因此圖像拼接技術的發展很大程度上取決于圖像配準技術的效率。
一、圖像拼接的應用價值
目前,圖像拼接技術已經數據圖像處理研究的熱門方向之一,被廣泛地應用在文物保護(古跡、古文字資料的拼接)、工業監控、刑事案件偵破、醫學圖像分析、攝影測量學、機器視覺、虛擬現實技術、超分辨率重構、軍事地形圖像生成等領域,有著實際的應用意義和研究價值。主要表現為:
(一)全景圖和超寬視角圖像的合成。將普通圖像或視頻圖像進行無縫拼接,得到超寬視角甚至360°的全景圖,這樣就可以用普通相機實現場面宏大的景物拍攝;
(二)碎片圖像的組合。將醫學和科研的顯微碎片圖像或者空間、海底探測得到的局部圖像合成大幅的整體圖像;
(三)虛擬現實。圖像拼接是虛擬現實領域里場景繪制(Image-based Rendering,IBR)方法中的一項基本技術,利用圖像拼接技術可以生成全方位圖像,用全景圖表示實景可代替3D場景建模和繪制。
例如2003年,美國“勇氣號”和“機遇號”火星探測器發回了大量的火星地面照片,科學家們就是運用圖像拼接技術合成了火星表面的寬視角全景圖像。
二、圖像拼接的方法
圖像拼接的方法很多,不同的算法步驟會有一定差異,但大致的過程是相同的。一般來說,圖像拼接主要包括以下步驟:
(一)圖像預處理。包括數字圖像處理的基本操作(如去噪、邊緣提取、直方圖處理等)、建立圖像的匹配模板以及對圖像進行某種變換(如傅里葉變換、小波變換等)等操作。
(二)圖像配準。就是采用一定的匹配策略,找出待拼接圖像中的模板或特征點在參考圖像中對應的位置,進而確定兩幅圖像之間的變換關系。
(三)建立變換模型。根據模板或者圖像特征之間的對應關系,計算出數學模型中的各參數值,從而建立兩幅圖像的數學變換模型。
(四)統一坐標變換。根據建立的數學轉換模型,將待拼接圖像轉換到參考圖像的坐標系中,完成統一坐標變換。
(五)融合重構。將帶拼接圖像的重合區域進行融合得到拼接重構的平滑無縫全景圖像。
三、國內外研究現狀
1975年,Kuglin和Hines提出了相位相關算法,該方法具有場景無關性,能將純二維平移的圖像進行精確對齊。1987年,De Castro和Morandi等人使用傅立葉變換將具有旋轉變換的圖像做對齊,由此產生擴展相位相關法。1996年,Reddy和Chaterji改進了De Castro的算法,基于快速傅立葉變換,利用極坐標和互功率譜,實現了具有平移、旋轉和縮放變換的圖像配準。
相位相關法雖然計算簡單精確,但要求待配準圖像之間有較大的重疊比率,同時計算量和適用范圍與圖像的大小有很大的關系。因此,出現了基于圖像幾何特征的配準方法。
1997年,Zoghlami I.、Faugeras O.和Deriche R.提出了基于幾何角模型的圖像對齊算法。1999年,Bao P.和Xu D.利用小波變換提取保留邊(edge-preserving)的視覺模型進行圖像的對齊,Nielsen F.則提出了基于幾何點特征優化的匹配方法。
隨著人們對圖像的分析和理解的深入,圖像拼接技術的研究也趨于成熟,圖像拼接利用的配準特征也從圖像的低級特征發展到利用高級特征。
1996年,Richard Szeliksi提出了基于運動的全景圖像拼接模型,模型通過采用Levenberg-Marquardt迭代非線性最小化方法(L-M算法)求出圖像間的幾何變換關系進行配準。此算法效果好、速度快,且能應對平移、旋轉和仿射等變換圖像的拼接,因此成為圖像拼接領域的經典算法。2000年,Shmuel Peleg、Benny Rousso等在其基礎上,根據相機的不同運動,自適應的選擇拼接模型,通過把圖像分割成條進行多重投影,提出了自適應的圖像拼接模型,使自適應拼接成為拼接領域研究的又一方向。
國內學者也對圖像拼接技術做了大量研究。張祖勛提出了多級影像概率松弛整體匹配技術,對不同傳感器、不同空間分辨率的影像進行配準。杜威、李華二人將視頻紋理和全景圖結合起來,提出一種應用于動態場景的全景圖表示方法。趙向陽、獨立民提出了基于Harris特征點匹配的自動拼接算法。侯舒維、郭寶龍采用簡單的邊緣信息閾值法、金字塔式分層搜索策略,提出了一種灰度圖像上的快速自動拼接算法。方青、王博亮提出了一種基于比值模版匹配的彩色圖像拼接算法。
參考文獻:
[1]王娟,師軍,吳憲祥.圖像拼接技術綜述[J].計算機應用研究,2008,25(7):1940-1943,1947
關鍵詞:字符切分 圖像預處理 小數點 小面積剔除
中圖分類號:G64 文獻標識碼:A 文章編號:1672-3791(2015)05(b)-0222-02
Abstract:The purpose of character segmentation is to cut out entire character string and turn it into a single digital image.Character segmentation is one of the key steps in the digital character recognition.After preprocessing,due to adhesions caused by a decimal point, character segmentation cannot be done correctly.In order to solve the problem of adhesions by decimal, proposing a method by excluding small areas to remove the decimal point.First,we get the statistical area of the various parts of the image,and then determine the threshold to distinguish the decimal from numeric characters,finally exclude the decimal point.After that,we preprocess the image,use linear projection segmentation to pick out the character.The experiment indiclrte that the method works well.
Keywords:Character segmentation;Preprocess;Decimal;Exclude small areas
字符切分主要是指把整個待識別字符串圖像中的單個字符都切割提取出來,讓它成為單個數字圖像以便識別。字符切分準確與否,直接影響著提取到正確的數字特征的成功率,而且識別的正確性也就大大降低了。在字符切分的過程中存在著很多不同的因素,影響著字符的切分,如數字字符大小的不同、數字字符字體的多樣性、數字字符的傾斜以及圖像預處理結果的清晰程度,都影響著數字字符的切分。
根據黑點數統計進行投影的直線切分方法是一種比較直觀和簡單的方法,其基本思路為:先對圖像進行垂直投影,然后再根據其對應的投影曲線,選取曲線中大波谷作為切分區域。在一般情況下,字符串中的字符間隙都是沒有筆畫部分,經過垂直投影后在間隙處出現大波谷的部分,根據大波谷來判斷進行切分是可以正確切分這些沒有粘連和重疊區域的數字串,對于有粘連和重疊區域的數字字符串就無法正確切分了。所以對于印刷體的數字串或者字符間距較大的數字串、書寫工整的數字串的切分這種切分,方法都適用。
該文主要研究小數點造成數字字符粘連情況下的直線切分法實現字符切分,采用小面積剔除方法將小數點剔除來解決小數點造成的字符粘連問題,保證字符能順利切分。
1 直線切分方法
該文使用直線切分方法對數字字符進行切分。直線切分方法是一種相對比較傳統的數字字符切分方法,它對簡單的二維目標切分非常有效。切分過程中的主要難點在于判斷是否有數字字符粘連或者斷裂,以及粘連,斷裂的數字的處理。
統計圖像在水平和豎直方向上的投影,是很常用的一種簡單實用方法。它的基本思想是統計出圖像在水平投影和豎直投影,然后再分析投影統計值的變化,來具體分析出含有七段式數字顯示儀表中的數字字符的位置。這種方法處理的圖像主要是二值圖像。將經過灰度處理、二值化、膨脹、腐蝕和平滑后的圖像用來切分,經過這些預處理后的圖像如圖1。
由式(1)和式(2)可以得出,水平方向上的投影是圖像A列數的一個函數。其中第行對應的投影值,是這一行中黑色像素點的個數。豎直方向上的投影,是圖像A行數的一個函數。其中第j列對應的投影值,是這一列中黑色像素點的個數。
使用公式(1)和(2)對待切分數字字符圖像進行投影統計,得到圖像的水平和豎直投影如圖2和3。
由圖像的豎直投影可知數字與數字之間存在空白,那么沿著這些空白將數字字符切分,同時依據水平方向投影截去圖像上下的空白,得到數字字符切分結果如圖4。
2 粘連字符切分
但是,預處理后的圖像在使用投影法切分字符的時候,發現會出現字符粘連的在一起。在圖像膨脹處理的時候,為了消除七段碼之間的間隙、孔洞,但同時將小數點也采取了膨脹處理,導致小數點與前后兩個數字字符粘連在一起,如圖5。這樣的字符粘連在一起使得字符切分的時候前面兩個字符沒有切分開來,如圖6,這樣就會造成字符無法識別。
字符切分直接影響字符識別的正確率,如圖6這種類型情況就必須將小數點影響解決才能正確切分字符。那么就得在預處理中圖像膨脹前將小數點去掉。
此時考慮單個字符與小數點的區別,發現小數點所占面積遠小于字符所占面積,如圖7。
由圖7可以看出,小數點的面積在七段碼數字中面積最小,采取剔除小面積區域方法將小數點刪除,解決字符粘連的問題,再進行膨脹就不會出現字符粘連情況。字符切分情況如圖8。
3 結語
結合直線切分方法,利用水平投影與豎直投影,解決了包含小數點時造成字符粘連的問題,將數字字符從圖像中提取出來,為后續作字符識別提供保障。小面積剔除法去除小數點,解決粘連問題效果良好。
參考文獻
[1] 張春伶.圖像分割算法綜述與探索[J].科技創新與應用,2012(10):55-56.
[2] 丁可.數字圖像處理技術研究與發展方向[J].經濟研究導刊,2013(18):246-247.
由于數碼圖像的普及,以及圖像處理和信息提取等技術的快速發展,使人們對圖像本身有了更高的要求,并且圖像在越來越多的司法或其它鑒定場合成為關鍵證物,如何在紛亂復雜的圖像中去偽存真,提取更完備更正確信息成為了當前數字圖像研究中的一個熱點。圖像取證正是在這個背景下應運而生。
2.圖像取證技術的研究意義
自進入二十一世紀以來,隨著個人電腦和其他數碼設備的大規模普及,圖像幾乎成了人們每天都能接觸到的東西,成為了人們生活中有意或無意都會留下的一個參照物,所以其中包含的巨量的信息是我們取之不盡用之不竭的資源。在司法或其它鑒定領域,只要我們能合理的利用圖像直接或間接包含的信息,我們就能獲取我們能夠想了解的任何一個方面,所以,對圖像取證技術的研究具有重大現實意義。只要擁有優越的圖像取證方法,我們就能夠從圖像中看出端倪,進而獲取方方面面我們可能用到的信息,為進一步的司法舉證或者其他鑒定工作打下良好基礎,同時在這個信息時代中借助高科技提供充足的線索,使鑒定人員能夠事半功倍的還原現場,大幅度的提升判斷速度和工作效率。
3.圖像取證技術的分類
人們應用圖像取證技術去解決問題的追求主要有以下五個方面:
一是原始證據圖像品質達不到需求,需要對圖像進行各種優化處理來對圖像中的細節信息進行分辨,以便更加細致的對照。在現實生活中,我們經常會遇到數碼設備由于光線、環境以及設備自身性能的問題而得到的不清晰的圖像,導致圖像中的關鍵目標無法進行分辨,這類圖像亟需一種有效的優化方法來區分其中的關鍵目標,以便為司法或者其他鑒定工作服務;
二是圖像資料數量巨大,人們需要更加智能的技術來對圖像中感興趣的信息進行快速檢索。當前的軟硬件條件下各式各樣的圖像信息數量龐大,尤其是各種監控設備的廣泛應用使得圖像數量規模變得更加令人嘆為觀止,有統計顯示,對于一段時長6小時的監控錄像,有時甚至需要使用其時長60%以上的工作時間才能完成取證工作,所以人們在這些紛繁復雜的圖像信息中尋覓自己關注的特定信息步履維艱,非常需要一種有效的針對圖像內容的檢索方法來快速的識別自己感興趣的圖像;
三是隨著各種圖像處理技術的發展和圖像處理工具大規模應用,圖像變得越來越容易被篡改和偽造,網絡上的PS風氣日益流行,并且這種修改是肉眼無法覺察的,使得我們在這些真假難辨的圖像面前如墜云霧,更有甚者,一些圖片偽造者別有用心,希望借其“作品”擾亂視聽,歪曲事實,如大名鼎鼎的“華南虎”事件,這類問題造成諸多方面的負面影響,導致政府公信力或者公眾判斷力下降,破壞社會的安定團結,造成許多惡劣后果。另外許多擁有嚴格版權的圖像也有被侵權之憂,人們需要一種有效的區分圖片真偽和來源的方法;
四是圖像資料中隱含的間接信息的提取,比如圖像中物體的速度或者景深等三維信息,這些都是圖像所能提供的間接信息,我們可以根據圖像的成像原理,來對其間接信息進行分析和提取,檢測圖像中目標的位置或速度,來實現一些極具現實意義的應用,比如汽車超速檢測等;
五是在有足夠的線索時將其他信息轉換為圖像信息,比如模擬畫像和合成照片等參考物證,這些應用是另一個意義上的圖像取證。
以上五個方面的應用是建立在當前的硬件應用環境之上的,可概括為增強取證、圖像篡改檢測、圖像間接信息提取、圖像內容智能檢索、基于信息的圖像構建五個方面,對圖像取證技術的研究能夠在目前這個環境下為人們提供充足的證據,以便對某一事物進行全方位的考察。
4.主要研究方法與現狀
本文論述的圖像取證問題范圍涵蓋圖像,下面對這圖像取證五個方面問題的研究方法與現狀分別進行介紹。
4.1 圖像增強
從信號圖像出現開始,人們便致力于改善圖像顯示效果,最早的圖像增強可追溯到1921年美國和歐洲進行海底電纜通信時,為了改善模擬信號圖像的還原效果,研究人員將圖像的灰度等級從5個增加到了15個,大大改善了圖像復原的效果。到了20世紀60年代,第一臺可以進行數字圖像處理的計算機研制成功,人們開始用幾何校正和灰度變換等方法進行圖像增強,到了70年代初,研究者已經將圖像增強技術應用到醫學圖像、地球遙感監測和天文學圖像等領域,80年代之后,硬件的快速發展讓人們有更充足的圖像增強算法來進行選擇,進入90年代之后,圖像增強技術更廣泛的應用到人們的生活和生產等領域,研究者們開始嘗試將這些算法嵌入到數碼設備中。
目前國內外關于圖像增強方法主要有基于空域的方法、基于變換域的方法和基于機器學習或貝葉斯統計的方法等。其中基于空域的方法主要是從子圖像乃至像素級別對圖像進行直方圖均衡[1—2]、線性對比度調整、反銳化掩膜、自適應優化[3]等處理,前兩者主要對圖像亮度對比度進行優化,后兩者主要針對圖像邊緣細節進行優化。基于變換域的方法包括傅里葉(Fourier)變換、小波(Wavelet)變換、曲波(Curvelet)、脊波(Redgelet)和輪廓波(Contourlet)變換、離散余弦(Discrete Cosine Transform)變換等,其原理是將圖像變換到其他空間,然后利用此空間對信號處理的優勢進行處理,然后再將此空間里的信號重構為空域圖像的形式,以實現優化處理。
較之空域圖像增強方法不同,變換域增強方法有其獨到的優勢?;诳沼虻膱D像增強方法往往針對性較強,如直方圖均衡方法主要針對圖像的對比度進行優化增強,自適應優化和反銳化掩膜主要將圖像的邊緣細節進行效果提升,而變換域方法有時候能夠取得一舉多得的效果。
隨著數學理論的發展,又出現了許多新的圖像增強方法,其中最具代表性的有基于數學形態學的方法、基于模糊數學的方法、基于人工智能的方法和基于偏微分方程的方法等。
4.2 圖像篡改偽造檢測
自1814年第一張照片問世之后不久,便出現了對照片的修改和加工,1865年著名攝影家Mathew Brady拍攝的一張照片在后期人為的增加了一個人物,從此之后,各種出于政治或者其他目的的圖像篡改便流行開來,大部分都是通過拼接手段對照片中的人物或者物品進行增加或者移除,進入數碼時代之后,圖像篡改變的更加簡單易行,隨著數碼技術和工具的普及,對圖像是否為篡改和偽造的甄別成為了計算機領域又一個前沿課題,由于圖像篡改檢測涉及到司法、輿論、政府公信力和傳媒等多方面的利害關系,當前學術界開始對圖像篡改檢測投入更多的精力進行研究。
Shih—fu chang等人通過研究CCD失真校正、非線性伽馬校正、色彩插值、白平衡和傳感器噪聲等對圖像生成的影響,并對這些影響形成的特征進行檢測,從而對圖像的來源和圖像是否拼接進行鑒定。Hany Farid等人利用小波分解和高階統計建模等方法來對圖像素材(包括數碼照片、掃描圖像和計算機生成圖像)進行盲檢測,根據來源不同的圖像具有各異的高階統計的特性,結合機器學習和數據挖掘技術,來進行來源檢測。Hany Farid和A.Popescu還根據DCT系數直方圖中的類采樣效應來進行二次壓縮檢測,并且通過EM算法(Expectation/Maximization)進行數字圖像重采樣檢測。J.Fridrich等人利用數碼相機的模式噪聲來作為檢測標準來判斷相機,進行相機識別。馬里蘭大學的吳旻利用對圖像不同塊之間DCT系數的相關性、信噪比進行統計和雙譜分析的方法,對圖像的空域濾波、壓縮、重采樣、亮度調整等篡改操作進行檢測。
在圖像防偽方面,數字水印技術是當前研究的熱點,并且在國內外的研究中取得了初步的進展。數字圖像篡改取證的研究近年來受到了世界上各國研究機構和研究者的重視,在許多國際重要期刊與國際會議上,圖像盲取證越來越多的成為一個重要專題,IEEE、Springer都為圖像盲取證設置了獨立的期刊,數字圖像取證科學的前沿性和重要性由此凸顯出來,一些圖像相關廠商也在其產品中增加關于圖像篡改取證的模塊,圖像處理工具大亨Adobe正準備在其招牌產品Photoshop中增加圖像防偽外掛程序,來進行圖像真偽和篡改的識別。
數字圖像真偽甄別涉及到圖像處理分析技術、數理統計、模式識別、數據挖掘、成像原理、計算機視覺等方面的知識,是一項比較復雜的系統工程。
4.3 圖像間接信息的提取
成像的過程是將三維景物通過光學系統變換到二維平面上的過程,按照感光媒介不同可分為傳統成像系統和現代成像系統,其代表分別為化學膠片和CCD(或CMOS)。在成像的過程中,拍攝目標所包含的各種相關信息也被悉數記錄,在計算技術發達的今天,國內外研究者寄希望于將包含在圖像中的這些蛛絲馬跡加以綜合運用,以便獲取許多我們以前只有通過物理測量或人工識別才可以獲取的信息,這些應用在現代被歸類為機器視覺。
機器視覺主要通過將觀察對象進行數字化,根據人類的判別規則來對觀察目標進行判別,或者逆用成像原理來獲取觀察目標的物理數據,從而實現對數字化圖像信息進行自動化的識別,這些需要識別的信息主要包括被拍攝目標與相機之間的距離、目標運動速度、圖像中包含的文字乃至人物等等,對圖像中的這些信息進行精確識別一直都是機器視覺領域的研究重點和難點。在現代的生產生活中,機器視覺已經越來越多的被應用到實際,完成一些重復性和機械性的識別工作,以彌補人眼長時間連續進行機械性識別易產生疲勞和不穩定的不足,減輕人類的勞動強度,在一些智能機器人中,也置入了機器視覺模塊,以便判斷周圍環境,為高級人工智能程序提供輸入信息。
1987年,Pentland首先提出了圖像模糊程度與物體距離之間的關系,并將離焦圖像的點擴散函數近似為類高斯函數來進行計算。1988年,Subbarao和Gurumoorthy等人取消了對點擴散函數的限制,利用線擴散函數的擴散參數來代表物體與鏡頭之間的距離,只需點擴散函數具有圓對稱性就可以。1999年,Schechner和Kiryati采用靈敏分析的方法來使用圓柱形點擴散函數估計測距誤差和不同頻率成分的關系,使離焦測距算法在精度上有了更高的提升。
國內外也有許多學者根據圖像中運動模糊位移來測算物體的相對運動速度,Cannon等利用頻域中的零值條紋在理論上證明從勻速直線運動模糊圖像中估計運動方向和相對運動尺度的可行性,但并沒有給出自動鑒別的方法。
在三維重建方面,目前的主要做法是找到圖像的被動線索和主動線索,然后根據同一場景的多個角度的圖像來進行參數化建模。
4.4 圖像內容智能檢索
基于圖像內容的檢索是計算機領域擁有戰略意義的新課題,由于其潛在應用價值極大,所以國內外對于這方面的研究都比較重視,從九十年代至今,已經有許多趨近成熟的系統問世。
國際商用公司(IBM)率先研發出第一個圖像內容檢索系統QBIC,其后麻省理工學院(MIT)也憑借其人才優勢研發出了PhotoBook圖像檢索系統。美國哥倫比亞大學也開發出了VisualSeek,這類系統主要針對如何選擇合適的全局特征來描述圖像中的內容。為了解決圖像內容檢索算法實用性比較差的問題,后來的研究者提出了Image Retrieval算法,各國科學家沿著這一方向又研發出了Netra、BlobWorld、SLMPLIcity等系統。
華裔科學家黃煦濤首先將相關反饋技術應用于圖像檢索,以減少機器低層特征與人類高層語義之間的差異,提高檢索結果的針對性。
4.5 基于信息構建圖像
在計算機模擬畫像方面,早期公安部組織研發了PZY—110型人像組合儀,不過未能在全國推廣普及。九十年代由公安部和清華大學開發的自動模擬畫像系統通過了專家鑒定。2001年中國刑警學院的趙成文教授的“警星CCK—Ⅲ人像模擬組合系統”開發成功,并達到了國際先進水平。
在顱骨面貌復原方面,我國的吉林大學和意大利都靈大學都采用了首先人工堆顱骨外觀修正,再對顱骨各個面的二維圖像進行采樣并建模。
加拿大哥倫比亞大學的Imager Lab采用參數化人臉模型的辦法來進行建模,Giuseppe等人采用CT切片的疊加來進行三維網格建模,取得了較好的復原效果。
5.總結
數字圖像取證技術由于起步較晚,尚未形成系統的理論體系和研究模型。本文對圖像取證技術及其研究內容做了綜述,并總結了圖像取證技術五個方面當前的國內外研究方法與現狀。圖像取證技術是在當前硬件環境下發展起來的一個新興領域,它包括到圖像質量優化、圖像真偽鑒別、圖像間接信息提取、圖像內容智能檢索、基于信息構建圖像等方面,涉及到信號與信號處理、成像原理、計算機視覺、數學形態學、統計學乃至密碼學等領域,是人們從繁雜的圖像信息中搜索有價值線索的利器,是與現實生活息息相關的一個研究方向,對于司法取證、圖像信息智能過濾和提取、敏感圖像真偽鑒別等有很大應用價值,極具現實意義。
參考文獻
[1]劉國軍,唐降龍,黃劍華等.基于模糊小波的圖像對比度增強算法[J].電子學報,2005,33(4):643—646.
[2]A.C.Popescu and H.Farid.Exposing Digital Forgeries by Detecting Duplicated Image Regions[M].Technical Report,TR2004—515,Dartmouth College,Computer Science,2004.
[關鍵詞]邊緣檢測 微地形
[中圖分類號] P21 [文獻碼] B [文章編號] 1000-405X(2013)-7-367-2
1幾種經典邊緣檢測算子的理論分析
1.1 Roberts算子
Roberts算子是2×2算子模板,對具有灰度變化陡峭的低噪聲圖像響應最好,并且對邊緣的定位準確,但由于2×2大小模板沒有清楚地中心點所以很難使用。
1.2Sobel算子
Sobel算子認為鄰域的像素對當前像素產生的影響不是等價的,所以距離不同的像素具有不同的權值,對算子結果產生的影響也不同。一般來說,距離越大,產生的影響越小。此算子對灰度漸變噪聲較多的圖像處理得較好。
1.3高斯拉普拉斯算子(Laplacian of Gaussian,LoG)
LOG算法中的高斯平滑運算會導致圖像中邊緣和其他尖銳不連續部分的模糊。大 值的濾波器產生魯棒邊緣,小 值的濾波器產生精確定位的邊緣。只有當兩者結合的很好時才能較好地檢測出圖像的最佳邊緣。
1.4Prewitt邊緣檢測算子
Prewitt算子是一種邊緣樣板算子。這些算子樣板由理想的邊緣子圖像構成。依次用邊緣樣板去檢測圖像,與被檢測區域最為相似的樣板給出最大值。用這個最大值作為算子的輸出值 (i,j),這樣可將邊緣像素檢測出來。
2微地形邊界提取方法
2.1微地形
微地形是一個相對概念,就是起伏比較小的地形。一般應用于園林景觀設計中,指在庭院景觀設計過程中采用人工模擬大地形的形態及其起伏錯落的韻律而設計出面積較小的地形,其地面高低起伏但起伏幅度不太大。微地形具有地面起伏小,高程精度要求高,地形單元復雜等特點。
2.2經典算子在微地形邊緣檢測方面存在不足
2.2.1經典算子效果比較與分析
Roberts 算子提取邊緣的結果邊緣較粗, Sobel算子和Prewitt 算子對邊緣的定位就準確了一些,而采用拉普拉高斯算子進行邊緣提取的結果要明顯優于前三種算子,特別是邊緣比較完整,位置比較準確。
2.2.2經典算子的不足之處
(1)針對性比較強,精度都不算特別高,而且在邊緣提取中存在著抗噪性和檢測精度的矛盾。若要提高檢測精度,則會檢測到噪聲產生偽邊緣,從而導致不合理的輪廓。若要提高抗噪性,則會產生輪廓漏檢和位置偏差。
(2)對噪聲極度敏感,執行邊緣檢測的結果常常是把噪聲當作邊緣點檢測出來,而真正的邊緣也由于受到噪聲干擾而沒有檢測出來。
(3)這幾種邊緣檢測算子在做微地形邊緣檢測時都不能很好地提取出其真正的邊緣。易出現很多偽邊緣,效果均不理想。
3微地形對象識別方法
由以上的分析和實例驗證可以看出,LOG算子雖然存在一些缺點,但是還是以上幾種方法中提取邊緣比較完整的一個,Sobel算子提取出的邊緣比較清晰,虛假邊緣比較少,提供了較為精確的邊緣方向信息;且由于Sobel算子對噪聲具有平滑作用,因此噪聲對它的影響不太明顯。所以可以考慮把這兩種算子結合起來,互相彌補其不足,保留其優點。
一種簡單的結合方法,就是采取閾值分割保留的方法。首先對圖像f(i,j)進行Sobel算子的邊緣提取,查看得到的圖像s(i,j)的直方圖,如圖所示,再對原圖f進行LOG算子處理,處理后的圖像為l(i,j)。
由圖3.1可以看出:經Sobel算子處理后的圖像s(i,j)的大部分的灰度級集中在150以下,據此,可以選取一個閾值T,當Ts(i,j)時,仍處理為s(i,j)。此處Sobel算子所起的作用就是為了確定邊緣位置,減少虛假邊緣的出現,同時也抑制了噪聲對邊緣提取的影響。
當然,閾值的選擇要根據圖像s(i,j)和圖像l(i,j)的直方圖來確定。由圖3.1可以看出,圖像s(i,j)的灰度值大部分集中在150以下,為了保證可以提取出完整的輪廓,閾值選在50和150之間。閾值選得越大,提取出的邊緣信息越少,圖像越接近于s(i,j);反之,閾值選得越小,提取出的邊緣細節信息越多,圖像越接近于l(i,j),同時噪聲的影響也越大,虛假邊緣也越多。閾值的選擇由操作者自己根據Sobel算子處理后的圖形s(i,j)的直方圖來確定.
在實際工作中,為了提高算法本身的自動性,常常希望可以自動確定閾值,而不是靠肉眼的觀察和一些經驗來反復判斷。因此,需要找到一種確定閾值的算法,可以最終得到與經驗判斷相符合的結果。提取方法如下:
圖像經過Sobel算子處理以后,圖像的輪廓細節與背景之間的差別已經被加強,也就是說圖像細節與背景之間的差異也被擴大了。而在此選擇閾值的目的就是把邊緣細節與背景分割開來,提取出邊緣區域,讓LOG算子對邊緣區域進行處理。而從統計意義上講,方差是表征數據分布不均衡性的統計量,要通過閾值對兩類問題進行分割,顯然,適當的閾值使得兩類數據間的方差越大越好,表明該閾值的確將兩類不同的問題區分開了,同時希望屬于同一類問題的數據之間的方差越小越好,表明同一類問題具有一定的相似性。因此可以采用類間、類內方差比來作為選擇閾值的評價參數。該方法的具體實現步驟如下:
1)求出圖像中所有像素的分布概率P0,P1,…,P255;
2)給定一個初始閾值Th=Th0,將圖像分為C1和C2兩類;
3)計算兩類的方差σ12和σ22;,灰度均值u1和u2,以及圖像的總體灰度均值u;
4)計算兩類問題的發生概率P1和P2: , P2=1一Pl
5)計算類間方差σb2,類內方差σin2:
6)選擇最佳閾值Th=Th’,使得圖像按照該閾值分為C1和C2兩類后,滿足:
3 實驗結果
圖中水田、田埂、樹木等都屬于微地形地物,這是一幅農田的近景影像圖,灰度色調較暗,而且后面的天空有云彩等的影響,傳統的算法很容易提取出偽邊緣。
實驗結果表明,這種方法處理微地形的效果優于其它算子。能夠較好的提取出地物的邊緣,并且抗噪聲的能力也較強。在實際的圖像邊緣提取工作中,LOG算子是常用的一種算子,相比其它經典算子而言,具有平滑噪聲點、邊緣定位準確的優點。但其固有的缺點也限制了它的使用。本文把Sobel算子和LOG算子結合起來,在一定程度上用Sobel算子的優點彌補了LOG算子的缺點,改進了LOG算子,既抑制了圖像中的大部分噪聲,又保證了較高的邊緣定位精度,對于微地形地物的提取有較好的效果。
參考文獻
[1] 唐良瑞,馬全明,景曉軍等.圖像處理實用技術[M].北京:化學工業出版社,2001.
[2] 管宏蕊,丁輝.圖像邊緣檢測經典算法研究綜述[J].首都師范大學學報自然科學版.2009,30(4):66-68.
關鍵詞:數字儀表;液晶;圖象處理;數字識別;特征提取
中圖分類號:TP391
隨著生產智能化的發展,自動化設備廣泛應用于工業控制、交通、生產領域。由于技術的進步以及成本的降低,液晶顯示屏逐漸取代數碼管,成為自動化儀表的關鍵顯示設備,顯示包括溫度、濕度、指標、參數等重要數據。為了實現生產和監控的自動化,往往需要對儀表液晶顯示屏的值進行識別。由于各類儀表液晶顯示屏顯示差別較大,數值識別方法各異,導致識別的成功率較低。
近年來計算機視覺技術和數字圖像處理技術的不斷發展,提高了數值識別效率和精度。利用攝像機完成表盤及背景圖像的采集,并將其轉換成數字信號,然后利用數字圖像處理技術實現關鍵操作,實現自動化儀表的數值自動識別,提高了數值識別效率和精度,大大降低了生產成本。
1 課題背景與技術簡介
1.1 液晶顯示識別概念。液晶顯示識別是對自動化儀表中的液晶顯示數值進行計算機識別,通過減背景、色澤分析方法進行字符的提取,用投影方法進行單個字符的分割,利用認知模型,分析采集的圖像的數值信息。
1.2 液晶顯示識別技術現狀。自動化儀表液晶顯示的廣泛應用,使得液晶數值顯示識別方法也逐步發展和進步。本文將對常用的液晶數值顯示識別方法進行分析,常用的液晶顯示識別技術有統計模式識別技術、結構模式識別技術與模糊模式識別技術。(1)液晶顯示統計模式識別技術。該方法利用液晶數值顯示屬于同一類別的各個模式之間的差異來實現識別,主要的識別誤差由環境噪聲和傳感器的性質所引起的,部分是模式本身所具有的隨機性質。該方法利用液晶數值識別來表示液晶顯示形狀上稍有差異的字符時,不僅是由分布選中液晶數值識別對應的特征空間的值點,而是分布在特征空間的某個區域。該區域能夠表示液晶顯示點隨機向量實現的集合。從直觀上看在液晶數值識別中規定某種距離度量,兩點之間的距離越小,它們所對應的模式就越相似。(2)液晶顯示結構模式識別技術。該方法利用液晶數值顯示的基本組成元素(基元)及其相互間的結構關系對液晶數值進行描述和識別的方法。該方法有效地圖像特征信息表示液晶顯示的結構信息,因此也常稱為液晶顯示結構模式識別。(3)液晶顯示模糊模式識別技術。該方法主要對利用人工智能的理念,用思維現象對抽象事物進行識別主。當對液晶顯示數值進行識別時,利用人腦思維認識模型,分析其在人腦中感官液晶顯示的數值,并使機器能夠學習這種認知方法。
2 儀表液晶顯示識別原理設計
本文針對目前儀表液晶顯示識別存在識別效率低、實現難度大的缺點,在上述識別方法的基礎上,提出一種高識別率的儀表液晶顯示值自動實時識別方法。該方法主要包括:定位特征區域、字符提取方法、數字識別算法。
2.1 定位數字區域。本文提出的方法首先對液晶屏的數字區域進行定位,定位過程包括粗定位與細定位。
(1)粗定位。首先把從液晶顯示屏中采集的原始圖像轉換為灰度圖,再求取其灰度能量圖,依據直方圖中的峰值能量,前后放寬5個能量級。
圖1 采集的原始圖與灰度圖
圖2 灰度能量圖
再對比生成的灰度圖與能量映射圖。若特定灰度圖中圖點的能量值在液晶屏灰度級的范圍內,則看作是顯示數值區域,由此類推把映射圖中相應的圖點賦黑色值;否則看作字段區域,賦予白色值。根據能量映射圖與灰度圖對比效果,采用圖像投影法,對液晶顯示屏字段區域進行粗定位。
(2)細定位。在完成液晶顯示數字區域粗定位后,對識別的數字區域進行從上到下的數字的按行統計。當能量映射圖的水平投影有效圖點的總數超過數字區域的1/2 寬度時,將記錄此操作數字為起始行。通常為減少誤判字段的開始位置的幾率,再嘗試向下操作若干行,假設選定的特定行也有足夠的圖點總數,則可認為記錄的行為數字區域的有效起始行,否則清除之前的操作,并選擇向下查找起始行。確定起始行后,對于第二行、第三行直至邊界區的行也可使用相同的方法。假定每行的圖點足夠判定時,即可保障判定的判定記錄的魯棒性。完成橫向方向的查找后,即可使用類似方法對數字區域進行局部垂直投影,從數字區域的垂直中線開始查找左右邊界。
2.2 字符提取。本文采用的字符提取方法是基于減背景方法的字符提取。該方法首先提取數字區域中的前背景信息,把數字區域中的每個圖點與背景模板中的圖點作差運算,若灰度能量對比相對較少時,則判定選定的圖點為背景區域,把該圖點賦予白色值,灰度能量對比相對較大的圖點保留原來的灰度。將數字區域中每個圖點都與背景模板中對應的圖點進行差值運算操作,得出的數字區域能夠保留重要的判別信息。
2.3 數字識別。本文采用的數字識別技術是基于神經網絡的數字識別技術,該技術對預先設定的每種輸入參數組合都設定一個預期值。根據輸入的參數組合,向構造的神經網絡輸入實際的識別模型,并由Input層經消息處理層向Output層傳播。實際Output與預期輸出之差即為誤差。參照平方誤差最小的認知規則,由Output層往消息處理層逐層修正連接加權。在送入神經訓練網絡前,對單個數值作歸一化處理,并把數值存貯在一個16*16 的數組中,作為網絡的Input層。
3 仿真及結果分析
本文在實驗中采用分辨率為640×480的攝像頭采集圖像,其中分別采取了大量不同亮度,不同對比度的圖像。
本文使用3層神經網絡模型,對液晶顯示的數字0-9進行識別。網絡的Input為56維;隱含層為8個神經元;允許的Output誤差在0.01-0.1之間。利用神經網絡進行液晶顯示數字的識別分2步完成。首先通過對液晶顯示屏數字采集大量帶有噪聲的數字區域圖,同時,構造神經網絡,采集數字區域圖所需時間較長。通過神經網絡,將認知過程中得到的信息存儲在矩陣中。進行數字識別時,直接調用這些連接權值,以此縮短識別周期。該方法具有很強的容錯性。
自動化儀表液晶數字自動識別系統測試結果如下:考察樣本集字符數為100;訓練樣本集字符數為600;識別率為94.58%;拒識率為5.42%??梢钥闯觯到y實現了很高的識別率和較強的穩定性,證明了該算法對自動化儀表液晶數字符識別的可行性。
參考文獻:
[1]李衍忠,蔡英杰,姒強.DDS譜質分析及其雜散抑制研究綜述[J].現代雷達,2000,22(4):33-38.
[2]申小陽,唐軼峻,姜柏軍.儀表的數字字符識別系統[J].儀表技術與傳感器,2005,6:55-57.
[3]嚴義,包健.一種實用視覺識別的儀表自動檢定系統[J].計算機應用,2002,1:28-30.
[4]章毓晉.圖像分割[M].北京:科學出版社,2001:67-70.
關鍵詞:隆昌石牌坊;文化遺產;數字化;保護
中圖分類號:J05 文獻標志碼:A 文章編號:1007-0125(2014)10-0168-02
二戰以后,世界各地許多有遠見卓識的人士意識到戰爭、自然災害、環境災難、工業發展等威脅著分布在世界各地的許多珍貴的文化與自然遺產。一方面,因年久腐變所致;另一方面,變化中的社會和經濟條件,如戰爭、自然災害、環境災難、工業發展等的影響,造成了更加難以彌補的損害或破壞現象?!拔幕z產”是祖先留下來的文化財產與人類文化發展相關的事物皆可被認為是文化遺產,文化遺產具有藝術價值和應用價值,是人類證明自身智慧和身份,并涵養自身精神、智慧與心靈的最好標志與養料。
一、民族文化遺產的數字化保護方案探索
新世紀以來,世界各種對民族文化遺產的保護更加關注和重視,伴隨著數字化技術甚至是數字媒體產業的崛起,不僅在各種工業領域得以廣泛應用,在保護文化遺產方面也顯露了引人矚目的效果,給文化遺產保護事業開辟了新的途徑。
(一)數字圖像處理
計算機圖像技術是文化遺產數字化的重要手段之一 。文化遺產數字化需要處理大量的實物圖像和制作虛擬圖像,需要應用最新的圖形圖像成果。涉及圖像處理、圖像過濾、圖像理解、圖像檢索等,甚至還包括與圖像處理密切相關的技術,包括:圖像形狀分析、圖像的對象分割、圖像庫相關反饋技術、圖像自動分類、圖像學習與理解。
(二)數字動畫制作
計算機動畫不但是文化遺產數字化的核心技術,是一種高度假定性的電影藝術,也是虛擬顯示技術的核心基礎。技術研究角度工作流程可分為計算機輔助二維動畫和計算機輔助三維動畫;在動畫合成方面,又有動畫特技合成、動畫實景合成、動畫模型合成,甚至還包括動畫顯微攝影合成等不同分法。
(三)多媒體數據庫
數字化信息組織的標準和規范制定了很多,目前網上數字資源比較常用的元數據格式有MARC(中國味CNMARC,WH/T0503-96)、Dublin Core(DC)、VRA核心類目、REACH著錄元素集等。其中,DC因其通俗易懂,包括有15各基本著錄項:題名、主題、說明、語種、來源、關聯、覆蓋范圍、創建者等,方便使用,得到了國際社會的普遍認可,有望成為國際標準。
二、隆昌石牌坊群可數字化資源的調研分析
突出數字化保護與開發的雙重目標。一方面,古老的石牌坊群需要延續和保護,另一方面,相關的知識和信息也需要傳播與共享。在傳統方式下,遺產的保護和利用存在著矛盾,始終處于兩難的境地,但數字化之后這一矛盾得到了破解。
(一)隆昌石牌坊綜述
牌坊是一種紀念性建筑,主要有柱、依柱石、梁、枋、樓等幾部分組成。牌坊建在里坊、路口、街旁,甚至是建陵墓、祠堂、衙署、園林等處,既可作為一種標志,也可用于褒揚功德、旌表節烈。從牌坊的作用或者建造意圖來說,可以將之分為三大類:標志坊、功德坊和節烈坊。標志坊是在某些具有紀念意義的地方所建的牌坊,作為一種標志,并起著昭示后人的作用。功德坊是彰顯有功名者的功名、整機的功名坊和表彰某人的性的道德坊的合稱。節烈坊則是用來表彰忠臣、孝子和貞潔烈女的,尤其是表彰婦女貞潔的最多。據《隆昌縣志》及1954年四川省第4文物調查組調查資料記載:隆昌境內沿6條古驛道而建有石牌坊69座,另有多達171座廟的鎮山門坊。經數百年自然侵蝕,特別是“”10年人為破壞,隆昌石牌坊現存17座。有功德坊(5座)、節孝坊(4座)、功德坊(2座)、貞潔坊、孝子坊、百壽坊、嵌磁觀賞坊(各1座)、山門坊(2座)。
(二)隆昌石牌坊群所所蘊含的的相關信息
牌坊的字牌、牌坊的立柱、牌坊的枋字牌是牌坊上用來題寫或雕刻文字的板面。牌坊具有標志意義、紀念意義或者是其他意義,都從牌坊上的字牌內容顯示出來。因為牌坊上的坊名、牌坊是為誰而立、得以立坊者的官職、姓名等內容,都書刻在字牌上。
牌坊的立柱:牌坊主要就是由豎向的柱子和橫向的枋構成,因而立柱自然是牌坊中不可缺少的構建之一,它主要作用起著支承的作用,支撐著上面的坊或坊與屋頂。牌坊的立柱有圓柱和立柱兩種形式,還有一些較為高大的牌坊,其立柱網網是在大柱邊附設小柱,以增加承重功能,并顯示氣勢。
牌坊的枋:牌坊中的橫向大構件都是枋,它的主要是連接直立的柱子,并與柱子共同承托牌坊上的雕飾以及有樓的牌坊頂。就牌坊雕刻來說,也是大部分雕飾在枋面上或下枋之間。牌坊的等級和造坊這的經濟實力等情況,也能從枋的多少、仿的制作難易、枋上的雕刻顯示出來。
三、四川隆昌石牌坊群數字化應用實施方案
數字技術能夠鼓勵和提高學者的進一步協作,能夠引領跨領域的合作,有一些項目正利用多媒體和地球空間信息技術,利用高動態圖像技術,促進建筑遺跡的檔案整理工作。以數字化方式重建歷史建筑、城市以及歷史事件。全部濃縮到構建一個“民族文化遺產數字中化保護與展示中心”是我們的目標,圍繞其進行挖掘、搶救、保護、開發、展示、傳播、利用民族文化遺產資源是整個完整的過程。
(一)網站建設
大多數網站可以有兩種不同的定位,一種是圖像收集,另一種是對單個的文物進行深入的研究,比較不同的,給用戶提供一些更多和相關那個時期的歷史、經濟方面的信息等等。比如你可以把圖片放大觀察其中的細節。
(二)數字復原技術
很多文化遺產由于時間的流逝,被外界的自然環境所侵蝕,同時也遭受著人為的破壞,變得破舊不堪。圖形復原技術以及剛剛提出的利用level set 進行三維模型的復原技術,為文化遺產的數字化保護帶來了新的生機。在二維圖像復原技術方面,目前已經提出了消除數字圖像中裂痕的算法,在三維模型復原方面,可以用level set 的方法進行復原。三維模型的復原技術對于將來恢復一些破損或不完整的雕塑文物有舉足輕重的作用。
(三)開發相關游戲平臺
游戲作為大眾文化的一種形式,在塑造社會文化方面起著重要的作用,在信息技術及數字化技術發達的今天,網絡游戲、視頻游戲、計算機游戲、手機游戲、街機游戲等名目繁多的數字化游戲的發展虛度更是驚人,在人們生活中占據了重要的地位,已經成為二十一世紀的主流文化形式之一。
具體的實施方案如下:
1、針對隆昌石牌坊群所獨有的民間傳說故事,當地民風民俗以及雕刻圖案所透露出的人物性格特點,設定成具體的游戲故事情節和人物角色,開發一些可交互性的各種游戲,使人們能夠以一種輕松、愉悅的方式領略四川的民族文化及原始藝術的魅力。
2、與一些游戲公司展開合作,針對游戲情節設計,將隆昌石牌坊群的經典的故事和傳說設計為很多游戲的任務關卡,依據人物造型設計游戲的角色,虛擬牌坊、廟宇設計游戲的場景等,這些都主要是突出隆昌石牌坊群的藝術特點和當地的人文歷史文化。
四、結論
文化遺產的數字化傳承是在科學和藝術的交叉領域中產生的新課題。文化遺產的理論研究還有待更深入的驗證和探討。本文只是將信息理論應用到了民族文化遺產的理論研究中去,應用信息可視化進行數字化文化遺產的研究具有一定的必然性、可行性,當然也面臨一定的問題。畢竟技術不能完全解決思維的問題。更多更有效的方法可能我們還沒能挖掘和思考到。
參考文獻:
[1] 鄭論.隆昌石牌坊[M].重慶出版社,2006.
[2] 賈磊磊.數字化時代文化遺產的保護和展現[M].文化藝術出版社,2010.
[3] 王耀希.民族文化遺產數字化[M].四川美術出版社,2009.
[4] 張強.隆昌石牌坊[M].重慶出版社,2006.
關鍵詞:人臉修飾;頻域濾波;幾何表示;演化模型
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2015)22-0119-03
Abstract: With the popularity of digital cameras, mobile phones and other camera equipment, automatic face modification technology has become a research hotspot in the field of computer vision, digital image processing. In this paper, the framework and the new progress of automatic face modification technology are summarized. The algorithm based on frequency domain filtering, the algorithm based on geometric representation, and the algorithm based on age evolution model are summarized. The main algorithms are introduced and the advantages and disadvantages of various algorithms are also analyzed. Through the research on the practical problems in the domestic and international application, the challenge and the shortage of the automatic face modification technology are presented.
Key words: face modification; frequency domain filtering; geometric representation; evolution model
隨著圖像信息處理技術的不斷進步,以及拍照設備的普及,人們對照片的處理需求不斷提高,尤其是針對面部圖像的修飾技術已成為電腦軟件和手機軟件的一個開發熱點,比如:美圖秀秀、人人-美顏美圖、光影魔術手等。這些軟件不要求用戶具有專業的圖像處理技術,可以方便地實現美化照片的效果。
人臉自動修飾與渲染是計算攝影領域中新的研究熱點。其主要關注人臉照片品質的提高,更關注對人臉的某些屬性的處理,如:對人臉皺紋的去除、膚色的改善、光潔度的提高等。人們希望經自動修飾與渲染的照片,能夠符合視覺感知習慣、更具吸引力,改變傳統的攝影、圖像處理工作需繁復的人工操作的現狀。因此,在攝影、廣告設計、電影制作、數字娛樂、專業研究領域都有著廣泛的應用前景。
本文對自動人臉修飾技術的研究背景、研究現狀進行了綜述,列舉了近幾年自動人臉修飾技術的主要算法,以及算法的改進、對比,最后對自動人臉修飾技術發展趨勢、存在的問題、下一步的研究方向進行了闡述。
1 人臉修飾技術研究進展
1.1 基于頻域濾波的方法
該算法可以實現圖像中高頻率瑕疵(如:皺紋、斑點)的去除,進而完成人臉的修飾,使處理后圖片看上去更白、更美觀,但該算法當遇到大范圍皺紋、斑點等瑕疵時的處理效果不理想。
1.2 基于幾何表示的方法
此外還有一些修改人臉外形的算法,通過對面部輪廓和器官作適當變形,使其更加貼近最優臉型,達到優化人臉的目的。但該類算法容易造成修改后的人臉對標準人臉的依賴,調整過大時,容易造成人臉原來特征的丟失。
1.3 基于年齡演化模型的方法
基于年齡演化模型的算法通?;贔G-NET數據庫、MORPH數據庫開展實驗。FG-NET數據庫包含了82個人,年齡從0~69歲,共有1002張照片,為包含大的年齡跨度里面收集的照片直接采自被拍攝者的老照片,因此拍攝角度、環境、光照條件都不能一致,有的照片還有帽子、眼鏡等遮擋,年代很早的照片都是黑白照片,而且早期的照片,受拍照攝備所限,畫面不夠清晰。但FG-NET仍然是現有的人臉年齡數據庫中,唯一包含了0~18歲照片的數據庫,而且照片反映的年齡跨度大、且密集。
MORPH數據庫是最大的、已公開的縱向人臉數據庫。該數據庫包含超過13000人的55000幅圖像,年齡跨度在16歲到77歲之間,并且該數據庫還在不斷擴種中。MORPH數據庫除了包含人臉照片,還包含被拍照者的年齡、性別、種族、體重、身高等信息,可供面部分析、年齡分析、面部識別的研究使用。
現階段年齡相關的人臉數據庫還很不完善,人臉圖像的采集需要經歷相當長時間的跟蹤拍攝,這需要相當長時間的積累,并且考慮包含不同種族、性別、地域的人臉照片。
在計算機視覺領域,年齡演化問題是一個研究熱點?;谀挲g演化模型的自動人臉修飾技術的關鍵是通過各年齡段的人臉照片構建合適的年齡演化模型。
早期的基于年齡演化模型的自動人臉算法中,結合了小波變換的內容,如:參考文獻[3]中,Tidderman提出了通過小波變換建立特征向量,并針對不同年齡構建合成人臉。實驗結果表明,當使用小區域邊緣強度加權來保留邊緣特征后,根據年齡進行人臉修飾的效果更明顯。對這一算法進一步改進,通過MRF模型在小波變換后進行年齡演化過程中的人臉特征學習,可以實現人臉的年輕化修飾、以及性別修改。實驗結果表明,MRF模型比單純使用小波變換對人臉的修飾效果要好。
此外,還有根據生物學、遺傳學等領域的研究來建立年齡演化模型的方法。如:參考文獻[4]中,Ramanathan根據生物學中顱面骨的生長規律,對0-18歲期間的人臉建立基于年齡影響的模型,融入人體測量學的方法,即:人臉不同部位在不同年齡段會有不同的生長進度,來提取不同年齡段人臉的特征。圖3顯示了側面人臉隨年齡增長的模型,及對應不同年齡跨度,產生的特征參數k。通過最優化計算人臉成長參數k,來實現不同年齡人臉比例的轉換,圖4顯示了參考文獻[4] 的實驗結果。
針對成年人的年齡演化模型,如:參考文獻[5]中,Ramanathan考慮到人的衰老,主要體現在面部肌肉的彈性變差、皺紋的增加,提出了與年齡相關的形狀、紋理變化的模型,可以用來修飾人臉產生老化特征,如:額頭皺紋、眼角紋、嘴角紋等。實驗通過將數據庫人臉按年齡分組,年齡跨度在10歲,如:21-30歲一組,31-40歲一組等,搜集的實驗數據可以很好的反映隨年齡、性別、種族等變化而產生的形狀、紋理特征。
綜上,基于年齡演化模型的自動人臉修飾技術先要對人臉數據庫按年齡分組,對不同分組提取特征,得到經年齡演化修飾后的圖像。實驗效果很大程度上依賴于人臉數據庫,為了得到好的演化效果,需要使用年齡跨度大的人臉照片。
2 總結
本文總結了國內外關于自動人臉修飾技術的算法框架,主要針對基于頻域濾波的算法、基于幾何表示的算法、基于年齡演化模型地算法進行了歸納,這些算法仍存在很大的改善空間,下一步研究可以考慮如下問題:
1)自動人臉修飾技術最重要的是保留人臉的個性化特征,不能在修飾后面目全非,因此如何在特征提取過程中盡量保留原照片的個性化特征,仍然需要繼續探討。
2)現階段的自動修飾技術,會使修飾的結果和方向趨于一致,如何使美化修飾過程具有一定的個性化是一個有待進一步研究的問題。
最后,為了使自動人臉修飾技術的應用更具有利用價值,在算法的改進中不能只局限于現有的數據模型、年齡演化模型,可以跨學科地嘗試、引入新的模型方法,以期在更具有實用價值的指導下設計新的算法或改進。
參考文獻:
[1] 韓靜亮,趙曦,趙群飛,等.基于迭代多級中值濾波的人臉美化算法[J].計算機應用與軟件,2010,27(5): 227-229.
[2] Leyvand T, Cohen-Or D, Dror G, et al., Data-driven enhancement of facial attractiveness, in ACM Transactions on Graphics(TOG), 2008: 38.
[3] Tidderman B, Stirrat B, Perrett D I, Towards realism in facial image transformations: Results from a wavelet mrf method, Computer Graphics Forum,2005, vol. 24: 449-456.
數字媒體專業設置在理工科院校、藝術類院?;騻髅筋愒盒5炔煌盒r往往還會有自身鮮明的特色,在課程體系的設置會有不同的偏重。本文的討論將結合山東大學數字媒體技術專業的專業特點予以展開。
1課程體系設計原則
面向新時期的人才需求,明確數字媒體專業的定位,借鑒學習國內外知名院校相似、相近專業的課程體系培養方案,并加以整理總結與分析,在此基礎上,從科學、系統地制定教學計劃出發,組織本專業課程內容,構建合理的專業知識結構。
在課程體系的建設中必須體現知識結構的綜合性,使得學生通過該專業的學習,可以充分理解數字媒體相關領域的基礎理論知識;熟悉特定應用領域的軟硬件環境與工具;并適應快速發展的數字媒體技術。
2課程體系設計方法
在課程體系的設置上,首先做到“強化基礎,突出特色”,實施2+2模式。針對一二年級的學生設置的課程重在打實基礎,包括數字媒體相關的基礎理論知識、基本的技術技能與藝術修養;在三四年級所開設的課程強化個人的專業方向特色,避免不恰當地期望學生面面俱到,否則學生在將來就業時可能無所適從。應當在課程安排上盡可能給予學生足夠的選擇,能夠使學生在具備計算機技術與藝術兩方面的基礎的同時,塑造自身的專長。
實現課程設置的模塊化是應對上述需求的有效手段。山東大學數字媒體技術專業采取課程群的方式,對課程體系進行組織優化。相關相近課程在條件成熟的基礎上,可以組成課程群,建立大梯隊,按課程群進行課程建設,就本課程群課程的設置、知識點、學分安排、相互之間的內容銜接等問題開展研究探討,并形成課程設置的調研報告,進而加強課程間的銜接與協調,獲得整體優化。
課程群的設置以群內課程內容相關性較強、群間課程內容相對獨立為原則,同時考慮不同專業方向的課程模塊設置的要求進行劃分。原則上每個課程群內的課程數目在5~10門。課程群設置相對固定。如果某課程群課程數目過多或過少,或根據設置新的專業課程模塊的要求,可以進行必要的課程群課程調整。
3課程體系設計案例
按照初步的規劃,主要課程群可以包括:公共(數學)基礎、計算機軟硬件基礎、人文藝術基礎、數字媒體專業基礎、游戲開發、動漫技術以及數字內容管理等。
主干課程可以包括:高級程序設計語言、數據結構、面向對象開發技術、離散數學、操作系統、軟件工程、數據庫系統、計算機網絡、計算機組成、素描基礎、彩畫基礎、速寫基礎、色彩構成、平面/立體設計、腳本策劃、多媒體技術、計算機圖形學、人機交互、數字圖像處理技術、高級渲染理論與技術、動畫造型、動畫渲染、角色與場景動畫、計算機游戲引擎技術、PC/視頻游戲編程、游戲項目管理、Web搜索技術、Web設計技術、內容管理與版權保護等。
課程群與具體課程的對應關系請參考圖1。課程群的設置規劃還需要結合各自院校的特點以及本專業的規范化建設經過一個不斷調整優化的過程。
另外,在課程體系的設計上,一定要強調知識點的優化與授課方式相結合,需要理論聯系實際,并在課程講授過程中,突出數字媒體技術專業的自身特點,包括傳統的計算機專業課程及藝術類課程在內。例如,操作系統課程在講授一般性的基礎理論之外,還要講操作系統與數字媒體技術的關系、當前主流操作系統的進步如何適應數字媒體技術的發展等等結合數字媒體技術特點的內容。數字媒體技術專業課程中許多課程涉及很多的數學理論,如計算機圖形學與圖像處理,但在知識點的選擇與課程講授中,這一類的課程也要深入淺出,不強調過多的理論問題,而是結合數字媒體技術中的應用來講。在此基礎上,針對部分學生將來可能進入數字媒體技術專業的碩士或者博士階段進行深造的要求,再增設部分高級研討課程,進一步深入講述背后的理論知識。
我們還規劃將部分知名公司或培訓結構的認證課程適當納入課程體系,學生通過相應的認證課程后,給予一定的學分,同時限制每名學生的總的認證學分。
實踐能力的培養也是數字媒體技術專業的重要內容,我們在課程設置上力求建立完善的實踐教學體系(具體介紹詳見本刊同期另文)。相應地,在課程設置方面,計劃增設部分跨課程、跨年度的綜合實驗課程,允許學生按年級、興趣與特長分別參與相應的項目中不同模塊的研發工作。
針對數字媒體專業的特點,還需要不斷豐富課程學習評價手段,將作業、課程設計、文獻綜述報告、考試等各種評價手段綜合考慮,加強課程設計與文獻綜述報告等形式的開放式考核手段的運用,加大分數比重,允許學生有選擇余地,全面衡量學生的學習質量。既不能只重視理論知識的學習,又要避免完全以練代學的職業化教學模式。
在教材的選用上,由于目前數字媒體技術專業的發展剛剛起步,很多課程一時很難找到合適的教材,有時也難免以教材定知識點與授課內容,影響了教學目標的實現。因此在課程體系建設過程中,我們一方面強調盡可能選用最新教材,并向國內外知名高校看齊,在條件許可的前提下選取相同教材或相近教材;另一方面,在課程講授過程中,不拘泥于教材,給學生傳授完整、最新的知識,并加強與兄弟院校的合作,積極開展課程資源的收集、整理與建設工作,建立共享的課程資料庫。
Wang Na
(Shaanxi Vocational & Technical College,Xi'an 710100,China)
摘要:圖像分割是圖像處理和分析領域的經典難題,醫學圖像分割是圖像分割中一個重要方面和應用領域,同時也是病變區域提取、臨床實驗、特定組織測量以及實現三維重建的基礎。在臨床應用和醫學研究中具有重要的研究意義。本文主要對幾類圖像分割方法進行了分析、研究和實驗,總結出各個方法的優缺點,從而可以達到更好的分割醫學圖像的目的。
Abstract: Image segmentation is the classic problems in image processing and analysis field. The medical image segmentation is an important aspect and applied field of image segmentation, and also is the foundation of the extraction of lesions, clinical trials, measurement of specific organizations and three-dimensional reconstruction, which has important research significance in clinical and medical research. This article focuses on the analysis, research and experiment of several types of image segmentation methods, sums up the advantages and disadvantages of each method, so that can achieve better medical image segmentation.
關鍵詞:醫學圖像 圖像分割 分割方法
Key words: medical image;image segmentation;segmentation method
中圖分類號:TP39文獻標識碼:A文章編號:1006-4311(2011)19-0156-01
0引言
醫學圖像的組織結構復雜位置重疊,一般情況下,將一幅醫學圖像分為目標區域和背景區域,其中目標區域就是指病變區域或者含重要診斷信息的區域,是臨床治療的重要對象;背景區域是指醫學上面認為正常的區域 [1]。醫學圖像分割的目的是把圖像中具有特殊涵義的區域與背景區域分割開來。目前的圖像分割方法有多種,為了達到更好的分割,對不同的分割任務,可采用了不同的分割方法。
1分割方法及研究
1.1 區域生長法區域生長法就是使較小的區域按照某種原則逐漸增長為大區域的過程。在區域增長法中,先是從一組“種子”點開始,將與種子點性質相似(顏色相似)的相鄰像素附加到生長區域的種子的過程。區域生長法種類比較多,例如區域生長算法和分裂合并算法。區域生長方法的特點是將圖像中像素間的空間相鄰關系充分利用,以達到智能分割的目的。在ITK[2]中給出了幾種基于區域分割的圖像分割方法,基于連接的區域生長法、相鄰區域連接法、獨點連接法等,是幾種各具特點的分割方法[2]。雖然區域分割方法是一種比較簡單的分割方法,它計算簡單,加之,目前新的發展,使之可以完成較簡單的醫學圖像分割。
1.2 基于閾值的分割方法基于閾值的方法的主要思想是通過設置某一閥值,將圖像中的像素點分為不同的類,從而完成圖像分割,根據使用的是圖像的整體信息還是局部信息,還可以將分割方法分為局部閾值和全局閾值。基于閾值的方法中最重要的一步就是如何選取合適的閾值,簡單的閾值選取方法是以圖像的灰度直方圖為對象,以得到的各個灰度級的概率分布密度為基礎,依據某一準則選取合適的閾值,最終確定像素點的歸屬。選擇不同的準則,將得到不同的閾值化算法。常見的閾值分割方法有最小誤差法、otsu方法、迭代法、模糊閾值、最大熵法等。
1.3 基于邊緣檢測的分割方法在醫學圖像中邊緣往往是圖像局部特性突變的結果。突變是一個區域的結束,另一個區域的開始。邊緣檢測方法是依照提取出來的邊緣,分割出目標區域。目前已有多種基于邊緣檢測的圖像分割方法,最基本的是通過邊緣檢測算子來檢測邊緣,常用的邊緣檢測算子有梯度算子、高斯―拉普拉斯算子、Canny算子。其中梯度算子是一階導數的算子,梯度算子有以下幾種:Roberts算子、Sobel算子、Prewitt算子等。高斯―拉普拉斯算子是另一種常用的算子,該算子是二階的,是一種對噪聲敏感的算子,在應用中一般都是先平滑濾波再進行二階微分;Canny算子是在噪聲情況下的一種較好的邊緣檢測算子。
圖1為采用幾種邊緣檢測算子對一幅大腦醫學圖像分割的結果。圖1(a)是一幅醫學圖像,圖1中(b)、(c)、(d)分別是應用Roberts算子、Sobel算子、Prewitt算子對圖1(a)邊緣檢測的結果。
水平集方法和Snake模型也是常用的邊緣檢測方法[3]。水平集方法的思想是將移動的界面作為零水平集嵌入高一維的水平集函數中,這樣由閉超曲面的演化方程可得到水平集函數的演化方程,而嵌入的閉超曲面總是其零水平集,最終只要確定零水平集即可確定移動界面的演化結果。Snake模型的基本思想是使得預先定義的初始曲線在一系列外部力和內部力的相互作用下進行演化,直到它滿足一定的收斂條件,曲線就會在圖像的邊緣處停止。水平集分割方法能夠綜合利用區域和邊界的信息,所以可以較好的分割圖像,應用水平集方法分割醫學圖像是一種比較有效的方法。但是水平集方法也存在一些不足,例如速度函數的定義較為困難,邊界控制參數的選取困難。由于物體各個部分屬性的不同,造成了各個部分邊界強度的不同,因此在參數選擇不適當時容易造成輪廓線可能穿越較弱邊界處或在與實際邊界尚有一段距離的地方停止。雖然Snake模型得到的圖像邊緣比較準確,但是該方法需要預先定義初始輪廓,并且對初始輪廓的選取有嚴格的要求,初始輪廓在選擇時必須比較接近圖像的真實邊緣,否則分割的結果不一定能達到圖像的真實邊緣。
1.4 結合特定理論的分割方法當前的圖像分割方法種類有多種,原因是很多新方法,新思維被成功引入到了分割領域,從而產生了不同的分割方法。典型的有模糊數學方法、形態數學方法、蟻群算法等,將這些方法和前面介紹的區域法,閾值法等方法結合又可產生不同的分割方法。①基于數學形態學的分割。形態學以幾何學為基礎對圖像進行分析,其思想是用一個結構元素作為基本工具來探測和提取圖像特征。形態學方法的主要應用有邊界提取、骨架提取、連通分量標記以及圖像重構等。②基于模糊集合理論的分割。模糊數學的發展為圖像分割提供了新的思路,基于模糊理論的方法在處理具有模糊特性的圖像時可以得到更好的分割效果。目前分割效果比較好的模糊分割方法主要有糊聚類方法、模糊連接度方法等。
2小結
總之,每種分割方法都有自己的優缺點,可以根據不同的分割任務,應用不同的分割方法,也可以將不同方法結合來達到準確、高效的目的。
參考文獻:
[1]章毓晉.圖象分割[M].北京:科學出版社,2001.
[2]/.