真人一对一直播,chinese极品人妻videos,青草社区,亚洲影院丰满少妇中文字幕无码

0
首頁 公文范文 計(jì)算機(jī)視覺論文

計(jì)算機(jī)視覺論文

發(fā)布時(shí)間:2022-05-02 09:37:29

開篇:寫作不僅是一種記錄,更是一種創(chuàng)造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的1篇計(jì)算機(jī)視覺論文,希望這些內(nèi)容能成為您創(chuàng)作過程中的良師益友,陪伴您不斷探索和進(jìn)步。

計(jì)算機(jī)視覺論文

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺下食品工業(yè)論文

1計(jì)算機(jī)視覺技術(shù)概述

1.1自動(dòng)化程度高

計(jì)算機(jī)視覺可以實(shí)現(xiàn)對(duì)農(nóng)產(chǎn)品的多個(gè)外形和內(nèi)在品質(zhì)指標(biāo)進(jìn)行同時(shí)檢測(cè)分析,可以進(jìn)行整體識(shí)別、增強(qiáng)對(duì)目標(biāo)識(shí)別的準(zhǔn)確性。

1.2實(shí)現(xiàn)無損檢測(cè)

由于計(jì)算機(jī)視覺技術(shù)對(duì)農(nóng)產(chǎn)品的識(shí)別是通過掃描、攝像,而不需要直接接觸,可以減少對(duì)所檢測(cè)食品的傷害。

1.3穩(wěn)定的檢測(cè)精度

設(shè)計(jì)的運(yùn)行程序確定后,計(jì)算機(jī)視覺技術(shù)的識(shí)別功能就會(huì)具有統(tǒng)一的識(shí)別標(biāo)準(zhǔn),具有穩(wěn)定的檢測(cè)精度,避免了人工識(shí)別和檢測(cè)時(shí)主觀因素所造成的差異。

2計(jì)算機(jī)視覺技術(shù)在食品檢測(cè)中的應(yīng)用

20世紀(jì)70年代初,學(xué)者開始研究計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用,近幾十年電子技術(shù)得到快速發(fā)展,計(jì)算機(jī)視覺技術(shù)也越來越成熟。國內(nèi)外學(xué)者在研究計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用方面主要集中在該技術(shù)對(duì)果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識(shí)別、內(nèi)部無損檢測(cè)等方面。國內(nèi)有關(guān)計(jì)算機(jī)視覺技術(shù)在食品業(yè)中的應(yīng)用研究起始于90年代,比國外發(fā)達(dá)國家晚20多年,但是發(fā)展很快。

2.1計(jì)算機(jī)視覺技術(shù)在果蔬分級(jí)中的應(yīng)用研究

計(jì)算機(jī)視覺技術(shù)在食品檢測(cè)中的應(yīng)用研究相當(dāng)廣泛,從外部直徑、成熟度的檢測(cè)到內(nèi)部腐爛程度的檢測(cè)都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計(jì)算機(jī)算法計(jì)算水果的半徑,進(jìn)而得出果蔬的最大直徑。研究表明,該算法不僅降低了計(jì)算量而且提高了計(jì)算精度,此方法用于水果分級(jí)的誤差不超過2mm,高于國際水果分級(jí)標(biāo)準(zhǔn)所規(guī)定的5mm分類標(biāo)準(zhǔn)差,可在工業(yè)生產(chǎn)中很好應(yīng)用。李慶中[5]也利用圖像的缺陷分割算法研究了計(jì)算機(jī)視覺技術(shù)在蘋果檢測(cè)與分級(jí)中的應(yīng)用,結(jié)果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎(chǔ),結(jié)合模糊聚類知識(shí)利用計(jì)算機(jī)視覺技術(shù)來檢測(cè)蘋果缺陷域,檢測(cè)不僅快速而且結(jié)果精確。劉禾等[7]通過研究認(rèn)為蘋果的表面缺陷可以利用計(jì)算機(jī)視覺技術(shù)進(jìn)行檢測(cè),計(jì)算機(jī)視覺技術(shù)還可以將蘋果按照檢測(cè)結(jié)果進(jìn)行分級(jí),把檢測(cè)過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級(jí)的重要特征之一,應(yīng)義斌等[8]通過計(jì)算機(jī)視覺技術(shù)、圖象處理技術(shù)、傅立葉描述子的方法來描述和識(shí)別果形以及有無果柄,其識(shí)別率達(dá)到90%。楊秀坤等[9]綜合運(yùn)用計(jì)算機(jī)視覺技術(shù)、遺傳算法、多層前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng),實(shí)現(xiàn)了具有精確度高、靈活性強(qiáng)和速度快等優(yōu)點(diǎn)的蘋果成熟度自動(dòng)判別。陳育彥等[10]采用半導(dǎo)體激光技術(shù)、計(jì)算機(jī)視覺技術(shù)和圖像分析技術(shù)相結(jié)合的方法檢測(cè)蘋果表面的機(jī)械損傷和果實(shí)內(nèi)部的腐爛情況,初步驗(yàn)證了計(jì)算機(jī)視覺技術(shù)檢測(cè)蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過計(jì)算機(jī)視覺技術(shù)對(duì)水果圖像的邊緣進(jìn)行檢測(cè),然后確定水果的大小用以水果分級(jí)。試驗(yàn)表明,該方法比傳統(tǒng)的檢測(cè)方法速度快、準(zhǔn)確率高,適用于計(jì)算機(jī)視覺的實(shí)時(shí)檢測(cè)。朱偉[12]在模糊顏色的基礎(chǔ)上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對(duì)西紅柿的缺陷進(jìn)行分割,結(jié)果顯示準(zhǔn)確率高達(dá)96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實(shí)可滴定酸含量以及糖分含量之間的相關(guān)性,然而根據(jù)相關(guān)性,樣品檢測(cè)的正確識(shí)別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個(gè)方向獲取蘋果的圖像,并通過計(jì)算機(jī)自動(dòng)分析圖像數(shù)據(jù),對(duì)蘋果的外徑、體積、以及圓形度等參數(shù)進(jìn)行處理,與人工檢測(cè)相比,計(jì)算機(jī)視覺技術(shù)具有檢測(cè)效率高,檢測(cè)標(biāo)準(zhǔn)統(tǒng)一性好等優(yōu)點(diǎn)。Blasco.J[15]通過計(jì)算機(jī)視覺技術(shù)分析柑橘果皮的缺陷,進(jìn)而對(duì)其在線分級(jí),正確率約為95%。趙廣華等[16]人綜合計(jì)算機(jī)視覺識(shí)別系統(tǒng)、輸送轉(zhuǎn)換系統(tǒng)、輸送翻轉(zhuǎn)系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實(shí)時(shí)監(jiān)測(cè)、品質(zhì)動(dòng)態(tài)的智能分級(jí)系統(tǒng),能夠很好地實(shí)現(xiàn)蘋果分級(jí)。王江楓等[17]建立了芒果重量與攝影圖像的相互關(guān)系,應(yīng)用計(jì)算機(jī)視覺技術(shù)檢測(cè)桂香芒果和紫花芒果的重量和果面損傷,按重量分級(jí)其準(zhǔn)確率均為92%,按果面損傷分級(jí)的準(zhǔn)確率分別為76%和80%。

2.2計(jì)算機(jī)視覺技術(shù)在禽蛋檢測(cè)中的應(yīng)用研究

禽蛋企業(yè)在生產(chǎn)過程中,產(chǎn)品的分級(jí)、品質(zhì)檢測(cè)主要采用人工方法,不僅需要大量的物力人力,而且存在勞動(dòng)強(qiáng)度大、人為誤差大、工作效率低等缺點(diǎn),計(jì)算機(jī)視覺技術(shù)可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽靜怡等[18]利用計(jì)算機(jī)視覺技術(shù)來檢測(cè)雞蛋蛋殼裂紋,利用攝像機(jī)獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術(shù),獲得裂紋形狀并判斷,試驗(yàn)結(jié)果表明,計(jì)算機(jī)視覺技術(shù)對(duì)雞蛋蛋殼裂紋的檢測(cè)準(zhǔn)確率高達(dá)98%。汪俊德等[19]以計(jì)算機(jī)視覺技術(shù)為基礎(chǔ),設(shè)計(jì)出一套雙黃雞蛋檢測(cè)系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設(shè)計(jì)的數(shù)學(xué)模型對(duì)比來實(shí)現(xiàn)雙黃雞蛋的檢測(cè)和識(shí)別,檢測(cè)準(zhǔn)確率高達(dá)95%。鄭麗敏等[20]人通過高分辨率的數(shù)字?jǐn)z像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學(xué)模型來預(yù)測(cè)雞蛋的新鮮度和貯藏期,結(jié)果表明,計(jì)算機(jī)視覺技術(shù)對(duì)雞蛋的新鮮度、貯藏期進(jìn)行預(yù)測(cè)的結(jié)果準(zhǔn)確率為94%。潘磊慶等[21]通過計(jì)算機(jī)視覺技術(shù)和聲學(xué)響應(yīng)信息技術(shù)相結(jié)合的方法檢測(cè)裂紋雞蛋,其檢測(cè)準(zhǔn)確率達(dá)到98%。MertensK等[22]人基于計(jì)算機(jī)視覺技術(shù)研發(fā)了雞蛋的分級(jí)檢測(cè)系統(tǒng),該系統(tǒng)識(shí)別帶污漬雞蛋的正確率高達(dá)99%。

2.3計(jì)算機(jī)視覺技術(shù)在檢測(cè)食品中微生物含量的應(yīng)用研究

計(jì)算機(jī)技術(shù)和圖像處理技術(shù)在綜合學(xué)科中的應(yīng)用得到快速發(fā)展,在微生物快速檢測(cè)中的應(yīng)用也越來越多,主要是針對(duì)微生物微菌落的處理。食品工業(yè)中計(jì)算機(jī)視覺技術(shù)在微生物檢測(cè)方面的研究和應(yīng)用以研究單個(gè)細(xì)胞為主,并在個(gè)體細(xì)胞的研究上取得了一定的進(jìn)展。殷涌光等[23]以顏色特征分辨技術(shù)為基礎(chǔ),設(shè)計(jì)了一套應(yīng)用計(jì)算機(jī)視覺技術(shù)快速定量檢測(cè)食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測(cè)結(jié)果與傳統(tǒng)方法的檢測(cè)結(jié)果具有很好的相關(guān)性,但與傳統(tǒng)方法相比,可以節(jié)省5d時(shí)間,檢測(cè)時(shí)間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質(zhì)。Lawless等[24]人等時(shí)間段測(cè)定培養(yǎng)基上的細(xì)胞密度,然后通過計(jì)算機(jī)技術(shù)建立時(shí)間和細(xì)胞密度之間的動(dòng)態(tài)關(guān)聯(lián),利用該關(guān)聯(lián)可以預(yù)測(cè)和自動(dòng)檢測(cè)微生物的生長情況,如通過計(jì)算機(jī)控制自動(dòng)定量采集檢測(cè)對(duì)象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計(jì)算機(jī)可以顯示被檢測(cè)菌落的具體位置,并且根據(jù)動(dòng)態(tài)關(guān)聯(lián)計(jì)算機(jī)視覺系統(tǒng)可以同時(shí)處理多個(gè)不同的樣品。郭培源等[25]人對(duì)計(jì)算機(jī)視覺技術(shù)用于豬肉的分級(jí)進(jìn)行了研究,結(jié)果顯示計(jì)算機(jī)視覺技術(shù)在識(shí)別豬肉表面微生物數(shù)量上與國標(biāo)方法檢測(cè)的結(jié)果顯著相關(guān),該技術(shù)可以有效地計(jì)算微生物的數(shù)量。Bayraktar.B等[26]人采用計(jì)算機(jī)視覺技術(shù)、光散射技術(shù)(BARDOT)和模式識(shí)別技術(shù)相結(jié)合的方法來快速檢測(cè)李斯特菌,在獲取該菌菌落中的形態(tài)特征有,對(duì)圖像進(jìn)行分析處理達(dá)到對(duì)該菌的分類識(shí)別。殷涌光等[27]人綜合利用計(jì)算機(jī)視覺、活體染色、人工神經(jīng)網(wǎng)絡(luò)、圖像處理等技術(shù),用分辨率為520萬像素的數(shù)字?jǐn)z像機(jī)拍攝細(xì)菌內(nèi)部的染色效果,并結(jié)合新的圖像處理算法,對(duì)細(xì)菌形態(tài)學(xué)的8個(gè)特征參數(shù)進(jìn)行檢測(cè),檢測(cè)結(jié)果與傳統(tǒng)檢測(cè)結(jié)果顯著相關(guān)(相關(guān)系數(shù)R=0.9987),和傳統(tǒng)檢測(cè)方法相比該方法具有操作簡單、快速、結(jié)果準(zhǔn)確、適合現(xiàn)場快速檢測(cè)等特點(diǎn)。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征和微生物數(shù)量進(jìn)行識(shí)別,并以此作為衡量乳制品質(zhì)量是否達(dá)標(biāo)的依據(jù),并對(duì)產(chǎn)品進(jìn)行分級(jí)。

2.4計(jì)算機(jī)視覺技術(shù)在其他食品產(chǎn)業(yè)中的應(yīng)用研究

里紅杰等[30]通過提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對(duì)照數(shù)學(xué)模型,采用數(shù)字圖像處理技術(shù)、計(jì)算機(jī)識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)貝類和蝦類等海產(chǎn)品的無損檢測(cè)和自動(dòng)化分類、分級(jí)和質(zhì)量評(píng)估,并通過實(shí)例詳細(xì)闡述了該技術(shù)的實(shí)現(xiàn)方法,證實(shí)了此項(xiàng)技術(shù)的有效性。計(jì)算機(jī)視覺技術(shù)還可以檢驗(yàn)玉米粒形和玉米種子質(zhì)量、識(shí)別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運(yùn)用計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行分析評(píng)估,毛葉棗可食率的評(píng)估結(jié)果與運(yùn)用物理方法測(cè)得的結(jié)果平均誤差僅為1.47%,因此得出結(jié)論:計(jì)算機(jī)視覺技術(shù)可以應(yīng)用于毛葉棗的自動(dòng)分級(jí)。GokmenV等[33-34]通過對(duì)薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數(shù)來研究薯片中丙烯酰胺的含量和褐變率的關(guān)系,結(jié)果顯示兩項(xiàng)參數(shù)相關(guān)性為0.989,從而可以應(yīng)用計(jì)算機(jī)視覺技術(shù)來預(yù)測(cè)加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應(yīng)用。韓仲志等[35]人拍攝和掃描11類花生籽粒,每類100顆不同等級(jí)的花生籽粒的正反面圖像,利用計(jì)算機(jī)視覺技術(shù)對(duì)花生內(nèi)部和外部采集圖像,并通過圖像對(duì)其外在品質(zhì)和內(nèi)在品質(zhì)進(jìn)行分析,并建立相應(yīng)的數(shù)學(xué)模型,該技術(shù)在對(duì)待檢樣品進(jìn)行分級(jí)檢測(cè)時(shí)的正確率高達(dá)92%。另外,郭培源等[36]人以國家標(biāo)準(zhǔn)為依據(jù),通過數(shù)字?jǐn)z像技術(shù)獲取豬肉的細(xì)菌菌斑面積、脂肪細(xì)胞數(shù)、顏色特征值以及氨氣等品質(zhì)指標(biāo)來實(shí)現(xiàn)豬肉新鮮程度的分級(jí)辨認(rèn)。

3展望

新技術(shù)的研究與應(yīng)用必然伴隨著坎坷,從70年代初計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中進(jìn)行應(yīng)用開始,就遇到了很多問題。計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的研究及應(yīng)用主要存在以下幾方面的問題。

3.1檢測(cè)指標(biāo)有限

計(jì)算機(jī)視覺技術(shù)在檢測(cè)食品單一指標(biāo)或者以一個(gè)指標(biāo)作為分級(jí)標(biāo)準(zhǔn)進(jìn)行分級(jí)時(shí)具有理想效果,但以同一食品的多個(gè)指標(biāo)共同作為分級(jí)標(biāo)準(zhǔn)進(jìn)行檢測(cè)分級(jí),則分級(jí)結(jié)果誤差較大[37]。例如,Davenel等[38]通過計(jì)算機(jī)視覺對(duì)蘋果的大小、重量、外觀損傷進(jìn)行分析,但研究結(jié)果顯示,系統(tǒng)會(huì)把花萼和果梗標(biāo)記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復(fù)雜,造成分級(jí)誤差很大,分級(jí)正確率只有69%。Nozer[39-40]等以計(jì)算機(jī)視覺為主要技術(shù)手段,獲取水果的圖像,進(jìn)而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進(jìn)行分級(jí),其正確率僅為85.1%。

3.2兼容性差

計(jì)算機(jī)視覺技術(shù)針對(duì)單一種類的果蔬分級(jí)檢測(cè)效果顯著,但是,同一套系統(tǒng)和設(shè)備很難用于其它種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計(jì)算機(jī)視覺設(shè)備。Reyerzwiggelaar等[41]利用計(jì)算機(jī)視覺檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測(cè)桃子的準(zhǔn)確率顯著高于杏的。Majumdar.S等[42]利用計(jì)算機(jī)視覺技術(shù)區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識(shí)別正確率有明顯差異。

3.3檢測(cè)性能受環(huán)境制約

現(xiàn)階段的計(jì)算機(jī)視覺技術(shù)和配套的數(shù)學(xué)模型適用于簡單的環(huán)境,在復(fù)雜環(huán)境下工作時(shí)會(huì)產(chǎn)生較大的誤差。Plebe等[43]利用計(jì)算機(jī)視覺技術(shù)對(duì)果樹上的水果進(jìn)行識(shí)別定位,但研究發(fā)現(xiàn)由于光照條件以及周邊環(huán)境的影響,水果的識(shí)別和定位精度不高,不能滿足實(shí)際生產(chǎn)的需要。綜上所述,可看出國內(nèi)外學(xué)者對(duì)計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用進(jìn)行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個(gè)學(xué)科,在研究和應(yīng)用的過程中,取得了較大的經(jīng)濟(jì)效益,也遇到了很多問題,在新的形勢(shì)下,計(jì)算機(jī)視覺技術(shù)和數(shù)碼拍攝、圖像處理、人工神經(jīng)網(wǎng)絡(luò),數(shù)學(xué)模型建設(shè)、微生物快速計(jì)量等高新技術(shù)相融合的綜合技術(shù)逐漸成為了各個(gè)領(lǐng)域?qū)W者的研究熱點(diǎn),以計(jì)算機(jī)視覺為基礎(chǔ)的綜合技術(shù)也將在食品工業(yè)中發(fā)揮更加重要的作用。

作者:姚瑞玲 單位:四川工商職業(yè)技術(shù)學(xué)院

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的移動(dòng)機(jī)器人導(dǎo)航

摘 要:針對(duì)跟隨路徑導(dǎo)引的移動(dòng)機(jī)器人導(dǎo)航方式的靈活性較差、維護(hù)成本較高、功能單一的缺點(diǎn),將計(jì)算機(jī)視覺用于移動(dòng)機(jī)器人路徑識(shí)別。首先對(duì)視覺傳感器獲得的視頻圖像進(jìn)行處理,獲得有用的特征目標(biāo),實(shí)現(xiàn)機(jī)器人對(duì)當(dāng)前路徑信息的理解。然后調(diào)用直行或轉(zhuǎn)彎功能模塊對(duì)機(jī)器人進(jìn)行導(dǎo)航控制。實(shí)驗(yàn)結(jié)果表明,該導(dǎo)航方式具有較好的實(shí)時(shí)性和魯棒性。

關(guān)鍵詞:計(jì)算機(jī)視覺;移動(dòng)機(jī)器人;路徑識(shí)別;自主導(dǎo)航

現(xiàn)代機(jī)器人技術(shù)在人工智能、計(jì)算機(jī)技術(shù)和傳感器技術(shù)的推動(dòng)下獲得了飛速發(fā)展,其中移動(dòng)機(jī)器人因具有可移動(dòng)性和自治能力,能適應(yīng)環(huán)境變化被廣泛用于物流、探測(cè)、服務(wù)等領(lǐng)域[14]。移動(dòng)機(jī)器人的優(yōu)秀技術(shù)之一是導(dǎo)航技術(shù),特別是自主導(dǎo)航技術(shù)。由于環(huán)境的動(dòng)態(tài)變化和不可預(yù)測(cè)性、機(jī)器人感知手段的不完備等原因,使得移動(dòng)機(jī)器人的導(dǎo)航難度較大,一直是人們研究的重點(diǎn)[5]。

目前常用的一種導(dǎo)航方式是“跟隨路徑導(dǎo)引”[6],即機(jī)器人通過對(duì)能感知到某些外部的連續(xù)路徑參考信息做出相應(yīng)的反應(yīng)來導(dǎo)航。如在機(jī)器人運(yùn)動(dòng)路徑上敷設(shè)金屬導(dǎo)線或磁釘,通過檢測(cè)金屬導(dǎo)線或磁釘?shù)奶卣餍畔泶_定機(jī)器人的位置。從導(dǎo)航的角度看,這種方法的優(yōu)點(diǎn)是可靠性較高,但功能單一,如不能在行進(jìn)的同時(shí)對(duì)目標(biāo)進(jìn)行識(shí)別、避障,對(duì)環(huán)境的適應(yīng)能力較弱、靈活性較差、維護(hù)成本較高,因此限制了其在移動(dòng)機(jī)器人中的應(yīng)用。

隨著計(jì)算機(jī)技術(shù)、數(shù)字圖像處理技術(shù)及圖像處理硬件的發(fā)展,基于計(jì)算機(jī)視覺的導(dǎo)航方式在機(jī)器人導(dǎo)航中得到廣泛關(guān)注[68]。在實(shí)際應(yīng)用中,只需要在路面上畫出路徑引導(dǎo)線,如同在公共交通道路上畫的引導(dǎo)線一樣,機(jī)器人就可以通過視覺進(jìn)行自主導(dǎo)航。相對(duì)于敷設(shè)金屬導(dǎo)線、磁釘?shù)确椒?,這種方法增強(qiáng)了系統(tǒng)的靈活性,降低了維護(hù)成本。視覺信息中包含有大量的數(shù)據(jù),要從中提取有用的信息,需要復(fù)雜的算法及耗時(shí)的計(jì)算。如何保證視覺導(dǎo)航系統(tǒng)在正確理解路徑信息的前提下仍具有較好的實(shí)時(shí)性和魯棒性,是該方法要解決的優(yōu)秀問題。

1 視覺導(dǎo)航系統(tǒng)構(gòu)成及工作過程

基于計(jì)算機(jī)視覺的移動(dòng)機(jī)器人導(dǎo)航實(shí)驗(yàn)系統(tǒng)的硬件部分由計(jì)算機(jī)、USB接口的攝像頭、LEGO實(shí)驗(yàn)用機(jī)器人組成。軟件分為2部分,即圖像處理和機(jī)器人運(yùn)動(dòng)控制?;谝曈X導(dǎo)航的原始輸入圖像是連續(xù)的數(shù)字視頻圖像。系統(tǒng)工作時(shí),圖像預(yù)處理模塊首先對(duì)原始的輸入圖像進(jìn)行縮小、邊緣檢測(cè)、二值化等預(yù)處理。其次利用哈夫變換提取出對(duì)機(jī)器人有用的路徑信息。最后,運(yùn)動(dòng)控制模塊根據(jù)識(shí)別的路徑信息,調(diào)用直行或轉(zhuǎn)彎功能模塊使機(jī)器人做相應(yīng)的移動(dòng)。整個(gè)工作流程如圖1所示。

1.1 視覺導(dǎo)航的圖像預(yù)處理

目前圖像采集設(shè)備都具有較高的空間和灰度分辨率,精度高、數(shù)據(jù)量大。

實(shí)驗(yàn)中的原始輸入圖像是USB攝像頭采集320×240像素的RGB格式圖像,最大幀數(shù)30幀/s。

圖像預(yù)處理的效果對(duì)后續(xù)哈夫變換檢測(cè)路徑信息的速度和準(zhǔn)確性有很大影響。對(duì)整幅圖像進(jìn)行抽取時(shí)計(jì)算量過大、也無必要,故先將彩色圖像轉(zhuǎn)換為灰度圖像,再將圖像的大小依據(jù)最近鄰域插值法原理[9]進(jìn)行縮小以節(jié)約后續(xù)計(jì)算時(shí)間。在實(shí)驗(yàn)室環(huán)境下,經(jīng)測(cè)試,將原始圖像縮小到30%仍然能滿足需要,處理時(shí)間縮短了72%。

由于圖像傳感器從時(shí)間和空間上對(duì)介質(zhì)(光)采樣,其圖像質(zhì)量對(duì)現(xiàn)場的非均勻光場和其他干擾因素非常敏感,二值化時(shí),不同光照條件下閾值的確定是一件比較困難的工作。目前常用的閾值選取方法有雙峰法、迭代法和 最大類間方差法[10]。從執(zhí)行時(shí)間和處理效果2方面考慮,對(duì)3種方法比較后(結(jié)果如表1所示),在優(yōu)先考慮實(shí)時(shí)性的前提下,選用雙峰法來求取閾值。在實(shí)驗(yàn)室條件下,路徑環(huán)境相對(duì)理想,黑色引導(dǎo)線與背景反差較大。在灰度直方圖上,引導(dǎo)線和背景都形成高峰,對(duì)這2個(gè)峰值及谷底的求取也可簡化,使用灰度級(jí)的最大值和最小值代替2個(gè)峰值,那么這2個(gè)峰值的中間值即可作為谷底用作圖像的閾值。

地面的反光和陰影,以及不均勻的光照都會(huì)導(dǎo)致同一幅圖像的二值化效果表現(xiàn)出很大差別,圖2和圖3是對(duì)同一幅圖像在不同光照條件下二值化的結(jié)果,可以看到在光照條件2下會(huì)出現(xiàn)大量的黑點(diǎn),這些黑點(diǎn)將嚴(yán)重影響提取路徑信息的速度并且可能導(dǎo)致錯(cuò)誤的路徑信息。然而,相對(duì)于灰度、顏色特征,邊緣特征受光照影響較小[11]。為此,對(duì)縮小后的圖像先進(jìn)行引導(dǎo)線的邊緣檢測(cè),邊緣檢測(cè)后圖像中引導(dǎo)線邊緣像素灰度的對(duì)比度得到增強(qiáng),通過實(shí)驗(yàn)確定合適的閾值,然后對(duì)圖像進(jìn)行二值化以提取路徑信息。

1.2 引導(dǎo)線角度檢測(cè)

2 視覺導(dǎo)航的機(jī)器人運(yùn)動(dòng)控制

機(jī)器人運(yùn)動(dòng)控制部分分為直行控制和轉(zhuǎn)彎控制2部分。

2.1 直行控制

如果哈夫變換的檢測(cè)結(jié)果表明是一條直線即機(jī)器人視野中只有1條主引導(dǎo)線時(shí),則運(yùn)行直行模塊。實(shí)際中有2種情況需要考慮:一是機(jī)器人的初始位置不一定正對(duì)引導(dǎo)線,二是在機(jī)器人的機(jī)電配置中,左右輪子的馬達(dá)運(yùn)動(dòng)不會(huì)絕對(duì)精確和對(duì)稱。這些會(huì)使機(jī)器人在運(yùn)動(dòng)中出現(xiàn)側(cè)偏。可采用下述方法進(jìn)行直行控制:根據(jù)引導(dǎo)線在圖像平面坐標(biāo)中的位置來判斷機(jī)器人的偏向。當(dāng)引導(dǎo)線位于圖像平面的左半邊,說明攝像頭的光軸與引導(dǎo)線不垂直且相對(duì)于引導(dǎo)線右偏,則命令機(jī)器人左轉(zhuǎn);當(dāng)引導(dǎo)線位于圖像平面的右半邊,說明攝像頭的光軸與引導(dǎo)線不垂直且相對(duì)于引導(dǎo)線左偏,則命令機(jī)器人右轉(zhuǎn);當(dāng)引導(dǎo)線在圖像平面兩邊均存在時(shí),則命令機(jī)器人不偏轉(zhuǎn)繼續(xù)直行。機(jī)器人在前進(jìn)過程中,根據(jù)圖像平面中引導(dǎo)線位置不斷調(diào)整方位,以一定的轉(zhuǎn)動(dòng)角度(轉(zhuǎn)動(dòng)角度盡量小,這樣機(jī)器人的擺動(dòng)幅度就會(huì)小)在直線路徑上行走。

2.2 轉(zhuǎn)彎控制

如果哈夫變換的檢測(cè)結(jié)果表明是兩條相互垂直的直線,即機(jī)器人的視野中出現(xiàn)轉(zhuǎn)彎路口,則開始運(yùn)行轉(zhuǎn)彎模塊。

機(jī)器人需要在距轉(zhuǎn)角合適的距離處開始運(yùn)行轉(zhuǎn)彎模塊,以保證機(jī)器人視野中始終具有引導(dǎo)線。如圖4所示,AB段表示攝像頭的縱向視野范圍,C點(diǎn)為轉(zhuǎn)角點(diǎn),機(jī)器人需要知道自身在實(shí)際二維平面中相對(duì)于轉(zhuǎn)角點(diǎn)C的距離即BC段距離。由圖像信息獲得現(xiàn)實(shí)世界坐標(biāo)系中的參數(shù),即所謂三維重建,這需要對(duì)基于計(jì)算機(jī)視覺的移動(dòng)機(jī)器人導(dǎo)航系統(tǒng)進(jìn)行攝像機(jī)標(biāo)定。

鑒于移動(dòng)機(jī)器人識(shí)別的引導(dǎo)線在地面上這一限制條件,并且攝像頭固定在機(jī)器人上,可以選擇機(jī)器人坐標(biāo)系為世界坐標(biāo)系,即世界坐標(biāo)系與機(jī)器人同步移動(dòng)。坐標(biāo)原點(diǎn)為標(biāo)定模板的左下角標(biāo)定點(diǎn)的中心,Zw軸垂直地面,XwYw平面即為地面。在該坐標(biāo)系下地面目標(biāo)的坐標(biāo)可以表示為(Xw,Yw,0),П甓模板由直徑5 mm、相距10 mm共72個(gè)圓點(diǎn)構(gòu)成,如圖5所示。

3 實(shí)驗(yàn)結(jié)果及結(jié)論

實(shí)驗(yàn)中選用的LEGO移動(dòng)機(jī)器人,其運(yùn)動(dòng)速度為8.57 cm/s(指令設(shè)定Power=25 RPM)。導(dǎo)航場地中畫有寬1 cm的黑色引導(dǎo)線,實(shí)驗(yàn)要求中機(jī)器人完全根據(jù)引導(dǎo)線自主運(yùn)動(dòng)。實(shí)驗(yàn)中,識(shí)別1幀圖像并且機(jī)器人根據(jù)識(shí)別的路徑信息運(yùn)行直行或轉(zhuǎn)彎模塊共需0.311 s,即機(jī)器人每處理1幀圖像移動(dòng)2.67 cm。實(shí)驗(yàn)室中的光照條件是機(jī)器人移動(dòng)時(shí)的主要干擾,而銳利的引導(dǎo)線邊緣受光照影響較小,對(duì)這些干擾有較好的濾除作用。經(jīng)過在陰天白天、晴天白天以及開燈和不開燈的情況下、晚上開燈的情況下、遮蓋物位于攝像頭上方50 cm處形成陰影情況下,機(jī)器人能正確的沿引導(dǎo)線移動(dòng)。同時(shí),當(dāng)攝像頭視野范圍內(nèi)引導(dǎo)線消失即認(rèn)為出現(xiàn)障礙物,機(jī)器人能發(fā)出前方有障礙物的報(bào)警信息。

可見上面所述方法有較好的實(shí)時(shí)性和魯棒性有一定的通用性,使得該視覺導(dǎo)航方法具有一定的應(yīng)用價(jià)值。只要光照條件變化不是非常劇烈,在工廠、醫(yī)院、辦公樓等環(huán)境中,機(jī)器人根據(jù)路徑引導(dǎo)線可自主到達(dá)目的地。

當(dāng)然,由于移動(dòng)機(jī)器人活動(dòng)場景的復(fù)雜性和動(dòng)態(tài)特性,以及視覺處理的復(fù)雜性,視覺導(dǎo)航還有很多需要解決的問題,例如當(dāng)導(dǎo)航場地出現(xiàn)較大面積的強(qiáng)烈反光、極暗的陰影時(shí)能否有效可靠的進(jìn)行移動(dòng)機(jī)器人的導(dǎo)航控制,這需要進(jìn)一步研究。另外,如何將視覺系統(tǒng)與本系統(tǒng)機(jī)器人平臺(tái)中的超聲波傳感器、光電傳感器及聲音傳感器在空間、時(shí)間及數(shù)據(jù)上進(jìn)行融合以提高系統(tǒng)的適應(yīng)性和環(huán)境識(shí)別能力也是一個(gè)研究方向。

作者簡介

趙 瑜 女,1983年出生,陜西西安人,碩士研究生。主要研究方向?yàn)榉墙佑|測(cè)量與可視化計(jì)算。

種蘭祥 男,1960年出生,陜西合陽人,西北大學(xué)信息科學(xué)與技術(shù)學(xué)院副教授,中國科學(xué)院西安光學(xué)精密儀器研究所博士研究生。主要從事非接觸測(cè)量、光電子技術(shù)和可視化計(jì)算方面的研究。

張萬緒 男,1964年出生,山西運(yùn)城人,西北大學(xué)信息科學(xué)與技術(shù)學(xué)院副教授。主要研究方向?yàn)橹悄軆x器儀表。

注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文

計(jì)算機(jī)視覺論文:談?dòng)?jì)算機(jī)視覺課程的教學(xué)創(chuàng)新

摘要:近年來,隨著計(jì)算機(jī)視覺技術(shù)與應(yīng)用的飛速發(fā)展,越來越多學(xué)生對(duì)這門課產(chǎn)生了濃厚的興趣。文章是對(duì)我院計(jì)算機(jī)視覺課程教學(xué)經(jīng)驗(yàn)的總結(jié),討論我們?cè)诮虒W(xué)過程中遇到的一些具體問題,主要包括教學(xué)內(nèi)容和工程實(shí)例的選取、教學(xué)方法的幾個(gè)注意事項(xiàng),期待與同行們進(jìn)行交流探討。

關(guān)鍵詞:計(jì)算機(jī)視覺;教學(xué)應(yīng)用;教學(xué)改革

計(jì)算機(jī)視覺是人工智能學(xué)科中的一門重要課程。隨著相關(guān)應(yīng)用在多個(gè)領(lǐng)域中的出現(xiàn),越來越多的學(xué)生開始對(duì)這門課產(chǎn)生了濃厚的興趣。如何讓學(xué)生能夠在整個(gè)課程中保持盎然的興趣,并為有志于深入研究計(jì)算機(jī)視覺的學(xué)生指明方向,成為我們教師首先應(yīng)注重的問題。

在實(shí)際的教學(xué)工作中,通過不斷摸索總結(jié),我們認(rèn)為,以實(shí)際應(yīng)用引導(dǎo)學(xué)生的學(xué)習(xí)興趣,既滿足了學(xué)生想了解計(jì)算機(jī)視覺實(shí)際應(yīng)用的需求,又加深了學(xué)生對(duì)于算法的理解,把算法放在一個(gè)實(shí)際應(yīng)用中,學(xué)生可以理解怎么用,為什么這么用。在這樣的目標(biāo)導(dǎo)引下,我們從選擇教材開始,準(zhǔn)備教學(xué)內(nèi)容(包括合理的應(yīng)用實(shí)例的選擇)、制作PPT、探索教學(xué)方法,形成了目前以實(shí)際應(yīng)用為主導(dǎo)的創(chuàng)新教學(xué)體系,非常受學(xué)生歡迎。在此,我們對(duì)這期間遇到的問題,解決方法、心得體會(huì)做一個(gè)總結(jié)和思考,希望能對(duì)同行有些許參考作用。

1選擇教材

在我們這個(gè)專業(yè),每年的上研率基本都保持在50%左右。在本專業(yè)的研究生階段,也開設(shè)了雙語教學(xué)的計(jì)算機(jī)視覺課程。另外,畢業(yè)后選擇參加工作的同學(xué)也基本都進(jìn)入和本專業(yè)非常相關(guān)的一些單位,所從事的工作,都是和在學(xué)校學(xué)習(xí)的知識(shí)密切相關(guān)。

因此,如何讓這門課程的教學(xué)既兼顧本科畢業(yè)就參加工作的那部分同學(xué),又兼顧繼續(xù)深造的學(xué)生的需求,也是在這門課程講授的過程中,需要特別注意的一個(gè)問題。對(duì)于本科畢業(yè)就要參加工作的同學(xué)而言,需要“廣度”,需要了解計(jì)算機(jī)視覺這門課在各個(gè)領(lǐng)域中的應(yīng)用,在實(shí)際中接觸到相關(guān)的項(xiàng)目或工作時(shí),能夠知道去哪里可以找到自己需要的參考資料;而對(duì)于要進(jìn)一步深造的同學(xué)而言,則需要一定的“深度”,為研究生階段的研究打下基礎(chǔ)。

全盤考慮到這些學(xué)生畢業(yè)之后的去向,我們選擇了兩本教材。一本是賈云得教授編著,科學(xué)出版社于 2000年出版的《機(jī)器學(xué)習(xí)》[2],這是一部順應(yīng)了時(shí)代與教學(xué)發(fā)展要求的教材,對(duì)計(jì)算機(jī)視覺中的基本概念、基本算法、基本算法的應(yīng)用、經(jīng)典應(yīng)用進(jìn)行了由淺入深的介紹。內(nèi)容涵蓋了所有經(jīng)典的數(shù)字圖像處理與機(jī)器視覺方法,也對(duì)一些已經(jīng)得到非常好實(shí)際應(yīng)用的方法,如光流法等作了簡要介紹。另外還選擇了一本英文原版的計(jì)算機(jī)視覺的經(jīng)典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],機(jī)械工業(yè)出版社于2003年出版。這是國內(nèi)外非常推崇的一本計(jì)算機(jī)視覺著作,該教材條理清晰,深入淺出,對(duì)計(jì)算機(jī)視覺的基本原理、算法、應(yīng)用的介紹非常詳盡。

在教學(xué)中,我們采用了英文的PPT,但主要用的教材是賈云得教授的《機(jī)器視覺》,這樣中英文對(duì)照講解,一方面加深學(xué)生對(duì)教學(xué)內(nèi)容的理解,另一方面也為學(xué)生今后閱讀專業(yè)的英文論文做了相應(yīng)準(zhǔn)備。

2教學(xué)內(nèi)容和工程實(shí)例的選取

2.1選取教學(xué)內(nèi)容

本課程之前,大學(xué)二年級(jí)的本科生已開設(shè)數(shù)字圖像處理課程,但所講的基本原理和算法都非常淺顯,所以在教學(xué)內(nèi)容的安排上,分為兩大部分:數(shù)字圖像處理部分和視覺部分。數(shù)字信號(hào)處理部分主要講解在視覺部分會(huì)用到的一些基本算法,為后面進(jìn)入計(jì)算機(jī)視覺部分打基礎(chǔ)。這部分約占總課時(shí)的1/3。視覺部分的課時(shí)也分為兩部分:算法講解與實(shí)例講解。在算法講解部分,對(duì)計(jì)算機(jī)視覺的基本算法、經(jīng)典算法都做了深入淺出的講解。實(shí)例部分則選擇了經(jīng)典的工業(yè)應(yīng)用,讓學(xué)生能夠?qū)λ鶎W(xué)算法進(jìn)一步加以理解。

2.2選取適當(dāng)?shù)墓こ虒?shí)例

就計(jì)算機(jī)視覺的教學(xué)內(nèi)容而言,各個(gè)孤立的算法和方法對(duì)本科生來講,有些抽象不好理解。如果在教學(xué)上僅僅通過老師在課堂上的講解,很難讓學(xué)生深入地理解相關(guān)的教學(xué)內(nèi)容,而選擇一個(gè)觸手可及且簡單好理解的工程實(shí)例往往就會(huì)達(dá)到意想不到的教學(xué)結(jié)果,學(xué)生可以把課堂上所學(xué)的枯燥理論與現(xiàn)實(shí)中活生生的事物聯(lián)系起來,從而加深對(duì)教學(xué)內(nèi)容的理解。

通過反復(fù)比對(duì)、反復(fù)論證,我們選擇了在講解基本原理和算法之后,在課程結(jié)束前,專門留出課時(shí)講解手機(jī)制造這個(gè)例子。手機(jī)現(xiàn)在是人手一部,是這些年青學(xué)子再熟悉不過的事物了,通過對(duì)手機(jī)主板、手機(jī)鍵盤的制造過程的講解,把所學(xué)的算法都融合進(jìn)來,學(xué)生在覺得有趣的同時(shí),不知不覺就加深了對(duì)所學(xué)算法的理解。

另外,在教學(xué)的過程中,我們還不斷穿插其他學(xué)生耳熟能詳?shù)膶?shí)例,如數(shù)碼相機(jī)原理中的一些算法的講解,我們和學(xué)生一起探討應(yīng)該怎么選擇數(shù)碼相機(jī)。再有,濾波器算法、在課堂上對(duì)Photoshop功能的演示,與所學(xué)算法關(guān)聯(lián)起來,學(xué)生都很容易理解接受。

3教學(xué)點(diǎn)滴

3.1點(diǎn)睛之筆

在第一節(jié)課的講述中,我們的重點(diǎn)不在于Marr理論,而是告訴學(xué)生:

人工智能就是要讓計(jì)算機(jī)像人一樣,能夠會(huì)聽、會(huì)看……

我們這門課程就是要讓計(jì)算機(jī)“會(huì)看”,要像人一樣會(huì)看。進(jìn)而展示給學(xué)生一些我們精心挑選的圖片,讓學(xué)生自己判斷,是不是自己的眼睛“騙了”自己,人眼和計(jì)算機(jī)看到的到底有什么不一樣。

每次講到這里,學(xué)生都會(huì)進(jìn)行熱烈的討論,每個(gè)人都有不同的看法,每個(gè)人都有自己的堅(jiān)持,不知不覺中,對(duì)這門課就產(chǎn)生了濃厚的興趣,有了繼續(xù)深入學(xué)習(xí)下去的愿望。在課堂討論的最后,比較人眼對(duì)圖片的判斷以及計(jì)算機(jī)的判斷后,讓學(xué)生自己總結(jié)歸納,我們這門課到底要研究些什么,都有可能應(yīng)用在哪些方面,然后對(duì)爭議比較大的提議一一探討。每到這個(gè)時(shí)候,大家的積極性就都被激發(fā)出來,在不斷的爭論與思想碰撞中找出正確的結(jié)論。

3.2拿身邊的事物說“事”

計(jì)算機(jī)視覺課程的前半部分,多涉及到圖像處理的一些常見算法。在講授各種各樣的濾波器和算子時(shí),并沒有針對(duì)各個(gè)濾波器和算子擺出一堆示例圖片,讓學(xué)生比較濾波前后的差異,從而很生硬地理解濾波器與算子的功能。取而代之的,我們首先以現(xiàn)在人手一臺(tái)的數(shù)碼相機(jī)為例提出問題,你為什么要選擇你手里的這臺(tái)數(shù)碼相機(jī)?當(dāng)初選這個(gè)品牌和型號(hào)時(shí),你的考慮是什么?歷年學(xué)生的回答幾乎都是看網(wǎng)上測(cè)評(píng),或者在網(wǎng)上看別人怎么說。這時(shí)列出我們收集到的各個(gè)品牌相機(jī)的測(cè)評(píng)報(bào)告,列出它們的優(yōu)缺點(diǎn),然后引導(dǎo)學(xué)生去思考,例如這個(gè)品牌的相機(jī)的缺點(diǎn)是照片發(fā)灰,不是很鮮亮,而另一個(gè)品牌的相機(jī)則綠的特別綠,紅的特別紅,為什么?那么有可能是哪部分的算法不夠完善,為什么?

通過如此簡單的對(duì)比,學(xué)生的積極性被完全激發(fā)。原來,數(shù)碼相機(jī)這個(gè)幾乎人人都有,大家都熟悉的“玩具”竟然和自己在課堂上學(xué)到的知識(shí)這么密切相關(guān)。

再有,就是利用學(xué)生們都熟悉的PS(Photoshop),演示現(xiàn)在所謂的“完美證件照”是怎么來的。為什么可以把疙疙瘩瘩的臉部皮膚變得光滑?在PS中,你就是點(diǎn)了一下鼠標(biāo),其實(shí)在后臺(tái),是加入了一個(gè)濾波器進(jìn)行了濾波。各種這樣的演示,學(xué)生都非常喜聞樂見。因?yàn)樗麄兺蝗话l(fā)現(xiàn),原來那些事物,和我自己接觸到這些看似枯燥的理論之間,還有這么深刻的聯(lián)系。

還有一個(gè)很受學(xué)生歡迎的例子就是對(duì)于“鼓形失真”的講解。我們的老師每次講到這里,都不會(huì)簡單告訴學(xué)生“鼓形失真”發(fā)生的原因是什么,應(yīng)該怎么解決?老師都會(huì)問學(xué)生,明星為什么都一窩蜂去減肥?現(xiàn)在的女明星為什么都要去弄個(gè)“錐子臉”?課堂上就會(huì)出現(xiàn)一個(gè)小高潮,男同學(xué)和女同學(xué)的看法各異,彼此之間開始爭論不休。此時(shí)再趁熱打鐵地問學(xué)生,如果拿著相機(jī),離自己的鼻子一公分,會(huì)拍出什么樣的效果?有學(xué)生開始拿出手機(jī)對(duì)著自己和別人開拍,有的學(xué)生開始頭頭是道地分析。每到這種學(xué)生都開始熱烈討論的時(shí)候,就可以適時(shí)引導(dǎo)學(xué)生往正確的方向去,讓他們自己找到正確的分析解決方法,往往這個(gè)時(shí)候,學(xué)生都會(huì)頗有成就感,對(duì)于問題的理解也會(huì)特別的深刻。

3.3選擇合適的實(shí)際應(yīng)用

在所有理論講解結(jié)束后,我們會(huì)留出2~4次課講述計(jì)算機(jī)視覺在工業(yè)上的應(yīng)用。這些年來,對(duì)于手機(jī)制造這樣一個(gè)工業(yè)應(yīng)用,非常受學(xué)生歡迎。正如“數(shù)碼相機(jī)”這個(gè)例子一樣,現(xiàn)在學(xué)生都是人手一部手機(jī),是大家再熟悉不過的東西。這個(gè)例子涉及到了在前面理論講述中的大部分算法,如二值圖像的處理、模板匹配、高斯濾波器等。學(xué)生通過對(duì)這個(gè)工業(yè)應(yīng)用的理解,更進(jìn)一步加深了對(duì)算法的理解。

以講解手機(jī)鍵盤的制造過程為例,向?qū)W生提出和前面所講內(nèi)容相關(guān)的問題,引導(dǎo)學(xué)生自發(fā)思考,如為什么選擇模板匹配法,而不是采用其他更復(fù)雜更精確的方法等等。每到這個(gè)時(shí)候,課堂氣氛總是分外熱烈,學(xué)生各抒己見,在不斷爭論中,更進(jìn)一步加深對(duì)課本上枯燥理論的認(rèn)識(shí)。

在這里需要注意的問題是一定要一步一步提出問題,循循善誘,引導(dǎo)學(xué)生一層一層地深入思考。如果問題的答案過于“深藏不露”,則有可能觸發(fā)學(xué)生的抵觸情緒,無法繼續(xù)深入地思考。

4結(jié)語

通過多年的教學(xué)摸索,我們認(rèn)為,在計(jì)算機(jī)視覺課程的講述中,以實(shí)際應(yīng)用引導(dǎo)學(xué)生這樣的教學(xué)方法非??扇?而且也收到了很好的效果。另外,除了制定好的教學(xué)大綱,并選擇合適的教材外,根據(jù)學(xué)校現(xiàn)在的時(shí)間情況,我們選擇了多媒體手段輔助教學(xué),充分利用Matlab和大屏幕投影等方方面面的優(yōu)勢(shì),結(jié)合多種方法進(jìn)行教學(xué),對(duì)講好計(jì)算機(jī)視覺這門課,非常有益。

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺導(dǎo)航綜述

摘要:導(dǎo)航技術(shù)是移動(dòng)機(jī)器人優(yōu)秀技術(shù),移動(dòng)機(jī)器人又有多種導(dǎo)航方式,本文對(duì)各種導(dǎo)航方式進(jìn)行了分析比較,提出由于計(jì)算機(jī)視覺理論及算法的發(fā)展,又由于和激光、雷達(dá)和超聲在導(dǎo)航方面相比,視覺導(dǎo)航具有很多優(yōu)點(diǎn),因此視覺導(dǎo)航被大量地采用。根據(jù)移動(dòng)機(jī)器人是在導(dǎo)航過程中對(duì)圖像進(jìn)行處理,實(shí)時(shí)性差始終是一個(gè)非常棘手的問題,提出解決該問題的關(guān)鍵在于設(shè)計(jì)一種快速圖像處理方法。

關(guān)鍵詞:視覺導(dǎo)航;移動(dòng)機(jī)器人;圖像處理

移動(dòng)機(jī)器人是一種在復(fù)雜的環(huán)境下工作的具有自規(guī)劃、自組織、自適應(yīng)能力的機(jī)器人。移動(dòng)機(jī)器人集人工智能、智能控制、信息處理、圖像處理、模式識(shí)別、檢測(cè)與轉(zhuǎn)換等專業(yè)技術(shù)為一體,跨計(jì)算機(jī)、自動(dòng)控制、模式識(shí)別、智能控制等多學(xué)科,成為當(dāng)前智能機(jī)器人研究的熱點(diǎn)之一。

在移動(dòng)機(jī)器人的運(yùn)動(dòng)過程中始終要解決的是自身的導(dǎo)航與定位問題,相關(guān)技術(shù)研究中,導(dǎo)航技術(shù)可以說是其優(yōu)秀技術(shù),也是其實(shí)現(xiàn)真正的智能化和完全的自主移動(dòng)的關(guān)鍵技術(shù)。也就是DurrantWhyte提出的三個(gè)問題:(1)“我現(xiàn)在何處?”;(2)“我要往何處去?”;(3)“要如何到該處去?”[1] 其中問題(1)是移動(dòng)機(jī)器人導(dǎo)航系統(tǒng)中的定位及跟蹤問題,問題(2)、(3)是移動(dòng)機(jī)器人導(dǎo)航系統(tǒng)中路徑規(guī)劃問題。導(dǎo)航研究的目標(biāo)就是沒有人的干預(yù)下使機(jī)器人有目的地移動(dòng)并完成特定任務(wù),進(jìn)行特定操作。機(jī)器人通過裝配的信息獲取手段,獲得外部環(huán)境信息,實(shí)現(xiàn)自我定位,判定自身狀態(tài),規(guī)劃并執(zhí)行下一步的動(dòng)作。

移動(dòng)機(jī)器人的導(dǎo)航方式分為:基于環(huán)境信息的地圖模型匹配導(dǎo)航;基于各種導(dǎo)航信號(hào)的路標(biāo)導(dǎo)航、視覺導(dǎo)航和味覺導(dǎo)航等[2]。

環(huán)境地圖模型匹配導(dǎo)航是機(jī)器人通過自身的各種傳感器,探測(cè)周圍環(huán)境,利用感知到的局部環(huán)境信息進(jìn)行局部地圖構(gòu)造,并與其內(nèi)部事先存儲(chǔ)的完整地圖進(jìn)行匹配。如兩模型相互匹配,機(jī)器人可確定自身的位置,并根據(jù)預(yù)先規(guī)劃的一條全局路線,采用路徑跟蹤和避障技術(shù),實(shí)現(xiàn)導(dǎo)航。它涉及環(huán)境地圖模型建造和模型匹配兩大問題。

路標(biāo)導(dǎo)航是事先將環(huán)境中的一些特殊景物作為路標(biāo),機(jī)器人在知道這些路標(biāo)在環(huán)境中的坐標(biāo)、形狀等特征的前提下,通過對(duì)路標(biāo)的探測(cè)來確定自身的位置。同時(shí)將全局路線分解成為路標(biāo)與路標(biāo)間的片段,不斷地對(duì)路標(biāo)探測(cè)來完成導(dǎo)航。根據(jù)路標(biāo)的不同,可分為人工路標(biāo)導(dǎo)航和自然路標(biāo)導(dǎo)航。人工路標(biāo)導(dǎo)航是機(jī)器人通過對(duì)人為放置的特殊標(biāo)志的識(shí)別實(shí)現(xiàn)導(dǎo)航,雖然比較容易實(shí)現(xiàn),但它人為地改變了機(jī)器人工作的環(huán)境。自然路標(biāo)導(dǎo)航不改變工作環(huán)境,是機(jī)器人通過對(duì)工作環(huán)境中的自然特征的識(shí)別完成導(dǎo)航,但路標(biāo)探測(cè)的穩(wěn)定性和魯棒性是研究的主要問題[3]。

視覺導(dǎo)航,計(jì)算機(jī)視覺具有信息量豐富,智能化水平高等優(yōu)點(diǎn),近年來廣泛應(yīng)用于移動(dòng)機(jī)器人的自主導(dǎo)航。視覺導(dǎo)航方式具有信號(hào)探測(cè)范圍廣,獲取信息完整等優(yōu)點(diǎn),是移動(dòng)機(jī)器人導(dǎo)航的一個(gè)主要發(fā)展方向[4]。目前國內(nèi)外主要采用在移動(dòng)機(jī)器人上安裝車載攝像機(jī)的基于局部視覺的導(dǎo)航方式,如文獻(xiàn)[4]中所提及的:D.L.Boley等研制的移動(dòng)機(jī)器人利用車載攝像機(jī)和較少的傳感器通過識(shí)別路標(biāo)進(jìn)行導(dǎo)航;A.Ohya等利用車載攝像機(jī)和超聲波傳感器研究了基于視覺導(dǎo)航系統(tǒng)中的避碰問題等。視覺導(dǎo)航中邊緣銳化、特征提取等圖像處理方法計(jì)算量大且實(shí)時(shí)性較差,解決該問題的關(guān)鍵在于設(shè)計(jì)一種快速的圖像處理方法或采取組合導(dǎo)航方式[4-5]。

味覺導(dǎo)航是通過機(jī)器人配備的化學(xué)傳感器感知?dú)馕兜臐舛龋鶕?jù)氣味的濃度和氣流的方向來控制機(jī)器人的運(yùn)動(dòng)。由于氣味傳感器具有靈敏度高、響應(yīng)速度快以及魯棒性好等優(yōu)點(diǎn),近年來許多研究人員在氣味導(dǎo)航技術(shù)上做了許多研究工作。但該項(xiàng)技術(shù)能夠真正應(yīng)用到實(shí)際環(huán)境中的卻很少,仍處于試驗(yàn)研究階段。Figaro Engineering Inc.公司研制的氧化錫氣味傳感器,被廣泛用于氣味導(dǎo)航試驗(yàn)。石英晶體微平衡氣味傳感器、導(dǎo)電聚合物氣味傳感器和一種模仿哺乳動(dòng)物鼻子功能的電子鼻等用于移動(dòng)機(jī)器人味覺導(dǎo)航的傳感器都處于試驗(yàn)階段。目前的味覺導(dǎo)航試驗(yàn)多采用將機(jī)器人起始點(diǎn)和目標(biāo)點(diǎn)之間用特殊的化學(xué)藥品,如酒精和樟腦丸等,引導(dǎo)出一條無碰氣味路徑,機(jī)器人根據(jù)不同的道路跟蹤算法,用氣味傳感器感知?dú)馕兜臐獾蜌馕对吹姆较蜻M(jìn)行機(jī)器人導(dǎo)航試驗(yàn)。味覺導(dǎo)航的研究具有很好的研究價(jià)值,該種移動(dòng)機(jī)器人可用來尋找化學(xué)藥品泄露源。

由于計(jì)算機(jī)視覺理論及算法的發(fā)展,又由于和激光、雷達(dá)和超聲在導(dǎo)航方面相比,視覺導(dǎo)航具有以下幾個(gè)優(yōu)點(diǎn):首先,即使在丟棄了絕大部分的視覺信息后,所剩下的關(guān)于周圍環(huán)境的信息仍然比激光雷達(dá)和超聲更多更精確;其次,激光雷達(dá)和超聲的原理都是通過主動(dòng)發(fā)射脈沖和接受反射脈沖來測(cè)距的,因此當(dāng)多個(gè)機(jī)器人同時(shí)工作時(shí),相互之間可能產(chǎn)生干擾,而視覺由于是被動(dòng)測(cè)量,因此多個(gè)機(jī)器人相互之間的干擾可以減少到最?。蛔詈?,激光雷達(dá)和超聲數(shù)據(jù)的采樣周期一般比攝像機(jī)長,不能及時(shí)對(duì)高速運(yùn)動(dòng)的機(jī)器人提供信息并作出規(guī)劃,因此視覺傳感器被大量地采用。目前移動(dòng)機(jī)器人的導(dǎo)航大都采用基于視覺或有視覺參與的導(dǎo)航技術(shù)。最近二十年來,在未知或部分未知環(huán)境中,基于自然路標(biāo)導(dǎo)航與定位技術(shù)的研究;視覺導(dǎo)航中路標(biāo)的識(shí)別以及圖像處理的新型快速算法的研究成為了計(jì)算機(jī)視覺的主要研究方向。

視覺導(dǎo)航主要完成障礙物和路標(biāo)的探測(cè)及識(shí)別。國內(nèi)外應(yīng)用最多的是在機(jī)器人上安裝車載攝像機(jī)的基于局部視覺的導(dǎo)航方式。P.I.Corke等對(duì)有車載攝像機(jī)的移動(dòng)機(jī)器人視覺閉環(huán)系統(tǒng)的研究表明,這種控制方法可以提高路徑跟蹤精度。從視覺圖像中識(shí)別道路是影響移動(dòng)機(jī)器人導(dǎo)航性能的一個(gè)最重要因素。對(duì)于一般的圖像邊沿抽取而言,已有了許多方法,例如,局部數(shù)據(jù)的梯度法和二階微分法。Trahanias利用視覺探測(cè)路標(biāo)來完成機(jī)器人的導(dǎo)航。其中路標(biāo)不是預(yù)先定義的人工路標(biāo),而是在學(xué)習(xí)階段自動(dòng)提取的自然路標(biāo)。在視覺導(dǎo)航中邊緣銳化、特征提取等圖像處理方法的計(jì)算量大,移動(dòng)機(jī)器人是在運(yùn)動(dòng)中對(duì)圖像進(jìn)行處理,實(shí)時(shí)性差始終是一個(gè)非常棘手的問題。解決該問題的關(guān)鍵在于設(shè)計(jì)一種快速圖像處理方法。為了滿足速度的要求,基于統(tǒng)計(jì)計(jì)算的預(yù)值法被應(yīng)用于機(jī)器人的導(dǎo)航,但在實(shí)際應(yīng)用中發(fā)現(xiàn),它抑制噪聲的能力差,特別是預(yù)值的選取極大地依賴于環(huán)境,要想獲得理想的結(jié)果,僅在一幅圖像中的不同區(qū)域就要設(shè)置不同的預(yù)值。近些年,由于人工智能的發(fā)展,有很多好的算法被應(yīng)用到移動(dòng)機(jī)器人的視覺導(dǎo)航中去。比如,根據(jù)導(dǎo)航圖像的特點(diǎn)采用邊緣提取結(jié)合HOUGH變換的方法和帶濾波窗的區(qū)域掃描的方法,經(jīng)過檢驗(yàn),這兩種算法都具有較好的實(shí)時(shí)性,對(duì)于直線形態(tài)的各類導(dǎo)航線以及對(duì)于已知半徑的弧形導(dǎo)航線具有較高的可靠性,以上算法目前對(duì)于分支較多的直線形態(tài)的導(dǎo)航線以及未知半徑的弧形導(dǎo)航線的效果不佳,這是今后努力的方向。

Stanley還提出了基于神經(jīng)網(wǎng)絡(luò)的機(jī)器人視覺導(dǎo)航技術(shù)。該技術(shù)中估算逆雅可比矩陣,并將圖像特征的變化與機(jī)器人的位置變化對(duì)應(yīng)起來,通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練來近似特征雅可比矩陣的逆陣。該技術(shù),通過提取幾何特征、平均壓縮、向量量化和主成分提取來簡化圖像處理,實(shí)現(xiàn)實(shí)時(shí)視覺導(dǎo)航。

綜上所述,移動(dòng)機(jī)器人是在運(yùn)動(dòng)中對(duì)圖像進(jìn)行處理,實(shí)時(shí)性差始終是一個(gè)非常棘手的問題。解決該問題的關(guān)鍵在于設(shè)計(jì)一種快速圖像處理方法。將室內(nèi)地面作為機(jī)器人視覺導(dǎo)航的路標(biāo)。依據(jù)地面的顏色信息,將地面上沒有障礙物的區(qū)域識(shí)別并分割出來,機(jī)器人在可行走區(qū)域內(nèi)行走,這樣就可以實(shí)現(xiàn)機(jī)器人的自主導(dǎo)航。利用環(huán)境中地面的顏色特征,采用比較簡單的圖像處理算法分割彩色圖像,經(jīng)實(shí)驗(yàn)證明可提高機(jī)器人導(dǎo)航的實(shí)時(shí)性、準(zhǔn)確性和魯棒性。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

摘 要: 針對(duì)當(dāng)前視頻監(jiān)控進(jìn)行考試監(jiān)考的丟包率大和智能化程度不高的問題,在計(jì)算機(jī)視覺下進(jìn)行學(xué)生考試自動(dòng)監(jiān)控系統(tǒng)優(yōu)化設(shè)計(jì),提出一種基于視頻幀循環(huán)糾錯(cuò)編碼的計(jì)算機(jī)視覺自動(dòng)監(jiān)考系統(tǒng)設(shè)計(jì)方法。系統(tǒng)設(shè)計(jì)分為硬件和軟件部分,包括A/D電路、時(shí)鐘電路、視頻幀循環(huán)糾錯(cuò)編碼電路、程序加載電路和輸出接口電路。實(shí)驗(yàn)測(cè)試結(jié)果表明,該系統(tǒng)能有效降低監(jiān)考過程中的視頻丟包,提高監(jiān)考區(qū)域的視覺覆蓋度,系統(tǒng)集成性和智能性較高。

關(guān)鍵詞: 計(jì)算機(jī)視覺; 考試; 自動(dòng)監(jiān)考; 視頻幀

0 引 言

隨著視頻圖像處理技術(shù)的發(fā)展,采用計(jì)算機(jī)視頻監(jiān)測(cè)方法進(jìn)行現(xiàn)場O控設(shè)計(jì),提高對(duì)監(jiān)控區(qū)域的自動(dòng)化識(shí)別和管理能力[1]。學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)是考試智能化管理系統(tǒng)的重要部分,采用計(jì)算機(jī)視覺分析方法進(jìn)行自動(dòng)監(jiān)考,首先采用計(jì)算機(jī)視頻監(jiān)控方法進(jìn)行考試現(xiàn)場的實(shí)時(shí)視覺畫面采集,從而實(shí)現(xiàn)對(duì)考試現(xiàn)場的檢驗(yàn)分析和指導(dǎo)。研究學(xué)生考試自動(dòng)監(jiān)考系統(tǒng),在促進(jìn)智能化考試管理和提高考場監(jiān)考的管控能力方面具有積極重要意義[2],對(duì)學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)是建立在視頻圖像分析基礎(chǔ)上的,結(jié)合系統(tǒng)硬件設(shè)備設(shè)計(jì)和軟件開發(fā),采用計(jì)算機(jī)視覺分析方法進(jìn)行監(jiān)控現(xiàn)場的異常信息特征提取和分析,采用視頻幀循環(huán)糾錯(cuò)編碼避免監(jiān)控過程中的丟包和誤碼失真。首先進(jìn)行系統(tǒng)的總體構(gòu)架分析,然后進(jìn)行監(jiān)考系統(tǒng)的硬件模塊化設(shè)計(jì),最后進(jìn)行系統(tǒng)調(diào)試分析,得出有效性結(jié)論。

1 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

1.1 外圍器件選擇

根據(jù)上述設(shè)計(jì)思想和總體設(shè)計(jì)構(gòu)架,進(jìn)行基于計(jì)算機(jī)視覺的學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的硬件模塊化設(shè)計(jì),學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的數(shù)據(jù)采集系統(tǒng)是整個(gè)系統(tǒng)的基礎(chǔ)。通過PCI橋接芯片與PC機(jī)進(jìn)行數(shù)據(jù)通信,采用PCI9054的LOCAL 總線設(shè)計(jì)方法,進(jìn)行數(shù)據(jù)特征采集,把學(xué)生考試監(jiān)考現(xiàn)場的視頻信息存儲(chǔ)到PCI總線上,在嵌入式RAM中對(duì)監(jiān)控視頻信息進(jìn)行收發(fā)轉(zhuǎn)換和視頻幀間編碼,基于視頻幀循環(huán)糾錯(cuò)編碼方法進(jìn)行視頻糾錯(cuò)。硬件設(shè)計(jì)主要包括如下幾個(gè)部分:學(xué)生考試監(jiān)考現(xiàn)場的視頻信息的DSP信號(hào)處理器、模擬信號(hào)預(yù)處理機(jī)、視頻信息的邏輯控制設(shè)備、外部I/O設(shè)備以及A/D設(shè)備和電源供電設(shè)備,用DSP控制A/D轉(zhuǎn)換FLASH寄存器寄存學(xué)生考試監(jiān)考現(xiàn)場的視頻視覺特征信息,同時(shí)DSP與PCI通信,DSP接收PCI總線的用戶信息,輸出多路視頻編碼到功率放大器。通過串行E2PROM進(jìn)行配置校驗(yàn),在C 模式下通過PCI總線送采樣數(shù)據(jù)或處理結(jié)果到PC機(jī)進(jìn)行監(jiān)考現(xiàn)場的監(jiān)控信息分析。

1.2 監(jiān)考系統(tǒng)的電路設(shè)計(jì)

根據(jù)上述總體設(shè)計(jì)要求,結(jié)合選擇的外圍器件,采用可編程DSP芯片ADSP?BF537作為優(yōu)秀處理芯片,進(jìn)行學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的電路設(shè)計(jì),主要包括了A/D電路、時(shí)鐘電路、視頻幀循環(huán)糾錯(cuò)編碼電路、程序加載電路和輸出接口電路等,分別設(shè)計(jì)描述如下:

(1) A/D電路。學(xué)生考試監(jiān)考系統(tǒng)的A/D電路是實(shí)現(xiàn)對(duì)輸入視頻采集信息的數(shù)/模轉(zhuǎn)換,提供給計(jì)算機(jī)和DSP芯片可識(shí)別的原始計(jì)算機(jī)視覺信息,結(jié)合視頻幀循環(huán)糾錯(cuò)編碼方法進(jìn)行可視化校對(duì)和視頻編碼。外部I/O設(shè)備包括A/D轉(zhuǎn)換器AD7864兩片,A/D電路的分辨率為12位,最大采樣頻率25 kHz,采用AD7864(以下簡稱7864)作為A/D芯片,它是4通道輸入、轉(zhuǎn)換速度1.65 μs的高性能AD芯片,自動(dòng)監(jiān)考系統(tǒng)的A/D輸入電壓滿足:

采樣通道數(shù)由DSP數(shù)據(jù)總線dspD[3:0]控制[3],A4~A0和譯碼,利用信號(hào)作讀數(shù)標(biāo)志信號(hào),得到A/D電路的接口硬件設(shè)計(jì)圖如圖1所示。

考慮到系統(tǒng)處理視頻傳輸信息的時(shí)間和讀數(shù)匹配問題,在進(jìn)行A/D設(shè)計(jì)中,需要考慮7864模擬輸入/輸出對(duì)應(yīng)碼表,見表1。

(2) 時(shí)鐘電路。時(shí)鐘電路執(zhí)行學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的時(shí)鐘中斷控制功能[4],采用5409A 作為自動(dòng)監(jiān)考系統(tǒng)的時(shí)鐘中斷的優(yōu)秀控制芯片,5409A有3個(gè)多通道緩沖串口McBSPs,提供串行A/D、D/A 設(shè)備以及其他的串行器件直接接口,本地總線支持復(fù)用/非復(fù)用的 32 位地址/數(shù)據(jù),包括 PCI 總線操作和LOCAL總線操作,PC9054 內(nèi)部CI9054的LOCAL 總線與PCI總線通過異步操作實(shí)現(xiàn)兩個(gè) DMA數(shù)據(jù)的串行接口輸入和輸出。時(shí)鐘電路的引腳設(shè)計(jì)如圖2所示。

(3) 視頻幀循環(huán)糾錯(cuò)編碼電路。視頻幀循環(huán)糾錯(cuò)編碼電路是整個(gè)系統(tǒng)設(shè)計(jì)的優(yōu)秀模塊,視頻幀循環(huán)糾錯(cuò)編碼通過Emulator由JTAG(Joint Test Action Group)口下載到DSP中運(yùn)行,在IEEE 1149.1標(biāo)準(zhǔn)協(xié)議下進(jìn)行 5409A芯片外圍器件的操作測(cè)試,芯片采用4通道高性能運(yùn)放,帶寬為10 MHz。使用ADUM1201進(jìn)行幀同步信號(hào)設(shè)計(jì)[5],選擇Motorola 公司高性能 MPC850/86作為自動(dòng)監(jiān)考系統(tǒng)的三維特征分析模塊,從外部16位存儲(chǔ)器讀取監(jiān)測(cè)視頻圖像的編碼特征,引出雙排的14腳插針外接上拉或下拉電阻,選擇引腳、時(shí)鐘信號(hào)輸入引腳,數(shù)據(jù)總線LD 9054與應(yīng)用電路連接,以串行E2PROM的配置電路作為I/O 初始化控制寄存器模塊單元,直接從地址0x20000000執(zhí)行16位打包模式實(shí)現(xiàn)視頻糾錯(cuò)編碼,得到視頻幀循環(huán)糾錯(cuò)編碼電路設(shè)計(jì)如圖3所示。

(4) 程序加載電路。選擇Motorola 公司高性能 MPC850/86作為學(xué)生考試自動(dòng)監(jiān)考的可視化校驗(yàn)視覺分析的程序加載電路的優(yōu)秀處理芯片。在程序加載電路中,采用可編程邏輯芯片PLC進(jìn)行圖像信息分析,在程序加載中,從外部16位存儲(chǔ)器直接執(zhí)行16位打包模式,引導(dǎo)ROM配置異步存儲(chǔ)器空間,通過連續(xù)讀取0x00字節(jié)的個(gè)數(shù)來確定學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的SPI存儲(chǔ)器的片選[6],程序加載電路設(shè)計(jì)如圖4所示。

圖4中,在VCC和地之間并聯(lián)1個(gè)電容,滿足程序加載電路的可編程的硬件寫保護(hù)和片內(nèi)的偶然性的寫保護(hù)功能。

(5) 輸出接口電路。輸出接口電路設(shè)計(jì)中,通過JTAG接口訪問CPU的內(nèi)部寄存器,通過串行E2PROM進(jìn)行配置校驗(yàn)。使用JTAG仿真器執(zhí)行12通道DMA異步串行口設(shè)計(jì),采用分立元件構(gòu)成串口復(fù)位電路,降低DSP的能耗。開關(guān)頻率也可在0~1間調(diào)節(jié),內(nèi)核電壓在0.8~1.2 V間調(diào)整,內(nèi)核電源通過10 和0.1 電容濾波,以減少電源噪聲。實(shí)時(shí)時(shí)鐘電源與I/O電源采取分別供電策略,綜上分析,得到輸出接口電路見圖5。

在上述進(jìn)行系統(tǒng)的硬件模塊化設(shè)計(jì)的基礎(chǔ)上,進(jìn)行系統(tǒng)集成設(shè)計(jì)與軟件開發(fā)。

2 實(shí)驗(yàn)測(cè)試分析

對(duì)上述學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)進(jìn)行軟件開發(fā)和系統(tǒng)調(diào)試分析。件開發(fā)建立在CCS 2.20開發(fā)平臺(tái)下,借助于 LabWindows/CVI,C/C++開發(fā)計(jì)算機(jī)視覺下的圖像和視頻信息處理程序。根據(jù)編寫的PCI卡驅(qū)動(dòng)程序進(jìn)行視頻信息采樣和監(jiān)考系統(tǒng)的原始數(shù)據(jù)采集,得到學(xué)生考試自動(dòng)監(jiān)考的視頻采集分析界面如圖6所示。

從圖6可見,采用本文設(shè)計(jì)的考試自動(dòng)監(jiān)考系統(tǒng),能有效實(shí)現(xiàn)計(jì)算機(jī)視覺下的監(jiān)考視頻信息傳輸。為了定量測(cè)試系統(tǒng)的性能,圖7給出了不同方法進(jìn)行監(jiān)考視覺分析的視頻丟包率對(duì)比結(jié)果,從圖7得知,該系統(tǒng)能有效降低監(jiān)考過程中的視頻丟包,從而提高監(jiān)考區(qū)域的視覺覆蓋度。

3 結(jié) 語

本文提出一種基于視頻幀循環(huán)糾錯(cuò)編碼的計(jì)算機(jī)視覺自動(dòng)監(jiān)考系統(tǒng)設(shè)計(jì)方法。系統(tǒng)設(shè)計(jì)分為硬件和軟件部分,首先進(jìn)行了學(xué)生考試自動(dòng)監(jiān)考系統(tǒng)的總體設(shè)計(jì)構(gòu)架分析和功能指標(biāo)描述;然后以ADSP?BF537并行微處理芯片為優(yōu)秀進(jìn)行監(jiān)考系統(tǒng)的硬件設(shè)計(jì),包括A/D電路、時(shí)鐘電路、視頻幀循環(huán)糾錯(cuò)編碼電路、程序加載電路和輸出接口電路;最后在Visual DSP++集成開發(fā)環(huán)境中進(jìn)行自動(dòng)監(jiān)考系統(tǒng)的軟件開發(fā)設(shè)計(jì),結(jié)合視頻幀循環(huán)糾錯(cuò)編碼進(jìn)行程序加載,實(shí)現(xiàn)計(jì)算機(jī)視覺下的自動(dòng)監(jiān)考。實(shí)驗(yàn)測(cè)試結(jié)果表明,該系統(tǒng)能有效降低監(jiān)考過程中的視頻丟包,提高了監(jiān)考區(qū)域的視覺覆蓋度,具有優(yōu)越性能。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)專利分析

摘 要 對(duì)基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)領(lǐng)域的專利申請(qǐng)趨勢(shì)、專利申請(qǐng)產(chǎn)出國和申請(qǐng)人分布進(jìn)行了統(tǒng)計(jì)分析,重點(diǎn)針對(duì)基于人眼、基于人臉、基于嘴巴的疲勞駕駛檢測(cè)這三個(gè)技術(shù)分支的發(fā)展脈絡(luò)進(jìn)行了梳理,并對(duì)基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)的發(fā)展趨勢(shì)進(jìn)行了分析。

關(guān)鍵詞 疲勞駕駛 人眼、人臉 嘴巴 專利

0引言

造成交通事故的原因25%-30%產(chǎn)生于疲勞駕駛,因此疲勞駕駛已成為誘發(fā)交通事故的重要因素。國內(nèi)外專家和學(xué)者針對(duì)疲勞駕駛的檢測(cè)開展了大量的研究工作,目前研究的重心主要集中在基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè),因此對(duì)基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)的相關(guān)專利進(jìn)行分析尤為必要。

1基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)專利申請(qǐng)數(shù)據(jù)分析

1.1全球?qū)@暾?qǐng)量趨勢(shì)

從圖1可以看出,基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)專利申請(qǐng)量從1990-2001年間處于技術(shù)研發(fā)初期,專利申請(qǐng)量相對(duì)較少。從2002年開始該領(lǐng)域的專利申請(qǐng)量逐漸呈現(xiàn)持續(xù)增長趨勢(shì),并在2014年達(dá)到最大值153件。由此可知,隨著疲勞駕駛的增多,人們對(duì)疲勞駕駛的檢測(cè)也越來越重視,相應(yīng)的研究也正不斷增加。基于此,在今后的一段時(shí)間內(nèi),相關(guān)的專利申請(qǐng)量有望繼續(xù)保持。

1.2專利申請(qǐng)產(chǎn)出地區(qū)分布

目前各領(lǐng)域的專利申請(qǐng)量主要集中在中國、美國、韓國、日本和歐洲,通過對(duì)該領(lǐng)域在中國、美國、韓國、日本和歐洲的專利申請(qǐng)量進(jìn)行統(tǒng)計(jì)分析發(fā)現(xiàn),中國的申請(qǐng)量以48%的占比雄居第一,其他幾個(gè)地區(qū)的申請(qǐng)量相差不大,具體如圖2所示。

1.3在華專利申請(qǐng)量變化趨勢(shì)

圖3為1990年至2014年基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)在華的申請(qǐng)量變化趨勢(shì)圖,由該圖可以看出,1990-2002年是技術(shù)的萌芽期,在2003年以后申請(qǐng)量才呈現(xiàn)逐年增長的趨勢(shì),并且在2012年-2014年將均維持在較高的申請(qǐng)量。因此,該領(lǐng)域國內(nèi)雖然起步較晚,但是最近幾年申請(qǐng)量相對(duì)其他地區(qū)卻具有壓制性的優(yōu)勢(shì)。

1.4在華主要申請(qǐng)人分析

圖4展示了在華主要申請(qǐng)人的申請(qǐng)量份額,主要以科研院所和大型汽車企業(yè)為主,其中吉利汽車公司以領(lǐng)先優(yōu)勢(shì)排名第一。

2主要技術(shù)分支的專利申請(qǐng)分析

基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)的主要技術(shù)分支有:基于人眼的駕駛疲勞檢測(cè)、基于人臉的駕駛疲勞檢測(cè)、基于嘴巴的疲勞檢測(cè)。下面從三個(gè)技術(shù)分支的發(fā)展概況、三個(gè)技術(shù)分支的主要工作原理及重點(diǎn)專利等方面進(jìn)行分析。

2.1全球?qū)@暾?qǐng)主要技術(shù)分支的申請(qǐng)量趨勢(shì)圖

由圖6可知,近年來基于人眼和人臉的駕駛疲勞檢測(cè)的申請(qǐng)量呈現(xiàn)較快增長,申請(qǐng)量也較基于嘴巴的疲勞檢測(cè)的申請(qǐng)量大,體現(xiàn)了該領(lǐng)域近年來的發(fā)展趨勢(shì),并體現(xiàn)出基于人眼和人臉的駕駛疲勞檢測(cè)的技術(shù)分支發(fā)展已較為成熟。三個(gè)技術(shù)分支在2006年之前,申請(qǐng)量的差別不大且數(shù)量均較小,顯示出在2006年以前三個(gè)分支的區(qū)別并不明顯,發(fā)展也較為緩慢,這說明基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)也是近10年才興起的一項(xiàng)技術(shù),它依賴于圖像處理技術(shù)的發(fā)展水平。

2.2在華專利申請(qǐng)主要技術(shù)分支的申請(qǐng)量趨勢(shì)圖

由圖7可知,三個(gè)技術(shù)分支在2006年以前均只有零星的申請(qǐng)量,這與該領(lǐng)域在全球的發(fā)展情況相符合,基于人眼的疲勞駕駛檢測(cè)在華申請(qǐng)量自2006年以來呈現(xiàn)穩(wěn)步增長,且近年來申請(qǐng)量最大。基于人臉的疲勞駕駛檢測(cè)申請(qǐng)量雖小于基于人眼的疲勞駕駛檢測(cè),但近年來的申請(qǐng)量也呈現(xiàn)出穩(wěn)步增長的勢(shì)頭。然而,基于嘴巴的疲勞駕駛檢測(cè)雖有增長趨勢(shì),但申請(qǐng)量一直都較小。由此可知,在國內(nèi)疲勞駕駛的檢測(cè)主要是采用人眼檢測(cè)和人臉檢測(cè),這兩個(gè)分支是國內(nèi)的研究的熱門,也是今后國內(nèi)在該領(lǐng)域的發(fā)展趨勢(shì)。

3結(jié)語

通過對(duì)基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)專利的申請(qǐng)量的總體分析,以及基于人眼、基于人臉、基于嘴巴三個(gè)技術(shù)分支的申請(qǐng)量趨勢(shì)分析可知,基于計(jì)算機(jī)視覺的疲勞駕駛檢測(cè)在近10年取得了較快發(fā)展,這與計(jì)算機(jī)圖像處理技術(shù)的發(fā)展密不可分;同時(shí),科研院所作為該領(lǐng)域研究的主體,應(yīng)加強(qiáng)與中小企業(yè)的合作。國內(nèi)疲勞駕駛的檢測(cè)研究主要集中在人眼檢測(cè)和人臉檢測(cè),這兩個(gè)分支是國內(nèi)的研究的熱門,同時(shí),基于人眼的疲勞檢測(cè)其發(fā)展方向明確,后續(xù)發(fā)展將集中在眼睛定位算法的研究上,并且定位精度將越來越高,越來越滿足實(shí)際的要求。

計(jì)算機(jī)視覺論文:一種基于計(jì)算機(jī)視覺的手指特征識(shí)別算法研究及其FPGA實(shí)現(xiàn)

摘 要: 為了提高視頻圖像中手指特征識(shí)別的精度和速度,提出一種基于矩形模板的動(dòng)態(tài)閾值算法。該算法采用矩形模板平滑圖像,用灰度閾值法提取目標(biāo)邊緣,實(shí)現(xiàn)對(duì)手指特征的準(zhǔn)確識(shí)別。Matlab仿真結(jié)果表明,該算法受環(huán)境噪聲影響較小,能清晰準(zhǔn)確地分割出手指邊緣。在FPGA平臺(tái)上設(shè)計(jì)了一套基于計(jì)算機(jī)視覺的手指特征識(shí)別系統(tǒng),并對(duì)該系統(tǒng)的實(shí)時(shí)性、手指識(shí)別精度等性能進(jìn)行了測(cè)試。測(cè)試結(jié)果表明,該系統(tǒng)的運(yùn)行速度與攝像頭攝取圖像的速度基本同步,可滿足系統(tǒng)對(duì)實(shí)時(shí)性要求。系統(tǒng)對(duì)手指位置識(shí)別的坐標(biāo)偏差約為3個(gè)像素,基本滿足系統(tǒng)對(duì)識(shí)別精度的要求。

關(guān)鍵詞: 計(jì)算機(jī)視覺; 手指特征識(shí)別; 動(dòng)態(tài)閾值算法; 矩形模版

S著科學(xué)技術(shù)的飛速發(fā)展,人與計(jì)算機(jī)之間的交互活動(dòng)越來越密切,并逐漸成為人們?nèi)粘I畹闹匾M成部分。傳統(tǒng)觸摸屏是現(xiàn)階段一種最常見,也是最重要的人機(jī)交互方式,其是通過一種附加在顯示器表面的透明介質(zhì),依賴使用者的手指觸摸該介質(zhì)來實(shí)現(xiàn)對(duì)計(jì)算機(jī)的輸入控制[1?2]。目前,這種觸摸屏技術(shù)已經(jīng)相當(dāng)成熟,但是,技術(shù)上不容易做到大尺寸,且成本相對(duì)較高,也易于破損。為了突破傳統(tǒng)觸摸屏這種人機(jī)交互方式的局限,把任何成像平面變成可用手指進(jìn)行交互的系統(tǒng),本文提出了一種基于計(jì)算機(jī)視覺的手指特征識(shí)別算法,并在FPGA平臺(tái)上建立了一套基于計(jì)算機(jī)視覺的手指特征識(shí)別硬件系統(tǒng)。這種基于計(jì)算機(jī)視覺的手指特征識(shí)別方法可為基于視覺的人機(jī)互動(dòng)提供一種新的技術(shù)解決途徑。其與傳統(tǒng)觸摸屏的區(qū)別在于,不需要在成像屏幕上安裝任何特殊介質(zhì),使用壽命得到大幅延長,應(yīng)用范圍有了很大擴(kuò)展。

1 圖像采集平臺(tái)

本文所采用的圖像采集平臺(tái)如圖1所示,在任何與計(jì)算機(jī)連接的顯示設(shè)備(如投影屏幕、等離子電視等)的左上角、右上角安裝兩個(gè)攝像頭,通過這兩個(gè)攝像頭便可確定手指在屏幕上的二維坐標(biāo)信息(x1,x2)。然后,將此坐標(biāo)點(diǎn)傳至計(jì)算機(jī),并與Windows系統(tǒng)的鼠標(biāo)程序關(guān)聯(lián)即可實(shí)現(xiàn)人機(jī)交互功能。圖2是圖像采集平臺(tái)的側(cè)視圖。其中虛線框表示攝像頭視野中系統(tǒng)需要處理的區(qū)域,即手指出現(xiàn)的區(qū)域。

2 手指特征識(shí)別算法及仿真

在系統(tǒng)實(shí)現(xiàn)過程中,如何從攝像頭所拍攝的畫面中準(zhǔn)確地識(shí)別并提取出手指信息是其難點(diǎn)之一。在目前的圖像處理技術(shù)中,用于識(shí)別背景圖案中目標(biāo)物體的算法很多,本文在分析基于色彩聚類的膚色識(shí)別算法的基礎(chǔ)上,結(jié)合課題特殊需求,提出一種基于矩形模板的動(dòng)態(tài)閾值算法,并在Matlab中對(duì)上述算法的處理效果進(jìn)行了仿真。

從圖像采集平臺(tái)可以看出,本系統(tǒng)只關(guān)心距屏幕很近的小視野內(nèi)是否出現(xiàn)區(qū)別于背景的目標(biāo)物體。因此,只需從攝像頭拍攝的圖像當(dāng)中截取一部分,如圖3中的小矩形框所示。

2.1 基于色彩聚類的膚色識(shí)別算法

膚色是人體區(qū)別于其他物體的一個(gè)重要特征,人體膚色特征不受位置、角度、大小等因素影響,具有較強(qiáng)的穩(wěn)定性。因此,本文首先選定基于色彩聚類的膚色提取識(shí)別算法進(jìn)行研究。在色彩聚類方法中,Anil K.Jain的Cb,Cr橢圓聚類方法最為典型[3?4]。采用非線性分段膚色分割得到的膚色區(qū)域在Cb,Cr空間中近似于橢圓,如下:

由圖5可知,利用該算法分割手指信息的效果尚可,能從比較友好的環(huán)境中迅速準(zhǔn)確地識(shí)別出手指信息。圖6為利用橢圓聚類膚色分割算法對(duì)從圖像采集平臺(tái)讀取圖像的手指識(shí)別效果??梢姡撍惴ㄔ谄胀ōh(huán)境下對(duì)手指的識(shí)別效果良好。但當(dāng)屏幕上的顏色影響手指膚色時(shí),該算法的識(shí)別能力就會(huì)有所降低。可見,該算法對(duì)皮膚顏色的純度要求較高,適用范圍受限。圖7為屏幕出現(xiàn)大面積藍(lán)色時(shí)對(duì)手指識(shí)別造成的影響效果。

2.2 基于正方形模板的動(dòng)態(tài)閾值算法

基于正方形模板的動(dòng)態(tài)閾值算法,即采用灰度閾值法,用正方形模板平滑圖像[5?6]。圖8(a)是3×3模板動(dòng)態(tài)閾值算法平滑圖像的過程。

應(yīng)用基于3×3模板的動(dòng)態(tài)閾值算法對(duì)原圖4進(jìn)行邊緣提取的仿真效果如圖9(a)所示??梢姡瑧?yīng)用3×3模板可以提取出目標(biāo)物體的邊緣,但不夠清晰。雖然可以通過增大模板取得比較理想的效果(圖9(b)為采用基于101×101模板的動(dòng)態(tài)閾值算法的處理效果),但會(huì)使計(jì)算量劇增,同時(shí)也縮小了模板所能完全覆蓋的范圍,使圖像邊緣產(chǎn)生無效的白色區(qū)域。

2.3 基于矩形模板的動(dòng)態(tài)閾值算法

根據(jù)課題實(shí)際需要,即所要處理的目標(biāo)區(qū)域?yàn)殚L方形窄條區(qū)域(如圖3所示),本文提出一種基于矩形模板的動(dòng)態(tài)閾值算法。該算法與基于正方形模板算法的區(qū)別在于,平滑圖像時(shí)所用的模板為窄條形,如3×5模板,3×15模板,3×41模板等。圖8(b)是3×9模板動(dòng)態(tài)閾值算法平滑圖像的過程。

圖10給出了采用基于3×9模板、3×14模板、3×81模板、3×101模板動(dòng)態(tài)閾值算法對(duì)原圖4進(jìn)行手部邊緣提取的仿真效果。由仿真效果可知,基于矩形模板的動(dòng)態(tài)閾值算法在模板取值為3×9的情況下,便能夠清晰提取出目標(biāo)物體的邊緣。而且,隨著模板取值的增加,目標(biāo)物體邊緣的提取效果更加清晰準(zhǔn)確。與基于正方形模板的動(dòng)態(tài)閾值算法相比,基于矩形模板的動(dòng)態(tài)閾值算法計(jì)算量較小,節(jié)約了系統(tǒng)的計(jì)算資源。

3 基于FPGA的手指特征識(shí)別算法的系統(tǒng)測(cè)試

為了驗(yàn)證本文所提出的基于矩形模板的動(dòng)態(tài)閾值算法能否滿足屏幕交互系統(tǒng)的整體要求,本文通過編寫軟件程序在FPGA開發(fā)板上對(duì)這種算法進(jìn)行了硬件實(shí)現(xiàn)和系統(tǒng)測(cè)試。

3.1 硬件實(shí)現(xiàn)

本文所采用的硬件實(shí)現(xiàn)系統(tǒng)主要是基于美國Altera公司生產(chǎn)的型號(hào)為EFA?CY1C12的“紅色颶風(fēng)”(Red Cyclone)系列FPGA開發(fā)板,并另外集成了用Ommvison公司的型號(hào)為OV9655的CMOS數(shù)字?jǐn)z像頭,以及ISSI公司的型號(hào)為IS61LV25616AL的SRAM存儲(chǔ)器[7?10]。最終搭建的硬件系統(tǒng)如圖11所示。

3.2 系統(tǒng)測(cè)試

本文主要對(duì)系統(tǒng)的實(shí)時(shí)性、手指提取精度、資源占用情況等影響系統(tǒng)運(yùn)行的重要技術(shù)指標(biāo)進(jìn)行了測(cè)試。

(1) 實(shí)時(shí)性

OV9655攝像頭在1 280×1 024分辨率下,能提供15 f/s的圖像采集速率,課題所設(shè)計(jì)的軟件程序可以在一幀圖像的處理時(shí)間內(nèi)完成了數(shù)據(jù)的采集、手指邊緣的識(shí)別等運(yùn)算,實(shí)現(xiàn)了系統(tǒng)執(zhí)行速度與攝像頭拍攝速度的同步,達(dá)到了系統(tǒng)對(duì)實(shí)時(shí)性要求。

(2) 手指識(shí)別精度

由于課題在軟件設(shè)計(jì)過程中編入了圖像采集防抖動(dòng)處理程序,提高了圖像采集的穩(wěn)定性,也提高了手指識(shí)別的精度。經(jīng)過測(cè)試,本系統(tǒng)得到的手指位置信息的坐標(biāo)偏差為3個(gè)像素,基本滿足大屏幕交互系統(tǒng)對(duì)識(shí)別精度的需求。

(3) 資源占用情況

從Quartus Ⅱ的編譯報(bào)告中可以看出,本系統(tǒng)的軟件運(yùn)行已占用FPGA的9 702個(gè)邏輯單元,占邏輯單元總數(shù)的80%??梢?,該硬件系統(tǒng)的FPGA運(yùn)算資源基本能滿足系統(tǒng)的實(shí)際需要。

4 結(jié) 語

本文通過對(duì)基于矩形模板的動(dòng)態(tài)閾值算法的研究和基于FPGA的手指特征識(shí)別硬件系統(tǒng)的實(shí)現(xiàn),建立了一套基于計(jì)算機(jī)視覺的手指特征識(shí)別系統(tǒng)。該算法受環(huán)境噪聲影響較小,能清晰準(zhǔn)確地分割出手指邊緣,且隨著矩形模版取值的增大,算法的識(shí)別效果會(huì)更加良好。該系統(tǒng)的實(shí)時(shí)性、手指識(shí)別精度及資源占用情況均可滿足系統(tǒng)要求。這種基于計(jì)算機(jī)視覺的手指識(shí)別方法成本低、靈活性好,為基于視覺的人機(jī)交互提供了一種新的技術(shù)途徑。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法

摘 要截至目前,運(yùn)動(dòng)目標(biāo)跟蹤已經(jīng)歷經(jīng)了幾十年的發(fā)展研究,其作為當(dāng)前社會(huì)一項(xiàng)至關(guān)重要的先進(jìn)技術(shù),對(duì)于人們的日常工作生活以及社會(huì)經(jīng)濟(jì)、軍事政治等其他各領(lǐng)域均有著積極的幫助作用。特別是在計(jì)算機(jī)視覺技術(shù)逐漸發(fā)展成熟的今天,運(yùn)動(dòng)目標(biāo)跟蹤與計(jì)算機(jī)視覺技術(shù)的融合程度也越來越高?;诖?,本文將選擇當(dāng)前比較常見的一種目標(biāo)跟蹤算法即Kalman filter算法,并以運(yùn)動(dòng)的人臉作為跟蹤目標(biāo),著重圍繞基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法進(jìn)行簡要分析研究。

【關(guān)鍵詞】計(jì)算機(jī)視覺 運(yùn)動(dòng)目標(biāo) 跟蹤算法

在計(jì)算機(jī)等現(xiàn)代科學(xué)技術(shù)尚未出現(xiàn)以前,人們?cè)讷@取外界信息時(shí)往往主要依賴視覺,而在我國計(jì)算機(jī)技術(shù)水平不斷發(fā)展提升的背景之下,計(jì)算機(jī)視覺技術(shù)的出現(xiàn)使得人類肉眼視覺得到了進(jìn)一步的發(fā)展延伸,尤其是在各種傳感器技術(shù)的幫助之下,使得人們能夠?qū)Ρ3诌\(yùn)動(dòng)狀態(tài)的目標(biāo)進(jìn)行實(shí)時(shí)跟蹤,從而準(zhǔn)確掌握目標(biāo)的具體形態(tài)屬性。在此背景之下,本文將運(yùn)動(dòng)目標(biāo)設(shè)定為運(yùn)動(dòng)的人臉,通過探究基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法,希望能夠?yàn)橄嚓P(guān)研究人員提供相關(guān)參考和幫助。

1 Kalman filter目標(biāo)跟蹤算法的簡要概述

Kalman filter目標(biāo)跟蹤算法是當(dāng)前眾多跟蹤算法當(dāng)中使用范圍較廣、使用頻率比較集中的一種跟蹤算法,這一算法最早可以追溯至上個(gè)世紀(jì)六十年代,人們通過將濾波理論與狀態(tài)空間模型相集合,從而得到的一種遞推估計(jì)的算法也就是卡爾曼濾波理論。其通過利用上一時(shí)刻獲取的預(yù)估值以及當(dāng)下獲取的實(shí)際觀測(cè)值,在信號(hào)與噪聲狀態(tài)空間模型當(dāng)中不斷更新狀態(tài)變量,進(jìn)而順利完成估計(jì)預(yù)測(cè)并獲得當(dāng)前時(shí)刻估計(jì)預(yù)測(cè)值。經(jīng)過不斷的發(fā)展,在計(jì)算機(jī)圖像處理以及其他運(yùn)動(dòng)目標(biāo)跟蹤當(dāng)中經(jīng)常會(huì)使用Kalman filter算法。如果在k時(shí)刻系統(tǒng)下的狀態(tài)向量用xk表示,那么在t0時(shí)刻下初始化的狀態(tài)預(yù)測(cè)方程為;在tk時(shí)刻下更新系統(tǒng)狀態(tài)的具體方程為

,其中Hk、Zk分別表示測(cè)量矩陣m×n維以及轉(zhuǎn)移矩陣n×n維的狀態(tài)向量。但在跟蹤計(jì)算機(jī)視覺運(yùn)動(dòng)目標(biāo)譬如說視頻目標(biāo)時(shí),由于相鄰的兩幀視頻圖像本身時(shí)間間隔非常短,因此目標(biāo)在這一時(shí)間內(nèi)難以發(fā)生明顯的運(yùn)動(dòng)狀態(tài)變化,此時(shí)我們可以通過將此間隔時(shí)間設(shè)定為單位時(shí)間,同時(shí)目標(biāo)在單位時(shí)間內(nèi)一直保持勻速運(yùn)動(dòng)狀態(tài),這時(shí)我們可以得到一個(gè)狀態(tài)轉(zhuǎn)移矩陣且

,定義系統(tǒng)觀測(cè)矩陣即為

,定義噪聲Wk以及Vk協(xié)方差矩陣則可以分別用

和表示。

如果在濾波器在經(jīng)過若干次卡爾曼濾波后仍然能夠恢復(fù)至原始狀態(tài),則其具有較好的穩(wěn)定性,但如果在進(jìn)行運(yùn)動(dòng)目標(biāo)跟蹤實(shí)驗(yàn)的過程當(dāng)中,對(duì)于處于運(yùn)動(dòng)狀態(tài)的被跟蹤目標(biāo),一旦出現(xiàn)遮擋行為則將在第一時(shí)間內(nèi)暫停估計(jì)參數(shù),并將這一參數(shù)估計(jì)值直接代入到狀態(tài)方程當(dāng)中,使得運(yùn)動(dòng)目標(biāo)無論是否被遮擋均可以對(duì)其進(jìn)行精確跟蹤。

2 基于計(jì)算機(jī)視覺的運(yùn)動(dòng)目標(biāo)跟蹤算法

2.1 建立顏色概率模型

顏色囊括了諸多的信息量光柱點(diǎn),尤其是在人類的視覺世界從本質(zhì)上來說也是一種用過感知自然界色彩以及明暗變化的世界,因此人們可以通過使用三基色原理獲得RGB顏色空間。考慮到顏色與計(jì)算機(jī)視覺場景當(dāng)中各個(gè)場景和目標(biāo)之間有著緊密的關(guān)系,同時(shí)不同于目標(biāo)的大小、形態(tài)等其他視覺特征,顏色特征鮮少會(huì)受到包括觀察視角等在內(nèi)各因素的干擾影響,從某種角度上來說基于顏色特征的運(yùn)動(dòng)目標(biāo)具有較好的穩(wěn)定性。為了能夠保障目標(biāo)跟蹤既穩(wěn)定又迅速,需要選擇合適的顏色特征,否則將極有可能導(dǎo)致出現(xiàn)跟蹤失敗。在這一環(huán)節(jié)當(dāng)中人們通常使用的是RGB顏色空間以及HSI顏色空間,但由于二者均具有一定的局限性,因此本文在對(duì)人臉特征尤其是顏色特征進(jìn)行選取時(shí),選擇了rgI顏色直方圖的方法,在解決兩N顏色空間自身缺陷的同時(shí),盡量避免目標(biāo)人臉運(yùn)動(dòng)位置以及尺寸等變化因素對(duì)目標(biāo)追蹤造成的干擾影響。在rgI顏色直方圖當(dāng)中其中R、G、B就是RGB顏色空間當(dāng)中的三原色,r、g、I有著相同的取值范圍即在0到1之間。保持間隔相等的情況下劃分L值即可得到rgI顏色直方圖。雖然rgI顏色直方圖與物體相對(duì)應(yīng),但如果目標(biāo)只是位置以及尺寸等出現(xiàn)變化,rgI顏色直方圖并不會(huì)受到任何實(shí)質(zhì)性影響,因此在理想情況下,利用rgI顏色直方圖能夠?qū)σ曨l圖像中不同運(yùn)動(dòng)位置以及不同尺寸的人臉進(jìn)行目標(biāo)追蹤。

2.2 跟蹤算法

運(yùn)動(dòng)目標(biāo)的不斷變化將會(huì)使得模板圖像隨之發(fā)生相應(yīng)變化,因此需要不斷更新模板圖像才能夠有效完成對(duì)運(yùn)動(dòng)目標(biāo)的連續(xù)跟蹤,本文在對(duì)運(yùn)動(dòng)目標(biāo)的實(shí)際運(yùn)動(dòng)范圍進(jìn)行預(yù)測(cè)過程中選擇使用卡爾曼濾波,之后利用rgI顏色直方圖在預(yù)測(cè)運(yùn)動(dòng)范圍之內(nèi)搜索和匹配相應(yīng)目標(biāo),從而通過此舉獲得與目標(biāo)模板有著最小歐式距離的區(qū)域,在此過程當(dāng)中存在一個(gè)特定閾值T,如果兩者的歐氏距離在進(jìn)行相減時(shí)差值沒有超過這個(gè)特定閾值,那么此時(shí)該區(qū)域就是運(yùn)動(dòng)目標(biāo)所在的實(shí)際位置,利用在這一區(qū)域當(dāng)中的rgI顏色直方圖并將其充當(dāng)下一幀運(yùn)動(dòng)目標(biāo)的匹配模板,在不斷重復(fù)的過程中模板能夠?qū)崿F(xiàn)不間斷地更新。由于相鄰的兩幀視頻圖像之間,時(shí)間間隔并不長,因此目標(biāo)人臉在極短的時(shí)間間隔當(dāng)中基本上不會(huì)出現(xiàn)突然變化,此時(shí)我們可以認(rèn)為運(yùn)動(dòng)目標(biāo)人臉的運(yùn)動(dòng)連續(xù)性比較強(qiáng),此時(shí)利用公式

可以進(jìn)行歐式距離的計(jì)算并用以衡量匹配的模板。其中匹配區(qū)域和模板的rgI顏色直方圖分別用l和l'表示,而rgI顏色直方圖中的維數(shù)則用n進(jìn)行表示。根據(jù)相關(guān)視頻圖像顯示,通過不斷更新模板確實(shí)可以對(duì)目標(biāo)運(yùn)動(dòng)人臉進(jìn)行實(shí)時(shí)跟蹤顯示。

3 結(jié)束語

總而言之,本文通過選擇當(dāng)前比較常見的目標(biāo)跟蹤算法即Kalman filter算法,利用卡爾曼濾波以及rgI顏色直方圖完成對(duì)運(yùn)動(dòng)人臉的跟蹤。事實(shí)證明,Kalman filter算法確實(shí)能夠在對(duì)各目標(biāo)之間的干擾進(jìn)行明確區(qū)分的基礎(chǔ)之上,準(zhǔn)確描述運(yùn)動(dòng)人臉目標(biāo),從而較好地跟蹤運(yùn)動(dòng)目標(biāo),但由于人臉之間本身存在一定的相似性,因此本文只是對(duì)理想狀態(tài)下的運(yùn)動(dòng)人臉進(jìn)行跟蹤實(shí)驗(yàn),日后還需要對(duì)計(jì)算機(jī)視覺技術(shù)和Kalman filter算法進(jìn)行進(jìn)一步優(yōu)化以妥善解決多人臉目標(biāo)以及相似性問題。

作者單位

重慶電子工程職業(yè)學(xué)院軟件學(xué)院 重慶市 401331

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的室內(nèi)自主移動(dòng)機(jī)器人導(dǎo)航綜述

摘要:計(jì)算機(jī)視覺在人工智能學(xué)科占據(jù)重要地位,為自主移動(dòng)機(jī)器人視覺導(dǎo)航做了深厚的理論鋪墊?;谟?jì)算機(jī)視覺的自主導(dǎo)航與路徑規(guī)劃是自主移動(dòng)機(jī)器人研究的關(guān)鍵技術(shù),計(jì)算機(jī)視覺室內(nèi)導(dǎo)航技術(shù)主要分為3類:第一類是環(huán)境地圖事先已知;第二類是同時(shí)定位與地圖構(gòu)建(simultaneouslocalization andmapping,SLAM);第三類是不依賴環(huán)境地圖。詳細(xì)闡述了每種導(dǎo)航模型和技術(shù)方法,探討了基于計(jì)算機(jī)視覺導(dǎo)航的最新技術(shù)進(jìn)展,總結(jié)了目前國內(nèi)外計(jì)算機(jī)視覺導(dǎo)航的研究進(jìn)展。

關(guān)鍵詞:計(jì)算機(jī)視覺;地圖匹配;SLAM;機(jī)器人導(dǎo)航;路徑規(guī)劃

1概述

計(jì)算機(jī)視覺在人工智能學(xué)科占據(jù)重要地位,為自主移動(dòng)機(jī)器人視覺導(dǎo)航做了深厚的理論鋪墊。目前,機(jī)器人導(dǎo)航技術(shù)有很多種,傳感器導(dǎo)航技術(shù)如里程計(jì)、激光雷達(dá)、超聲波、紅外線、微波雷達(dá)、陀螺儀、指南針、速度、加速度計(jì)或觸覺等得到了普遍應(yīng)用,與上述非計(jì)算機(jī)視覺導(dǎo)航技術(shù)相比較,計(jì)算機(jī)視覺導(dǎo)航技術(shù)如人眼般具有靈敏度高且可捕獲的信息量大以及成本低等優(yōu)點(diǎn)。由于室內(nèi)相對(duì)室外空間比較狹小且內(nèi)部環(huán)境復(fù)雜,所以普通移動(dòng)機(jī)器人在作業(yè)過程中,完成躲避眼前障礙物、自主導(dǎo)航以及為自身找出一條可行路徑等一系列操作會(huì)相對(duì)比較困難。計(jì)算機(jī)視覺導(dǎo)航技術(shù)可利用本身的攝像頭獲得室內(nèi)周圍的環(huán)境信息,實(shí)時(shí)對(duì)其周身的場景進(jìn)行快速反饋,對(duì)視野前方障礙物進(jìn)行快速識(shí)別和檢測(cè),從而確定一條高效的可行的安全路徑。本文對(duì)計(jì)算機(jī)視覺導(dǎo)航技術(shù)進(jìn)行分類研究,主要分為3類:第一類是環(huán)境地圖事先已知,提前對(duì)外界環(huán)境特征進(jìn)行提取和處理,建立全局地圖,并將地圖信息存儲(chǔ)在機(jī)器人內(nèi)存數(shù)據(jù)庫中,在導(dǎo)航的時(shí)候?qū)崟r(shí)進(jìn)行地圖匹配;第二類是同時(shí)定位與地圖構(gòu)建,移動(dòng)機(jī)器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時(shí)逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實(shí)時(shí)定位和導(dǎo)航;第三類是不依賴環(huán)境地圖,自主移動(dòng)機(jī)器人不需要依賴任何的環(huán)境地圖,其在作業(yè)活動(dòng)時(shí)的可行區(qū)域主要取決于攝像頭實(shí)時(shí)識(shí)別和檢測(cè)的環(huán)境相對(duì)信息。

2環(huán)境地圖的表示方法

目前,計(jì)算機(jī)視覺導(dǎo)航技術(shù)多采用柵格地圖、幾何地圖、拓?fù)涞貓D和混合地圖構(gòu)建環(huán)境地圖信息。

2.1柵格地圖

柵格地圖,將柵格圖像考慮為一矩形,均分為一系列柵格單元,將每個(gè)柵格單元賦予一個(gè)平均概率值,并利用傳感信息估計(jì)每個(gè)單元內(nèi)部內(nèi)存障礙物的概率。構(gòu)建柵格地圖的優(yōu)點(diǎn)是其地圖表達(dá)形式直觀,創(chuàng)建和維護(hù)比較容易;但當(dāng)劃分的柵格單元數(shù)量不斷增多時(shí),實(shí)時(shí)性就會(huì)慢慢變差;當(dāng)劃分的柵格單元越大時(shí),環(huán)境地圖的分辨率越低。

2.2幾何地圖

幾何地圖利用幾何特征如點(diǎn)、直線、平面等來構(gòu)成環(huán)境主要框架,需要知道這些特征在環(huán)境中信息的具體位置,所以幾何地圖通常使用其對(duì)應(yīng)的三維空間坐標(biāo)來表示。幾何地圖構(gòu)建過程相對(duì)簡單,保留了室內(nèi)環(huán)境的各種重要信息,是基于計(jì)算機(jī)視覺的定位與地圖構(gòu)建算法中最常用的一種表示方式。但是為了完成環(huán)境的建模需要標(biāo)記大量的特征,從而計(jì)算量也非常的大,降低了實(shí)時(shí)性,其重建的地圖也容易出現(xiàn)與全局不一致的情況。

2.3拓?fù)涞貓D

拓?fù)涞貓D用許多節(jié)點(diǎn)和連接這些節(jié)點(diǎn)的曲線來表示環(huán)境信息。其中,每個(gè)節(jié)點(diǎn)相對(duì)應(yīng)真實(shí)環(huán)境中的特征點(diǎn)(如門角、窗戶、椅子、桌子角及拐角等),而節(jié)點(diǎn)之間的曲線表示兩個(gè)節(jié)點(diǎn)對(duì)應(yīng)的地點(diǎn)是相聯(lián)通的。拓?fù)涞貓D把環(huán)境信息表上在一線圖上,不需要精確表示不同節(jié)點(diǎn)間的地理位置關(guān)系,圖像較為抽象,表示起來方便且簡單。機(jī)器人首先識(shí)別這些節(jié)點(diǎn)進(jìn)而根據(jù)識(shí)別的節(jié)點(diǎn)選擇節(jié)點(diǎn)與節(jié)點(diǎn)間的曲線作為可作業(yè)的路徑。

2.4混合地圖

混合地圖主要包括3種形式:柵格一幾何地圖、幾何一拓?fù)涞貓D以及柵格一拓?fù)涞貓D。混合地圖采用多種地圖表示,可結(jié)合多種地圖的優(yōu)勢(shì),與單一的地圖表示相比更具有靈活性、準(zhǔn)確性和魯棒性,但其不同類別的地圖結(jié)合起來管理會(huì)比較復(fù)雜,難以協(xié)調(diào),增加了地圖構(gòu)建的難度。文獻(xiàn)針對(duì)室內(nèi)環(huán)境所建立的模型分為全局拓?fù)浜途植繋缀伪硎霾糠郑w環(huán)境通過拓?fù)涔?jié)點(diǎn)串連起來,維護(hù)了整體環(huán)境表述的全局一致性;而以每個(gè)拓?fù)涔?jié)點(diǎn)為優(yōu)秀所采用的幾何表述則可確保局部精確定位的實(shí)現(xiàn),這樣建立的幾何一拓?fù)浠旌檄h(huán)境模型可將二者的優(yōu)勢(shì)都表現(xiàn)出來,使得移動(dòng)機(jī)器人定位和地圖構(gòu)建同時(shí)進(jìn)行,實(shí)現(xiàn)容易。

3基于計(jì)算機(jī)視覺的室內(nèi)導(dǎo)航

基于計(jì)算機(jī)視覺的室內(nèi)導(dǎo)航技術(shù)可利用攝像頭捕獲機(jī)器人周圍環(huán)境的全部信息,對(duì)其周身的場景進(jìn)行反饋,對(duì)障礙物進(jìn)行快速識(shí)別和檢測(cè),從而確定一條高效的可行的安全路徑。本文將計(jì)算機(jī)視覺室內(nèi)導(dǎo)航技術(shù)主要分為3類:第一類是環(huán)境地圖事先已知;第二類是定位與地圖構(gòu)建同時(shí)進(jìn)行;第三類是不依賴環(huán)境地圖。

3.1環(huán)境地圖事先已知

提前對(duì)外界環(huán)境特征進(jìn)行提取和處理,建立全局地圖,并將地圖信息存儲(chǔ)在機(jī)器人內(nèi)存數(shù)據(jù)庫中,在導(dǎo)航的時(shí)候?qū)崟r(shí)進(jìn)行地圖匹配,即預(yù)存環(huán)境地圖。在環(huán)境地圖事先已知的導(dǎo)航中,路標(biāo)信息保存在計(jì)算機(jī)內(nèi)存的數(shù)據(jù)庫中,視覺系統(tǒng)中心利用圖像特征直接或間接向移動(dòng)機(jī)器人提供一系列路標(biāo)信息,一旦路標(biāo)被確定后,通過匹配觀察到的圖像和所期望圖像,機(jī)器人借助地圖實(shí)現(xiàn)自身精確定位和導(dǎo)航。該導(dǎo)航技術(shù)過程可分為以下步驟:

a)圖像獲?。簲z像頭獲取其周圍的視頻圖像;

b)路標(biāo)識(shí)別及檢測(cè):利用相關(guān)圖像處理算法對(duì)圖像進(jìn)行一系列預(yù)處理如進(jìn)行邊緣檢測(cè)和提取、平滑、濾波、區(qū)域分割;

c)路標(biāo)匹配標(biāo)志:在觀察到的圖像和所期望圖像之間進(jìn)行匹配,搜索現(xiàn)有的路標(biāo)數(shù)據(jù)庫進(jìn)行標(biāo)志路標(biāo);

d)位置計(jì)算:當(dāng)有特征點(diǎn)進(jìn)行匹配時(shí),視覺系統(tǒng)會(huì)根據(jù)數(shù)據(jù)庫中的路標(biāo)位置進(jìn)行自身精確定位和導(dǎo)航。

在基于計(jì)算機(jī)視覺的地圖匹配定位過程中,主要有2種地圖匹配較為典型。

①已知起點(diǎn),已知地圖。這種條件下的定位稱為局部定位,采用的是一種相對(duì)定位的方法,如圖1所示為其位姿估計(jì)過程,這種情況目前導(dǎo)航技術(shù)研究得最多。

②不知起點(diǎn),已知地圖。這種條件下的定位稱為全局定位。當(dāng)機(jī)器人需要重置時(shí),通常使用這種定位方法來檢索機(jī)器人的當(dāng)前位置(即姿態(tài)初始化)。常用的輔助方法是在環(huán)境中添加一些人造信標(biāo),如無線收發(fā)器,幾何信標(biāo),條碼技術(shù),紅外或超聲波接收系統(tǒng)進(jìn)行位置識(shí)別,利用視覺系統(tǒng)識(shí)別自然標(biāo)志,自主定位。

3.2定位與地圖構(gòu)建同時(shí)進(jìn)行

不知起點(diǎn),不知地圖。SLAM技術(shù)最早由Smith等人于1986年提出,移動(dòng)機(jī)器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時(shí)逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實(shí)時(shí)定位和導(dǎo)航。在日后的導(dǎo)航研究中,混合地圖中的幾何一拓?fù)浠旌檄h(huán)境模型被得到廣泛應(yīng)用,主要用來解決SLAM問題。

2003年,在解決SLAM技術(shù)難題上,Arras等人采用基于Kalman濾波器和最鄰近(nearest neighbor)匹配策略的隨機(jī)地圖創(chuàng)建方法。下面是該算法步驟:

a)數(shù)據(jù)采集:首先初始化系統(tǒng),從攝像頭傳感器采集距離數(shù)據(jù);

b)狀態(tài)預(yù)測(cè):視覺系統(tǒng)預(yù)測(cè)機(jī)器人運(yùn)動(dòng)狀態(tài),實(shí)時(shí)返回新位姿信息和協(xié)方差矩陣,預(yù)測(cè)地圖;

c)觀測(cè):從原始捕獲的信息中提取主要特征信息并將此信息返回給局部地圖;

d)測(cè)量預(yù)測(cè):預(yù)測(cè)機(jī)器人當(dāng)前位姿的全局地圖;

e)位置匹配:應(yīng)用最鄰近濾波器匹配局部地圖中的觀測(cè)點(diǎn)和預(yù)測(cè)點(diǎn);

f)估計(jì):使用擴(kuò)展Kalman濾波器更新地圖;

g)創(chuàng)建:將非相關(guān)的觀測(cè)點(diǎn)加入地圖,對(duì)機(jī)器人返回增量式地圖;

h)輸出地圖。

制約機(jī)器人視覺系統(tǒng)性能的重要因素是信息實(shí)時(shí)處理的計(jì)算復(fù)雜度和處理效率,SLAM算法需要在地圖密度與計(jì)算效率之間取得權(quán)衡。

3.3無環(huán)境地圖

在這類系統(tǒng)中,機(jī)器人不需要依賴任何的環(huán)境地圖信息,機(jī)器人的活動(dòng)取決于其當(dāng)時(shí)識(shí)別和提取出來的環(huán)境信息,這些環(huán)境信息可能是桌子、椅子和門等,不需要知道這些環(huán)境元素的絕對(duì)位置。無環(huán)境地圖的導(dǎo)航技術(shù)典型的技術(shù)有3大類:基于光流的導(dǎo)航技術(shù)、基于外觀信息的導(dǎo)航技術(shù)、基于目標(biāo)識(shí)別的導(dǎo)航技術(shù)和基于目標(biāo)跟蹤的導(dǎo)航技術(shù)。

3.3.1基于光流的導(dǎo)航技術(shù)

光流是三維空間運(yùn)動(dòng)物體在觀測(cè)成像面上的像素運(yùn)動(dòng)的瞬時(shí)速度,也是圖像亮度的運(yùn)動(dòng)信息描述。光流法計(jì)算最初是由Horn和Schunck于1981年提出的,其利用二維速度場與灰度,引入光流約束方程,得到光流計(jì)算的基本算法。光流計(jì)算基于物體移動(dòng)的光學(xué)特性提出了2個(gè)假設(shè):①運(yùn)動(dòng)物體的灰度在很短的間隔時(shí)間內(nèi)保持不變;②給定鄰域內(nèi)的速度向量場變化是緩慢的。如Santos-Victor等人研發(fā)了一種基于光流的robee視覺系統(tǒng),該系統(tǒng)模擬了蜜蜂的視覺行為。在robee視覺系統(tǒng)中,使用單獨(dú)的雙目視覺方法來模擬蜜蜂的中心反射(Centering Reflex):當(dāng)機(jī)器人移動(dòng)到走廊兩側(cè)的墻壁中心時(shí),左眼捕獲場景的瞬時(shí)速度與右眼捕獲場景的瞬時(shí)速度是相同的,幾乎沒有差別,那么機(jī)器人就可以知道他們?cè)谧呃鹊闹行摹H绻劬蓚?cè)的眼睛的瞬時(shí)變化速度不同,則機(jī)器人移動(dòng)到較慢的速度。在自動(dòng)機(jī)器人導(dǎo)航的實(shí)現(xiàn)中,基于這個(gè)想法是測(cè)量攝像機(jī)捕獲圖像場景瞬時(shí)速度差異。這種導(dǎo)航技術(shù)只能用于室內(nèi)單通道直走道導(dǎo)航,不能引導(dǎo)機(jī)器人改變方向,具有一定的局限性。

3.3.2基于外觀信息的導(dǎo)航技術(shù)

基于外觀的機(jī)器人導(dǎo)航方法,不需要構(gòu)建真實(shí)的地圖導(dǎo)航,機(jī)器人通過自身所攜帶的攝像頭和傳感器感知周圍目標(biāo)的外觀信息進(jìn)行自主定位和導(dǎo)航。其中,所述的外觀信息多為目標(biāo)信息的顏色、亮度、形狀、空間大小和物理紋路等。機(jī)器人在導(dǎo)航時(shí)存儲(chǔ)連續(xù)視頻幀的環(huán)境圖像信息,并將連續(xù)視頻幀與控制指令相關(guān)聯(lián),從而再執(zhí)行指令規(guī)劃有效路徑到達(dá)目的地。

3.3.3基于目標(biāo)識(shí)別導(dǎo)航技術(shù)

為了達(dá)到目標(biāo)點(diǎn)或是識(shí)別目標(biāo),機(jī)器人很多時(shí)候只能獲取少量的圖像信息。Kim等人提出了一種用符號(hào)代替導(dǎo)航各個(gè)位置的賦值方法。該賦值方法中,機(jī)器人執(zhí)行命令如“去窗邊”“去你后面的椅子旁”等。這樣,通過相關(guān)的符號(hào)命令,機(jī)器人自動(dòng)識(shí)別并建立路標(biāo),通過符號(hào)指令到達(dá)目標(biāo)點(diǎn)。例如“去你后面的椅子旁”,這樣的命令就是告訴機(jī)器人路標(biāo)是椅子、路徑向后。該導(dǎo)航技術(shù)的難點(diǎn)在于目標(biāo)是否可以準(zhǔn)確實(shí)時(shí)識(shí)別路標(biāo)。第一,識(shí)別大量不同類別的物體,室內(nèi)環(huán)境有許多不同類別的物體,需要將它們組織到一個(gè)在給定的容易搜索圖像數(shù)據(jù)結(jié)構(gòu)中去,起到容易識(shí)別是用什么度量來區(qū)分物體;第二,識(shí)別大量不同背景下的物體,一個(gè)合適的物體表達(dá)式有助于將圖像組織成片斷,而這些片斷來自于物體的種類且與物體無關(guān)的;第三,在抽象層次上識(shí)別物體,機(jī)器人可以不需要在看到一個(gè)具體的杯子之前便能知道它是一個(gè)杯子,相關(guān)程序能夠類似的物體進(jìn)行識(shí)別和區(qū)分。

3.3.4基于目標(biāo)跟蹤的導(dǎo)航技術(shù)

基于目標(biāo)跟蹤的導(dǎo)航技術(shù),為機(jī)器人構(gòu)造一個(gè)虛擬地圖,機(jī)器人通過攝像頭獲取連續(xù)的視頻序列確定一個(gè)跟蹤的目標(biāo),為了達(dá)到對(duì)目標(biāo)的精確定位和實(shí)時(shí)跟蹤,可以利用粒子濾波算法對(duì)需要跟蹤的目標(biāo)進(jìn)行建模?;诹W訛V波的目標(biāo)跟蹤主要包含四個(gè)階段,分別是初始化目標(biāo)區(qū)域,概率轉(zhuǎn)移,目標(biāo)區(qū)域權(quán)重計(jì)算,目標(biāo)區(qū)域重采樣。在機(jī)器人導(dǎo)航之前,通過視頻序列的當(dāng)前幾幀標(biāo)注機(jī)器人所需要跟蹤的目標(biāo),在導(dǎo)航時(shí),機(jī)器人通過連續(xù)的視頻幀感知周圍的待跟蹤目標(biāo),同時(shí)對(duì)所需要跟蹤的目標(biāo)散播粒子,當(dāng)獲取的視頻幀對(duì)目標(biāo)區(qū)域重采樣后足以讓機(jī)器人確定所需要跟蹤的目標(biāo)時(shí),機(jī)器人通過確定的目標(biāo)為自己規(guī)劃最有效的路徑到達(dá)目的地。獲取視頻序列目標(biāo)跟蹤是算機(jī)視覺領(lǐng)域中的重要分支,它在工業(yè)生產(chǎn)、交通導(dǎo)航、國防建設(shè)、航空導(dǎo)航等各個(gè)領(lǐng)域有著廣泛的應(yīng)用。

4結(jié)論

本文對(duì)近三十年來基于計(jì)算機(jī)視覺的室內(nèi)自主式移動(dòng)機(jī)器人導(dǎo)航技術(shù)進(jìn)行了詳細(xì)的分類介紹,對(duì)于移動(dòng)機(jī)器人是否需要地圖匹配的導(dǎo)航系統(tǒng)進(jìn)行了詳細(xì)的綜述。目前,在做導(dǎo)航和面向任務(wù)的決策時(shí),自主機(jī)器人尚未能夠準(zhǔn)確地綜合考慮真實(shí)環(huán)境空間中的各種不確定性,當(dāng)路徑前方突然出現(xiàn)動(dòng)態(tài)場景變化、目標(biāo)運(yùn)動(dòng)、遮檔障礙物時(shí)便會(huì)顯得一無所措,無法及時(shí)把握室內(nèi)環(huán)境變化的動(dòng)態(tài)信息進(jìn)行實(shí)時(shí)導(dǎo)航,而這將是未來計(jì)算機(jī)視覺研究的一大難點(diǎn)和熱點(diǎn)。所以,室內(nèi)自主移動(dòng)機(jī)器人仍在發(fā)展中,還有很多的問題值得研究和探索,現(xiàn)有的機(jī)器人大多數(shù)都需要人為定期去進(jìn)行清理和維護(hù),直到今天還沒有產(chǎn)生一臺(tái)真正意義上完全自主的移動(dòng)機(jī)器人。

計(jì)算機(jī)視覺論文:探討計(jì)算機(jī)視覺技術(shù)在圖書館工作中的應(yīng)用

摘要:隨著科技的不斷發(fā)展,計(jì)算機(jī)視覺技術(shù)的發(fā)展越來越迅速,它的研究和應(yīng)用范圍不斷的擴(kuò)大,已經(jīng)涉及到制造業(yè)、農(nóng)業(yè)、醫(yī)療診斷以及軍事領(lǐng)域。本文通過對(duì)計(jì)算機(jī)視覺技術(shù)在圖書館工作應(yīng)用中的探討,了解計(jì)算機(jī)視覺技術(shù)在圖書館實(shí)行的效果。

關(guān)鍵詞:計(jì)算機(jī);視覺技術(shù);圖書館;應(yīng)用探討

引言

俗話說“書是人類進(jìn)步的階梯”,各大高校以及各大城市都建有圖書館,圖書館可以滿足人們對(duì)各種知識(shí)的需求,因此對(duì)圖書館的管理工作也是十分重要。如今科技不斷的發(fā)展,計(jì)算機(jī)視覺技術(shù)被運(yùn)用到圖書館管理中。計(jì)算機(jī)視覺是用攝影機(jī)和電腦來代替人眼進(jìn)行檢測(cè)、監(jiān)控、識(shí)別和測(cè)量等的機(jī)器視覺,它能夠?qū)κ占瘉淼膱D片和視頻進(jìn)行處理,然后獲得相應(yīng)的三維信息。計(jì)算機(jī)視覺是一門綜合性的學(xué)科也是一個(gè)富有挑戰(zhàn)性的領(lǐng)域,它已經(jīng)被應(yīng)用到各個(gè)領(lǐng)域中,它的重要性不言而喻。

一、計(jì)算機(jī)視覺技術(shù)的特點(diǎn)

(一)檢測(cè)范圍廣泛

人眼的檢測(cè)范圍畢竟有限,有些細(xì)微的方面人眼是檢測(cè)不到的,比如紅外線、超聲波等,但是計(jì)算機(jī)視覺技術(shù)卻是可以檢測(cè)到人眼所檢測(cè)不到的范圍。計(jì)算機(jī)視覺技術(shù)可以將紅外線和超聲波處理成圖像呈現(xiàn)出來,它的檢測(cè)范圍十分廣泛而且是不加選擇的進(jìn)行檢測(cè),可以說它的使用大大拓展了人眼的視野。

(二)檢測(cè)安全可靠

我們都知道電子產(chǎn)品如果接觸使用必然是會(huì)受到一定輻射的,但是計(jì)算機(jī)視覺與以往的檢測(cè)機(jī)器不同,它是不需要與被測(cè)者進(jìn)行接觸的,觀測(cè)者和被測(cè)者都是十分安全不會(huì)受到絲毫損傷的,而且它在使用的過程中并不會(huì)像人眼一樣感到疲憊,它可以一直進(jìn)行高效率的工作,因此對(duì)其檢測(cè)結(jié)果也是十分的可靠的。

二、視覺技術(shù)在圖書館工作中的應(yīng)用分析

(一)圖書剔舊和修補(bǔ)

圖書館是人們知識(shí)的殿堂,是思想文化知識(shí)不斷擴(kuò)展的地方,因此圖書館的剔舊是一項(xiàng)十分重要的工作。圖書館的空間畢竟有限,一些相對(duì)陳舊而利用率較低的參考文獻(xiàn)是需要不定期的進(jìn)行篩選的,這些資料通常都是表面發(fā)黃、布滿灰塵和封面破舊等,而圖書館的剔舊工作大多是由工作人員親自到書庫中進(jìn)行挑選,這樣不僅工作量大、耗時(shí)長還有可能會(huì)存在遺漏的現(xiàn)象,而且資料上的灰塵也會(huì)給工作人員的身體健康帶來影響。

圖書館會(huì)收藏一些珍貴的古籍和字畫,但是時(shí)間一長,受到溫度、濕度等的影響會(huì)造成古籍和字畫表面發(fā)黃、紙張變脆甚至?xí)霈F(xiàn)蟲眼,這時(shí)候就需要對(duì)古籍字畫進(jìn)行修補(bǔ)工作。這項(xiàng)工作大多由工作人員親力親為,會(huì)給工作人員帶來一定的健康影響,如果使用計(jì)算機(jī)視覺技術(shù)代替人們來進(jìn)行工作,會(huì)大大減少工作人員的工作強(qiáng)度,同時(shí)也保證了工作效率。

(二)管理職工人員

圖書館中職工人員的正常有序的工作是保證圖書館正常運(yùn)行的關(guān)鍵之處,在進(jìn)行圖書館職工人員的管理上可以引用計(jì)算機(jī)視覺技術(shù)。以往的職工簽到可能會(huì)出現(xiàn)代簽現(xiàn)象,而計(jì)算機(jī)視覺技術(shù)可以采用圖像視覺處理技術(shù)對(duì)職員進(jìn)行磁卡、眼膜、人臉識(shí)別等進(jìn)行簽到,杜絕了以往簽到工作所存在的弊端。同時(shí),在圖書館工作處理中,計(jì)算機(jī)視覺技術(shù)也可以幫助職工人員處理一些難題,讓圖書館工作能夠有序高效的進(jìn)行。

(三)監(jiān)控檢測(cè)系統(tǒng)

如今圖書館的書籍是完全向人們開放的,人們可以自由進(jìn)行借閱,以往的人工檢測(cè)會(huì)造成猜疑和尷尬,也會(huì)加大圖書館管理人員與讀者之間的磨擦。計(jì)算機(jī)視覺技術(shù)的使用可以全自動(dòng)化進(jìn)行監(jiān)控和檢測(cè),避免了以往人工監(jiān)測(cè)所出現(xiàn)的問題。圖書館的書籍借閱管理工作異常重要,計(jì)算機(jī)視覺技術(shù)可以全程自動(dòng)化進(jìn)行高效工作,可以進(jìn)行無人看管檢測(cè)讀者進(jìn)出攜帶書籍文獻(xiàn)和借閱空間的監(jiān)控等,大大提高了工作效率,讓圖書館的借閱工作順利有序的進(jìn)行。

三、視覺技術(shù)在圖書館工作中的應(yīng)用問題的研究

(一)循序漸進(jìn)的結(jié)合

計(jì)算機(jī)視覺作為一個(gè)新興技術(shù),雖然已經(jīng)被運(yùn)用到各個(gè)領(lǐng)域內(nèi),但是在引進(jìn)入圖書館的管理中,如果想要快速的取代傳統(tǒng)的管理模式,無論是工作人員還是工作理念都不可能及時(shí)接受這種改變的。新技術(shù)的融入必須要循序漸進(jìn),找到與傳統(tǒng)的管理模式的結(jié)合點(diǎn),然后進(jìn)行慢慢磨合,達(dá)到與傳統(tǒng)相結(jié)合的效果,這樣人們才能夠接受一種新技術(shù)的使用,不僅提高了工作效率減輕了工作人員的工作負(fù)擔(dān),也能夠更好的發(fā)揮出計(jì)算機(jī)視覺技術(shù)的真正作用。

(二)提高專業(yè)人員的業(yè)務(wù)水平

新的技術(shù)需要新的業(yè)務(wù)水平來支持,如果沒有相應(yīng)的業(yè)務(wù)水平是沒有辦法發(fā)揮出新技術(shù)應(yīng)有的作用。計(jì)算機(jī)視覺技術(shù)通過計(jì)算機(jī)成像系統(tǒng)來代替人類的視覺感官,能夠自主適應(yīng)環(huán)境、自主工作的能力。計(jì)算機(jī)視覺技術(shù)在不斷的更新中,它的使用功能也是越來越多,操作方法越來越復(fù)雜,這時(shí)就需要圖書館的工作人員對(duì)計(jì)算機(jī)視覺技術(shù)有細(xì)的了解,能夠熟練操作和運(yùn)用計(jì)算機(jī)視覺技術(shù)。圖書館管理階層應(yīng)該組織工作人員進(jìn)行培訓(xùn)工作,讓他們接收新的知識(shí)掌握新的技術(shù),不斷的提高圖書館工作人員的業(yè)務(wù)水平,才能夠保證圖書館工作高效進(jìn)行。

(三)讀者素質(zhì)和應(yīng)用手段的提高

現(xiàn)代化圖書館要想實(shí)現(xiàn)工作和服務(wù)的全面自動(dòng)化,就需要有現(xiàn)代化技術(shù)的支持,計(jì)算機(jī)視覺技術(shù)的引用雖然是一個(gè)現(xiàn)代化技術(shù)的支持,但是如今僅停留在生物特征的識(shí)別領(lǐng)域。比如圖書館如今普遍有門禁系統(tǒng),這也僅停留在計(jì)數(shù)功能和監(jiān)控可沖消磁條的識(shí)別和認(rèn)定上,如果有些讀者素質(zhì)不高故意去掉這些生物識(shí)別,圖書館的門禁系統(tǒng)就沒有辦法阻止這些讀者的進(jìn)入進(jìn)出。因此,提高讀者的素質(zhì)和計(jì)算機(jī)視覺技術(shù)的應(yīng)用手段,才能夠保證計(jì)算機(jī)視覺技術(shù)在圖書館被廣泛的進(jìn)行使用。

結(jié)束語

計(jì)算機(jī)視覺技術(shù)作為新興的綜合性技術(shù),被運(yùn)用到工業(yè)、農(nóng)業(yè)、醫(yī)學(xué)、軍事、體育等各個(gè)領(lǐng)域,它的出現(xiàn)代替了人類去完成不可能的工作,開拓了人類的視野,提高了工作效率和深度,讓人類從不適應(yīng)的工作環(huán)境中解放出來。計(jì)算機(jī)視覺被稱為自動(dòng)化的眼睛,對(duì)周圍的空間物體有著傳感、抽象、判斷的能力,它能夠從根本上改變?nèi)藗兊乃季S方式。

雖然如今計(jì)算機(jī)視覺技術(shù)在圖書館的應(yīng)用中僅處于初始層面,但是每項(xiàng)新的技術(shù)的引用不都是循序漸進(jìn)需要一個(gè)過渡時(shí)段嗎?計(jì)算機(jī)視覺技術(shù)雖然進(jìn)入了瓶頸時(shí)期,但是相信在不斷的提高和完善下,一定會(huì)突破瓶頸期進(jìn)入到迅猛發(fā)展的時(shí)期。計(jì)算機(jī)視覺技術(shù)的提高,能夠讓圖書館更好的發(fā)揮其作用,讓人們能夠更快更方便的利用圖書館汲取不同的知識(shí),同時(shí)也能夠加快學(xué)術(shù)的發(fā)展和社會(huì)的進(jìn)步。

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺圖像精密測(cè)量下的關(guān)鍵技術(shù)

摘 要近代測(cè)量使用的方法基本上人工測(cè)量,但人工測(cè)量無法一次性達(dá)到設(shè)計(jì)要求的精度,就需要進(jìn)行多次的測(cè)量再進(jìn)行手工計(jì)算,求取接近設(shè)計(jì)要求的數(shù)值。這樣做的弊端在于:需要大量的人力且無法精準(zhǔn)的達(dá)到設(shè)計(jì)要求精度,對(duì)于這種問題在現(xiàn)代測(cè)量中出現(xiàn)了計(jì)算機(jī)視覺精密測(cè)量,這種方法集快速、精準(zhǔn)、智能等優(yōu)勢(shì)于一體,在測(cè)量中受到了更多的追捧及廣泛的使用。

【關(guān)鍵詞】精密測(cè)量 計(jì)算機(jī)視覺圖像 關(guān)鍵技術(shù)

在現(xiàn)代城市的建設(shè)中離不開測(cè)量的運(yùn)用,對(duì)于測(cè)量而言需要精確的數(shù)值來表達(dá)建筑物、地形地貌等特征及高度。在以往的測(cè)量中無法精準(zhǔn)的進(jìn)行計(jì)算及在施工中無法精準(zhǔn)的達(dá)到設(shè)計(jì)要求。本文就計(jì)算機(jī)視覺圖像精密測(cè)量進(jìn)行分析,并對(duì)其關(guān)鍵技術(shù)做以簡析。

1 概論

1.1 什么是計(jì)算機(jī)視覺圖像精密測(cè)量

計(jì)算機(jī)視覺精密測(cè)量從定義上來講是一種新型的、非接觸性測(cè)量。它是集計(jì)算機(jī)視覺技術(shù)、圖像處理技術(shù)及測(cè)量技術(shù)于一體的高精度測(cè)量技術(shù),且將光學(xué)測(cè)量的技術(shù)融入當(dāng)中。這樣讓它具備了快速、精準(zhǔn)、智能等方面的優(yōu)勢(shì)及特性。這種測(cè)量方法在現(xiàn)代測(cè)量中被廣泛使用。

1.2 計(jì)算機(jī)視覺圖像精密測(cè)量的工作原理

計(jì)算機(jī)視覺圖像精密測(cè)量的工作原理類似于測(cè)量儀器中的全站儀。它們具有相同的特點(diǎn)及特性,主要還是通過微電腦進(jìn)行快速的計(jì)算處理得到使用者需要的測(cè)量數(shù)據(jù)。其原理簡單分為以下幾步:

(1)對(duì)被測(cè)量物體進(jìn)行圖像掃描,在對(duì)圖像進(jìn)行掃描時(shí)需注意外借環(huán)境及光線因素,特別注意光線對(duì)于儀器掃描的影響。

(2)形成比例的原始圖,在對(duì)于物體進(jìn)行掃描后得到與現(xiàn)實(shí)原狀相同的圖像,在個(gè)步驟與相機(jī)的拍照原理幾乎相同。

(3)提取特征,通過微電子計(jì)算機(jī)對(duì)掃描形成的原始圖進(jìn)行特征的提取,在設(shè)置程序后,儀器會(huì)自動(dòng)進(jìn)行相應(yīng)特征部分的關(guān)鍵提取。

(4)分類整理,對(duì)圖像特征進(jìn)行有效的分類整理,主要對(duì)于操作人員所需求的數(shù)據(jù)進(jìn)行整理分類。

(5)形成數(shù)據(jù)文件,在完成以上四個(gè)步驟后微計(jì)算機(jī)會(huì)對(duì)于整理分類出的特征進(jìn)行數(shù)據(jù)分析存儲(chǔ)。對(duì)于計(jì)算機(jī)視覺圖像精密測(cè)量的工作原理就進(jìn)行以上分析。

1.3 主要影響

從施工測(cè)量及測(cè)繪角度分析,對(duì)于計(jì)算機(jī)視覺圖像精密測(cè)量的影響在于環(huán)境的影響。其主要分為地形影響和氣候影響。地形影響對(duì)于計(jì)算機(jī)視覺圖像精密測(cè)量是有限的,基本對(duì)于計(jì)算機(jī)視覺圖像精密測(cè)量的影響不是很大,但還是存在一定的影響。主要體現(xiàn)在遮擋物對(duì)于掃描成像的影響,如果掃描成像質(zhì)量較差,會(huì)直接影響到對(duì)于特征物的提取及數(shù)據(jù)的準(zhǔn)確性。還存在氣候影響,氣候影響的因素主要在于大風(fēng)及光線影響。大風(fēng)對(duì)于掃描儀器的穩(wěn)定性具有一定的考驗(yàn),如有稍微抖動(dòng)就會(huì)出現(xiàn)誤差不能準(zhǔn)確的進(jìn)行精密測(cè)量。光線的影響在于光照的強(qiáng)度上,主要還是表現(xiàn)在基礎(chǔ)的成像,成像結(jié)果會(huì)直接導(dǎo)致數(shù)據(jù)結(jié)果的準(zhǔn)確性。

2 計(jì)算機(jī)視覺圖像精密測(cè)量下的關(guān)鍵技術(shù)

計(jì)算機(jī)視覺圖像精密測(cè)量下的關(guān)鍵技術(shù)主要分為以下幾種:

2.1 自動(dòng)進(jìn)行數(shù)據(jù)存儲(chǔ)

在對(duì)計(jì)算機(jī)視覺圖像精密測(cè)量的原理分析,參照計(jì)算機(jī)視覺圖像精密測(cè)量的工作原理,對(duì)設(shè)備的質(zhì)量要求很高,計(jì)算機(jī)視覺圖像精密測(cè)量儀器主要還是通過計(jì)算機(jī)來進(jìn)行數(shù)據(jù)的計(jì)算處理,如果遇到計(jì)算機(jī)系統(tǒng)老舊或處理數(shù)據(jù)量較大,會(huì)導(dǎo)致計(jì)算機(jī)系統(tǒng)崩潰,導(dǎo)致計(jì)算結(jié)果無法進(jìn)行正常的存儲(chǔ)。為了避免這種情況的發(fā)生,需要對(duì)于測(cè)量成果技術(shù)進(jìn)行有效的存儲(chǔ)。將測(cè)量數(shù)據(jù)成果存儲(chǔ)在固定、安全的存儲(chǔ)媒介中,保證數(shù)據(jù)的安全性。如果遇到計(jì)算機(jī)系統(tǒng)崩潰等無法正常運(yùn)行的情況時(shí),應(yīng)及時(shí)將數(shù)據(jù)進(jìn)行備份存儲(chǔ),快速還原數(shù)據(jù)。在對(duì)于前期測(cè)量數(shù)據(jù)再次進(jìn)行測(cè)量或多次測(cè)量,系統(tǒng)會(huì)對(duì)于這些數(shù)據(jù)進(jìn)行統(tǒng)一對(duì)比,如果出現(xiàn)多次測(cè)量結(jié)果有所出入,系統(tǒng)會(huì)進(jìn)行提示。這樣就可以避免數(shù)據(jù)存在較大的誤差。

2.2 減小誤差概率

在進(jìn)行計(jì)算機(jī)視覺圖像精密測(cè)量時(shí)往往會(huì)出現(xiàn)誤差,而導(dǎo)致這些誤差的原因主要存在于操作人員與機(jī)器系統(tǒng)故障,在進(jìn)行操作前操作員應(yīng)對(duì)于儀器進(jìn)行系統(tǒng)性的檢查,再次使用儀器中的自檢系統(tǒng),保證儀器的硬件與軟件的正常運(yùn)行,如果硬軟件出現(xiàn)問題會(huì)導(dǎo)致測(cè)量精度的誤差,從而影響工作的進(jìn)度。人員操作也會(huì)導(dǎo)致誤差,人員操作的誤差在某些方面來說是不可避免的。這主要是對(duì)操作人員工作的熟練程度的一種考驗(yàn),主要是對(duì)于儀器的架設(shè)及觀測(cè)的方式。減少人員操作中的誤差,就要做好人員的技術(shù)技能培訓(xùn)工作。讓操作人員有過硬過強(qiáng)的操作技術(shù),在這些基礎(chǔ)上再建立完善的體制制度。利用多方面進(jìn)行全面控制誤差。

2.3 方便便攜

在科學(xué)技術(shù)發(fā)展的今天我們?cè)谏町?dāng)中運(yùn)用到東西逐漸在形狀、外觀上發(fā)生巨大的變大。近年來,對(duì)于各種儀器設(shè)備的便攜性提出了很高的要求,在計(jì)算機(jī)視覺圖像精密測(cè)量中對(duì)設(shè)備的外形體積要求、系統(tǒng)要求更為重要,其主要在于人員方便攜帶可在大范圍及野外進(jìn)行測(cè)量,不受環(huán)境等特殊情況的限制。

3 計(jì)算機(jī)視覺圖像精密測(cè)量發(fā)展趨勢(shì)

目前我國國民經(jīng)濟(jì)快速發(fā)展,我們對(duì)于精密測(cè)量的要求越來越來高,特別是近年我國科技技術(shù)的快速發(fā)展及需要,很多工程及工業(yè)方面已經(jīng)超出我們所能測(cè)試的范圍。在這樣的前景下,我們對(duì)于計(jì)算機(jī)視覺圖像精密測(cè)量的發(fā)展趨勢(shì)進(jìn)行一個(gè)預(yù)估,其主要發(fā)展趨勢(shì)有以下幾方面:

3.1 測(cè)量精度

在我們?nèi)粘I钪?,我們常用的長度單位基本在毫米級(jí)別,但在現(xiàn)在生活中,毫米級(jí)別已經(jīng)不能滿足工業(yè)方面的要求,如航天航空方面。所以提高測(cè)量精度也是計(jì)算機(jī)視覺圖像精密測(cè)量發(fā)展趨勢(shì)的重要方向,主要在于提高測(cè)量精度,在向微米級(jí)及納米級(jí)別發(fā)展,同時(shí)提高成像圖像方面的分辨率,進(jìn)而達(dá)到我們預(yù)測(cè)的目的。

3.2 圖像技術(shù)

計(jì)算機(jī)的普遍對(duì)于各行各業(yè)的發(fā)展都具有時(shí)代性的意義,在計(jì)算機(jī)視覺圖像精密測(cè)量中運(yùn)用圖像技術(shù)也是非常重要的,在提高圖像處理技術(shù)做以提高。同時(shí)工程方面遙感測(cè)量的技術(shù)也是對(duì)于精密測(cè)量的一種推廣。

4 結(jié)束語

在科技發(fā)展的現(xiàn)在,測(cè)量是生活中不可缺少的一部分,測(cè)量同時(shí)也影響著我們的衣食住行,在測(cè)量技術(shù)中加入計(jì)算機(jī)視覺圖像技術(shù)是對(duì)測(cè)量技術(shù)的一種革新。在融入這種技術(shù)后,我相信在未來的工業(yè)及航天事業(yè)中計(jì)算機(jī)視覺圖像技g能發(fā)揮出最大限度的作用,為改變?nèi)藗兊纳钭龀鼋艹龅呢暙I(xiàn)。

作者單位

常州信息職業(yè)技術(shù)學(xué)院 江蘇省常州市 213164

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的人臉檢測(cè)與識(shí)別技術(shù)初探

隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,計(jì)算機(jī)已深入到社會(huì)的各個(gè)領(lǐng)域,并深刻的改變?nèi)藗兊墓ぷ?、學(xué)習(xí)和生活方式。信息的獲取、分析、處理、、應(yīng)用能力已經(jīng)成為社會(huì)中人們的一個(gè)必備的技能。多媒體技術(shù)也在發(fā)生著日新月異的變化,包括這多媒體技術(shù)的基本概念、圖像、音頻、視頻、動(dòng)畫的常用處理工具等。其中人臉檢測(cè)與識(shí)別技術(shù)在計(jì)算機(jī)視覺方面也是尤為重要的,人臉檢測(cè)與識(shí)別技術(shù)主要是用于身份信息的識(shí)別,也可以用來對(duì)個(gè)人的隱私信息通過識(shí)別來進(jìn)行保護(hù)。

誕生于20世紀(jì)40年代的電子計(jì)算機(jī)是人類最偉大的發(fā)明之一。并且一直以飛快的速度發(fā)展著。進(jìn)入21世紀(jì)的現(xiàn)代社會(huì),計(jì)算機(jī)已經(jīng)進(jìn)入各個(gè)行業(yè),并成為各行業(yè)必不可少的工具。如今的計(jì)算機(jī)發(fā)展的更加智能化,就如今來說,人們最什么事情都非常重視信息,人類和社會(huì)的發(fā)展,時(shí)刻都離不開信息。計(jì)算機(jī)如今重視的方面就是對(duì)信息的閱讀和控制,人臉檢測(cè)與識(shí)別技術(shù)也是應(yīng)運(yùn)而生。

人臉識(shí)別的論述

人臉識(shí)別是人類視覺中的一大特色,因?yàn)槟軐?duì)身邊的人進(jìn)行識(shí)別,才不會(huì)對(duì)身邊的信息進(jìn)行混淆,簡單來說,根據(jù)人臉可以對(duì)人的年齡,性別進(jìn)行初步判斷。隨著計(jì)算機(jī)技術(shù)的智能化,計(jì)算機(jī)業(yè)已經(jīng)通過視覺能進(jìn)行人臉的識(shí)別。其中在對(duì)人臉識(shí)別的同時(shí)進(jìn)行有關(guān)信息的收集、識(shí)別、提取、變換、存儲(chǔ)、傳遞、處理、檢索、檢測(cè)、分析和利用等技術(shù)。如今人臉識(shí)別已經(jīng)應(yīng)用于很多的領(lǐng)域,但是要人臉檢測(cè)與識(shí)別是需要基于本來已經(jīng)收集和整理的信息本庫才能進(jìn)行。再加上現(xiàn)在計(jì)算機(jī)技術(shù)雖然已經(jīng)接近成熟,然而在人臉識(shí)別方面的表情傳達(dá)出什么信息還是無從下手進(jìn)行編程和設(shè)計(jì)。所以,基于計(jì)算機(jī)視覺的人臉檢測(cè)與識(shí)別技術(shù)還是會(huì)有很廣的發(fā)展空間,再加上人臉識(shí)別還可以維護(hù)人們的財(cái)產(chǎn)安全和隱私保護(hù),必然會(huì)引起社會(huì)各界人士的廣泛關(guān)注。

從19世紀(jì)末開始就已經(jīng)有人對(duì)人臉識(shí)別進(jìn)行了研究,因?yàn)楫?dāng)時(shí)沒有先進(jìn)的科學(xué)技術(shù)做后盾,所以經(jīng)過了數(shù)百年的研究仍然沒有什么顯著的進(jìn)展和成果。直到20世紀(jì)90年代人臉識(shí)別才成立了自己的學(xué)科,在加上當(dāng)時(shí)的科技發(fā)展水平已經(jīng)達(dá)到了不錯(cuò)的水平,人臉識(shí)別這個(gè)學(xué)科得到了快速的發(fā)展。如今,我國的計(jì)算機(jī)技術(shù)也已經(jīng)居于世界的前列,我國也已經(jīng)擁有比較完善的一套東方面孔的人臉數(shù)據(jù)庫。

人臉識(shí)別在發(fā)展過程中大概經(jīng)歷了三個(gè)階段:第一階段就是對(duì)人臉特征進(jìn)行整理,整理出所需要的數(shù)據(jù)庫,并且應(yīng)用當(dāng)時(shí)的計(jì)算機(jī)技術(shù)做出一套質(zhì)量不錯(cuò)的人臉灰度模型,這個(gè)階段的識(shí)別工作全部由操作人員來完成;第二階段比第一階段要先進(jìn),有了基礎(chǔ)人機(jī)互交,將人臉的特征經(jīng)過多維度的矢量在模型上表示出來,并也可以設(shè)計(jì)出一套人臉識(shí)別的系統(tǒng),這個(gè)階段的識(shí)別不再是僅僅依靠操作人員,而是操作者和計(jì)算機(jī)一起完成;第三個(gè)階段是計(jì)算機(jī)智能識(shí)別的最高峰,一切操作和識(shí)別都依靠機(jī)器全自動(dòng)化進(jìn)行,在人臉識(shí)別過程中也不再是每臺(tái)計(jì)算機(jī)都需要完成一整套的工作,也實(shí)現(xiàn)了計(jì)算機(jī)與計(jì)算機(jī)之間的互聯(lián),多臺(tái)計(jì)算機(jī)一起完成人臉識(shí)別的過程,都人力也是一種解放。

積極踐行人臉檢測(cè)識(shí)別技術(shù)

人臉檢測(cè)識(shí)別技術(shù)是計(jì)算機(jī)實(shí)現(xiàn)智能化特征后的又一重要發(fā)展方向之一,它已經(jīng)在世界范圍內(nèi)得到了廣泛的普及與應(yīng)用。人們可以通過人臉識(shí)別來進(jìn)行定位,來起到保護(hù)人們財(cái)產(chǎn)安全的作用,通過人臉識(shí)別來抵制社會(huì)中的造假率,之前曾經(jīng)有一些不法分子利用假身份來做損害公共利益和侵犯人們隱私權(quán)的事情,有了人臉識(shí)別讓不法分子沒有可乘之機(jī),也應(yīng)用人臉識(shí)別來對(duì)財(cái)務(wù)密碼進(jìn)行聯(lián)系,起到對(duì)人們的財(cái)產(chǎn)有絕對(duì)的保護(hù)作用,對(duì)社會(huì)的安定何嘗不是一項(xiàng)有意義的發(fā)明。

人臉識(shí)別一直是計(jì)算機(jī)智能化發(fā)展過程中的一個(gè)重要領(lǐng)域,因?yàn)槿四樀淖R(shí)別與檢測(cè)是一個(gè)很難做到完善的項(xiàng)目,由于人類的面部表情豐富,要對(duì)人類的面部表情做出判斷和分析會(huì)存在一定的困難。再加上人臉識(shí)別的過程中,每個(gè)獨(dú)立存在的個(gè)體都有一張專屬于自己的臉。它的輪廓沒有明顯的特征界限,同時(shí)對(duì)眼、鼻子、嘴等器官在臉上的分布情況也沒有明確的界限,這就使得對(duì)人臉識(shí)別來進(jìn)行算法設(shè)計(jì)有一定的困難,所以只有通過輪廓特征來進(jìn)行初步的判斷,分辯出各種器官,再根據(jù)器官來完成人臉的分布情況設(shè)計(jì)灰度模型的完成工作。

隨著紅外光的可利用率提高,也應(yīng)用到了人臉識(shí)別的領(lǐng)域,在人臉識(shí)別過程中也加入不同光的效果來識(shí)別人臉,使得如今的人臉識(shí)別的準(zhǔn)確度有了明顯的提高。但是光的效果是不可控的,在環(huán)境不適宜和用戶不配合的情況下,利用紅外光技術(shù)來進(jìn)行人臉識(shí)別又會(huì)將準(zhǔn)確度拉到很低的成度。因此,在人臉檢測(cè)與識(shí)別方面仍然有一些尚未解決的問題,值得人們關(guān)注和探索。

科學(xué)的進(jìn)步、時(shí)代的進(jìn)步,必將給發(fā)展賦予新的內(nèi)容。這個(gè)社會(huì)已經(jīng)成為了一個(gè)信息化社會(huì),信息化代表了一種信息技術(shù)被高度重視,信息資源被高度共享,從而使得人的智力和潛力以及社會(huì)物質(zhì)資源潛力被充分發(fā)揮。在這個(gè)信息化社會(huì)中最重要的就是信息。個(gè)人信息已經(jīng)成為在社會(huì)中必備的物質(zhì)。如此看來信息的保護(hù)也成為了發(fā)展的頭等大事,基于計(jì)算機(jī)視覺的人臉檢測(cè)與識(shí)別技術(shù)也有了發(fā)展的獨(dú)特性,它的獨(dú)特性由這個(gè)時(shí)代所決定。

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺創(chuàng)新研究的探索者

人類正在進(jìn)入后信息時(shí)代,計(jì)算機(jī)越來越廣泛地進(jìn)入到幾乎所有的科技和生活領(lǐng)域?,F(xiàn)代計(jì)算機(jī)具有強(qiáng)大的功能和運(yùn)行速度,但與人腦相比,其智能化程度仍有待提高。如何讓計(jì)算機(jī)具有類人腦的學(xué)習(xí)與分析能力,擁有“視覺”“聽覺”,并可通過“思考”與人類溝通交流,是當(dāng)今世界計(jì)算機(jī)視覺研究領(lǐng)域各國科學(xué)家不斷追求和探索的目標(biāo)。

計(jì)算機(jī)視覺是人工智能領(lǐng)域的優(yōu)秀之一,其研究的終極目標(biāo)是讓機(jī)器具有人一樣的視覺功能。西安交通大學(xué)電子與信息工程學(xué)院楊國安教授在計(jì)算機(jī)視覺領(lǐng)域沉心研究多年,為計(jì)算機(jī)視覺的發(fā)展提供了豐富的理論基礎(chǔ)。

“西安交通大學(xué)鄭南寧院士是圖像處理、計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域的國際知名專家,是他2001年把我從日本引進(jìn)回來的。”這是楊國安選擇計(jì)算機(jī)視覺和圖像處理領(lǐng)域的契機(jī)。在該領(lǐng)域,楊國安主要研究新型的小波變換、多尺度幾何分析和壓縮感知理論,對(duì)這些最前沿的理論進(jìn)一步地改進(jìn),以提高圖像分析與理解的能力、計(jì)算機(jī)視覺模型的精度、大數(shù)據(jù)的模式分類的效率以及互聯(lián)網(wǎng)圖像檢索的正確識(shí)別率。

留學(xué)回國后,楊國安在鄭南寧院士團(tuán)隊(duì)參與完成了多項(xiàng)國家項(xiàng)目,包括國家自然科學(xué)基金創(chuàng)新研究群體項(xiàng)目“智能化視覺信息處理理論與實(shí)現(xiàn)技術(shù)”,國家自然科學(xué)基金重點(diǎn)項(xiàng)目“高效可伸縮視頻編解碼基礎(chǔ)理論與方法研究”,國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃項(xiàng)目“視覺信息環(huán)境感知與識(shí)別關(guān)鍵技術(shù)”,國家科技支撐計(jì)劃項(xiàng)目“數(shù)字媒體內(nèi)容互通共用關(guān)鍵技術(shù)”,國家高技術(shù)研究發(fā)展計(jì)劃項(xiàng)目“基于離散小波變換的JPEG2000圖像處理及場景數(shù)據(jù)實(shí)時(shí)傳輸”等。其中,在國家科技支撐計(jì)劃項(xiàng)目中,楊國安取得國家發(fā)明專利“一種分布式多格式數(shù)字視頻轉(zhuǎn)碼結(jié)構(gòu)設(shè)計(jì)方法”的正式授權(quán)。該項(xiàng)專利開發(fā)出了一種分布式多格式數(shù)字視頻轉(zhuǎn)碼結(jié)構(gòu)設(shè)計(jì)新方法:對(duì)源視頻文件解復(fù)用后將視頻進(jìn)行快速無縫分割,通過動(dòng)態(tài)調(diào)度程序,將視頻片段以及音頻文件發(fā)送到各個(gè)轉(zhuǎn)碼計(jì)算機(jī)上進(jìn)行快速多格式轉(zhuǎn)碼,在輸入某一種格式的視頻后只需解碼一次,便能輸出多種格式的碼流,并且能對(duì)輸出碼流進(jìn)行很好的碼率控制,最后收集轉(zhuǎn)碼后的視頻片段進(jìn)行無縫拼接并與轉(zhuǎn)碼后的音頻文件復(fù)用。該項(xiàng)專利不僅改善了像素域級(jí)聯(lián)轉(zhuǎn)碼器的轉(zhuǎn)碼效率,也增強(qiáng)了視頻轉(zhuǎn)碼后的質(zhì)量,并在我國相關(guān)電視廠家得到實(shí)際應(yīng)用,取得了良好的社會(huì)和經(jīng)濟(jì)效益。

目前,罟安正在主持國家自然科學(xué)基金項(xiàng)目“基于生物視覺稀疏編碼特性和顯著性特征的多尺度幾何分析紋理模型研究”。他介紹說,今后的研究重點(diǎn)將是進(jìn)一步研究基于多尺度幾何分析和脈沖耦合神經(jīng)網(wǎng)絡(luò)的生物視覺模型,并將其應(yīng)用到大數(shù)據(jù)的模式識(shí)別以及互聯(lián)網(wǎng)圖像檢索上。

學(xué)術(shù)方面,楊國安有木哿Γ砥礪前行。他長期兼任IEEE Transactionson Signal ProcessingENeural Networks等世界頂級(jí)期刊的通信評(píng)審專家,并在IEEE,Elsevier和springer等知名期刊和國際會(huì)議上發(fā)表SCI和EI收錄論文30余篇,其中SCI收錄8篇,EI收錄21篇,取得國家專利2項(xiàng),出版“十一五”至“十三五”規(guī)劃教材各1部,為碩士和博士研究生開設(shè)課程,培養(yǎng)碩士研究生和博士研究生30余名,2016年2月又培養(yǎng)出交通大學(xué)歷史上第一位日本博士留學(xué)生。

在科研的世界里,只有腳踏實(shí)地,持續(xù)奮斗與攀登,才可能收獲點(diǎn)點(diǎn)星光。在20余年的研究工作中,楊國安亦是如此勉勵(lì)自己,不斷創(chuàng)新,突破傳統(tǒng)。相信在未來,他一定能收獲一片屬于他的星空。

主站蜘蛛池模板: 嘉祥县| 日土县| 汤阴县| 白城市| 灌云县| 平舆县| 大同县| 莱阳市| 察哈| 白城市| 晋城| 图们市| 广德县| 五莲县| 南城县| 荣成市| 磴口县| 天津市| 溧水县| 遂川县| 如东县| 台南县| 贵南县| 丁青县| 浪卡子县| 岑溪市| 光泽县| 绥棱县| 黔东| 白朗县| 江阴市| 大竹县| 偃师市| 彰武县| 于田县| 仁化县| 宁武县| 昭通市| 金门县| 收藏| 丰顺县|