前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺的應用方向主題范文,僅供參考,歡迎閱讀并收藏。
近年來,經濟的發展和人們生活水平的提升也使得人們的出行更加便捷,越來越多的人都是自己駕車出行,這樣導致公路上的交通流量不斷增加,如何保障交通的順暢性和安全性成為人們關注的重點問題。信息技術的發展推動了計算機視覺技術的出現,為交通安全性的提升提供了一定的保障。本文主要對計算機視覺技術進行分析,進一步探討計算機視覺技術在智能交通系統中的應用。
【關鍵詞】計算機 視覺技術 智能交通 系統 應用
智能交通系統簡稱ITS,這是一種新型的交通管理系統。該系統主要結合了信息化技術、計算機技術以及數據傳輸技術等多種技術,用來對整個交通運輸體系進行管理,可以實現人、車、路的全面監控和管理。計算機視覺藝術作為智能交通系統中的一個重要環節,受到相關工作人員的高度重視。隨著計算機視覺技術的發展,不僅為交通行業的發展提供了更多的便捷,同時還能夠篩選道路交通的各種信息,進一步增強了智能交通系統的靈活性和準確性。
1 計算機視覺技術的概述
計算機視覺也被稱為圖像分析和圖解理解,其包括的理論主要有攝影幾何學、概率論、圖像處理理論以及人工智能理論等部分。計算機視覺技術主要是用二維投影圖像實現三維物體重構。這種技術的應用范圍比較廣泛,不僅應用于二維圖像識別方面,同時還用于三維物體的識別和重建上面。通過計算機視覺技術能夠獲取專業化的三維信息,對三維信息的獲取一般有兩種方法,其中一種是直接獲取法,還有一種是間接獲取法。直接獲取法主要是通過計算機視覺技術的效果來確定三維運動中產生的各種參數,這一過程對攝像機運動問題的關注程度較高;間接獲取的方式就是將單幅圖像和攝像機焦距相結合,來判斷被測量位置視覺上的信息。計算機視覺技術的關鍵就是實現特別匹配,在特殊情況下可以利用不同的攝像C同時收集運動信息,從而提高相關控制的精確度。
2 計算機視覺技術在智能交通系統中的應用
計算機視覺技術在智能交通系統中的應用可以實現道路交通的監控,同時還能夠實現自動收費、智能導航等功能,主要應用有以下幾個方面的內容。
2.1 交通監控中對計算機視覺技術的應用
基于計算機視覺技術的交通監控系統主要分為三個步驟,首先是對車輛和行人進行跟蹤和分割,其次是對車流量進行分析和計算,并且計算車輛的平均速度和道路上車輛的隊列長度,最后根據道路的交通狀況來規劃形式線路,從而有效緩解道路交通擁堵的現狀,方便人們減少出行時間。車輛和行人作為道路中運動的主要目標,在監控場合下,需要對運動時間進行有效分割,常用到的分割方式包括光流法和幀差法兩種,其中前一種分割方式主要是依據圖像中不同的運動用映射參數正確的表達,這樣可以將具有同樣映射參數的光流量進行分配,從而完成參數分割。計算機視覺在交通監控中的應用主要是對車輛速度、車輛數目、車輛分類進行檢測。隨著計算機通信技術的發展,計算機視覺技術也是日新月異,基于計算機視覺的交通監控系統具有較強的實時工作性,能夠快速的適應高度公路以及城市道路交通的監控。
2.2 車輛導航中對計算機視覺技術的應用
實現車輛的智能導航是計算機視覺技術在智能交通中應用的典型案例。這種技術主要為駕駛人員提供道路信息和車輛運行狀況兩大信息。通過車輛智能導航系統的運行能夠對道路兩邊的界限進行有效的識別,將車輛引向規定的行駛車道,在車輛行駛過程中,該系統能夠自動檢測車輛與前方其他車輛之間的距離,從而提醒駕駛人員保持車輛的安全距離,最終實現安全導航駕駛。通過該系統的攝像機運動能夠識別其他車輛的行駛狀況,并且通過計算檢測點的方式計算車輛的模擬匹配點。車倆智能導航系統中就使用了計算機視覺技術,可以從中提取相關信息,計算車輛行駛的安全距離和速度。
2.3 計算機視覺技術用于車輛輔助駕駛
計算機視覺技術在車輛輔助駕駛中的應用主要是幫助駕駛人員對外界的變化做出反應。具體表現為車輛在市內行駛時,計算機視覺技術的應用能夠識別周邊道路的標記,并且對交通標志、其他車輛和行人進行識別,然后篩選相關信息進行計算,讓駕駛人清楚外界的具體狀況,從而避開其他的車輛和行人,能夠從根本上減少交通事故的發生,增強車輛的安全運行。輔助駕駛的形式轉變為人機交互的方式,一定程度上能夠滿足駕駛人員對信息的需求。
2.4 計算機視覺技術用于車輛智能收費
車輛收費是車輛在公共交通位置行駛中的一個關鍵環節。隨著科學技術的發展,車輛收費系統逐漸向著計算機技術的應用方向發展,計算機視覺技術在各地區交通發展中的應用是現代化交通發展的一個重要突破口。很多地區的智能化收費都是通過識別車牌的方式來實現收費,我國在車牌識別這方面僅僅限制于單目車牌和雙目車牌的識別,其中單目車牌識別的核心就是將車牌照位置作為核心部分,我國大部分地區都是將單目系統作為核心部分來使用。采用雙目系統對車牌進行識別,也可以對車輛的型號進行識別,通過大量的實踐發現,雙目系統進行車牌識別的實用性較強。但是這種識別方式在實際應用過程中仍然存在著信息獲取難度大、車牌照定位難度大等多種問題,尤其是車輛在高速路上行駛時,對于車牌信息的獲取更為困難,因此,在這方面還需要加大研究和實踐。
3 結束語
隨著計算機視覺技術的智能化發展,其在智能交通系統中的應用能夠解決多方面的問題。該技術的應用不僅能夠實現車輛的實時監控,同時還能夠實現車輛導航以及車輛收費,幫助駕駛人員識別車輛行駛中存在的障礙物,這樣一來,可以增強車輛行駛的安全性,同時還能夠提高我國道路交通系統的整體管理水平。但是該技術應用中也存在不足之處,未來發展中需要降低視覺系統的價格,減少系統的尺寸,從而增強系統對車輛信息的處理速度,最終實現對道路交通的全面監測。
參考文獻
[1]王春波,張衛東,許曉鳴.計算機視覺技術在智能交通系統中的應用[J].測控技術,2000(05):22-24.
[2]郁梅,蔣剛毅,郁伯康.智能交通系統中的計算機視覺技術應用[J].計算機工程與應用,2001(10):101-103+121.
[3]顧晶. 基于計算機視覺的智能交通監控系統的研究[D].東南大學,2006.
[4]謝萍萍,黃傳春.計算機視覺技術在智能交通系統中的應用[J].福建電腦,2008(10):77+133.
物體為什么會呈現出人們所看到的視覺效果?經過多重反射后,光線將怎樣變化?如何讓計算機把真實世界里的物理原理數字化表現出來?這些都是松下康之在微軟亞洲研究院工作時要思考的問題,攝像機拍攝出的畫面抖動看不清怎么辦?松下康之也遇到過生活提出的小挑戰。
松下康之用研究員的“專屬語言”解釋道,“低層視覺研究”和“滿幀視頻穩定技術”可以很好地回答和解決上面問題。“這也正是我所從事的兩個研究方向:一個是光度學,另一個是視頻分析,”微軟亞洲研究院視覺計算組主管研究員松下康之說,“兩者之間并沒有十分緊密的聯系,但這也正是有趣的地方。”
從東京大學的博士到微軟亞洲研究院實習生、從日本東京到北京的希格瑪大廈、從電氣工程學專業到以物理學為基礎的計算機視覺和視頻分析與合成。事實上,這種“毫無關系”所帶來的驚喜與巧合也貫穿于松下康之的經歷之中。于是,松下康之給記者講述了一個充滿偶然與必然、選擇與堅持的故事。言語間,流露出日本文化的嚴謹、美國式的活潑和與在微軟亞洲研究院的中國研究員一樣的親切與隨和。
邂逅未來
微軟亞洲研究院院長洪小文曾說過:“創新更多的是意外”。而松下康之與微軟亞洲研究院的緣分,正是充滿著這種“必然的意外”。
在東京大學讀書的時候,松下康之本科、碩士、博士的專業方向都是電氣工程。那時,松下康之已經研究了智能交通系統。“但是,我意識到自己想做一些更加基礎的研究,并且希望可以把這些研究應用到不同的事情上。”在博士畢業前兩年,松下康之就發現了自己對計算機視覺領域的濃厚興趣。而電氣工程與計算機科學聯系緊密,計算機系統結構和軟件都有學習,所以對于松下康之來說,從電氣工程轉到計算機視覺并不是一個很大的跨越。
2002年,當時松下康之還在讀博,在一次國際性的計算機視覺大會上,他見到了時任微軟亞洲研究院副院長的沈向洋,“我之前就認識他,還知道他在計算機視覺領域非常有名。我希望能有機會與他一起工作,學到更多東西。”于是,松下康之向沈向洋毛遂自薦,“意外地”成了一名微軟亞洲研究院的實習生,經過4個月的實習生活之后,松下康之發現自己已經喜歡上了這里的研究環境和生活,就這樣,在微軟亞洲研究院的工作開始了。
如何用科技來解決實際問題,從而改變更多人的生活,一直是微軟亞洲研究院的初衷。生活也不斷地給松下康之帶來靈感和意外的收獲。
其中,“滿幀視頻穩定技術”的“誕生”就源于松下康之的婚禮――用手持的攝像機拍攝的婚禮畫面是搖晃的,看起來很不舒服,新婚妻子對婚禮錄像效果很不滿意,松下康之就想通過研究解決視頻顫抖的問題。“現有的數字影像鑲嵌技術可以對畫面進行穩定性處理,但如果物體移動,這種在場景固定的情況下才能實現的方法就不可行了。而通過‘滿幀視頻穩定技術’,丟失掉的像素被自然的補充上了。”同理,還可以去除覆蓋在視頻上的文字、鏡頭上的污點,來補上丟失的像素。
科技的光影魔術
“視頻分析在不久的將來將變得更加重要,因為圖像和視頻的界限已經越來越模糊,我相信最后一切都將變成視頻。”松下康之對記者說。
微軟亞洲研究院的計算機視覺包括:高層視覺(如人臉識別技術)和低層視覺(如光度學,即研究光線與物體的相互作用),松下康之的研究方向屬于后者。
“光度學也非常重要,因為如果我們不明白‘低層’上發生了什么,就無法在‘高層視覺’研究上取得突破,所以‘低層視覺’研究是非常基礎的。如果“低層視覺”發展了,那么“高層視覺”也會隨之發展。”
雖然是“肉眼”難以察覺的變化,但是松下康之卻給記者描述了光度學形象的應用――3D復原和現實物體數字化。而要實現上面的兩項應用,很明顯需要比普通人更特別的“視力”。
“計算機視覺里有一個傳統的方法,叫多視角立體視覺法(multi-view stereo),通過不同視角拍攝的圖片我們可以重現3D,但不能做細節的重現;還有另一種方法,叫立體光學法(photometric stereo),攝像機和物體都是固定的,但是光線是變化的,如果移動光源就可以得到物體的不同觀察值,通過觀察值可以得到表面方向(surface orientation)。”
前者可以得到整體的形狀,但卻無法得到細節,而后者不能給你整體的形狀,因為它只能給你表面方向。如何把兩個技術的優點結合起來得到最真實的3D圖像呢?
“我們考慮如果把一個持續光源固定在攝像機上,這樣我們就可以同時移動光源和攝像機。”于是,松下康之和他來自東京大學的實習生一起做出了看起來與普通家用數碼產品沒有太大差別的“3D攝像機”。“這個3D攝像機的相關的配件在市場上很容易就能買到,手持永遠是簡單的,人們不會想要拿著一個龐然大物。”松下康之向記者介紹研發背后的原因。
文化熔爐
作為美國電氣電子工程師協會2009年計算機視覺與模式識別國際會議(CVPR)和2009年計算機視覺國際會議(ICCV)的區域主席、著名期刊International Journal of Computer Vision(IJCV)和Computer Vision Applications(CVA)的編委,松下康之坦言,微軟亞洲研究院對研究員在專業領域的自由交流的支持,使得研究員對自己的研究領域“看得更遠、更透徹”。
“通過這些職務,我對研究方向有了更高的認識,這種視野能夠幫助我決定今后什么樣的研究更有價值。此外,我能夠認識計算機視覺界的很多人,這是另一個收獲。”松下康之笑著說。
關鍵詞:計算機視覺;案例推理;圖像處理;圖像描述
中圖分類號:TP391.41 文獻標識碼:A文章編號:1009-3044(2007)04-11102-03
1 引言
基于案例推理(case-base reasoning)是人工智能中正不斷發展的一項重要推理技術。基于案例推理與類比推理方法相似,案例推理將舊經驗或教訓轉換為知識,出現新問題時,首先查找以前是否有相似的案例,并用相似案例解決新問題。如果沒遇到相似案例的,經過推理后解決新問題的方法,又會成為新的案例或新經驗,下一次再遇到相同問題時,就可以復用這些案例或經驗。
這與人遇到問題時,首先會用經驗思考解決問題的方式相似,這也是解決問題較好的方法。基于案例推理應用于工業產品檢測或故障診斷時具有以下特點:
CBR智能化程度較高。利用案例中隱含的難以規則化的知識,以輔助規則推理的不足,提高故障診斷系統的智能化程度。
CBR較好解決“知識獲取”的瓶頸。CBR知識表示以案例為基礎,案例的獲取比規則獲取要容易,大大簡化知識獲取的過。
CBR求解效率較高。是對過去的求解結果進行復用,而不是再次從頭開始推導,可以提高對新問題的求解效率。
CBR求解的質量較高。CBR以過去求解成功或失敗的經歷,可以指導當前求解時該怎樣走向成功或避開失敗。
CBR持續不斷的學習能力,使得它可以適應于將來問題的解決。
所以基于案例推理方法正不斷應用在產品質量檢測和設備故障診斷方面,并取得較好的經濟效益。為了產品檢測和設備故障診斷中,更為智能化,更容易實現現場檢測和診斷,計算機視覺技術起到很大的作用。
計算機視覺是研究用計算機來模擬人和生物的視覺系統功能的技術學科,使計算機具有感知周圍視覺世界的能力。通過計算機視覺,進行圖像的獲取預處理、圖像分割與特征抽取、識別與分類、三維信息理解、景物描述、圖像解釋,讓計算機具有對周圍世界的空間物體進行傳感、抽象、判斷的能力,從而達到識別、理解的目的。
計算機視覺隨著科學技術發展,特別計算機技術、通信技術、圖像采集技術、傳感器技術等,以及神經網絡理論、模糊數學理論、小波的分析理論等計算機視覺理論的不斷發展和日趨成熟,使計算機視覺從上世紀60年代開始興起發展到現在,取得快速發展,已經從簡單圖像質量處理發展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉向運動,由二維轉向三維,并主要著眼于對圖像的識別和理解上,也使計算機視覺的應用領域更為廣泛,為案例推理中運用計算機視覺打下基礎。
2 案例推理系統的主要關鍵技術
(1)案例的表示與組織
案例的表示與組織即是如何抽取案例的特征變量,并以一定的結構在計算機中組織存儲。如何將信息抽取出特征變量,選擇什么語言描述案例和選擇什么內容存放在案例中,案例按什么組織結構存放在存儲器中,這關系到基于案例推理方法的效率,而且對于案例數量越來越多,結構十分復雜的案例庫,尤其重要。
(2)案例的索引與檢索
案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫中檢索并選擇潛在可用相似案例。后面的工作能否發揮出應有的作用,很大程度上依賴于這一階段得到的案例質量的高低,因此這一步非常關鍵。
(3)案例的復用和調整
案例的復用即是如何根據舊案例得出新解,涉及到找出案例與新問題之間的不同之處,案例中的哪些部分可以用于新問題,哪些部分不適合應用于新問題的解決。而復用還分案例的結果復用,案例的求解方法復用。
(4)案例的學習
案例的學習即是將新解添加到案例庫中,擴充案例庫的案例種類與數量,這過程也是知識獲取。此過程涉及選取哪些信息保留,以及如何把新案例有機集成到案例庫中,包括如何存儲,如何建立索引等等。
針對案例推理的關鍵技術,根據檢測和故障診斷系統的特點,計算機視覺主要解決如何將產品圖像輸入系統,如何將產品圖像特征進行抽取和描述,如何區別產品不同之處。以便案例推理系統進行案例建模,確立案例的表示形成和案例相似度的計算。本文主要從計算機視覺如何運用在案例推理系統進行探討。
3 產品輸入系統
產品輸入系統在不同產品類型和生產環境可能有不同之處,主要應有傳感器單元和圖像采集單元。如圖1。
圖1 產品輸入系統結構
傳感器單元主要判斷是否有產品存在,是否需要進行圖像采集,是否繼續下一個產品圖像的采集。這簡單傳感器可使用光電開關,配合光源,當產品經過時,產品遮擋住光源,使光電開關產生一個0值,而沒有產品經過時,光電開關產生相反的1值,系統通過判斷光電開關的值,從而判斷是否有產品。
圖像采集單元簡單地說是將產品拍攝并形成數字化圖像,主要包括光源、反射鏡、CCD相機和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機主要是拍攝設備。圖像采集卡主要是將圖像數字化。通過傳感器判斷有產品后,光源發出的光均勻地照在被測件上,CCD相機拍攝,拍攝圖像經過圖像采集卡數字化后輸入存儲設備。存儲設備即為計算機硬盤。存放原始圖像、數據、處理結果等。
這是案例推理系統的原始數據,是圖像處理、圖像特征抽取描述的基礎。
4 圖像處理
在案例推理系統中,需要對案例的組織和案例建模,案例的組織即案例的表示,相對計算機而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區別其它圖像,具有唯一性。同時,又能完整地表示該圖像。所以案例的表示要體現案例的完整性、唯一性、操作容易性。
圖像中有顏色區別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說圖像內部包含表示的本質,即圖像的描述。根據圖像特點,確立圖像案例的表示,以圖像的像素、圖像的數字化外觀、圖像物體的數字組成等屬性。這需要對產品輸入的原始圖像進行處理。
在計算機視覺技術中,對原始圖像主要進行圖像增強、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。經過這些處理后,輸出圖像的質量得到相當程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進行分析、處理和識別。具體工作流程如圖2所示:
圖2 計算機視覺的任務與工作流程
圖像預處理是將產品的數字圖像輸入計算機后,首先要進行圖像的預處理,主要完成對圖像噪聲的消除以及零件的邊緣提取。預處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。
圖像二值化處理主將灰度圖形二值化的關鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據灰度直方圖中兩峰之間的谷值作為閾值來分割目標和背景。
圖像的平滑處理技術即圖像的去噪聲處理,主要是為了去除實際成像過程中因成像設備和環境所造成的圖像失真,提取有用信息。
圖像邊緣提取是為了將圖像中有意義的對象與其背景分開,并使之具有某種指定的數學或符號表達形式,使計算機能夠理解對象的具體含義,檢測出邊緣的圖像就可以進行特征提取和形狀分析了。可采用多種算法,如采用Sobel算子提取邊緣。
圖像預處理是為下一步的特征描述打基礎,預處理的好壞直接影響案例推理的結果和檢測診斷的效率。
特征提取是對圖像進行描述,是案例建模關鍵,案例建模是根據案例組織要求抽取圖像特征,是建立案例索引和檢索的關鍵。如果圖像沒有特征,就談不上進行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產品、產品形狀大小、產品顏色,產品有什么缺陷、產品缺陷在什么位置等特征,根據這些圖像特征進行描述,形成計算機中屬性值,并從數據庫查找相應信息資料,從而確定產品之間的關系,相似度,也就是案例推理的方向。
5 系統的檢索
根據案例推理原理和相應算法,建立案例推理系統模型,如圖3所示。
圖3 案例推理系統
對話系統:完成人機交互、問題描述、結果顯示和系統總控制。
案例庫系統:由案例庫及案例庫管理系統組成。
數據析取系統:對各種已有的源數據庫的數據通過轉換而形成所需的數據。
多庫協同器:根據問題求解的需要,按照一定的數據抽取策略,完成問題求解過程中對模型庫系統、方法庫系統、知識庫系統和數據庫系統等資源的調度與協調。
知識庫系統:由產生式規則組成,這些知識包括專家經驗和以規則形式表示的有關知識,也可以是數據挖掘結論,支持案例檢索、案例分析、案例調整等。 模型庫系統:由模型庫、算法庫、模型庫管理系統組成。完成模型識別和調用,并把結果綜合,送入對話系統顯示,作為補充信息供案例檢索、調整使用。
數據庫系統:存放待決策支持的所有問題,并完成其維護與查詢等功能。
由于系統主要應用產品的現場實時檢測監控或故障診斷,所以系統的檢索時,也必須輸入檢索值,即輸入現場產品的圖像,在通過產品預處理、圖像的二值化、分割和邊界處理后,進行圖像特征描述,根據圖像描述進行分類識別。根據案例推理的算法檢索案例庫中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結果,并將案例的解輸出,給相關控制系統進行決策。如產品質量檢測,確定產品質量是否合格,是否有不合格產品,不合格產品是什么原因造成,故障源是什么,如何解決和排除故障,等等。
6 結論
案例推理方法有效地解決計算機視覺技術中圖像檢索問題。對提高圖像檢索的效率和準確度提供了平臺。
計算機視覺技術也為案例推理系統實現產品現場實時檢測、監控、診斷提供技術支持。計算機視覺技術現場的數據采集、處理為案例推理打好基礎。
兩者的結合設計的系統適用范圍很廣,只要產品需要進行質量檢測、監控,或設備需要進行故障診斷和維護,都可以適用。
系統提供的實時檢測、監控和診斷功能,提高企業的生產效益,降低了生產成本。
參考文獻:
[1](美)桑肯(Sonka,M).圖像處理分析與機器視覺[M].人民郵電出版社.
[2]王宏等譯.計算機視覺[M].電子工業出版社.
[3]蔡建榮.自然場景下成熟水果的計算機視覺識別[J].農業機械,36(2):61-64.
[4]王宇輝.基于計算機視覺的錐體零件尺寸在線檢測算法[J].重型機械,2005,2:4-6
[5]駱志堅.基于計算機視覺檢測技術自動計數系統的研究與應用[J].儀表技術與傳感器,2005,3:41-43.
[6]左小德.貼近度分析法在案例庫推理中的應用[J],南大學學報(自然科學版),1997,18(1):21-26.
[7]姜麗紅.案例推理在智能化預測支持系統中的應用研究[J].決策與決策支持系統,1996,6(4):63-69.
農業機械化不僅是人類的解放,解放勞動力。這些年輕的勞動力投入到其他領域,促進中國的經濟發展可以提高農業生產的效率,優化操作質量和增加作物產量,有利于農業發展和農民收入,因此,今后應重視先進技術的推廣,提高農業機械化水平。目前農業機械的使用,一些機械在使用過程中不能清楚地確定作物的位置,機器在關閉過程中很容易錯過,所以利用新技術在農業機械有利于彌補農業機械的脆弱性,提高機器的運作效率。
目前,高新技術的應用范圍擴大,農業機械行業也開始使用高新技術,引入計算機視覺技術、自動控制技術、信息網絡技術、人工智能技術、機器人技術和液壓技術在農業機械的應用現狀。
2 農業機械的應用技術
2.1 農業機械的應用計算機視覺技術
農業機械的應用計算機視覺技術,主要是利用計算機視覺技術在農產品質量、品位等農業產品檢查,是基于圖像處理,計算機視覺的學科,主要是視覺信息處理理論。表達和計算方法研究,近年來,圖像處理,計算機硬件和軟件,等可視化仿真技術的逐漸發展計算機視覺技術的使用功能也擴大,計算機視覺技術是用來檢查農產品的質量不僅是現階段和分級產品還用于收割、種植等。
2.2 農業機械的CAD技術
CAD技術在我國已廣泛應用于機械工程設計制造從上個世紀60年代,我國40多年后獨立研究開發和推廣應用。但由于我國機械工程設計CAD系統的開發過程的社會主義改革開放的影響,以便后期的完美程度我國機械工程設計CAD系統程度的效率和其他性能大大受到限制,相對于我國的國外機械工程設計CAD系統仍處于較低水平。
2.3 農業機械的信息網絡技術
信息網絡技術在農業機械中的應用非常成功,信息網絡技術和地理信息系統,結合自動化技術等技術,可以監測作物和土壤的農業生產,也可以生產作物的發展,植物病蟲害,和實時監控等等,然后依靠定位系統和地理信息系統來完成現場操作。
農業機械、機器人技術應用、信息網絡、計算機視覺、自動控制技術的融合。目前,已經開發了采摘機器人,嫁接機器人,機器人除草,施肥機器人噴涂機器人,等。對肥料和噴涂機器人的使用,可以避免肥料、殺蟲劑和其他化學品危害人體,達到改善環境的目的。目前雖然我國機器人技術落后于發達國家,取得了一些就,但由于現代機械機器人的購買成本非常高,所以這項技術并沒有得到普及。
在農業機械的設計、制造和測試,虛擬現實技術具有非常廣闊的發展前景,利用虛擬現實技術建立三維模型的農業機械設計師不僅可以了解每一個部分的質量,也可以完全滿足的每一部分的運行性能三維農業機械模型具有很高的精度,和農業機械制造商大規模生產的計算機數據的基礎上。
在虛擬制造系統中,虛擬現實技術的基礎,虛擬制造系統是由多種學科知識,利用計算機技術綜合建模、仿真、生產、制造汽車。與此同時,虛擬制造系統還可以制定合理的產品檢驗和測試程序。目前,虛擬制造技術應用范圍廣泛,涉及開始工裝及模具生產設備,和其他領域,可以在生產部門系統,在這一過程中完成建模、修改、分析和優化的四個工作。此外,虛擬現實技術用于柔性制造系統和計算機集成制造系統的設計。
2.4 人工智能技術
近年來,全球高端技術獲得了農業機械在農業的快速發展,管理,挖掘和采摘等實現智能化,使用人工智能技術研究和開發的激光拖拉機、內部導航設備,等等,可以拖拉機的方向和具置測量,并通過建立計算機數據庫將記錄相關數據,使用數據庫了解排水位置、土壤濕度、等等。了解土地信息后,制定合理的土地種植方案,計算機化化肥消費,數量的農藥和種子。
3 先進技術的應用在農業機械化操作的保障措施
得到更好的應用程序為了促進先進技術,提高農業機械化水平,未來應該完善的技術推廣體系,提高農業機械化水平,促進農業生產和發展。完善的技術推廣體系,高度重視農業技術推廣,建立試驗示范基地,發揮作用的指導,讓農民參觀和學習。讓他們意識到農業機械設備的重要作用,加強農業機械化的意識,接受和使用機械設備,技術推廣和培訓活動。讓廣大農民掌握農業機械和設備的使用,提高思想認識和應用技能、農業機械和農業技術應用于農業生產。
構建技術環境,當地政府應該高度重視農業機械和農業技術推廣的作用。提高思想認識,加強規劃和指導,增加資本投資,培訓專業人才,創新工作方法,對許多人來說,完善的技術推廣體系,認真履行職責,并擴大先進技術的影響。完善法律法規,充分利用其在技術和人才優勢,重視技術的宣傳和推廣活動,增強服務意識,擴展廣泛的服務渠道,更好的滿足實際工作的需要,對農業技術的發展,為推廣農業機械和設備創造便利。
4 農業機械新技術的發展
農業機械新技術的應用和發展是為了提高農業的生產力服務,所以農業機械新技術的發展主要是以下幾點:
首先,加快新技術的使用和推廣。科學技術是第一生產力,加快計算機視覺技術、自動控制技術和智能技術等新技術在農業機械的使用,同時引進國外先進的機械、新技術,促進我國農業的發展,提高農業的生產效率具有重要意義。
第二,政府補貼。購買新機器的個人組織生產、資本壓力,使得他們很難機械技術推廣,所以對于農業機械推廣使用新技術,政府將給予補貼材料,擴大新機器的使用。
第三,提高農業資源的利用效率。機械使用以提高農業生產的效率,提高農業資源的利用率。例如,在傳統的農業生產過程中,和處理農作物秸稈,絕大多數情況下燃燒,不僅浪費資源,還污染空氣。但農業機械的使用新技術的農作物秸稈粉碎加工、作物秸稈可以轉化成脂肪不僅材料,提高農業資源的使用效率,也減少了空氣污染。
關鍵詞:印制電路板;圖像處理;機器視覺;PCB裸板;自動光學檢測;缺陷檢測 文獻標識碼:A
中圖分類號:TP391 文章編號:1009-2374(2016)09-0010-05 DOI:10.13535/ki.11-4406/n.2016.09.005
我國是全球第一大PCB生產基地,作為電子產品承載體的電路板,其集成度和產量不斷在提高。為了保證電子產品的性能,電路板缺陷檢測技術已經成為電子行業中非常關鍵的技術。建立在圖像處理算法基礎上的機器視覺檢測技術與傳統的人工檢測技術相比,提高了缺陷檢測的效率和準確度。因此,設計一種高效精準的機器視覺檢測電路板缺陷的系統,具有非常重要的現實意義。評估印刷電路板質量的一個重要因素就是表觀檢測,PCB的表觀質量對產品性能及成品使用安全有著極大的重要性。而伴隨著近年來在工業生產領域崛起的計算機視覺,當前表觀缺陷檢測和分類識別的研究方向已經轉向了利用計算機視覺技術來實現。計算機圖像處理識別技術這種基于計算機視覺的檢測技術成功取代了傳統的PCB缺陷檢測方法,在自動光學檢測系統眾多應用中占據了相對重要的地位,一躍成為PCB生產業表觀缺陷的主要檢測方法。
圖1 系統框圖
因此本文通過設計AOI自動光學檢測系統,搭建較為簡單的PCB缺陷自動檢測系統的實驗平臺,對PCB中四類較為關鍵、常見的缺陷進行檢測、分析、識別、判定,為研究推廣PCB缺陷自動檢測系統開拓應用前景,如能實現工業上的產業化檢測,將有高額的經濟收益。本文側重對PCB中的四類較為關鍵、常見的缺陷進行檢測、分析、識別、判定,并且僅搭建了較為簡單的PCB缺陷自動檢測系統的實驗平臺,即通過復雜算法對采集到的圖像進行處理、配準、對比,從而得出PCB缺陷類型及對其進行標識。如圖1所示。
1 硬件設計方案
PCB缺陷檢測的總體系統設計方案主要是基于自動光學檢測技術來搭建PCB缺陷檢測系統,硬件設計是使用CNC-T程控光源高精度影像測試系統操作臺,對待測電路板進行圖像采集,再通過VS2010軟件所編寫程序處理,得出待測電路板的缺陷種類。整個系統主要分為運動控制、光源、圖像采集、圖像處理四個模塊,分模塊簡要闡述了實驗過程、所需設備以及軟件算法,搭建了一個相對完整的系統工作平臺。
圖2 CNC-T程控光源影像操作臺
該設備具有測量元素種類齊全、手動測量、自動對焦等多種功能,使用該設備采集圖像進行二維檢測,測量軟體為YR-CNC,將圖像儲存至電腦后便由VS軟件進行圖像處理。實驗組成如圖3所示:
圖3 實驗系統框圖
1.1 運動控制模塊
本系統運動流程為:被檢測的PCB在檢測臺上,通過步進電機XY軸運動到攝像機拍攝區域,CCD攝像機固定在工作臺上方(Z軸),通過Z軸的運動實現聚焦。如圖4所示:
圖4 平臺運動示意圖
設備工作臺臺面尺寸為746mm×506mm,承載玻璃面尺寸為452mm×354mm,有效測量行程為400×300×200。本裝置既可通過軟件驅動自動采集圖像,也可以通過手動控制,移動并聚焦采集待測PCB的圖像。
1.2 光源模塊
輔助光照――采用的是正向和背向光源這兩種輔助光照。其中正光源和攝像頭同側,均位于Z軸上,正光源主要用于檢測待測物體的表面特征。背光源位于檢測臺面下方,與正光源處于同軸反向關系,背光源能突出待測物體的輪廓特征,常用于檢測物體輪廓尺寸。
圖像采集:分別利用正光源突出PCB表面如走線、過孔和焊盤等主要特征,而下光源主要使PCB的輪廓尺寸和過孔產生強烈的輪廓對比。
光源:使用的是高度集中照明光源中心的LDR系列,由于該光源的傘狀結構緊密排列著LED且采用了CCS獨創的柔性板,使之成為LED照明系統的標準模式。照明系統如圖5所示:
圖5 照明系統
1.3 圖像采集模塊
圖像采集模塊是由圖像采集卡、相機和鏡頭組成的,該模塊是圖像配準階段的硬件基礎。計算機采集圖像的媒介就是相機,而相機按照不同原理又分為多種,常見的有CCD(Charge Coupled Device)和CMOS(Complementary Metal Oxide Semiconductor)兩類。本系統采用的是CCD 1/2英寸43萬像素彩色攝像頭和高清晰度0.7~4.5X變焦倍率鏡頭,顯示分辨率為0.001mm。
1.4 圖像處理模塊
通常獲得的圖像將受到工業現場環境、光照等條件的干擾,計算機所獲得的圖像質量多數參差不齊,圖像的清晰度不一致,大大增加了PCB缺陷檢測的難度,所以在利用復雜算法檢測、識別PCB缺陷前要先對圖像進行預處理。
本圖像處理模塊主要通過VS軟件在OpenCV計算機視覺庫的基礎上,通過一系列算法對圖像進行處理對比。
2 系統軟件設計
2.1 OpenCV
OpenCV(Open Source Computer Vision Library)是一個跨平臺的可以運行在Linux、Windows和Mac OS操作系統上的基于(開源)發行的計算機視覺庫。它重量輕而高效,開放了多種接口如MATLAB、Ruby和Python等,并且在計算機視覺和圖像處理中大多數通用的算法都是被允許的。OpenCV可用于開發實時圖像處理、計算機視覺和模式識別方案,它提供了多種函數,實現了大量的計算機視覺算法,算法涵蓋了從最基礎的濾波至以高級的物體檢測。OpenCV實際上是一堆C和C++語言源代碼文件,許多常見的計算機視覺算法由這些源代碼文件實現。如C接口函數cvCanny()實現Canny邊緣檢測算法。它可直接加入到我們自己的軟件項目編程中,而無需去編寫自己的Canny算子代碼,就是沒有必要重復“造輪子”。
根據OpenCV中源代碼文件巨多的特點,以算法的功能為基準,將這些源文件分到多個模塊中,如core、imgproc、highgui等。將每個模塊中的源文件編譯成一個庫文件(如opencv_core.lib、opencv_imgproc.lib、opencv_highgui.lib等),用戶在使用時,僅需在自己的項目中添加要用的庫文件,與自己的源文件一起連接成可執行程序即可。
OpenCV計算機視覺庫的出現,是為了使人們利用方便快捷的計算機視覺框架,在計算機視覺領域可以更加輕松地設計出更為復雜的應用程序。OpenCV涵蓋了多種計算機視覺應用區域,如用戶界面、信息安全、醫學影像學、工廠產品檢驗、立體視覺、機器人和攝像機標定等,約有500多個函數。因為計算機視覺與機器學習是相輔相成的,所以OpenCV也開放了MLL(Machine Learning Library)機器學習庫。MLL除了在視覺任務相關中使用,也可以很容易地應用到其他機器學習中。
2.2 Microsoft Visual Studio2010
Visual Studio是微軟公司推出的開發環境,是同行業中目前最流行的Windows平臺應用程序開發環境。Visual Studio 2010于2010年4月12日,其集成開發環境(IDE)已被重新設計和組織,變得更簡單了。
Visual Studio 2010同時帶來了NET Framework 4.0、Microsoft Visual Studio 2010 CTP(Community Technology Preview――CTP),并且支持開發面向Windows 7的應用程序。除了Microsoft SQL Server外,它還支持IBM DB2和Oracle數據庫。目前有專業版、高級版、旗艦版、學習版和測試版五個版本。Visual Studio的用處十分廣泛,不僅可被用來基于Windows平臺創建Windows應用程序和Web應用程序,還可被用來創建智能設備、Office插件和Web服務等應用程序。微軟的Visual Studio 2010將成為一個版本的經典,這是相當于6.0版本。該版本可以自定義開始頁,新功能還包括:(1)C# 4.0中的動態類型和動態編程;(2)多顯示器支持;(3)使用Visual Studio 2010的特性支持TDD;(4)支持Office;(5)Quick Search特性;(6)C++ 0x新特性;(7)IDE增強;(8)使用Visual C++ 2010創建Ribbon界面;(9)新增基于.NET平臺的語言F#。本課題將基于OpenCV計算機視覺庫使用Microsoft Visual Studio2010開發環境,通過編輯算法實現PCB缺陷檢測。
3 圖像預處理
要使用計算機對圖像進行處理,所得到的連續圖像就必須被轉換為離散的數據集,這是因為計算機只能處理離散度數據,這一過程我們稱之為圖像采集。圖像采集由圖像采集系統實現,如圖6所示。圖像采集系統的三個主要模塊是成像系統、采樣系統和量化器。
圖6
將整理出的字符圖像交予識別模塊來識別,被稱為圖像的預處理。PCB的圖像預處理包括灰度化、增強、濾波、二值化、配準等,處理后的PCB輸出的圖像質量將得到改善,在很大程度上使得該圖像特征更直觀,方便計算機分析和處理。PCB的圖像預處理為整個PCB缺陷檢測系統的核心部件,很大程度上決定了檢測的準確性。圖像預處理流程如圖7所示:
圖7 圖像預處理流程圖
4 PCB缺陷檢測
本文針對四種常見缺陷:斷路、短路、毛刺(凸起)、缺損(凹陷)進行檢測研究。在這四種缺陷中,最為嚴重的缺陷類型是斷路和短路,它們將會使整塊板子失去本來的功能;而凸起、凹陷也可能影響到PCB在使用過程中的穩定性能。如圖8所示為幾種常見的缺陷:
圖8 常見電路板缺陷
4.1 PCB缺陷的檢測方法
常用的PCB缺陷檢測方法有參考法和非參考法兩種。要是從概念理解和電路難易程度看,參考法明顯更加具有概念直觀、電路簡單的優勢;要是從檢測所需要的條件來看,非參考法則在不需要待測PCB與標準PCB進行準確對準這一點上優于參考法。
本課題采用參考法進行PCB缺陷檢測。
使用參考法對PCB缺陷進行檢測的流程為:(1)確定標準的PCB圖像并放入參考庫;(2)通過成像設備采集待測PCB圖像,進行圖像預處理之后,再二值化PCB待測圖像,并對其進行連通域提取;(3)然后將處理結果與標準圖像進行對比,利用圖像相減來判斷PCB可能存在的缺陷;(4)進行分類,確定缺陷類型。
4.2 圖像連通域
像素是圖像中最小的單位,每個像素周圍有8個鄰接像素,常見的鄰接關系有兩種:4鄰接與8鄰接。4鄰接一共4個點,即上下左右。包括對角線位置的點,8鄰接的點一共有8個,如圖9所示:
圖9 領域示圖
如果像素點A與B鄰接,我們稱A與B連通,即有如下的結論:
如果A與B連通、B與C連通,則A與C連通。在視覺上看來,點與點相互連通,形成一個區域,而不是連通的點形成不同的區域。這種相互立體的所有的點,我們稱為連通區域。連通區域標記常用的方法有Two-Pass(兩遍掃描法)和Seed Filling(種子填充法)兩種方法,本課題主要介紹第二種。
Seed Filling來源于計算機圖形學,通常應用在填充圖形上。思路:以一個前景像素當作種子,而后在處于同一像素值且位置相鄰的連通區域,把和種子相鄰的前景像素融合到同一組像素中,結果將是獲得一個像素集,即連通區域。接下來介紹使用種子填充法實現的連通區域分析法:
第一,重復掃描圖像,當得到當前像素點B(x,y)=1時停止:(1)賦予B(x,y)一個label,并將像素位置作為種子,接著將所有位于該種子周圍的前景像素都壓入棧中;(2)將棧頂像素賦以相同的label值并彈出,接著將全部位于棧頂像素周邊的前景像素都壓入棧中;(3)重復(2)步驟,直到棧為空。此時,圖像B中的一個像素值被標記為label的連通區域便被找到了。
第二,在掃描結束前,重復第一個步驟,由此可以獲得圖像B中所有的連通區域在掃描結束后。
掃描所得的連通域如圖10所示:
圖10 圖像連通域提取
4.3 缺陷識別
缺陷識別具體特征如表1所示:
表1 缺陷特征
缺陷種類 二值圖像面積 連通區域數
斷路 減少 增加
短路 增加 減少
凸起 增加 不變
凹陷 減少 不變
第一,短路和斷路。在出現短路缺陷時,待測圖像與標準圖像相比,其所包含的連通區域數將會減少。同理可得,在出現斷路缺陷時,待測圖像與標準圖像相比,其所包含的連通區域數將會增多。因此,斷路和短路缺陷便可利用比較連通區域數來判定和識別。
第二,凸起和凹陷。凸起缺陷將導致導線和導線、導線和其他導體間的間隙變小,而凹陷缺陷將導致導線和導線、導線和其他導體間的間隙變大,二者均會導致PCB使用過程中出現不穩定狀態。而觀察可知,這兩種缺陷的連通區域相同,差別在于各自二值化面積的大小,所以可以通過計算該待測圖像的連通區域面積來識別凸起、凹陷缺陷。
識別過程:將經過圖像預處理的待測PCB圖像與標準圖像進行對比后,通過算法找出缺陷。比較二者的連通區域數,若前者大于后者,則標定該缺陷點為斷路,反之則為短路;若二者連通區域數相同,則比較二值化圖像面積,若前者大于后者,則標定該缺陷點為凸起,反之則為凹陷。檢測流程如圖11所示:
圖11 PCB缺陷檢測流程圖
5 系統實驗
本文使用CNC-T程控光源高精度影像測試系統操作臺,結合VS2010軟件基于OpenCV計算機視覺庫的算法編程來實現PCB的缺陷檢測。整體實驗過程為:手動控制操作臺捕捉、聚焦、采集待測PCB的圖像,采集到的圖像與標準圖像進行對比、識別,得出缺陷種類并顯示結果。
本課題一共就所研究缺陷類型,做了40組實驗,通過實驗結果計算正確率。如表2所示:
表2 實驗結果統計
缺陷類型 實驗次數 正確率
斷路 10 100%
短路 10 100%
凸起 10 100%
凹陷 10 100%
針對不同電路板圖中出現的同種斷路類型進行檢測,效果如圖12a、圖12b、圖12c所示,可準確檢測出缺陷存在。
圖12
針對不同電路板圖中出現的同種短路類型進行檢測,效果如圖13a、圖13b、圖13c所示,可準確檢測出缺陷存在。
圖13
針對不同電路板圖中出現的同種凸起類型進行檢測,效果如圖14a、圖14b、圖14c所示,可準確檢測出缺陷存在。
圖14
針對不同電路板圖中出現的同種凹陷類型進行檢測,效果如圖15a、圖15b、圖15c所示,可準確檢測出缺陷存在。
圖15
6 結語
PCB板面向體積越來越小、密度越來越高的方向發展。在檢測產品價格方面,國外AOI檢測產品價格普遍偏高,而由于經濟原因,在國內PCB板生產制造商多數仍采用人工目測等傳統檢測方法檢測。隨著經濟的發展,數字圖像處理研究的深入,自動光學檢測系統也開始頻繁活躍在人們視線中,但在PCB缺陷檢測方面的應用卻還有待完善。因此,本論文建立在深入掌握工控系統結構并從PCB板的質量標準、圖像特點、缺陷特征及檢測要求的分析基礎上,對以圖像處理為基礎的PCB缺陷檢測技術進行了深入研究。由于PCB缺陷自動檢測系統的研究涉及多個領域的知識,其研究過程十分耗時、繁瑣,由此,本論文僅僅對PCB缺陷檢測中較為常見的問題進行了較深入研究,并且僅搭建了較為簡單的PCB缺陷自動檢測系統的實驗平臺,對PCB中的四類較為關鍵、常見的缺陷進行檢測、分析、識別、判定。雖然還未實現真正實現工業上產業化檢測,但是在未來幾十年中,研究推廣的PCB缺陷自動檢測系統將有十分良好的應用前景,也將有高額的經濟收益。
參考文獻
[1] 陳勝勇,劉盛,等.基于OpenCV的計算機視覺技術實現[M].北京:科學出版社,2008.
[2] Gary Bradski,Adrian Kaebler,于仕琪,等.學習OpenCV[M].北京:清華大學出版社,2009.
[3] 周長發.精通Visual C++圖像處理編程(第3版)
[M].北京:電子工業出版社,2006.
[4] 黨振.中國大陸PCB產業的現狀與未來[J].印制電路信息,2006,32(1).
[5] 胡躍明,譚穎.自動光學檢測在中國的應用現狀和發展[J].微計算機信息,2006,(4).
[6] 李漢,何星,等.印刷電路板的自動光學檢測系統
[J].無損檢測,2004,26(6).
[7] 張利,高永英,等.PCB板檢測中的定位研究[J].中國圖像圖形學,1999,4(8).
[8] 姚立新,張武學,等.AOI系統在PCB中的應用[J].電子工業專用備,2004,(5).
[9] 范小濤,夏雨人.一種基于圖像處理的PCB檢測算法研究[J].計算機工程與應用,2004,(13).
[10] 傅莉.印制電路板的發展及前景[J].電腦與電信,2010,(5).
[11] 張明軒.基于視頻序列的人臉檢測與跟蹤算法研究[D].中北大學,2011.
[12] 張馳.基于機器視覺的智能控制與圖像識別問題研究[D].蘭州理工大學,2009.
[13] 謝飛.基于計算機視覺的自動光學檢測關鍵技術與應用研究[D].南京大學,2013.
[14] 張靜.PCB表觀缺陷的自動光學檢測理論與技術
[D].電子科技大學,2013.
[15] 俞瑋.AOI技術在PCB缺陷檢測中的應用研究[D].電子科技大學,2007.
【關鍵詞】OpenCV視覺庫 圖像處理 Android平臺
Opencv全稱:Open Source Computer Vision Library,是一個可以移植到其他開發工具中的一個跨平臺的圖像處理視覺庫,它由C++語言編寫,主要有C++、C語言接口,為了能在手機等移動端更方便的進行圖像處理,我們利用其JAVA接口將opencv視覺庫添加到Android的開發工具中,實現了在移動端的圖像處理功能。
1 opencv的特點
(1)跨平臺,有很好的移植性。Opencv由跨平臺的中高層API構成,可以運行在Linux、Windows和Mac OS操作系y上,該庫有C++、C、Java接口,我們運用Java接口就可以將Opencv視覺庫移植到Android studio開發工具中。
(2)免費、開源,與耗費很高的商業化工具(比如 MATLAB+Simulink)有很大的區別。
(3)高效、快速、使用方便。Opencv視覺庫具有強大的圖像運算功能,API中有比較完善的處理函數,能夠明顯提高開發效率。
2 Opencv在Android studio中的環境搭建流程
2.1 安裝Java JDK
需要完成JDK的下載、安裝和環境配置的流程,安裝完成后,要運行資源管理器輸入 Java Version來驗證是否安裝成功,若顯示Java版本信息,則安裝成功。
2.2 下載Android Studio開發工具并安裝
在Android Studio的中文社區下載最新的Android Studio開發工具(要包含Java SDK),并運行Android Studio,根據安裝提示進行安裝,并運行開發工具。
2.3 配置Opencv Android SDK
在Opencv官網(http://)下載Opencv Android SDK并解壓。在Android Studio中,新建一工程,點擊File并import Module,并選中解壓的Opencv SDK文件夾中的Java文件夾,這樣就將Opencv視覺庫移植到了Android Studio中。然后右鍵App project,打開open Module Settings中的Depencies,點擊Module Dependency,添加OpencvLibrary,這樣就完成了深層配置。最后把Opencv SDK文件夾中的native文件夾中的libs的4個文件夾復制到所建好的工作空間中的project中的libs中。
3 圖像的灰度處理和像素取反處理的應用舉例
本文中是用的移動端為魅族MX3,Android版本號為5.0.1。
3.1 灰度處理
使用OpenCv將一幅圖像轉換為灰度圖像在實際應用中也不少,轉換為灰度圖像比較簡單,關鍵函數: cvCvtColor:cvCvtColor(IplImage* src, IplImage* dst, CV_BRG2GRAY)。值得注意的是:最后一個參數為 CV_BRG2GRAY ,表示將BRG圖片(彩色圖片)轉換為灰度圖片(黑白),參數src、dst必須事先分配好內存空間,使用完之后必須要釋放空間。
3.2 像素操作―取反
OpenCV中圖像取反是將圖像中的像素點變為原來像素點的反色。例如,如果一副灰度圖像的每個像素值由2^8=256個,假設點i點像素值為brga[i] ,則取反后的像素值為 255- brga[i]&oxff。
關鍵代碼為:
int cnum = src.channels();
byte[] bgra = new byte[cnum];
for (int i = 0;i
bgra[i] = (byte) (255 - bgra[i]&0xff);}
然后運用matToBitmap函數將Mat格式的圖像轉換成Bitmap的圖像,并顯示在android手機移動端。
經過編寫代碼并運行得到的處理結果如圖1所示。
4 結束語
OpenCV視覺庫是一套簡單易用且完整的計算機視覺框架,幫助開發人員完成大量的底層工作,減少了工作量,更有效提高了設計出復雜計算機圖形處理的能力。并且我們將OpenCV移植到Android操作系統中去,也是圖像處理領域的一大進步。我們相信,在OpenCVForAndroid的應用不斷拓展中,眾多圖像處理領域會有廣泛的前景。
參考文獻
[1]陳雪嬌.基于Open CV的計算機視覺技術研究[J].電腦知識與技術,2015(30).
[2]張家怡.圖像識別的技術現狀和發展趨勢[J].電腦知識與技術,2010(21).
[3]黎松,平西建,丁益洪.開放源代碼的計算機視覺類庫Open CV的應用[J].計算機應用與軟件,2005.22(08).
[4]何鵬,王連鵬,楚艷紅.基于Open CV 的機器視覺在智能手機中的應用[J].計算機工程與設計,2011(10).
[5]王福斌,李迎燕,劉杰,陳至坤.基于OpenCV的機器視覺圖像處理技術實現[J].機械與電子,2010(06).
作者簡介
劉賢輝(1992-),男,山東省青島市人。現為青島市山東科技大學在讀研究生。主要研究方向為移動端的圖像處理研究
通過闡述農業機械中的幾種新的技術手段,比如計算機技術、網絡信息技術、人工智能技術及液壓技術等在農業機械中的應用情況,對農業機械技術的發展進行了分析,希望可以為農業機械設備的智能化發展提供相應的參考依據。
關鍵詞:
農業機械;技術手段;應用;發展前景
我國在國際上的地位正在逐漸提高,這與我國的經濟發展是分不開的,經濟的發展需要基礎的支持,農業就是我國的基礎,我國是農業大國,農村人口基數大。隨著近幾年我國農業的發展,很多高新技術也被運用到農業的機械設備中,使農機設備向著智能化的方向發展,有效地提升了農業生產的整體效率。在農業的生產中使用高新技術還能夠提高農業的生產效率,保證農機相關機械的正常運作。
1農業機械技術的應用分析
1.1計算機技術
這里所說的計算機技術主要指的是計算機視覺技術,這一技術最早被運用在農業機械上是在20世紀70年代中期,當時主要運用的是計算機技術中的視覺技術,利用這一技術的主要目的是可以對農產品的品質質量進行分級別檢查。計算機視覺技術是以圖像處理為基準,隨著圖像處理以及視覺模擬技術的發展,計算機視覺技術不僅可以用來檢查農產品的品質,而且還可以用來對農產品進行播種、收割。雖然計算機視覺技術在我國農業技術領域的應用時間還不是很長,在實際的使用中還有很多的問題出現,但是相信隨著科學技術的不斷發展,計算機視覺技術必將會改變傳統的農業作業模式,為現代化農業發展提供技術上的支持。
1.2網絡信息技術
網絡信息技術在我國農業機械上的應用是非常成功的,信息技術與地理信息系統的有機結合不僅可以為農業的生產提供高精度的監控,而且還能夠對農業生產中出現病蟲害的情況進行及時的檢測,然后根據定位系統來進行田間作業。
1.3液壓技術
液壓技術主要依靠的是微電子技術和工業傳感技術,在數據的采集上,運用液壓技術主要完成的是能量的轉換和匹配,其目的是為了讓農業機械的效率能夠得到進一步的提高,讓機械設備的相關系統特征可以得到完善,讓機械設備的可靠性能夠得到提升,這也很好地符合了環境保護的相關標準要求。而大部分的農業機械都是采用內燃機作為原動力,所以很多時候都會出現工作負荷,一般情況下,我們都是通過電液控制手段來完成負載與原動力之間的匹配情況,盡可能地減少功率傳輸過程中出現的損失,從而提高農業機械系統的工作效率。
1.4人工智能技術
隨著信息全球化的不斷深入,高端技術不僅在大型的企事業單位中被運用,在農業中也得到了廣泛的應用,比較有成果的就是美國利用人工智能技術研發出激光拖拉機、機械的內部導航裝置,等等,這些裝置可以對拖拉機的運行方向及所處位置進行實時的測定,在了解地區土地信息之后,再制定合理的土地種植方案、農藥及種子的數量,等等。
2農業機械技術的發展趨勢
2.1推廣農業機械產品的技術發展
目前在我國的農業機械發展上,已經開始運用機電智能化技術和計算機技術,這使得農業機械化設備的科技含量有了極大的提高,不僅有效地提高了農業機械的作業效率,而且也提升了農業的生產效率。
2.2農業資源的利用率得到了提升
只有提高了農業資源的開發利用率,才能夠確保農業實現可持續發展,同時也為保護生態環境奠定基礎,如回收農業生產的廢棄物,普及無害化的處理設備,運用無害化技術來處理廢水可以有效地達到保護環境的作用。而在農業種植的過程中,使用有機肥料還可以進一步提高農業資源的利用效率。除此之外,大力發展節能型動力機械設備可以有效地避免出現資源浪費,從而提高農業資源的整體利用效率。
2.3提高農業機械產品的質量監督水平
要想提升農業的機械化水平,還要從規范設計的基本要求出發,全面提高農業產品的質量。在質量提升的過程中,還要注重農業產品的整體造型和外觀,農機設備的耐久性也要經得起考驗。選用與農機設備相配套的發電機及元件,能夠最大程度上提高農業機械產品的質量。在農業機械設備完成安裝之后,還要對其進行試運行,只有保證了設備各項指標都正常的基礎上,才能夠真正的投入使用,這也是提高農業機械產品可靠性的前提。
2.4加大政府的補貼力度
各級地方政府要加大農業機械的技術推廣,做好農業機械的培訓工作。國家還要將拖拉機、插秧機等農機具作為農具購置補貼的關鍵,普及農業機械知識。這樣也能夠更好地提高農業機械化的發展進程。2.5確保農業機械技術的安全生產關注安全監督管理及裝備的創建工作,加大農業機械的安全投入,以便更好地滿足農業機械工作安全監督管理的需求。除此之外,最重要的是,要將農業機械的安全檢驗工作納入到各級縣市政府的財政預算當中。
3結語
隨著科學技術的飛速發展,一些高新技術正在逐漸地被運用到農業的機械設備中,這些機械設備的出現不僅提高了農業的整體生產水平,而且還進一步提升了農業的生產效率,很好地實現了農業的可持續發展。在今后的農業發展過程中,農業機械也必定是智能化的,所以要求操作人員要不斷地提高自己的專業素養,全面推廣農業機械新技術,只有這樣才能夠真正意義上實現我國農業機械的智能化。
作者:徐家亮 劉曉鵬 單位:黑龍江省克東縣農機安全監理站
參考文獻:
[1]陶樂然.長春星宇小區新技術應用[C]//增強自主創新能力促進吉林經濟發展———啟明杯•吉林省第四屆科學技術學術年會論文集(下冊).2006.
[2]劉蒙之.傳播新技術與國家發展———一種政治經濟學的觀察[C]//中國傳播學會成立大會暨第九次全國傳播學研討會論文集.2006.
[3]張仁江,田莉.制造業企業新技術采納:動因、路徑及障礙分析———基于T公司的縱向案例研究[C]//第六屆(2011)中國管理學年會———技術與創新管理分會場論文集.2011.
[4]胡札進,姚尚斌,徐七三“.雙低”儲藏與四項儲糧新技術的綜合應用[C]//全面建設小康社會:中國科技工作者的歷史責任———中國科協2003年學術年會論文集(上).2003.
[5]柳旭.淺析電視空間新技術對審美體驗的影響[C]//2009中國電影電視技術學會影視技術文集.2010.
提起數字媒體,人們通常會想到傳媒行業,其實數字媒體的應用絕不局限于傳媒。隨著寬帶網絡的普及,人們在日常業務處理過程中,正面對越來越豐富的網上媒體和內容,包括各種視頻、音頻、文本、圖像等。下面,就讓我們跟著諸位數字媒體方面的專家一起來分享這個繽紛的世界。
三維幾何建模與形狀表示
北京大學視覺與聽覺信息處理國家重點實驗室主任教育部長江學者獎勵計劃特聘教授 查紅彬
精彩問答
在背景比較復雜、有干擾的情況下模型檢索的效果怎么樣?
在模型檢索的時候并沒有考慮背景,因為這是做模型檢索比較容易的部分。模型檢索一般是沒有背景的,但也可以做,但是要推廣到背景比較復雜的物體上識別可能有很大的問題,因為這時候匹配不僅僅是局部匹配,而是兩個子集和子集的匹配問題,到目前為止,我們只是做沒有背景的模型檢索。
為什么要重新談論三維形狀表示問題?在多媒體信息處理領域里面,有兩個比較重要的方向,這也是計算機科學技術領域里兩個重要的方向,一個是計算機視覺,一個是計算機圖形學。計算機視覺是從圖像中通過識別或重建處理,得到一個對對象物的描述。反過來說圖形學,是對一個對象和場景的描述,通過繪制和動畫生成圖像和視頻。它們從處理過程來說是逆過程,這兩個領域之間有密切的關聯。
我們現在考慮計算機三維建模或模型的描述,考慮的不僅僅是計算機視覺或計算機圖形學所包含的內容。這里面簡單列舉一下,比如基于模型的三維物體識別和場景識別,這兩個應該是典型的計算機視覺里面考慮的應用。除了這以外還可以用模型干別的事情,比如繪制,還包括基于這樣模型的設計、變形、動畫等等。除了兩個單獨研究的應用之外,還要想怎么把兩者結合起來,把虛擬和真實的東西無縫連接到一起,這些都牽涉到三維模型。
我們考慮的三維模型跟以前相比,應用領域大了很多,要達到這個要求,對模型的表達、形狀的表達也都有了更高的要求。
怎樣找到一些更新更有效地表達形式來符合這些要求呢?這里有四個方面,現在能不能建立一個形狀空間,把考慮的對象完整地在形狀空間里面表達出來。第二點就是針對形狀的特性,表達要具有柔性,對象物的表面不都是連續的,也有一些非連續性和不規律性,這些特性怎樣能夠進行柔性處理。第三個是需要一些描述是局部性的,另外一些要求描述是整體性的,這兩者之間如何有一個很好的結合方法。第四是在大量的計算當中,包括變形和動畫中有很多編輯的工具,所以我們要求對現在的形狀表達有一些比較高的要求。
在計算機視覺里面有一個老大難就是識別,已有模型,但是眼前看到的是一部分三維數據,怎么用這部分數據和模型數據匹配來識別它呢?這就牽涉到局部匹配,我們要解決局部匹配需要什么描述?我們要有一個模型,從大量的數據中建立一個模型庫,并從中抽取很多特征,把這些特征進行組織。這里面牽涉三個比較大的問題,第一個是形狀空間怎么構造,沒有很好的特征表達或整理的形式,后面的匹配以及其他的工作就很難做。第二個是怎么定義基于這種特征的相似度。第三個是怎樣在形狀空間當中搜索到最優的匹配。
針對這些問題我們最近一兩年做了一些工作,最近提出一個廣義形狀分布(Generalized Shape Distributions)描述方式,主要目的有兩點,能不能在三維形狀表示過程當中,找到一些最關鍵的描述指令,并從中找到相互關系,把整體和局部結合起來。如果把之間的關系描述出來,就能把局部結構性的信息用整體觀點加進去,這兩件工作就是我們做這件事情的主要目的。
在形狀描述問題上,我們還有很多工作要做,除了局部、整體描述之外,我們要想辦法把他們結合到一起。今后幾年要用更多的模式識別的辦法,來解決面臨的圖形學或虛擬現實和計算機視覺當中的很多問題。
生活中的計算機視覺
香港中文大學信息工程系終身教授
微軟亞洲研究院視覺計算組負責人 湯曉歐
精彩問答
微軟亞洲研究院視覺計算組在原創思想這一塊,引領下一個方向有沒有什么考慮,您談到很多對人們日常生活影響很大的應用,但是在背后的更深層的考慮,更新的創意在哪里呢?
我們的研究者都很年輕,我本人也才工作七年的時間,很多的算法已經發展這么多年了,所以在開始的時候比較容易想出來的方法,現在已經很難有那么多的原創內容。我們的工作是去找一些非常原創的內容,有的是理論上的,有的是新的發明,這可以有很大的影響。
圖像通過閃光燈的分割,前景和背景深度差會不會影響分割效果,距離會不會影響分割效果呢?
我們這個通過閃光燈對圖像進行分割的技術,會一定程度上受到光的強度和距離的影響。
我們主要的研究領域包括計算機視覺、模式識別、圖像處理和視頻處理。下面就為大家介紹幾個比較典型的應用。
如何將圖片的前景和后景分離?我們現在照兩張圖片,一張打閃光燈,一張沒有打閃光燈,這樣拍出來的照片背景沒有變化,但前景變化很厲害。在開閃光燈的情況下拍的照片,前景和后景可以利用一些技術很容易地分開來。
把一個圖片的前景切割出來放入另一張圖后,那剩下的圖片缺一塊的怎么辦呢?如何修復剩下的圖片呢?在例舉的圖片上,大家可以看到不同的區域,我們可以由一個算法,從其他的地方借過來,再貼上去,經過這樣的處理后,圖像基本上和原來沒有太大的區別。
如此的修修補補又有什么用呢?比如說,你對這張圖像不是很滿意,你可以把圖片上不喜歡的部分劃出來,然后利用一些技術將劃出來的空白部分填上。更有用的地方在于,你照了不想被別人看到的照片后,除了刪除,你多了一個選擇。你可以把不想讓別人看到的照片部分去掉,并利用一些算法把空白的地方填補上,而且讓別人看不出來。
現在大家的電腦上都會有很多照片,怎么快速地瀏覽這些照片呢?我們可以把這些圖像都放在一個屏幕上,可屏幕畢竟有限,怎么才能把照片放得更多一些呢?我們現在做的是可以隨機把照片放到桌面上,但是電腦會對每張照片上的重要信息進行篩選,在放盡可能多的照片的同時,讓每張照片上最重要的信息不被遮掩,而且均勻地分布在桌面上。這樣大家看起來就更清楚了。這個算法就是怎么讓所有圖像均勻分布,同時把所有背景都要蓋上。我們可以對圖像進行各種處理,同時我們也可以利用一些技術知道別人有沒有處理圖像,對圖像有沒有做過手腳。
現在我們來說說視頻方面。比如說抖動很厲害的圖像,怎么把物體移到中間?一個辦法是把除移動圖像外的公共部分切出來,但是移動越大,公共部分就會越來越小,更好的辦法是用一些技術把空處填上。
現在MSN的功能已經越來越豐富。比如說一段電影,你看到一件比較中意的衣服,只要你把鼠標移動衣服的覆蓋范圍,你就能很清楚地知道這件衣服的品牌及價格。如果你把鼠標在那件衣服上輕點,電腦就會直接跳轉到這個衣服的相關網站。
你在視頻聊天的時候如果不想讓對方看到你所處的環境,你就可以很輕松地把背景模糊掉。如果大家對自己的長相不是那么有信心,我們可以幫你改變一下你的長相。為自己添一幅酷酷的墨鏡,換上一個性感的大嘴巴,這些都能輕而易舉地完成。
多媒體傳感器網絡
北京郵電大學教授、博士生導師
智能通信軟件與多媒體北京市重點實驗室主任 馬華東
傳感器研究是IT非常熱門的話題, 首先我為大家介紹一下多媒體傳感器網絡的基本概念。從早期的巨型機到今天的小型機,生物芯片尺寸越來越小,但是效率越來越高;網絡設備聯網和數據交換的需求越來越大,設備之間的傳輸量也越來越大;從信息處理的角度來看,內容逐漸占據了主導地位,由數據為中心轉到以內容處理為中心。這三方面的演化是今天討論多媒體傳感器的背景。
傳感器網絡是一組傳感器節點,由組織方式協作地感知采集和處理感知對象的信息,它的基本特點是造價低、能量敏感、通信能力有限、計算能力弱、動態變化。現在的需求是要求通信能力越來越強,計算能力應付節點的處理的要求。
右圖是目前主流的傳感器節點的配置,從配置來講還是比較低的,現在信息處理側重壓力、溫度、光、震動等簡單的數據或者是標量數據。人類獲取信息80%是視覺信息,10%左右是聽覺信息,也就是說90%左右的信息是多媒體信息。傳感器網絡就是對音頻、視頻信息獲取后提供給使用者,使其對環境信息有一個全方位的了解,對傳感器網絡的應用是非常廣泛的。
從網絡的結構來講,基本結構和原來傳感器網絡差別不是很大,這里面強調增加音頻、視頻獲取處理,網絡傳輸整個過程的各個環節,同時這里面最好可以交互。有了這個概念以后,深入分析一下主要特點,首先是網絡能力的增強,這樣一個傳感器網絡應該集信息的采集、處理傳輸、轉發、能量供應等方面,除了傳統的標量數據,音頻、視頻的圖像數據,都可以進行采集處理。
現在多媒體傳感器網絡目前有哪些問題呢?從需求來看,現在網絡是異構的信息,媒體信息的格式,種類很多,并且差異非常大,數據量比較大,特別是音頻、視頻信息,格式比較復雜。這些信息傳輸過程中需要高速實時地傳輸,對網絡傳輸速率也提出了比較高的要求。媒體信息的安全問題,也是網絡需要考慮的,還有服務質量的問題。針對這些需求,我們可以看到,通信資源和計算資源這兩者之間存在非常大的矛盾,或者非常大的鴻溝,如何解決這兩者之間的差距就是我們研究的問題所在。
最后談一下多媒體傳感器網絡研究的挑戰,首先是節點的芯片設計,這是基礎,這里面需要采用多種技術,包括軟硬件協同設計的技術,各種技術結合,降低成本、能耗、體積、提高運算速度和可靠性。第二是三維場景的覆蓋問題,方向性傳感模型是一個簡單的二維圖形,實際上是三維圖形監測,這是一個三維場景方向的問題,研究這個就復雜多了。還有一個問題是服務質量保證問題,在新的網絡當中服務質量體系是什么樣,也是研究的方向。再一個是信息處理,為了使網絡傳輸數據量比較快,能不能在節點做信息處理的計算。當然信息的安全也比較重要,用這些節點獲取多媒體信息怎么保證安全的質量,使應該看到的人看到這些信息,不應該看到的人看不到這些信息。
在多媒體傳感器網絡中,我們還是做了一些工作,和一些同行學者也有一些交流,這里面也有一些質疑,說多媒體傳感網絡和原來傳感器網絡設計初衷是不是吻合的,原來沒有想讓它處理這么多信息,原來體積比較小,加上這些信息以后,無疑使它的體積增大,這里面和初衷之間是不是有矛盾,傳感器網絡研究有沒有必要性,如果有必要性可行不可行,這都是我們目前研究的問題。
關鍵詞:增強現實;視線追蹤;應用
增強現實(Augmented Reality簡稱AR)技術是近年來的一個研究熱點,有著廣泛的應用前景。它是對現實世界的補充,使得虛擬物體從感官上成為周圍真實環境的組成部分。與傳統的虛擬現實(Virtual Reality簡稱VR)不同,增強現實只是實現對現實環境的增強,加深了對現實環境的感受。在實際的AR體驗中,因為人的觀察視線會不斷地變化,AR系統需要實時的根據用戶的視場重新建立位置坐標系,進行追蹤。而視線追蹤技術就是實時地跟蹤用戶頭部的位置和視線方向,根據這些信息來確定虛擬物體在真實空間坐標中的位置,并將它實時地顯示在顯示器中的正確位置。
一、視線追蹤技術及其特點
(一)視線追蹤技術概述。
視線追蹤也稱為眼動追蹤,它被認為是研究視覺信息加工的有效手段。利用專用設備來記錄學習者的眼球運動(Eve-Movement,簡稱眼動)情況,可以作為分析學習者內部心理活動情況的依據。關于視線追蹤技術的研究己有較長歷史,目前它己在多個領域得到廣泛應用。例如用于圖片廣告研究(網頁評估、設計評估等)、動態分析(航空航天、體育運動、汽車、飛機駕駛等)、產品測試(可用性測試)、場景研究(商場購物、店鋪裝演、家居環境等)和人機交互等多個領域。此外,視線追蹤在智能計算機、智能家電、虛擬現實和數字游戲等領域也有很好的應用前景。
在眼動實驗研究中,當被試對視覺信息進行提取時,其注視時間、注視次數、注視點序列、眼跳距離、回視次數、瞳孔直徑等通常被視為思維和心理加工的重要參數。因此,通過對被試在學習過程中的實時眼動信息進行觀測,可用于分析和引導其學習的依據。眼動模式一般分為三種:注視(fixation)、眼跳(saccade)和追隨運動(pursuit movement)。其中,持續一段時間、相對穩定的眼球運動稱為注視;眼球快速運動時導致視覺區域的聚焦點產生變化,這種行為稱為眼跳;眼睛緩慢、平滑地追蹤某個緩慢運動的目標,則稱為追隨運動。通過分析眼動模式和相關參數,可以獲得很多重要的信息。例如,眼跳速度會隨著疲倦程度的增加而降低,而隨著學習任務難度的增加而增加;眨眼速度和眼睛睜開程度的降低則可能意味著疲倦的加重。因此,可以據此來確定學習者的學習精神狀態,或對其學習過程進行分析,從而采取相應的學習策略或干預措施。
(二)視線追蹤系統的類型及其特點。
人眼的注視點主要由頭的方位和眼睛視線決定。頭的方位決定了人眼可能注視的范圍,眼睛的視線決定了注視點的精確位置。國內外將視覺跟蹤技術按照借助的媒介分為硬件和軟件兩種。以硬件為基礎的視線跟蹤的基本工作原理是利用圖像處理技術,通過攝像機攝入瞳孔反射的紅外線記錄視線變化,達到視線追蹤的目的。視線跟蹤裝置目前有穿戴式與非穿戴式,接觸式與非接觸式,如帶上專用頭盔、眼鏡或者頭部固定支架,置于頭部上的攝像機,這種情形用戶使用較不舒適。通過軟件實現的視線跟蹤方法,對用戶沒有干擾,首先利用攝像機獲取頭部、臉部或眼睛圖像,再經過軟件分析對視線定位與跟蹤。由于不需要佩戴任何裝置,用戶的自由度舒適度較好。
人與計算機交互是研究人與計算機之間溝通的技術,將視線跟蹤、語音識別、手勢輸入、感覺反饋等引入人機交互,提高了交互的自然性和高效性。視線追蹤技術同樣引發了人機交互系統的改革,鼠標、觸控板的消失,及通過追蹤人眼視線,用眼神來操作電腦、輸入文字、玩游戲。
二、視線追蹤技術在AR增強現實研究中的應用
(一)顯示技術。
AR的簡單定義就是將計算機生成的虛擬數字信息疊加到現實的生活場景中。這個“疊加”是需要通過顯示設備作為中介來實現。
增強現實系統中的顯示器可以分為頭盔顯示器(HMD)和非頭盔顯示設備。目前,一般的增強現實系統主要使用透視式頭盔顯示器。透視式頭盔顯示器主要由三個基本環節構成:虛擬信息顯示通道、真實環境顯示通道、圖像融合及顯示通道。其中,虛擬信息的顯示原理與虛擬現實系統所用的浸沒式頭盔顯示器基本相同;圖像融合與顯示通道是與用戶交互的最終接口,根據其中真實環境的表現方式,可分為基于CCD攝像原理的視頻透視式頭盔顯示器和基于光學原理的光學透視式頭盔顯示器兩類。
光W透視技術是通過安裝在設備眼前的光學透鏡來呈現出真實和虛擬世界。首先計算機生成的虛擬信息經過光學系統放大后反射后進入視野,透過透鏡又能直接看到現實場景,兩部分的信息匯聚到人眼的視網膜上實現AR的效果。視頻透視技術是借助安裝在頭顯上的攝像頭來捕捉獲取外部真實環境,計算機將數字模擬信息疊加到攝像機的視頻信號上,再將真實場景和虛擬場景進行融合。相比較光學透視技術,它的視角場更大,而且不受外界的強光干擾。不過一旦攝像機與用戶的視點不能保持完全重合,會產生一些偏差。
(二)跟蹤注冊技術。
基于計算機視覺的注冊技術主要是指利用計算機視覺獲取真實場景的信息后,經過圖像處理方面的知識來識別和跟蹤定位真實場景。細分可以劃為基于傳統標志的注冊算法和基于自然特征點無標志注冊算法。基于計算機視覺的注冊技術的精度較高,但是對計算量非常大,而且算法復雜,對系統的要求非常高。
為了取長補短,得到更加精確的注冊結果,現在有結合兩種技術的混合注冊方法。通常是先由跟蹤傳感器大概估計位置姿態,再通過視覺法進一步精確調整定位。一般采用的復合法有視覺與電磁跟蹤結合、視覺與慣導跟蹤結合、視覺與GPS跟蹤結合等。
三、結論
在國外,增強現實早已在醫學、遙操作、制造與維修、可視化與教育培訓、娛樂、軍事訓練等領域取得了成功應用。在國內,不少單位和個人對增強現實中的關鍵技術和算法進行了研究,并且以牙科醫學、設備維修等許多背景得到了初步應用研究。但國內的研究目前仍多限于實驗階段,與國外的應用水平還有一定距離。
目前,隨著增強現實的快速發展,出現了許多新的研究方向,如新的顯示方式、照片真實感圖形繪制、調節現實、基于網絡的增強現實和針對戶外隨身增強現實系統的技術等等。其中涉及到的技術包括基于圖像的繪制(IBMR)、多通道信息融合、普適計算技術、顯示設備和跟蹤設備的隨身便攜化等。隨著系統性能的提高、操作過程的簡化和設備成本的降低,增強現實會在越來越多的領域得到廣泛應用。
參考文獻:
[1]奚惠寧等.視線追蹤應用技術的專利分析[J].電視技術,2013(S2)。