公務員期刊網 精選范文 計算機視覺范疇范文

    計算機視覺范疇精選(九篇)

    前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺范疇主題范文,僅供參考,歡迎閱讀并收藏。

    計算機視覺范疇

    第1篇:計算機視覺范疇范文

    關鍵詞:計算機視覺;跟蹤算法;綜述;人數統計

    中圖分類號:TP391 文獻標識碼:A DOI:10.3969/j.issn.1003-6970.2013.03.003

    0 引言

    計算機視覺作為一門多學科的交叉領域,涉及圖像處理、計算機圖形學、模式識別、人工智能、人工神經網絡、計算機、數學、心理學、生理學和物理學等。本文是對視頻人數統計技術的綜述,屬于智能視頻監控范疇

    由于智能視屏監控的挑戰性以及其巨大的應用價值,越來越多的學校、研究所以及公司的研究人員投入到該領域中來。麻省理工學院、卡內基梅隆大學以及其他國外著名大學成立了專門的計算機視覺及多媒體方向的實驗室;Nice和Object video等公司已經針對飛機場、國界線等應用場合開發了一些相應的智能監控系統。國際上的高級視頻和錄像(Advanced Videoand Signal-Based Surveillance)論壇每年都會舉辦PETS(Performance Evaluation of Tracking Systems)會議專門針對于人群行為分析,包括群體人數統計,人流密度估計;對單個人員以及群體中個體進行跟蹤;特殊群體和特殊事件檢測等。本文主要針對視頻人數識別這個研究方向,從基于特征點、顏色與形狀信息、模板匹配三種不同類型識別跟蹤方式分析了近些年來國內外的研究工作及最新進展,通過對各種不同識別方法比較,對當前亟需解決的問題做了詳細的分析。

    1 人數識別研究現狀

    人數統計算法融合了運動物體檢測、行人檢測與分割、形狀分析、特征提取和目標跟蹤等多個領域的技術。從采用的手段來講可以分為直接法和間接法:直接法(或稱基于檢測的),即首先在場景中檢測出每個行人,再計數。第二種稱為間接法(也稱為基于映射或基于度量的),一般是建立場景特征與行人數量的函數關系來測算人數。在行人高度密集的場景中,間接法比直接法更加可靠,主要因為直接法無法有效分割每個行人,特別是在行人高度密集的場景中,從20世紀90年代起到目前為止這近20年里,出現了眾多的視覺跟蹤算法,1988年,Aggarwal和Nanadhakumar對運動圖像分析算法進行了總結,將算法分為兩類,一類是基于光流法的分析,另一類是基于特征點的分析,此后在視覺跟蹤領域中,又出現了許多新的方法,目前,視頻中人數的跟蹤方法大致分為三類,分別是基于區域的跟蹤、基于特征點的跟蹤、基于模板和模型的跟蹤,這種分類方法概括了目前大多數視覺跟蹤算法,因此下面用這種分類方法對視覺跟蹤算法進行介紹。

    1.1 基于特征的人數識別

    基于特征的人數跟蹤算法選取目標的某個或某些局部特征作為相關時的對象,這種算法的優點在于即使目標的某一部分被遮擋,只要還有一部分特征可以被看到,就可以完成跟蹤任務,另外,這種方法與卡爾曼濾波器聯合使用,也具有很好的跟蹤效果。這種算法的難點是:對某個運動目標,如何確定它的唯一特征集?這也是一個模式識別問題,若采用特征過多,系統效率將降低,且容易產生錯誤,文獻對這一問題進行了討論,在特征提取時,一般采用Canny算子獲得目標的邊緣特征,而采用SUSAN算子獲得目標的角點信息。有關基于特征的跟蹤算法還可參見文獻。在2009年,Albiol使用角點個數作為場景特征來估測人數,首先通過Harris角檢測器檢測出圖像角點,然后進行角點匹配以區分人身上的角點和背景角點,Albiol認為每幀總人數與人身上角點的個數成正比例關系,以此估測人數,算法雖然簡單,但在PETS 2010“人數統計與密度估計”競賽中取得優勝。2010年,Conte等“”基于Albiol的方法提出改進。采用的SURF(Speed up Ro.bust Feature)特征點以代替角點,同時,Conte等不僅考慮到特征點個數對人數估測的影響,還考慮到透視投影(拍攝距離d)密度人群遮掩(特征點密度p)對于估測的影響,同時對所有SURF點進行分組回歸以提高精度,在這個基礎上張茂軍等相比Conte等的研究成果在處理遠距離人群上精度提高,主要因為使用“非最大抑制聚類”——對不同拍攝距離的人群采取不同的聚類標準,有效解決遠距離人群的類過大問題,提取人身上特征點的方法是在掩模上直接檢測特征點,使得特征點個數更加穩定,有利于SVM預測。

    1.2 基于區域的人數識別

    基于區域的跟蹤算法基本思想是:首先得包含目標的模板(Template),該模板通過圖像分割獲得或是預先人為確定,模板通常為略大于目標的矩形,也可為不規則形狀;然后在序列圖像中,運用相關算法跟蹤目標,對灰度圖像可以采用基于紋理和特征的相關,對彩色圖像還可利用基于顏色的相關。

    McKenna等首先利用色彩和梯度信息建立自適應的背景模型,并且利用背景減除方法提取運動區域,有效地消除了影子的影響;然后,跟蹤過程在區域、人、人群三個抽象級別上執行,區域可以合并和分離,而人是由許多身體部分區域在滿足幾何約束的條件下組成的,同時人群又是由單個的人組成的,因此利用區域跟蹤器并結合人的表面顏色模型,在遮擋情況下也能夠較好地完成多人的跟蹤。Marana等認為低密度人群在圖像上體現出粗糙紋理特征,而高密度人群則體現出精細紋理特征。文獻分別采用自組織理論和Minkowsld不規則維度理論從圖像紋理特征預測人群密度。Lin等則結合Harr小波變換(HWT)和支持向量機(SVM)進行行人頭部輪廓檢測,從而達到人數統計的目的。文獻利用顏色和形狀信息實現人頭的檢測,包含兩個步驟:黑色區域提取和形狀分析。通過對HSV空間V通道的像素設置閾值這種方法有效地檢測出黑色區域,同時可以少受光照變化和陰影的影響。使用一種基于形狀描述的快速弧形結構提取方法實現人頭檢測。姬紅兵等提出了一種基于局部特征的目標跟蹤算法,通過多尺度分析方法,根據顏色和空間上的相似性將目標分割為多個區域,每個區域由一個團塊表示,團塊包含了該區域所有像素的顏色均值、形狀和位置,根據團塊特征構造目標的外觀模型,定義團塊的匹配準則,通過團塊匹配進行目標跟蹤。

    1.3 基于模板匹配的人數識別

    采用模板匹配識別跟蹤方法首先將圖像序列轉換為一組靜態形狀模式然后在識別過程中和預先存儲的行為標本相比較,

    部分學者在運動前景提取的基礎上使用了輪廓匹配方法對目標進行定位,文獻使用了半圓模型搜索前景中人頭肩所在位置,然后使用Snake模型與卡爾曼濾波相結合對目標進行跟蹤目標,但Snake模型比較適合單目標的跟蹤,當行人發生重疊時,定位精度會有一定的下降;在此基礎上文獻提出使用含有人harr特征分類器(使用頭肩部上半身樣本),對行人重疊情況下的檢測精度有一定的提升。文獻提出使用垂直攝像頭降低行人之間的遮擋程度,通過對基于AdaBoost的人頭檢測本方法,建立一個良好的人頭檢測分類器。然后根據運動人頭的特征去除誤檢區域。最后配合過線跟蹤實現出入口人數統計。

    2 視頻跟蹤問題中的難點

    從上面的闡述可以看出,各種方法都有自己的優點和不足,是在文獻基礎上分析得到的幾種具體識別方法的比較結果,由于各種方法在設定理想情況下都有較好的準確率,所以不對各種方法的準確率做出比較,而是從各種算法的復雜度、魯棒性、先驗知識需求、高密度復雜人群適應性(有遮擋出現)等方面進行相對的比較分析,分析結果如表1。

    2.1 視覺跟蹤問題中的難點

    從控制的觀點來看,視覺跟蹤問題所面臨的主要難點可以歸結為對視覺跟蹤算法在三個方面的要求,即對算法的魯棒性、準確性和快速性。

    魯棒性是指視覺跟蹤算法能夠在各種環境條件下實現對運動目標持續穩定的跟蹤。影響人數跟蹤系統魯棒性的最主要原因在于目標處環境的光照變化以及部分遮擋引起的運動目標不規則變形和全部遮擋引起的目標的暫時消失。當運動目標所處環境的光照發生改變時,采用圖像灰度信息或色彩信息作為跟蹤基礎的視覺跟蹤算法一般都會失效,而基于圖像特征的方法往往不受光照改變的影響,如利用運動目標的邊緣信息能有效避免光照變化對運動目標的影響,但在復雜環境中要將運動目標的邊緣和周圍其它目標邊緣區分開來是非常困難的,遮擋問題是視覺跟蹤算法中又一難點問題,利用單攝像機解決遮擋問題也一直是視覺跟蹤領域中的熱點。而利用多攝像機可以在很大程度上解決這一問題,但正如前所述,多攝像機的應用又會引入新的難題。

    在視覺跟蹤研究中,準確性包括兩個方面,一是指對運動目標檢測的準確性,另一個是指對運動目標分割的準確性,對運動目標檢測準確性的目的是盡量避免運動目標虛檢和漏檢,從而提高對真實運動目標的檢測概率。由于實際復雜環境中存在大量噪聲。至今已經出現了上千種各種類型的分割算法,但由于尚無通用的分割理論,目前并沒有一種適合于所有圖像的通用分割算法。

    一個實用的視覺跟蹤系統必須能夠實現對運動目標的實時跟蹤,這就要求視覺跟蹤算法必須具有快速性但是,視覺跟蹤算法處理的對象是包含巨大數據量的圖像,這些算法往往需要大量的運算時間,很難達到實時處理的要求,通常,簡單算法能夠實現實時跟蹤,但跟蹤精度卻很差;復雜算法具有很高的跟蹤精度,實時性卻很差,一種通用的減小視覺跟蹤算法運算量的方法是利用金字塔分解或小波變換將圖像分層處理。

    3 展望與結束語

    3.1 展望

    實現一個具有魯棒性、準確性和快速性的視覺跟蹤系統是當前視覺跟蹤技術努力的方向。但視覺跟蹤技術在這幾個方面中每前進一步都是非常困難的,因為該技術的發展與人的感知特性的研究緊密聯系在一起,由于目前對人的感知特性沒有一個主流的理論,其數學模型更是難以建立。同時,在計算機視覺中大多數問題是不確定的,這就更增加了視覺跟蹤技術發展的難度。但是,近幾十年來,數學理論方面取得了巨大的進步,因此合理的使用在數學理論方面的知識提高系統的性能能夠很好的解決視覺跟蹤問題。例如現在已經應用在諸多領域的模糊算法,神經網絡等提高系統性能,簡化計算復雜度。

    3.2 結束語

    第2篇:計算機視覺范疇范文

    關鍵詞:視頻拼接;跟蹤定位;OPENCV

    [基金資助]:全國大學生創新創業訓練項目(2013XKCX210)廣西高校科學技術研究項目:(2013YB092)

    引言

    隨著安防向著智能化的進一步發展,越來越多的領域對傳統意義上的視頻監控提出了更多的要求。傳統的監控攝像機多為固定攝像機,監控視野狹窄,而且運動目標容易超出監控視野范圍,而不能對其連續跟蹤,這也就導致了監控漏洞的出現。如果能夠建立一種既能全局監控掌握整體情況,又能針對感興趣目標進行跟蹤特寫的系統,就可以很好地解決全局監控與局部跟蹤不可兼得的難題,因此提出了基于視頻拼接的特寫聯動系統。

    1 介紹OPENCV

    OPENCV是一個開源的跨平臺計算機視覺庫,可以運行在Linux、Windows和Mac OS等多個操作系統上。它輕量級而且高效,由一系列 C 函數和少量 C++ 類構成,同時提供了Python、Ruby、MATLAB等語言的接口,實現了圖像處理和計算機視覺方面的很多通用算法。

    2 圖像拼接

    OPENCV提供的專門用于全景拼接的類Stitcher,該類可以對無序的任意張圖片進行全景拼接,拼接效果如圖2.1所示。

    (a)

    圖2.1 Stitcher類的拼接效果

    可以看出,效果是十分不錯的。不過在時間的處理上,Stitcher封裝的算法表現的并不令人滿意,對兩張320*240的JPG圖像,花費了9968毫秒才完成了拼接。所以這個類也只適合用來做圖片的拼接,想要在視頻中做實時的拼接處理是不可能的。

    3 視頻拼接

    Stitcher封裝的算法,除了時間,其他各方面都令人滿意。假如需要將其運用到視頻拼接上,以每秒播放20幀為例,速度需要提高100多倍,光優化代碼是不現實的。

    不過經過對Stitcher類的詳細了解,可以對拼接兩張圖片的條件進行總結,就是相機參數和img_mask圖片。也就是說,不需要每一次都計算這兩個東西,只需要提取視頻的第一幀進行拼接,然后保存這兩個參數,視頻之后的所有幀直接用就行了。OPENCV提供了Stitcher所有的C源代碼,對應的拼接算法封裝在estimateTransform和composePanorama函數中。只需要將這兩個函數融合成一個,將其中涉及到相機參數(代碼中定義為cameras_)和img_mask圖片(代碼中定義為mask_warped)的變量轉換成Stitcher類的變量,然后重新定義一個函數,將composePanorama尾部的圖片融入代碼復制出來就行了。代碼修改后,同樣是320*240的兩張圖片,耗時157毫秒。這樣視頻拼接的功能就可以用Stitcher類來實現了。

    4 跟蹤定位

    對圖像場景中的物體進行跟蹤,首先需要知道物體是否是活動的。假如物體一直處于不運動的狀態,那么這種情況應該屬于圖像識別的范疇。如果物體運動,必將產生位移,也就是相對于上一幀發生了像素偏差,然而,圖像背景并沒有移動。這樣一來跟蹤算法顯而易見。

    首先需要記錄第一幀的圖像數據,然后記錄第二幀的圖像數據,兩幀數據圖像做對比,定義如下計算公式:

    其中,x,y分別是像素的坐標,threshold是閾值。一般來說,閾值為零,表示像素沒有發生位移。不過在實際情況下,考慮到光線和天氣的影響,像素會在人眼分辨不出來的情況下發生變化,所以閾值就不同的場景而定。圖片的運算結果如圖4.1所示,考慮到實際情況,需要對結果進行濾波處理,之后進行像素膨脹處理,這兩個步驟主要是將圖像中有明顯位置移動的物體保留下來,過濾掉因光照、天氣產生的噪聲。為了達到更好的效果,也可以加入對時間的判斷,具體算法可以參見Gary Bradski和Adrian kaebler的learning Opencv[5]的第九章。

    5 實驗結果及分析

    實驗結果基本上每個小章節的結尾都已經給出,以下給出系統整體運行的結果。本文選用三個校園取景的視頻作為實驗視頻,采用VS2008編譯器,搭建OPENCV2.2.4的環境,運行系統為WINDOWS XP,運行效果如圖5.1所示,時間耗費如表5.2所示。

    圖5.1 拼接及跟蹤的結果

    實驗采用兩個480*360大小的avi視頻,實時拼接耗時360毫秒,加上跟蹤算法總共消耗386毫秒。實際應用中。從源代碼分析,主要消耗時間的過程有:圖片的重新投影(代碼中定義為warp),耗時109毫秒。投影后的圖片與各自的二值圖像標記混合(代碼中定義為feed),耗時32毫秒。所有圖像融合(代碼中定義為blend),耗時47秒。其中wrap和feed執行了多次,blend執行一次。

    6 總結

    本文對視頻拼接的特寫聯動系統的實現進行了詳細的介紹。主要通過優化OPENCV圖像處理庫來編寫系統程序代碼,通過優化Stitcher類算法,從而實現所需的特定功能。融合了跟蹤算法,有效解決了跨場景跟蹤的難題,有一定的實用性和研究價值。

    參考文獻

    [1] MATTHEW BROWN* AND DAVID G LOWE. Automatic Panoramic Image Stitching using Invariant Festures, December 2006

    [2] 王小強,陳臨強,梁旭. 實時全自動視頻拼接方法, 2011

    [3] David G. Lowe. Distanctive Image Festure from Scale-Invariant Keypoints, 2004

    [4] Bill Triggs,Philip McLauchlan,Richard Hartley. Bundle Adjustment A modern Synthesis, 2000

    第3篇:計算機視覺范疇范文

    數字技術對影視制作的影響,這一類的研究文獻主要是從理論方面進行討論,數字技術帶來的變革對傳媒界、從業人員、影視制作觀念的影響。《數字技術對電視媒體的能動性研究》從傳播事業發展的歷史入手,分析了傳播技術學派的理論以及它所引發的爭議。通過對數字技術的研究,尤其是通過數字技術對電視媒體的影響的重點研究,研究傳媒技術在傳媒事業發展過程中的能動作用。作者認為數字技術對影視制作的巨大推動作用是積極的,是正面的,這種積極的能動作用將為我們正確認識傳媒技術與傳媒事業的關系帶來新的視角?!稊底旨夹g對影視從業者的影響》這篇文章,數字技術在貫穿影視制作全過程的應用中,其不僅僅改變了傳統的制作方式,不僅僅體現在數字特效令人震撼的視覺效果上,而是對影視制作從觀念到具體創作實現的方方面面都帶來了革命性的影響,作者從編劇、導演、攝像幾個影視制作的關鍵環節進行分析?!稖\析數字技術對影視藝術發展的影響》對飛速發展的數字技術為影視藝術發展所帶來的深刻變化進行了論述,重點闡明了在電影數字化進程中應該建立新的電影觀念?!蛾P于數字技術與影視創作觀念的冷思考》,認為數字技術在影視創作中發揮著越來越重要的作用。但是作者認為應冷靜地看待數字技術對影視生產的價值。數字技術的確為影視創作提供了重要的美學表現手段,但從創作手段來看,傳統的影視拍攝手段仍然有無盡的開掘空間,辯證地看待數字技術所帶來的影響。

    二、數字技術對影視制作中的美學方面的影響

    比如,《數字技術從電影創作到接受的美學思考》這篇文章,認為,當前數字技術在電影中的運用仍屬于初級階段,但其本身急劇的發展和日新月異的變化,以及其牽涉、融匯多門類學科的特性,使數字技術的概念和范疇仍紛繁復雜,還有待進一步梳理和規范。其著重論述的數字技術是以計算機圖形學為基礎,在與電影制作結合過程中發展起來的信息數字化處理技術,側重于其在電影創作和接受方面引起的影像變革和美學意義?!峨p刃劍、雙重視閾與審美價值—論知識經濟時代數字技術對影視藝術的影響》針對知識經濟時代數字技術在影視藝術生產實踐中所體現出來的“雙刃劍”特性,文章在“雙重視域”的學理審視下分析了數字技術對影視劇藝術的積極影響和消極影響,并主張回到影視劇藝術生產的文化語境,在審美情境中貫注生動的歷史具體性,弘揚人文精神的審美價值理想。

    第4篇:計算機視覺范疇范文

    關鍵詞:韋伯局部描述子;LBP特征;SLBH特征;顯著性因子;行人檢測

    中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2015)09-0202-03

    近年來,基于計算機視覺的行人檢測技術一直是智能交通系統領域研究的熱點問題[1],而可行且高效的行人特征提取算法是其中的關鍵部分,為此,許多專家學者對此進行了深入研究。

    Haar特征由Viola等學者首次提出并用于人臉識別領域,取得了良好的檢測效果[2,3],而后被許多學者改進和擴展,使其更加適合于行人檢測領域。Abramson Y[4]在標準haar特征的基礎上進行了擴展,以增強對運動行人姿態的描述和檢測。但該特征仍然易受光照變化、環境遮擋等因素的影響,適應場景變化的能力較差,魯棒性不高。HOG特征是行人檢測特征提取領域的另一經典算法,與haar特征不同,HOG特征屬于矢量特征范疇[5]。Lazebnik S等人[6]為了提升了HOG特征提取速度提出了PHOG特征。SIFT特征[7]由于其優異的不變性也被廣泛到應用到目標檢測特征提取的應用中。HOG特征和SIFT特征都是比較典型的矢量特征提取算法,但是由于特征維數較高,實時性難以保證,必須經過特征降維處理。再就是Edgelet特征[8-9],與其他行人檢測特征提取算法不同,該特征著力于描述行人輪廓特征,能有效處理環境復雜且目標被遮擋情況較為嚴重條件下的行人檢測,但是由于計算較為復雜,實時性較低。Ojala T等人提出的LBP特征因其具有維度低、計算速度快、能很好的刻畫圖像的紋理信息而被廣泛應用,并且出現了許多的變體[10,11]。Chen等人[12]根據韋伯定理提出了韋伯局部描述算子,該特征雖然對光照和噪聲干擾具有一定的魯棒性,但是其特征提取仍比較復雜,計算量較大。

    本文在分析上述特征的基礎上,針對Haar特征維度高、冗余度大,而LBP特征又無法刻畫人眼的視覺敏感度,提出了一種基于顯著性的局部二值化Haar特征(Saliency Local Binary Haar,SLBH)提取算法。該特征維度低,對平移、縮放和噪聲具有一定的魯棒性,并能顯現特征的局部顯著性,從而提高了行人檢測的準確率。本文結構安排如下:SLBH特征將在第2節詳細介紹,第3節給出實驗與結果分析,最后是總結。

    1 SLBH特征

    1.1 顯著性因子

    顯著因子是對局部特征顯著性的描述,韋伯定律指出,在發散的局部特征中,局部顯著性不能由差別閾限的絕對值來進行比較,而應由其相對值進行確定。根據韋伯定律[12],可以利用式(1)計算出中心像素點在其鄰域內的顯著性因子。其中[Ic]表示中心像素點的灰度值,p為鄰域個數,[Ii]為對應鄰域像素點的灰度值。

    [S(Ic)=arctani=0p(Ii-Ic)Ic] (1)

    其中,[S(Ic)∈-π2,π2]。 為了方便后續計算,本文再通過增加一個值為[π2]的偏置項將[S(Ic)]值域轉換至轉換[0,π]。[S(Ic)]是對局部特征顯著性的描述,其值越大表明顯著性越強。

    1.2 加權LBP特征

    局部二元模式(LBP)是一種描述圖像局部紋理的算子,因其具有計算簡單,對光照變化不敏感等優點而被廣泛應用于計算機視覺領域。LBP特征計算如式(2)所示,其中[gc]為中心像素點的灰度值,[gi]為[gc]的八個鄰域像素點灰度值,[s(?)]為閾值比較函數,其定義如式(3)所示。

    [LBP(gc)=i=07s(gi-gc)?2i] (2)

    [s(x,y)=0,if x-y≤T1,otherwise] (3)

    在計算出整幅圖像的LBP特征值后,根據式(4)統計LBP特征直方圖,其中判斷函數[f(?)]定義如式(5)所示。

    [H(k)=x,yf(LBP(x,y),k),k∈[0,K]] (4)

    [ f(x,y)=1,if x=y0,otherwise] (5)

    LBP特征僅利用了中心像素與其鄰域內像素間的差異,而缺乏對物體顯著性的描述。如圖1所示,雖然兩個矩形區域具有相同LBP特征值,但是其顯著性因子相差卻很大。根據韋伯定律,顯著因子越大,其顯著性越強,其所描述的信息也就越重要,而LBP特征并不能描述這些顯著性信息。Cao Y等人[11]利用中心像素與鄰域像素差的絕對值之和作為權值,來增加像素間差異在LBP特征直方圖中的影響,如式(6)所示,其中K為最大的LBP特征值,判斷函數與式(5)相同,權值函數如式(7)所示。

    [H(k)=x,yw(x,y)*f(LBP(x,y),k),k∈[0,K]] (6)

    [w(gc)=i=07|gi-gc|] (7)

    Cao Y等提出的加權LBP直方圖雖然考慮到了像素鄰域間差異的影響,但是它也沒能很好描述特征的局部顯著性。此外,由于在加權直方圖統計過程中不斷累積權重,使得各維度之間相差較大。受韋伯定理的啟發,本文使用更接近人類視覺差異的顯著性因子作為權重來統計加權LBP直方圖。直方圖統計函數如下:

    [H(k)=x,yS(x,y)*f(LBP(x,y),k),k∈[0,K]] (8)

    1.3 SLBH特征

    Viola等人[3]最先提出并將Haar特征應用于行人檢測中。但隨著研究的深入,學者們發現原始的Haar特征對于檢測靜止的、對稱的物體比較有效,而對于行人這類非剛性物體,則需要在其它方向上增加能夠描述行人運動特點的特征。Lienhart R等人在Viola提出的標準Haar特征的基礎上進行了擴展,本文使用了圖2所示的這8種擴展的Haar特征。

    將上述8種Haar特征構成了一個3*3的矩形區域,為了方便描述,我們稱Haar特征的黑色或者白色矩形區域為一個cell,而3*3的矩形區域稱為一個block。如果對3*3區域從上到下,順時針編號,分別表示為[c0],[c1], [c2], [c3], [c4], [c5], [c6],[c7], 中心黑色區域表示為[cc],如圖3所示。然后按照式(1)進行計算,得到的結果為局部二值化Haar特征(Local Binary Haar,LBH)。

    其中,[I(k,l)]表示圖像[I]在點[(k,l)]處像素值,w表示cell的寬度,h表示cell的高度??紤]到LBP模式缺乏對顯著性描述的缺陷,因此本文利用式(8)來統計局部二值化Haar特征直方圖,即SLBH特征。該特征計算步驟如下:

    Step 1:將輸入圖像轉換到灰度空間。

    Step 2:利用積分圖技術求取每個cell的像素灰度值之和。

    Step 3:將8個cell按照圖3所示結構組成一個block。

    Step 4:根據式(9)計算每個block內的LBH值,根據式(1)計算每個block的顯著性因子。

    Step 5:按照式(8)統計直方圖,即為該圖像的SLBH特征。

    與傳統Haar特征相比,SLBH特征增加了顯著性因子計算,其計算復雜度雖高于傳統Haar特征,但該特征在刻畫行人紋理信息時需要的特征數量較少,故此特征實時性較好。由于引入加權局部二元模式的思想使SLBH特征擁有傳統的Haar特征無法比擬的光照不變性,可以有效的提高系統的魯棒性,這在下面的試驗中可以看到SLBH特征優越的檢測效果。

    2 實驗與結果分析

    為了驗證本文算法的有效性與優越性,設計了兩組實驗進行特征性能評估和檢測性能對比。所有的實驗樣本均采集于INRIA行人樣本庫,其中訓練集中正樣本2416幅行人圖像,負樣本為3070幅,測試集中正樣本1126幅,負樣本3070幅。圖4為本文算法的實現流程圖。為了能夠直觀的顯示出各種特征的檢測性能,本文使用檢測率(detection rate, DR)、虛警率(False Positive Rate, FPR)和識別率(recognize rate, RR)以及平均每幅圖像特征提取時間(Average Extraction Cost, AEC)4種評價指標,其計算公式如式(11)、式(12)和式(13)所示。其中TP表示行人檢測為行人(true positive),FP表示是非行人檢測為行人(false positive),FN表示行人檢測為非行人(false negative)。

    2.1特征性能評估

    為了測試本文對Haar特征改進的性能,實驗選用了Haar、LBH和SLBH特征做對比實驗,并且選擇SVM作為分類器。實驗統計結果如表1所示,從表1中可以發現本文提出的SLBH特征雖然特征提取時間略高于其它兩種特征,但是在其它3種評價指標上都優于Haar和LBH特征。

    2.2 檢測性能對比

    本文在相同的實驗條件下選擇PHOG特征[6]、加權LBP特征[11]、WLD特征[12]、HOG-LBP特征[13]和本文算法進行對比實驗。其實驗結果如表2所示,可以看出,本文提出的SLBH特征的各項評價指標均高于其它方法的實驗效果。圖5是在Detect Human行人樣本測試集上測試的部分實驗結果圖。

    3 總結

    本文針對Haar特征維度高、冗余大以及對光照敏感等不足提出了一種顯著性的局部二值化Haar特征,該特征結合了視覺顯著性和加權LBP的思想,能減少Haar特征的維數,并增強了紋理描述能力。通過在INRIA行人樣本庫中實驗,結果表明本文所提方法的檢測率與誤檢率都優于其它方法。

    參考文獻:

    [1] Dollar P, Wojek C, Schiele B, et al. Pedestrian detection: An evaluation of the state of the art[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2012, 34(4): 743-761.

    [2] Viola P., Jones M. Robust real-time face detection [J]. International Journal of Computer Vision, 2004, 52(2):137-154.

    [3] Viola P, Jones MJ, Snow D. Detecting pedestrians using patterns of motion and appearance [J]. International Journal of Computer Vision, 2005, 63(2):153-161.

    [4]Abramson Y., Rabinovich A..Decidability of split equivalence [J].Information and Computation,2002,173(1):15-39.

    [5]Pang Yanwei, Yuan Yuan, Li Xuelong, Pan Jing.Efficient HOG human detection [J].Signal Processing,2011.91(4):773-781.

    [6]Lazebnik S,Schmid C,Ponce J.Beyond Bags of Features:Spatial Pyramid Matching for Recognizing Natural Scene Categories [C]//Prac of the IEEE Computer Seciety Conference on Computer Vision and Pattern Recognition, 2006:2169-2178.

    [7]Lowe D M.. Distinctive image features from scale-invariant keypoints [J]. International Journal of Computer Vision, 2004, 60(2):91-110.

    [8]Wu Bo, Nevatia Ram.Detection and tracking of multiple, partially occluded humans by Bayesian combination of edgelet based part detectors [J].International Journal of Computer Vision,2007,75(2):247-266

    [9]Hu Bin, Wang Shengjin, Ding Xiaoqing.Multi features combination for pedestrian detection [J].Journal of Multimedia,2010,5(1):79-84

    [10]Thanh Nguyen D, Ogunbona P O, Li W. A novel shape-based non-redundant local binary pattern descriptor for object detection[J]. Pattern Recognition, 2013,46(5):1485-1500.

    [11]Cao Y, Pranata S, Nishimura H. Local Binary Pattern features for pedestrian detection at night/dark environment[C]//18th IEEE International Conference on. IEEE, 2011: 2053-2056.

    第5篇:計算機視覺范疇范文

    【關鍵詞】智能時代;云計算;安全架構

    一、前言

    當今世界,新一輪的科技革命和產業變革正在持續深入,工業互聯網、智能制造、人工智能、大數據、物聯網等領域正在加速布局,“智能時代”企業信息系統最顯著的變化是虛擬化、數字化一切、軟件定義,促使企業信息化的不斷發展,公司信息化資產數量日趨增多、系統的關聯性和復雜度不斷增強,使企業信息安全形勢日益嚴峻,信息安全防護工作面臨前所未有的困難和挑戰。為了更好監控和保障信息系統運行,及時識別和防范安全風險,同時滿足國家和行業監管要求,保證信息安全管理工作的依法合規,企業亟需建立一個全數據、集中管理的企業安全平臺,做到事前預警、事中監控、事后分析以及響應,全面的提升信息安全管理與防護水平。

    二、智能時代的變化趨勢

    我們正處在一個變革的時刻,“智能”是這個時代最顯著的標志。在今年春天首屆世界智能大會上馬云提出,智能時代有三個最主要的要素:互聯網、大數據、云計算;李彥宏也指出,未來30年推動社會進步的動力,就是智能科技的進步;浪潮董事長孫丕恕表示,智能從實現形式上就是要通過物聯網、互聯網將企業生產數據、互聯網數據和企業自身的管理數據全部打通,實現無邊界信息流和大數據分析。由此看來,一個企業走向智能化首先要完成業務在線化和流程服務軟件化,然后完成應用軟件的SaaS(Software-as-a-Service)化,從而助企業實現智能生產、智能維護、智慧服務。1.安全技術的變化基于云計算、虛擬化、大數據、智能制造、移動辦公的持續推進,都是基于企業信息基礎架構所實施的,開放式計算環境和更靈活的支持架構,要求安全技術隨之匹配發展,才能適應新環境,新技術下的安全需求。中國工程院倪光南院士在《云安全的思考》主題演講中指出,云安全一定會呈現出多維度、多層次、跨領域、多學科技術交叉等方面的特征。對于云計算的安全保護,需要一個完備體系,從技術、監管、法律三個層面上,形成可感知、可預防的智能云安全體系。2.企業智能架構從應用架構上看,未來的應用都是角色化、場景化的,可連接互聯網資源,全員應用,實現移動化和智能化。虛擬化、數字化一切、軟件定義促使企業信息架構的變革,以業務為導向和驅動,在企業管理、集成等方向上提供基礎共性平臺,為企業快速構建和集成應用軟件提供基礎支持,從而實現工程經驗模塊化、產品實際協同化、項目流程一體化結構,實現由統一業務層、統一界面構架層、應用系統層、統一工作臺面、大數據分析、云計算層組成的一種新模式。在企業IT系統的業務基礎機構層面,引入先進的統一軟件平臺,為上層應用開發提供統一標準,接口和規范,同時基于“平臺+組件”的架構實現各類應用的組合和復用,助企業實現數字化轉型。3.云架構在人工智能一日千里的時代,云計算已成為產業革新的原動力、新型管理的主平臺、人工智能的強載體。在新的云時代,整個社會都在發生數字化的迭代。云成為數字化最重要的基礎架構。騰訊董事局主席兼首席執行官馬化騰指出:“用云量將成為一個重要的經濟指標,能夠衡量一個行業數字經濟發展程度。”他還表示:“傳統企業的未來就是在云端用人工智能處理大數據?!薄霸?AI”是當前最主流的方向,其核心包括三項核心能力(計算機視覺、智能語音識別、自然語言處理)。在計算機視覺領域實現開放OCR識別、人臉核身、圖片處理等多項智能云服務;在智能語音識別領域實現語音轉文字、語音合成、聲紋識別、情緒識別等功能;在自然語言處理領域,以“數據+算法+系統”為核心,提供毫秒級響應的個性化服務。

    三、企業信息安全措施

    VMware首席執行官帕特•基辛格表示:“抵御安全攻擊,響應速度不是核心,而是如何將支離破碎的安全保護進行更有效的整合,實現安全架構的簡化,這才是企業安全轉型的關鍵?!卑踩夹g在智能時代必須跟上發展的變化,“智慧安全”的理念正在深入,著力點從網絡系統安全、數據安全深入到業務應用安全等各個層面,AI防火墻、態勢感知平臺、云安全產品、企業移動化信息安全管理平臺、智慧眼監控雷達、業務應用安全審計平臺成為保護企業信息安全的前沿技術。1.企業數據的安全阿里巴巴董事局主席馬云說:“數據是新能源。”隨著數據量的持續增長,應用數量不斷增加,數據將成為社會創新的重要驅動力。隨著“網絡強國戰略”、“互聯網+”行動計劃、大數據戰略的推進,網絡安全風險和威脅也進入到企業:非對稱的業務流量、定制化的應用程序、需要被路由到計算層之外并達到數據中心周邊的高流量數據、跨多個虛擬化應用,以及地理上分散的移動應用,都造成數據泄露的機會,隨著中央網絡安全和信息化領導小組的成立,信息安全已上升到國家安全層面。因此數據保護十分重要,最好的選擇是本源的防護,既做到保護數據本源的同時,又能靈活應對各種安全環境的需求。而符合這種要求的安全技術就是基于專業的安全分析模型和大數據管理工具,可準確、高效地感知整個網絡的安全狀態以及變化趨勢,通過企業本地部署安全大數據分析平臺,打通云端情報與本地設備的聯動,形成情報觸發預警,預警觸發防護的閉環。對外部的攻擊與危害行為可以及時的發現,并采取相應的響應措施,保障企業信息系統安全。2.企業網絡安全2016年,在“4.19講話”中再一次強調網絡安全建設的重要性,并提出:“要樹立正確的網絡安全觀,加快構建關鍵信息基礎設施安全保障體系,全天候全方位感知網絡安全態勢,增強網絡安全防御能力和威懾能力,要加快網絡立法進程,完善依法監管措施,化解網絡風險。此外根據網絡安全法相關規定,我們也可以看出,網絡安全法在原有信息系統安全等級保護制度的基礎上,創新了網絡安全等級保護的工作方法,企業的信息安全建設需在原有信息系統安全等級保護制度建設的基礎上,將新技術新應用帶來的重要信息系統建設諸如云計算、移動互聯、物聯網、工業控制、大數據等領域的國家關鍵信息基礎設施建設都納入國家安全等級保護制度進行管理,將風險評估、安全監測、通報預警、應急演練、災難備份、自主可控等重點措施也納入了國家網絡安全等級保護制度的管理范疇。企業緊跟網絡技術的發展,以“智慧安全2.0戰略”為指導,將“智慧安全”的核心從網絡系統安全、數據安全深入到業務應用安全等各個層面?,F在已可以采用AI、機器學習、行為分析等技術手段進行動態分析、靜態分析、異常檢測、深度解析等手段,更有效地防范未知威脅。3.物聯網安全預計到2021年,全球將有超過460億臺設備,傳感器和執行器連接在一起,更廣闊,更強大和更穩定的物聯網時代即將到來,并且最終將給企業帶來全新業務方式。物聯網(IoT)為企業創新提供了廣闊的前景。企業通過監控、分析收集來的數據量,來確保業務的正常發展。其中數據大都是從傳感器、應用、門禁系統、配電單元、UPS、發電機和太陽能電池板產生的數據,但隨著這些應用的增長,物聯網帶給企業的安全風險也很大。要應對物聯網的安全挑戰,企業應從智能設備的離線安全、入網安全、在線安全等維度進行整體安全檢測與防護,在云端接入大數據感知威脅和安全態勢分析平臺,獲取威脅情報;在本地端通過減少威脅“檢測時間(TTD)”,即減少發生威脅到發現威脅的時間差,縮短檢測時間,可有效限制攻擊者的操作空間,和最大限度減少損失。①及時更新基礎設施和應用,讓攻擊者無法利用公開的漏洞;②利用集成防御對抗復雜性,采取平衡防御與主動應對的安全控制;③密切監控網絡流量(這在網絡流量模式可預測性非常高的IoT環境中非常重要);④追蹤物聯網設備如何接觸網絡并與其他設備進行交互(例如,如果物聯網設備正在掃描其他設備,則可能是表示惡意活動的紅色警報)。

    四、結論

    神州控股董事局主席郭為對未來的預測時說:“云計算將成為未來主流IT運算模式,大數據會成為最重要核心資源;自上而下的創新將是智能時代推動社會進步的主流方式,借助云計算、大數據這兩項關鍵技術實現互聯網化、協同化和智能化?!敝悄苁俏覀冞@個時代的標志,對于企業信息化來說,它的路很長,首先要完成核心業務在線化和所有的業務流程服務軟件化,然后完成應用軟件的SaaS(Soft-as-a-Service)化,當企業的核心業務完全建立在互聯網上,并有軟件SaaS平臺驅動,企業才能夠向智能化方向演進——低成本積累大數據,并通過數據分析進行商業決策,最終向實時數據分析、實時智能商業決策演進。由此,企業信息智能化任重道遠,從現在開始制定適當的安全策略,以此加快IT新趨勢的適應能力,在不斷采用新技術的過程中建立適合企業的安全管理系統,做到覆蓋企業安全運維的所有場景,監視安全威脅,預測安全風險。

    參考文獻

    [1]維克多•邁克熱•舍恩伯格.大數據時代:生活、工作與思維的大變革[M].浙江人民出版社.

    第6篇:計算機視覺范疇范文

    關鍵詞:圖像分割;直方圖;粗糙集;粗糙度;閾值分割

    中圖分類號:TP18 文獻標識碼:A文章編號:1009-3044(2011)10-2356-02

    Image Segmentation Based on Rough Set Theory

    LI Ran

    (School of Electronic and Communication Engineering, North China Electric Power University, Baoding 071003, China)

    Abstract: Image segmentation is an important problem in digital image processing. Threshold segmentation method is a typical image segmentation method, and the choice of thresholds is an important aspect that affects the quality of image segmentation. For improving accuracy of segmentation, rough set theory is applied to determine threshold in this paper. Histogram is defined as the lower approximation of the rough set of image, and the Histon is defined as the upper one. Thus roughness is calculated, and then the effective segmentation threshold can be determined. Experimental results show that the algorithm has high segmentation accuracy compared with classical threshold segmentation method.

    Key words: image segmentation; histogram; rough set; roughness; threshold segmentation

    在圖像分析和計算機視覺中,如何把目標物體從圖像中有效分割出來一直是一個經典的難題,它決定圖像的最終分析質量和模式識別的判別結果。圖像分割就是將圖像中有特殊意義的不同區域分割開來,使這些區域互不重疊。很多應用領域,最終的對象分類質量和場景解釋在很大程度上取決于高質量的分割輸出[1]。

    圖像分割方法的選擇,在很大程度上依賴于特定的成像方式以及成像中的可變因素和不變因素(如噪聲和紋理等),這些都會在很大程度上影響后繼的分割[2]。現今國內外常用的圖像分割方法主要包括閾值法[3-6]、區域生長法[7-8]、邊緣檢測法[9-10]、結合特定理論工具的分割方法等[11-13]。

    粗糙集理論是一種具有不精確、不確定、不完整和不一致信息的全新數學工具,它可以從大量的數據中分析、推理、挖掘隱含知識及規律。本文將粗糙集理論中上近似和下近似的概念引入圖像的直方圖中,將粗糙度和直方圖閾值分割法結合起來,確定最佳分割閾值,最終實現圖像分割。

    1 粗糙集理論的基本思想

    粗糙集理論是20世紀80年代初由波蘭數學家Z.Pawlak提出的,是一種用于研究不完整數據和不精確知識的表達、學習歸納的數學分析理論。粗糙集理論的核心思想是在保持分類能力不變的前提下,通過對知識的簡化,導出問題的決策或分類規則。

    基于粗糙集理論進行數據分析的全部對象的數據集合稱為信息系統(IS),也稱知識表達系統。一個信息系統可以用一個四元組來定義:IS=(U,A,V,f),其中U={x1,x2,…,xn}是對象的非空有限集合,稱為論域;A={a1,a2,…,an}是屬性的非空有限集合;V是屬性A所構成的域,即V=∪Va,,Va是屬性a∈A的值域;f:U×A->V是一個信息函數,U中任一元素取屬性a在Va中有唯一確定值,即a∈A,x∈U,f(x,a) ∈Va。

    在粗糙集理論中,主要討論能夠在論域U上形成劃分或覆蓋的知識[14]。通常,在問題求解過程中,處理的是論域U上的一簇劃分。因此,定義論域U及論域U上的一簇等價關系S,稱二元組K=(U,S)是關于論域U的一個知識庫或近似空間。論域上的等價關系代表劃分和知識。這樣,知識庫就表示了論域上由等價關系(屬性特征及其有限個屬性特征的交)導出的各種各樣的知識,即劃分或分類模式,同時代表了對論域的分類能力,且隱含著知識庫中概念之間存在的各種關系。

    粗糙集理論中還定義了不可分辨關系的概念。U/S表示論域U中的對象根據關系S構成的所有的等價類簇,若PS,且P≠,則∩P(P中的全部等價關系的交集)也是論域U一種等價關系,稱為P上的不可分辨關系[15],記為:

    不可分辨關系是對象P由屬性集表達時在論域U中的等價關系。不可分辨關系是粗糙集理論的基石,它揭示出論域知識的顆粒狀結構。

    2 直方圖分割法

    基于直方圖的圖像分割方法屬于閾值分割法的一種。目標區域和背景區域對比足夠大的圖像,借助直方圖可方便地確定物體圖像和背景的灰度突變位置,并把此處確定為閾值來進行圖像分割。

    圖像的灰度直方圖反映了一幅圖像中各灰度級像素出現的頻率,它能反映出圖像的灰度分布情況。對于目標區域和背景區域有較大對比度的圖像,其直方圖會呈現明顯的雙峰結構,根據直方圖的這一特點,可以方便地找到判決門限。但是這種經典的直方圖閾值分割法只適用于目標物體有明顯的灰度特征并且背景簡單的圖像分割,對于目標和背景沒有明顯灰度差異的圖像則不能實現完美的分割。

    3 基于粗糙集理論的圖像分割方法

    3.1 粗糙度基本概念

    這里特別說明一下粗糙度的概念。給定知識庫K=(U,S),則XU和論域U上的一個等價關系R∈IND(K),定義子集(概念或信息粒)X關于知識R的下近似和上近似分別為式(1)和式(2):

    (1)

    (2)

    等價關系R定義的集合X的近似精度和粗糙度分別為式(3)和式(4):

    (3)

    精度αR(X)反映了在知識R下對于集合X表達的范疇了解的程度。粗糙度恰恰相反,它反映了在知識R下對于集合X表達的范疇了解的不完全程度。顯然0≤αR(X)

    3.2分割算法及其步驟

    圖像的直方圖可以由粗糙集理論中近似空間的概念映射。設論域 為圖像的灰度直方圖,則知識庫K=(U,S)為圖像直方圖的近似空間。圖像的直方圖根據像素的灰度值把像素劃分為很多子集,每個像素被明確地歸為某個子集中,因此被看作下近似。關于上近似的確定可以引入一個Histon直方圖[16],它考慮了各像素和周圍像素顏色間的近似關系。由下近似和上近似可根據式(4)確定粗糙度為:

    (5)

    式(5)中hi(g)表示圖像基本直方圖函數,Hi(g)為圖像的Histon直方圖函數,g為灰度值。當Hi(g)>>hi(g)時,ρi(g)接近于1,此時灰度為g的像素點大部分位于像素值變化比較小的區域,即圖像的分割區域塊內部;當Hi(g)

    根據上面的分析,分割算法步驟設計如下:1) 由基本直方圖求取下近似;2) 根據Histon直方圖求取上近似;3) 求取粗糙度;4) 依據粗糙度選取最佳分割閾值。

    4 仿真結果

    選取256×256的cameraman圖進行分割實驗。圖1(a)為原始圖像,圖1(b)為基本直方圖分割法得到的分割結果,圖1(c)為依據粗糙度選取最佳閾值的分割結果。由圖1(c)可以看出,選用本文給出的分割方法相對于基本直方圖分割法目標區域的提取更為完整,背景去除更為徹底。

    5 結論

    本文將粗糙集理論引入傳統的直方圖閾值圖像分割法,提出了一種高效的圖像分割方法。該方法利用粗糙集理論中的近似空間概念,將基本直方圖和Histon直方圖分別歸為下近似和上近似,由此計算出粗糙度,來選取最佳的分割閾值,提高了區域劃分的準確度。實驗結果表明,基于粗糙度選取閾值的分割方法對于目標和背景沒有明顯差異并且背景復雜的圖像會得到較好的分割結果。

    參考文獻:

    [1] Lin Kai-yan, Wu Jun-hui, Xu Li-hong. A survey on color image segmentation techniques[J].Journal of Image and Graphics,2005,10(1):1-10.

    [2] 何俊,葛紅,王玉峰.圖像分割算法研究綜述[J].計算機工程與科學,2009,31(12):58-61.

    [3] 任明武,楊靜宇,孫涵.一種基于邊緣模式的直方圖構造新方法[J].計算機研究與發展,2001,38(8):972-976.

    [4] 薛景浩,章毓晉,林行剛.基于最大類間后驗交叉熵的閾值化分割算法[J].中國圖象圖形學報,1999,4(2):110-114.

    [5] 付忠良.基于圖像差距度量的閾值選取方法[J].計算機研究與發展,2001,38(5):563-567.

    [6] Otsu N.A Threshold Selection Method from Gray Level His-togram[J].IEEE Trans on System Man and Cybernetics,1979,9(1):62-66.

    [7] Pohle R, TENnies K D. A New Approach for Model-Based Adaptive Region Growing in Medical Image Analysis [C].Proc of the 9th Int'1 Conf on Computer Analysis and Patterns,2001:238-246.

    [8] 王楠,黃養成.一種改進的彩色圖像區域分割和邊緣提取算法[J].裝備指揮技術學院學報,1999,10(4):106-110.

    [9] 應駿,葉秀清,顧偉康.一個基于知識的邊沿提取算法[J].中國圖象圖形學報,1999,4(3):239-242.

    [10] 王宇生,卜佳俊,陳純.一種基于積分變換的邊緣檢測算法[J].中國圖象圖形學報,2002,7(2):145-159.

    [11] KIM Jinsang, CHEN Tom. Multiple Feature Clustering for Image Sequence Segmentation[J].Pattern Recognition Letters,2001,(22):1207-1217.

    [12] 陳燕新,戚飛虎.基于競爭Hopfield網絡的自動聚類圖像分割方法[J].模式識別與人工智能,1998,11(2):215-221.

    [13] Chen D,Sun Y. A Self-Learning Segmentation Framework The Taguchi Approach[J].Comput Med Imaging Graph,2000,24 (5):283-296.

    [14] 苗奪謙,李道國.粗糙集理論、算法與應用[M].北京:清華大學出版社,2008.

    第7篇:計算機視覺范疇范文

    人工智能如今已是科技行業中“閃耀的新星”。

    我們不禁追問:

    人工智能的前沿問題到底是什么?

    眾多科技公司對“人工智能”的厚愛是趕時髦還是真較量?

    在概念被炒得火熱的同時,

    人工智能的實際應用和有效價值又表現如何?

    5月23日-27日,圍棋界的人機大戰在烏鎮上演??聺嵟cAlphaGo三番棋大戰之后,人類又組團群雄再戰AlphaGo。人工智能再次成為這些天的新聞焦點。

    人工智能如今已是科技行業中“閃耀的新星”。IDC的一份報告顯示,認知計算和人工智能解決方案市場在2016年到2020年的年復合增長率將達到55.1%,認知計算和人工智能在各行各業中的廣泛應用將推動其全球收入從2016年的近80億美元增加到2020年的470多億美元。

    Gartner副總裁兼資深研究員大衛?卡利(David Cearley)在2017年重大技術趨勢預測會上表示:“應用人工智能和高級機器學習實現了一系列的智能應用,包括物理設備(機器人、自動駕駛汽車、消費電子產品)、應用程序和服務(虛擬個人助理、智能顧問)?!?/p>

    卡利說,這些應用將以不同于以往的智能應用程序和智能產品的形式呈現出來,并為各種各樣的網絡設備、現有軟件和服務解決方案提供嵌入式的智能。

    Gartner執行副總裁、研究主管兼資深研究員達爾?普拉默(Daryl Plummer)預測,到2020年,更智能的算法將會讓人工智能改變全球10多億工作者的狀態。

    在Gartner的2017年十大重大技術趨勢預測中,人工智能相關技術占據了前三名的位置,分別是:人工智能和高級機器學習、智能應用、智能產品。

    第一,人工智能和高級機器學習。人工智能和高級機器學習由很多技術(比如深度學習、神經網絡、自然語言處理)組成。Gartner認為,更先進的技術將超越基于規則的傳統算法,創造能夠理解、學習、預測、適應甚至有望自主運作的系統,從而讓智能機器顯得更加“智能”。

    第二,智能應用。像虛擬個人助理這樣的智能應用程序可以發揮人類助理的某些職能,讓人們的日常工作變得更加容易,提高用戶工作效率。Gartner認為,這些智能應用程序有潛力改變現在人們的工作性質和職場結構。“未來十年,幾乎所有的應用程序、服務都將包含某種程度的人工智能。人工智能和機器學習在應用程序和服務方面的應用將不斷發展壯大,這將成為一個長期的趨勢。”卡利舉了一個麥當勞的案例:麥當勞生產漢堡,智能應用每分鐘通過照片分析超過1000個面包來檢查其顏色、形態和芝麻分布狀況,從而不斷自動調整烤箱的溫度和烘烤時間,可以大幅減少人工成本,并保證高質量。

    第三,智能產品。智能產品是指超出了剛性編程模型范疇的物理實體,通過應用人工智能和機器學習來實現高級行為,并與周圍環境和人類更加自然地交互。

    目前,日本長崎的Henn-ne賓館已經開始使用10臺類人機器人進行迎賓服務,代替了原來預訂柜臺的所有服務員。隨著無人機、無人駕駛汽車和智能家電等智能產品的不斷普及,Gartner預計各自為政的智能產品將轉變為相互協作的智能產品。

    數據經濟時代下,人工智能和物聯網等新技術正在成為全球經濟發展的新動力。人工智能的廣泛應用將會作為一種新的常態,推動行業企業轉型,改變人們的生活工作方式。隨著“加快人工智能等技術研發和轉化”今年首次被寫入政府工作報告,商業人工智能將在擁有龐大數據資源的中國市場迎來前所未有的發展機遇。

    當今世界上各大科技公司均將投資目光投向人工智能的未來發展上,并且在可預知的未來一段時間內,他們紛紛計劃在該領域發力。

    那么,我們不禁追問:人工智能的前沿問題到底是什么?這么多科技公司對“人工智能”的厚愛是趕時髦還是真較量?在概念被炒得火熱的同r,人工智能的實際應用和有效價值又表現如何?

    前沿領域篇 人工智能研究的前沿是什么

    史蒂芬?霍金教授在2017GMIC 全球移動互聯網大會上的視頻演講中對于人工智能的前言研究領域如此表述。在過去的20 年里,人工智能一直專注于圍繞建設智能所產生的問題,也就是在特定環境下可以感知并行動的各種系統。在這種情況下,智能是一個與統計學和經濟學相關的理性概念。通俗地講, 這是一種做出好的決定、計劃和推論的能力。基于這些工作,大量的整合和交叉孕育被應用在人工智能、機器學習、統計學、控制論、神經科學以及其它領域。共享理論框架的建立,結合數據的供應和處理能力,在各種細分的領域取得了顯著的成功。例如語音識別、圖像分類、自動駕駛、機器翻譯、步態運動和問答系統。

    他說,現在,關于人工智能的研究正在迅速發展。這一研究可以從短期和長期來討論。一些短期的擔憂在無人駕駛方面,從民用無人機到自主駕駛汽車。比如說,在緊急情況下, 一輛無人駕駛汽車不得不在小風險的大事故和大概率的小事故之間進行選擇。另一個擔憂在致命性智能自主武器。它們是否該被禁止?如果是, 那么“自主” 該如何精確定義。如果不是, 任何使用不當和故障的過失應該如何問責。還有另外一些擔憂,由人工智能逐漸可以解讀大量監控數據引起的隱私和擔憂,以及如何管理因人工智能取代工作崗位帶來的經濟影響。

    長期擔憂主要是人工智能系統失控的潛在風險,隨著不遵循人類意愿行事的超級智能的崛起,那個強大的系統威脅到人類。這樣錯位的結果是否有可能?如果是,這些情況是如何出現的?我們應該投入什么樣的研究,以便更好地理解和解決危險的超級智能崛起的可能性,或智能爆發的出現?

    有人說,腦科學和人工智能迄今為止還是兩門平行的學科,人工智能對人類腦科學研究暫時沒有任何實質性的幫助。反觀腦科學卻對人工智能的深度學習方面提供了不少幫助, 比如人工智能借用神經科學里的視覺工作機制理論,使得人工智能有了今天的發展。但實際上,至今為止, 人工智能也只是用了腦科學其中的一個理論而已。

    但卡內基?梅隆大學計算機科學學院機器學習系主任Tom Mitchellt不這么認為。他在GMIC2017上的演講中提到,下圍棋、下象棋,人工智能在這一領域突破非常快,背后主要是依靠深層次的機器學習。

    另外在腦科學方面的發展也非常迅猛。在過去十幾年的時間里,有很多先進的技術和設備,使得我們可以采用無創或者微創的方法進入到人的大腦,進行毫米級的觀察,而且在毫秒內就可以對幾千張影像進行分析,觀察人腦的活性。

    此外,動物大腦的研究更加令人歡心鼓舞,通過基因方面的研究,在基因上進行相應的工程,對老鼠和其他動物相應的神經元進行修飾、改變,這樣可以更好地對人的神經活動進行一些管理和控制。無論是人工智能還是腦科學,都取得了令人矚目的巨大進展。現在人的腦科學和人工智能方面到了可以有更多交集的好時機,我們應該在人工智能和腦科學之間搭建更多的橋梁。

    而天風證券海外首席分析師何翩翩(美國麻省理工學院電機工程學士、人工智能碩士、MBA三學位獲得者)在GMIC 全球移動互聯網大會上分享關于人工智能未來發展趨勢的報告時表示,目前, 國內外人工智能的討論范疇一直都圍繞著五個點:強度、能力、廣度、監督和自主性。通俗地講可以概括為:機器訓練智能化的程度;用來解決什么問題;特定性向通用性的延伸;監督和無監督;人工智能是助手還是主角。

    她介紹了MIT關于人工智能的五大趨勢預測。首先,最先出現的兩個趨勢應該是正向強化學習和對抗性神經網絡。AlphaGo 可以說是深度強化學習技術的一個里程碑。GAN (生成對抗網絡)很有可能會是在無監督學習還沒能普及之前讓計算機變得更加智能的關鍵所在。其次是語言學習。語音識別和語音接口,在技術和應用場景方面已經算是AI 里面較為成熟的,計算機通過語言與我們交流和互動,理解語言的上下文含義,將使AI 系統獲得全方位的實用性提升,這也是AI步入夏天的第一步。

    第四個趨勢是,2017 年中國開始成為人工智能主要參與者。BAT 的布局,加上國內投資者對于AI 創業公司的投資熱情高漲。政府方面也在積極推動政策扶持,預計在2018 年前投資約150 億美元。但我們也發現關于AI 的夸張報道鋪天蓋地,對AI 的炒作也達到了令業界人士不安的程度。我們認為這樣對AI 可能會造成揠苗助長的負面效果,繼而導致創業公司因估值過高而步向失敗以及投資枯竭的情況。

    第五個趨勢就是面對炒作我們應該深呼吸一口氣,頭腦時刻保持清醒,理智地去看待AI 行業的下一步發展,踏踏實實地去做好AI 應用的研發工作。

    百家爭鳴篇 廠商厚愛AI 是趕時髦還是真較量

    谷歌

    谷歌早在2011年就成立了AI部門。2015年8月,谷歌宣布架構重組,設立母公司Alphabet,把谷歌搜索里提煉出來的人工智能做成谷歌大腦,然后應用到各領域。

    今年5月,谷歌揭示了人工智能發展的一種主要新方法,它被稱為“自動機器學習(AutoML)”,它允許人工智能成為另一個人的架構師,并在無需人工工程師輸入的情況下進行自我創造。

    AutoML項目專注于深度學習,一種涉及到通過神經網絡層傳遞數據的技術。創建這些層是很復雜的,因此谷歌的想法是創造能夠自我創造的人工智能。

    谷歌的這個想法,就是讓現有的人工智能創建自己的代碼層,而事實證明,它比它的人類技術人員更快、更有效地完成了它的工作。

    NVIDIA

    在AI世界里,NVIDIA擁有的GPU技術一直占據中心地位。從2016年起,NVIDIA開始為數據中心和自動駕駛技術提供圖形處理器,成為提振去年股價的中心動力,而這兩項業務的發展也是蒸蒸日上。根據其最近公開的財報,第一財季的數據中心業務收入翻倍至4.09億美元,遠超過預期的3.182億美元。汽車業務收入增長24%至1.4億美元,好于預期的1.32億美元。

    NVIDIA創始人兼CEO黃仁勛在本月初的2017 GPU技術大會上宣布,將與日本汽車制造商豐田合作,為其提供人工智能硬件及軟件技術,致力于在未來幾年內提升自動駕駛系統的性能并推進商業化進程。

    IBM

    日前,以“天工開物?人機同行”為主題的2017 IBM論壇在北京召開。會上IBM了全面升級的加強版合作伙伴計劃(PartnerWorld計劃),以期幫助合作伙伴在云計算、認知、大數據、安全等高增長領域建立更強大的專業知識和新技能,在認知時代打造企業核心競爭力、推動業務高速增長以及提升最終客戶的滿意度。

    IBM大中華區董事長陳黎明認為,Watson是IBM在人工智能領域60年集大成者。IBM在人工智能這個領域的尖端技術集中體現到了Watson這套系統上面去,當然IBM的能力也在不斷的研發、不斷拓展當中,它的能力一定會變得越來越強。目前Watson 所有具備的URLI四大能力是: Watson能夠理解、推理、學習并通過自然語言與人類進行交互。它已經超越了語言和語音的范疇,深入到視覺、情緒和發現領域,其中情緒和發現是Watson所特有的。

    OpenAI

    OpenAI 是一家非營利性機構,由特斯拉CEO 馬斯克聯合多個硅谷名人成立,馬斯克也時常發出人工智能,如開發人工智能即召喚邪惡,甚至表示未來人類將會成為人工智能的寵物,以及人機結合,人類與人工智能并存,或者可以理解為“半機械人”。

    在2015 年12 月,馬斯克及多位硅谷大亨成立了OpenAI 機構,開始了他的瘋狂人工智能計劃,并籌得了10 億美元的資金來推動人工智能健康有序發展。他所研究的人工智能技術成果開源,分享給想要使用的每一個人。要知道推動人工智能發展的關鍵因素是人才和數據,OpenAI 擁有龐大資金后,首先爭奪人工智能人才,從谷歌等公司直接挖來頂尖人工智能研究人員,Google2Brain 團隊的前研究員Ilya2 Sutskever 擔任研究總監。與谷歌、微軟等相比,OpenAI人工智能隊伍仍然十分弱小。OpenAI 近日一項實驗具有里程碑的意義,基于全新算法,人類在虛擬現實環境中演示一遍后,機器人就能模仿執行相同的任務。盡管任務相對比較簡單,但對未來發展奠定基礎,前景廣闊。

    百度

    百度是我國最早在人工智能領域布局的公司。2013 年年初,李彥宏就提出設立深度學習研究院;當年4月,百度設立了硅谷人工智能實驗室。之后,人工智能就漸漸成為百度的戰略發展方向,到如今,百度在人工智能的投入與布局已經初現成果。2016 年6 月,《麻省理工科技評論》評選的“全球最聰明的50 家公司”,百度成功入選; 2016 年11月, 百度大腦入選15 項世界互聯網領先科技成果。除百度大腦外,百度在人工智能領域的布局還包括:無人車駕駛、度秘、百度AR 和百度醫療大腦。

    阿里巴巴

    依托阿里云和電商大數據, 阿里巴巴也在人工智能領域逐漸發力。2016 年8 月初, 在云棲大會北京峰會上,阿里云正式推出人工智能ET。ET 目前已具備智能語音交互、圖像視頻識別、交通預測、情感分析等技能。此外,阿里還有“電商大腦” 和“阿里小蜜”。

    騰訊

    騰訊相對較晚,2016 年9 月末,騰訊AI 實驗室成立,專注于人工智能的基礎研究及應用探索。目前, 該實驗室已經有超過30 位頂尖科學家入職,其中超過90%擁有博士學歷。下一步,將圍繞內容、社交、游戲三個領域的應用場景,專注機器學習、自然語言處理、語音識別和和計算機視覺四個方面的基礎研究。

    聯想

    2017 年4 月中旬,聯想集團董事長楊元慶對外宣布,未來4 年,聯想集團將在人工智能、物聯網和大數據方面的投資超過12 億美元(約82 億元人民幣)。至2021 年3 月份,聯想集團每年研發開支將到達15 億美元左右,且上述款項將占總研發預算的20%以上。

    同BAT 相比,聯想在人工智能領域的探索起步較晚。但未來,每年將有15 億美元的研發資金用于三個技術方向的研究:第一, 將AR作為未來的顯示和應用平臺;第二,對話式的人機交互;第三,針對后臺設備的數據中心技術平臺。據悉,其在智能家居、智能辦公室、智能醫療及其他領域已經開始有所動作,最終聯想能否殺入人工智能排位賽的前列, 讓我們拭目以待。

    美團云

    近日,美團云推出高性能GPU 云主機,標志著美團云正式進軍AI 領域,開啟云端AI 戰略。

    美團云高級研發總監王昕溥向《中國信息化周報》記者介紹,美團云打造的人工智能版圖主要包含三大類產品:主機類、平臺類和服務類。主機類產品中,除已可申使用的高性能GPU 云主機外,還將上線FPGA 云主機服務。FPGA 的單位功耗性能是GPU 的10 倍以上,由多個FPGA 組成的集群能達到GPU 的圖像處理能力并保持低功耗的特點。英特爾預計,到2020 年,將有1/3 的云數據中心節點采用FPGA 技術。平臺類產品方面,美團云還將于7 月正式開放深度學習平臺,輸出美團云AI 能力,為用戶提供TensorFlow 的靈活、高擴展性深度學習框架。美團云深度學習平臺可以讓工程師擺脫底層的繁瑣細節及資源約束,實現一站式開發、測試、部署。在上層服務類產品中,美團云即將上線人臉識別、OCR 文字識別、圖片識別、語音識別、智能客服、自然語言處理、機器翻譯等與人們生活場景密切相關的AI 服務,讓人類生活更加智能化。

    實際應用篇 最接地氣的AI應用有哪些

    說到人工智能(AI),目前被炒得最熱的似乎都是天上飛的技術,比如無人駕駛、AlphaGO 對戰下圍棋, 而實實在在落地到應用生活層面的人工智能卻并不被關注。這不禁讓市場感嘆,2017 年的人工智能虛火上升, 不接地氣。

    云知聲董事長/CTO 梁家恩就曾在4月舉辦的硬蛋AI+ 產業峰會演講中表示,現在絕大多數的AI 產品都更像是在炫耀技術,哪天看不到技術的痕跡了,才可能是達到了一個使用的階段,并最終滲透到智慧生活、智慧城市、智慧制造等領域。其中智慧生活是面向普通的用戶,智能城市是讓資源如何變得更加的優化,智能制造是軟件實現個性化。

    可能,生活中的智能家居是最接地氣的AI應用。

    隨著物聯網時代的來臨,智能生活將成為大多數人的生活常態。而老百姓日常生活所離不開的家居用品則可能是人工智能這項飄在云端的技術中最接地氣和最容易落地的產業,而智能家居落地后會大大改變人們的生活方式。

    數據顯示,2017 年全球智能語音產業規模將達112.4 億美元,復合年均增長率達35.1%,將成為未來智能硬件爆發的據點之一。2012 年至2020年,中國智能家居市場年增長率將達到25%左右,2020 年市場規模將達到3576 億元。而國外,包括蘋果在內的科技巨頭也在布局HomeKit 的智能家居新模式。

    IBM Watson Health已經開始證明自己在幫助處理期刊文章、開展最新醫學研究以及隨后充當診斷助理方面的寶貴價值。現在,IBM正在訓練Watson讀取醫學影像,以幫助放射科醫師加速開展工作并減少錯誤。

    無人機是現在最火的智能設備,除了民用航拍,近幾年專家們還開始利用它們回傳的視頻和圖片來進行大型工程的結構檢查。人們將現有的機器視覺AI技術加入無人機,它就可自行對設備進行檢視,大大縮短設備維護的時間。

    Facebook 表示未來將使1000多架太陽能激光無人機為全球 50 億人提供上網服務,用激光從 6 萬至 9 萬英尺(約合 1.8 萬至 2.7 萬米)的高空發送高速數據供全球最偏遠的地區上網。據悉,該公司將使用一種名為 Aquila 的無人機來完成該項目,這種 V 形無人機的翼展與波音767相仿,重量卻不及一輛小轎車。

    F8 大會期間,Facebook 還展示了這種無人機的最新設計,它可以一次性在高空停留 3 個月,這些無人機有望在今年夏天升空測試――聽起來真的很酷。

    如今,人工智能雖在整個行業內掀起火熱的浪潮,但是如何將研究進程轉換為實際的有效價值才是研究的最終方向。

    相關鏈接

    第8篇:計算機視覺范疇范文

    [關鍵詞]增強現實;移動學習;學習情境

    [中圖分類號]G40-057 [文獻標識碼]A [論文編號]1009-8097(2013)05-0005-05 [DOI]10.3969/j.issn.1009-8097.2013.05.001

    引言

    隨著智能終端技術的成熟與發展,無線寬帶網絡與移動數據業務的部署與推廣,曾經局限于實驗室的增強現實技術開始走進大眾生活,增強現實應用開始涌現。增強現實(Augmented Reality,AR)是在虛擬現實技術基礎上發展起來的一種計算機應用和人機交互技術,通過將虛擬的信息應用到真實環境中,使真實的環境和虛擬的物體實時地疊加到同一個畫面或空間同時存在,呈現給使用者一個感官效果真實的新環境。

    高普及度、便攜易用的手持設備如智能手機等,實現了增強現實系統的小型化和便攜化,是最能體現增強現實價值的平臺之一,將大大拓展和深化增強現實系統應用的廣度和深度。在近年新媒體聯盟(New Media Consortium,NMC)的地平線報告中,增強現實技術和移動技術多次被列為具有潛力的關鍵技術,在教育領域具有廣闊的應用空間和發展潛能,將對教學、學習和創造性表達產生積極的重大影響。增強現實技術為學習者提供情境性的學習體驗,為移動學習提供了新的交互方式和學習情境,更好地符合了學習者隨時隨地進行學習的泛在學習目標。如何有效地將其應用到學習領域,為用戶提供學習支持,需要我們的深入研究和思考。

    一、增強現實系統

    增強現實系統研究涉及多學科背景,包括計算機圖形處理、人機交互、信息三維可視化、新型顯示器、傳感器設計、無線網絡等。我們對增強現實系統從多個角度進行了綜合分析,如圖1所示。增強現實系統的工作原理與傳統增強現實系統相同,基本流程為:(1)獲取場景信息;(2)對傳感器獲取的信息進行分析處理;(3)生成虛擬圖像;(4)三維顯示。相對于傳統增強現實系統,增強現實系統一般不需要顯示完整的場景,但需要實時地分析處理大量傳感器數據和虛擬信息,以進行精確的三維注冊,所以增強現實系統具有特定的軟硬件平臺支持和關鍵技術支撐。與傳統的增強現實系統相比,增強現實創新了移動應用模式,具有增強、移動、整合、開放等特征。

    1.硬件系統

    (1)處理器系統——持續計算能力

    處理器系統用于提供增強現實系統的計算能力,是評價移動互聯網終端性能的重要參數,主要包括CPU和GPU。當前智能手機的CPU已發展為多核處理器,以高速頻率保證高運算要求。同時隨著應用程序的豐富,智能終端需要處理復雜的圖像任務,在硬件上引入了GPU負責圖形顯示功能的處理,系統性能得到極大提高。

    (2)顯示系統——采集顯示能力

    顯示系統主要提供智能終端的采集顯示能力,包括顯示屏幕、攝像頭等,是實現增強現實應用的重要設備。當前智能終端的顯示屏幕基本在3.5英寸以上,屏幕色彩度日益提高,分辨率逐漸增強。終端攝像頭分辨率通常達到百萬級別至千萬級別,可以拍攝和錄制高清晰度影像。

    (3)傳感器系統——狀態感知能力

    傳感器系統是實現增強現實的必要支持。當前,豐富的傳感器設備已經成為智能手機的重要組成部分,如GPS、電子羅盤、加速計、陀螺儀、重力感應器、位移傳感器、光線感應器等。傳感器系統使手機變得越來越智慧化,向著情境感知的方向發展,增強了手機體驗感和用戶互動,是實現增強現實系統的有力支持。

    (4)交互系統——人機互動能力

    交互系統是影響增強現實系統體驗的主要手段。當前智能手機采用觸摸屏交互、語音交互等交互方式,在人機操作關系上產生了很大的變革,可以通過多通道與計算機生成的虛擬信息進行交互式反應,使用戶更自然地融入到場景中去,具有更新鮮的體驗感。

    (5)網絡系統——通信傳輸能力

    無線通信技術和互聯網技術是移動服務的支撐技術。在一些增強現實的應用中需要通過遠程服務器來存儲大量的數據信息,某些數據處理也要通過遠程服務器來完成。3G等無線通信技術為增強現實應用的發展提供了網絡帶寬等支持。

    2.軟件系統

    (1)目標識別算法

    目標識別指在相關場景中找到給定的目標物體,并對其進行標記。增強現實需要實現復雜移動場景中的實時目標識別,如可采用多特征如色彩、紋理、輪廓融合的方式對復雜場景進行特征提取和識別。

    (2)跟蹤注冊算法

    跟蹤注冊算法將虛擬物體合并到真實空間中的準確位置。增強現實系統應實時跟蹤手機在真實場景中的位置及姿態,并根據這些信息計算出虛擬物體在圖像中的坐標,實現實時、魯棒、穩定、準確的跟蹤,保證虛擬物體畫面與真實場景畫面精準匹配。

    (3)三維圖形渲染算法

    通過三維圖形建模和渲染算法處理,在真實環境中疊加有增強顯示效果的三維物體,進行逼真顯示,幫助用戶對環境的理解。

    3.增強現實的類型

    從增強現實在跟蹤注冊技術采用的不同方法角度來分析,可以將增強現實分為基于標記的和無標記的兩類。基于標記的增強現實是指通過特定的標記或圖案供系統辨識,使用計算機視覺方法識別出這些標志物,從而計算出攝像機相對于標志物的位置和方向,再據此計算出虛擬物體應該放置的位置和方向。在無標記增強現實系統中,真實環境的任何一部分都能被用作一個可跟蹤的目標,通過攝像頭捕捉現實世界的圖像,然后在顯示屏的圖像上疊加文本、鏈接或其他對象實體,構建一個新的三維圖形模型。二移動學習與增強現實的研究與發展分析

    對增強現實技術的研究屬于教育新技術研究的范疇,目標是通過技術研究,探索技術在教與學中的應用模式。本節基于Hype Cycle模型與地平線報告研究,分析增強現實在教育中的應用發展與前景。

    1.Hy]pe Cycle模型分析

    (1)Hype Cycle模型與教育技術

    Hype Cycle(發展規律周期)模型是由Gartner提出的一個應用廣泛的發展周期預測模型,模型描述了一項技術從誕生到成熟,再到廣泛應用的過程,如圖2所示。模型指出,技術的發展過程通常有以下規律:首先是起步上升期和快速發展期,這兩個時期主要是理論研究階段,新的技術理論從出現到快速成長,理論突破頻繁。到了快速發展期的頂端,基礎理論基本成熟,理論探索空問縮小。而此時該項技術在產業上的應用尚未成熟,缺乏成熟的應用模式,因此新技術受關注程度進入下降期。隨著新技術應用模式的不斷創新,該項技術的受關注程度將再次增加,并將其帶入一個持續發展的爬坡期。隨著技術應用模式的成熟,進入穩定應用期。

    教育技術關注技術在教育領域應用,Hype Cycle發展周期模型對技術演進的分析,有助于我們對技術教學應用的研究。在教育技術研究中,教育新技術研究是前瞻性研究,它有助于我們探索教育技術未來發展的方向,幫助我們研究新技術,預見新技術在教育領域中的發展。技術的教學應用研究是核心研究,是教育技術的目的。需要在對新技術研究的基礎上進一步設計開發其在教學中的應用,通過技術在教育中的應用體現和提升其價值。表1和圖2分析了技術發展周期模型與教育技術研究各個階段的關系。

    (2)基于Hype Cycle模型的移動學習與增強現實分析

    我們綜合分析了Gartner最新提出的關于教育、新型技術、情境感知、人機交互等領域的分析,對其中與移動學習、增強現實、移動應用等相關的項目進行了分析,作出圖3分析。

    由圖3中各項技術所處的發展階段,得到如下分析結果:

    增強現實:處于快速發展階段末期,理論研究逐步成熟,但在行業上的應用尚未成熟,需要進一步探索技術的行業應用模式。

    移動學習:Gartner將移動學習分為了兩類,一類為低階(Low-range/Midrange)手持設備,一類為智能終端設備。兩類移動學習當前都尚處于應用模式探索階段。

    移動應用開發:與增強現實相關的移動應用開發研究,如位置服務應用、移動開發平臺等,技術相對成熟,已經具有相關的應用模式,處于技術的穩定應用期。

    情境感知:情境感知是與增強現實密切相關的一個研究領域,當前主要處于理論研究的快速發展時期。

    2.地平線報告分析

    我們對新媒體聯盟歷年的地平線報告中,與移動學習和增強現實有關的項目進行了分析。從2006年至今,在地平線報告中,每年都有移動技術和移動學習相關的項目,2005、2006、2010和2011年四年的地平線報告中,也都關注了增強現實在教育領域中的應用。

    從地平線報告分析可以發現,手機、移動寬帶、移動設備、移動計算等技術在近年被提及的次數最多,移動技術在教育中具有巨大的應用空間和發展潛能,移動學習是教育信息化發展的重要趨勢。增強現實也在近年逐漸得到教育領域的關注。在2012年地平線報告中,與移動學習和增強現實有關的項目有如下變化。首先,“增強現實”這一項在2012年地平線報告中已不再出現。而在2011年地平線報告中排列第二位的“移動設備”,2012年從關注硬件設備轉為關注如何通過移動設備更好地進行各種應用研究。2012年提出的“移動應用程序”(Mobile Apps)和“平板電腦應用”,強調的都是“應用”(Tablet Computing)。2013年地平線報告中再次強調了“平板電腦應用”(Tablet Computing)。分析這種變化,在于傳統增強現實和移動相關的理論與技術研究相對成熟,未來關注的重點是學習應用模式的研究與創新,這與Garter的預測模型分析結果是一致的。

    3.分析

    基于Hype Cycle模型和地平線報告,我們分析如下:

    (1)傳統增強現實、移動設備、移動計算等理論與技術已趨于發展成熟,為增強現實和移動學習的發展提供了支持,未來將更多的關注應用模式的創新研究。

    (2)增強現實技術在理論研究上日趨成熟,需要進一步探索其行業應用模式,隨著移動學習和泛在學習的發展,教育應用將是增強現實應用開發和價值體現的重要領域。

    (3)基于智能設備的移動學習正處于應用模式的發現和創新階段,增強現實為移動學習提供了新的學習情境和交互方式,帶來了新的研究場景和研究思路,將有效推動新的移動學習模式的研究。

    (4)移動學習和增強現實二者相互融合,相互推動,共同發展。隨著未來在情境感知等領域研究的發展和成熟,也將進一步推動增強現實的應用研究。

    三、基于增強現實技術的移動學習分析

    基于增強現實技術的移動學習研究在國內外還處于起步階段,還需要我們更多的探索。

    1.研究現狀分析

    已有研究中,學者們對增強現實技術應用于移動學習領域的有效性進行了分析,指出其在多個方面的優勢。

    (1)在學習情境創設上,基于增強現實的移動學習可以創建符合情境的學習環境,支持泛在的、協作的情境學習,豐富了個人學習環境的建設。

    (2)在增強學習體驗上,增強現實促進學習者與多種形式的情境信息進行交互互動,使學習信息的搜索更加便捷、學習體驗更加真實,學習交互更加自然。

    (3)在促進學習與能力培養上,增強現實型學習軟件在注意力保持、學習遷移方面等優于文本型、圖文型、計算機多媒體型等類型,有助于提高學習有效性。

    2.學習案例分析

    當前增強現實在教學領域的應用案例主要集中在泛在學習和游戲等方面。Star Walk(星空漫步)是一款典型的基于iOS系統的天文地理學習軟件,如圖4所示。

    在使用時,當學習者開啟Star Walk后,將攝像頭對準天空,軟件將對屏幕內的對象信息進行分析處理,及時提供關于對象的信息,呈現學習對象的增強實時互動三維模型,是一種即指即現的方式。學習者可以實時根據所處的經緯度、時間,學習所在位置的星空圖,并可以通過“時間機器”功能,使學習者觀察過去、現在的星相信息。軟件通過維基百科鏈接描述天體條目的信息,并能夠設置標簽,通過微博等社交網絡與其他學習者交互。Star Walk增強現實軟件拉近了學習者與星空、天文學的距離,并且使用方法簡單、界面設計美觀、功能強大,是增強現實技術在移動學習中應用的成功案例。

    3.Speeht的增強現實學習模式

    對Star Walk學習案例進行分析,可以發現,增強現實應用綜合了學習者的位置、時間、環境和社會關系等情境信息,創設了完善的移動學習體驗。Marcus Speeht等提出了一個基于增強現實的學習分析模式,如圖5所示。

    模式基于增強現實的情境增強維度和學習目標維度進行分析,橫向維度分析了六種典型的移動學習情境:獨立情境,標識、位置、環境、關系與時間,縱向維度分析了六種不同層次的教學目標:資源描述、探索發現、內容理解、學習反思、團體合作、行為績效。

    增強現實支持和滿足了學習對情境的要求,學習內容由移動學習系統通過感知學習者的學習情境自動推送給學習者,并且通過情境感知和處理,增強和創設新的學習情境。不同類型的增強現實學習,能夠滿足移動學習不同的情境需求,達到不同層次的教育目標。如StarWalk學習應用,基于學習者的位置情境、環境情境和時間情境,為用戶提供良好的學習體驗,將有助于學習內容的資源描述、探索發現、增強學習者的內容理解與協作學習。

    Specht的分析模式對我們研究基于增強現實的學習具有借鑒和指導作用,從情境信息角度設計和分析移動學習應用,為學習者創設完善的學習情境,將增強移動學習的智能性和適應性,有助于學習支持系統功能的進一步完善,是移動學習可以深度擴展的方向。四增強現實學習系統設計

    本節提出一個增強現實學習系統的設計與開發模型。在前期研究中,我們曾提出了一個面向位置服務移動學習的開發模型,在此基礎上,我們對前期模型進行了擴展和細化,新的模型不僅適用于基于增強現實的系統開發,也能夠對各種移動學習系統的開發提供框架指導,如圖6所示。

    增強現實學習系統的設計與開發包括需求分析、功能設計與技術實現三個模塊。在需求分析階段,要從用戶角度和資源特點出發,對所要開發的軟件進行分析。并非所有的學習活動都適用于移動學習形式,因此,需求分析是首要步驟,目的在于判斷學習是否適合于增強現實類型。不恰當的應用移動設備不僅會造成資源上的浪費,還可能對學習的最終效果產生負面作用。在功能設計階段,結合增強現實軟件的特點和移動學習應用模式要求,進行媒體設計、交互設計、三維模型設計、位置服務和社交服務設計。在技術開發階段,基于相應的移動平臺,進行應用程序的開發。三個模塊對應的層次包括系統層、服務層、應用層和開發層。系統層為手機提供底層的軟硬件支撐,包括手機硬件平臺和操作系統。服務層提供應用程序開發的接口和模塊,我們將服務層進一步細化為兩個層次:操作系統平臺類庫和第三方支持類庫。不同類型移動學習系統開發涉及的功能模塊,主要在服務層提供的各種開發包的支持下實現。其中基礎服務層主要包括操作系統平臺類庫,如傳感器編程組件、位置服務組件等。開發服務層包括第三方支持類庫,地圖引擎,增強現實開發的相關工具開發包如ARToolKit、Layar、高通Vuforia,以及各種相關移動開發框架等。應用層向上為用戶提供學習應用,向下選擇和使用服務層的相關功能。根據對移動學習系統的應用需求、功能模塊、學習目標等的分析,選擇適當的移動學習應用模式。具體的開發結合選用的平臺,基于服務層的支持實現。在用戶層,學習者通過智能手機終端,使用相應的學習軟件。

    主站蜘蛛池模板: 成人在线免费网站| 日本娇小xxxⅹhd成人用品| 亚洲成人激情小说| 高清成人爽a毛片免费网站| 成人综合激情另类小说| 国产成人精品美女在线| 亚洲国产精品成人午夜在线观看| 日韩成人无码一区二区三区| 在线看欧美成人中文字幕视频| 四虎成人国产精品视频| 成人毛片一区二区| 亚洲人成人77777网站| 国产成人精品亚洲精品| 成人综合伊人五月婷久久| 亚洲国产精品无码成人片久久| 成人黄色免费网站| 亚洲国产一成人久久精品| 国产成人精品免费视频大全| 成人午夜私人影院入口| 欧美成人黄色片| 91成人免费观看在线观看| 亚洲国产精品成人久久| 国产成人yy免费视频| 国产成人精品自线拍| 成人区人妻精品一区二区不卡视频 | 欧美成人免费午夜全| 成人亚洲成人影院| 青青国产成人久久91网站站| 在线91精品亚洲网站精品成人| 久久精品成人一区二区三区| 国产午夜成人AV在线播放| 四虎精品成人免费永久| 免费国产成人α片| 亚洲色成人WWW永久在线观看| 国产成人mv在线播放| 国产成人午夜高潮毛片| 亚洲欧美成人日韩| 亚洲av午夜成人片精品网站| 亚洲国产成人久久一区www| 久久久久久成人毛片免费看| 精品国产成人亚洲午夜福利|