公務員期刊網 精選范文 卷積神經網絡現狀范文

    卷積神經網絡現狀精選(九篇)

    前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的卷積神經網絡現狀主題范文,僅供參考,歡迎閱讀并收藏。

    卷積神經網絡現狀

    第1篇:卷積神經網絡現狀范文

    關鍵詞:圖像復原;盲復原;逆濾波;神經網絡復原

    1 圖像退化及復原模型

    1.1 圖像降質的數學模型

    圖像復原處理的關鍵問題在于如何建立退化模型。假定輸入圖像f(x,y)經過某個退化系統后輸出的是一幅退化的圖像。為了方便討論, 把噪聲引起的退化(即噪聲)對圖像的影響一般作為加性噪聲考慮,這也與許多實際應用情況一致,如圖像數字化時的量化噪聲、隨機噪聲等就可以作為加性噪聲,即使不是加性噪聲而是乘性噪聲,也可以用對數方式將其轉化為相加形式。原始圖像f(x,y) 經過一個退化算子或系統H(x,y) 的作用,然后和噪聲n(x,y)進行疊加,形成退化后的圖像g(x,y)。圖像退化的過程可以用數學表達式寫成如下的形式:

    g(x,y)=H[f(x,y)]+n(x,y)

    n(x,y)是一種統計性質的信息下圖表示退化過程的輸入和輸出的關系,其中H(x,y)包含了退化系統的物理過程,即所要尋找的退化數學模型。

    1.2 圖像的退化恢復模型

    數字圖像的圖像恢復問題可以看作是:根據退化圖像g(x ,y)和退化算子H(x ,y)的形式,沿著逆向過程去求解原始圖像f(x ,y), 或者說逆向地尋找原始圖像的最佳近似估計。

    2 研究背景與意義

    圖像復原是數字圖像處理技術的一個重要研究方向,在現實生活中,有著非常廣闊的應用前景和市場。數字圖像處理研究很大部分是服務于數字圖像復原的,而運動模糊圖像的復原又是圖像復原中的重要課題之一,從六十年代起就有人研究它。初期研究的主要原因是對衛星所拍攝的圖像進行復原,因為衛星相對地球是運動的,所拍出的圖像是模糊的(當然衛星所拍攝圖像的模糊原因不僅僅是相對運動而造成的,還有其他原因如大氣湍流所造的模糊等等)。美國的噴氣推進實驗室(JPL)對徘徊者飛行器發回的月球照片進行了圖像恢復處理。傳統的圖像恢復方法可以很好地恢復出來原始圖像,但是需要事先知道系統的先驗知識(例如系統的點擴散函數)。在先驗知識不足的情況下,如何恢復出來原始圖像?這就需要模糊圖像盲恢復技術。根據不同的應用背景和先驗知識,大致可以兩種方法恢復兩種類型的模糊圖像,以滿足不同的應用要求。

    第一種方法:如何快速恢復模糊圖像,進行適時性圖像處理?這個技術在實際生活中有著廣泛應用。

    第二種方法:如何在事先不能確定模糊系統點擴散函數的情況下,恢復模糊圖像,改善圖像的質量,這就是圖像盲恢復的問題。

    3 國際國內研究發展和現狀

    從歷史上來看,數字圖像處理研究有很大部分是在圖像恢復方面進行的,包括對算法的研究和針對特定問題的圖像處理程序的編寫。數字圖像處理中很多值得注意的成就就是在這兩方面取得的。

    在六十年代中期,去卷積(逆濾波)開始被廣泛地應用于數字圖像恢復。這一階段對模糊圖像的研究主要是把因相對運動而拍攝的模糊圖像復原過來,從而增強人們的判讀能力。早期做圖像復原研究,主要強調盡可能使模糊圖像復原到原貌,增加它的判讀性,在此發展了很多的復原方法,諸如:差分復原、維納濾波等.這些方法各有特點,較好的解決了運動模糊圖像的判讀問題,但是在應用上均有一定的限制。

    雖然經典的圖象復原方法不少,但歸納起來大致可分為逆濾波法,或稱相關變換法( inv ersefiltering or t ransfo rm related techniques) 和代數方法( alg ebraic techniques) 兩種。

    3.1 傳統復原法

    3.1.1 逆濾波方法

    逆濾波法大致有經典逆濾波法、維納濾波法、卡爾曼濾波法等. 其中,在傅立葉變換域,經典逆濾波的變換函數是引起圖象失真的變換函數的逆變換,其雖在沒有噪聲的情況下,可產生精確的復原圖象,但在有噪聲時,將對復原圖象產生嚴重的影響,雖然濾波函數經過修改,有噪聲的圖象也能復原,但它僅適用于極高信噪比條件下的圖象復原問題; 維納濾波法是通過選擇變換函數,同時使用圖象和噪聲的統計信息來極小化均方復原誤差,這雖然在一定程度上克服了逆濾波法的缺點,但是維納濾波法需要較多有關圖象的先驗知識,如需要對退化圖象進行滿足廣義平穩過程的假設,還需要知道非退化圖象的相關函數或功率譜特性等等,而在實際應用中,要獲得這些先驗知識有較大的困難,為此,Ozkan 等人在研究圖象序列的復原問題時,提出了一種解決空間和時間相關性的多幀維納濾波法,是近年來維納濾波法的新發展; 卡爾曼濾波是一種遞歸濾波方法,其雖可用于非平穩圖象的復原,但是因計算量過大,而限制了其實際應用的效果。 Wu 和Kundu 又對卡爾曼濾波方法進行了改進,不僅提高了速度,并考慮了應用于非高斯噪聲的情況; Cit rin 和Azimi-Sadjadi 也對卡爾曼濾波方法進行了改進,提出了塊卡爾曼濾波方法; Koch 等提出了擴展卡爾曼濾波( extended Kalmam filter) 復原方法,該方法可以較好地復原模糊類型不相似的退化圖象.除了上述的逆濾波方法外,還有參數估計濾波法,它實質上是維納濾波法的變種. 20 世紀90 年代初,又提出了基于遞歸圖象濾波的自適應圖象復原方法及合成濾波方法,它代表了濾波方法新的發展方向. 1998 年Kundur 等人首先明確提出了遞歸逆濾波( recursiv e inv er se filter ing ) 算法 ,2000 年Chow 等人又進行了改進,即在代價函數中增加了空間自適應正則化項,從而很好地抑制了噪聲,并減少了振鈴現象,較好實現了在低SNR 條件下的盲圖象復原. 2001 年,Eng 等人結合模糊集的概念,提出了自適應的軟開關中值濾波方法,它能在有效地去掉脈沖噪聲的同時,很好地保存圖象的細節,是一種值得重視的新的圖象復原方法。

    3.1 2 代數方法

    Andrews 和Hunt 提出了一種基于線性代數的圖象復原方法。這種方法可能比較適合那些相對于積分運算,則更喜歡矩陣代數,而相對于分析連續函數,又更喜歡離散數學的人的口味。它為復原濾波器的數字計算提供了一個統一的設計思路。代數方法可分為偽逆法、奇異值分解偽逆法、維納估計法和約束圖象復原方法等。 其中,偽逆法,實質上是根據圖象退化的向量空間模型來找到引起圖象退化的模糊矩陣,但由于模糊矩陣總是很大的,因此在計算上往往不可行; 而奇異值分解偽逆法則是利用矩陣可分解成特征矩陣系列的思想,將模糊矩陣進行分解,由于簡化了計算,從而有利于模糊矩陣的估計計算,但在有噪聲存在時,經常會出現不穩定的現象; 維納估計法雖然考慮了噪聲的情況,但它僅適合噪聲是二維隨機過程,且已知其期望和協方差的情況。前面的方法僅把圖象看成是數字的陣列,然而一個好的復原圖象應該在空間上是平滑的,其在幅度值上是正的,而約束圖象復原方法就是將這些因素作為約束條件,如基于維納估計法和回歸技術而提出的圖象復原方法就是一種約束圖象復原方法,而且通過選取不同的約束參數和回歸方法可以得到不同的圖象復原算法。傳統的圖象復原算法或面臨著高維方程的計算問題,或要求恢復過程滿足廣義平穩過程的假設,這就是,使得具有廣泛應用價值的圖象復原問題沒有得到圓滿的解決的根本原因。

    3.2 神經網絡圖象復原的方法

    神經網絡圖象復原方法的發展方向自從神經網絡圖象復原首次提出十多年來,其研究在不斷地深入和發展,描述它的現狀已屬不易,展望它的未來更是困難,況且科學研究具有不確定性. 據筆者判斷,如下諸方面是亟待解決的問題,或研究活動已有向這些方面集中的趨勢。

    3. 2.1小波神經網絡用于圖象復原將是研究的重點

    自1992 年Zhang 提出小波神經網絡以來,如今已提出了各種類型的小波網絡,且小波與神經網絡的結合成了一個十分活躍的研究領域。通過學者們的理論分析和模擬實驗表明: 由于小波神經網絡具有逼近能力強、可顯著降低神經元的數目、網絡學習收斂的速度快、參數( 隱層結點數和權重) 的選取有理論指導、能有效避免局部最小值問題等優點,因此將其用于圖象復原是一個值得研究的方向。將小波的時頻域局部性、多分辨性等性質,與神經網絡的大規模并行性、自學習特性等優點結合起來,不僅將使用于圖象復原的小波神經網絡具有自適應分辨性,也將使正則化參數的選取更具有自適應能力. 最終使復原圖象既能保持圖象的細節,又能很好地抑制圖象中的各種噪聲。

    3.2.2細胞神經網絡、BP 網絡、自組神經網絡

    值得進一步研究細胞神經網絡( CNN ) 由于其具有易于硬件實現的特點,因而具有很強的商業價值,但由于其自身還有很不成熟的地方,因此值得深入地研究. 其研究方向有: 細胞神經網絡理論基礎的進一步完善及在此基礎上建立細胞神經網絡中鄰域系統的概念; 與圖象數據局部相關性等概念結合起來研究,以建立新的圖象復原理論,形成新的圖象復原技術。BP 網絡對受污染或帶噪聲的訓練樣本,不僅能進行正確的映射,且與其純樣本仍相似。 正是BP 網絡的泛化能力強,使它在解決圖象復原問題時,可能比其他神經網絡具有更好的潛在性能。 將BP 網絡用于圖象復原是很值得進一步研究的.大家知道,人腦的學習方式是“自主的”,即有自組織和自適應的能力的,即人腦能在復雜、非平穩和有“干擾”的環境及其變化的情況下,來調整自己的思維和觀念,還能根據對外界事物的觀察和學習,找到其內在的規律和本質屬性,并能在一定的環境下,估計到可能出現的情況以及預期會遇到和感覺到的各種內容及情況。 自組織神經網絡(SONN) 正是基于人腦的這些功能而生成的,由于它具有能從輸入的數據中,揭示出它們之間內在關系的能力,因此將其用于“盲圖象”的復原將是非常有利的。

    3.2.3 需要提出更適合圖象復原的新神經網絡模型

    小波神經網絡是為逼近任意非線性函數而提出來的,但為了圖象復原的需要,可考慮針對圖象復原的特殊情況,提出新的神經網絡模型。 如,因為大多數圖象是由平滑區域和輪廓細節組成的,其圖象數據在平滑區域雖具有較強的相關性,但與輪廓細節相鄰的數據應極不相關,所以,提出一種專用于圖象復原的“相關性神經網絡模型”是必然的期待; 再有,因為多項式具有較廣的擬合性和較好的收斂性,所以應提出的“多項式神經網絡”,將它們用于圖象復原也是值得研究的。

    3.2.4 神經網絡與其他理論的結合

    研究是尋求新模型、新方法的重要途徑目前神經網絡的研究正由單純的神經計算轉向計算智能,并結合腦科學的研究向生物智能方向發展。 為此,神經網絡圖象復原的研究也應考慮吸收模糊、分形、混沌、進化計算、信息融合等交叉學科的研究成果。 與模糊系統的結合將是一個重要的研究方向,因為,神經網絡與模糊系統有如下很多的相同之處: ( 1) 它們在處理和解決問題時,無需建立對象的精確數學模型,而只需要根據輸入的采樣數據去估計其要求的決策; ( 2) 在對信息的加工處理過程中,均表現出了很強的容錯能力; ( 3) 它們都可以用硬件來實現. 由此可見,將神經網絡與模糊系統結合,用于圖象復原將是有意義的研究工作。

    4 未來展望

    圖像恢復發展到現在,已經有了許多成熟的算法,但是還是存在許多問題,等待著我們去解決。目前圖像恢復的最新發展有:

    1. 非穩圖像復原,即空間可變圖像復原。

    2. 退化視頻信號的復原問題,以及攝像機拍照圖像復原,這是一個需要進一步研究的領域。

    3. 運動補償時空復原濾波,同時將時間相關應用到運動補償中。

    4. “Telemedicine“的出現,遠程診斷極大的依賴于遠程接受的圖像質量,圖像恢復在醫學領域中有相當重要的作用。

    5. 模糊 PSF 的 Identification 仍然是一個困難的問題,尤其在空間可變的 PSF 的估計中。

    6. 空間可變恢復方法,可以利用 Wavelets 和 Markov 隨機場等方法進行復圖像恢復,這是一個具有發展潛力的研究方向。

    參考文獻

    1 馮久超,黃海東. 基于神經網絡的盲圖象恢復[ J ] . 計算機科學,2000,27( 1) : 67~68.

    2 Er ler K,Jernigan E. Adaptive image restorat ion using recursive image f ilters [ J ] . IEE E Trans actions on Signal Process ing,1994,42( 7) : 1877~1881.

    第2篇:卷積神經網絡現狀范文

    關鍵詞:圖像分割 閾值分割 遺傳算法 小波變換

    中圖分類號:TP391 文獻標識碼:A 文章編號:1002-2422(2010)02-0001-03

    圖像分割是按照一定的規則把圖像劃分成若干個互不相交、具有一定性質的區域,把人們關注的部分從圖像中提取出來,進一步加以研究分析和處理。圖像分割的結果是圖像特征提取和識別等圖像理解的基礎,對圖像分割的研究一直是數字圖像處理技術研究中的熱點和焦點。圖像分割使得其后的圖像分析,識別等高級處理階段所要處理的數據量大大減少,同時又保留有關圖像結構特征的信息。圖像分割在不同的領域也有其它名稱,如目標輪廓技術、目標檢測技術、閾值化技術、目標跟蹤技術等,這些技術本身或其核心實際上也就是圖像分割技術。

    1 經典圖像分割方法

    1,1閾值分割方法

    閾值分割是常見的直接對圖像進行分割的算法,根據圖像像素的灰度值的不同而定。對應單一目標圖像,只需選取一個閾值,即可將圖像分為目標和背景兩大類,這個稱為單閾值分割:如果目標圖像復雜,選取多個閾值,才能將圖像中的目標區域和背景被分割成多個,這個稱為多閾值分割,此時還需要區分檢測結果中的圖像目標,對各個圖像目標區域進行唯一的標識進行區分。閾值分割的顯著優點,成本低廉,實現簡單。當目標和背景區域的像素灰度值或其它特征存在明顯差異的情況下,該算法能非常有效地實現對圖像的分割。閩值分割方法的關鍵是如何取得一個合適的閾值,近年來的方法有:用最大相關性原則選擇閾值的方法、基于圖像拓撲穩定狀態的方法、灰度共生矩陣方法、最大熵法和谷值分析法等,更多的情況下,閾值的選擇會綜合運用兩種或兩種以上的方法,這也是圖像分割發展的一個趨勢。

    1,2基于邊緣的圖像分割方法

    邊緣總是以強度突變的形式出現,可以定義為圖像局部特性的不連續性,如灰度的突變、紋理結構的突變等。邊緣常常意味著一個區域的終結和另一個區域的開始。對于邊緣的檢測常常借助空間微分算子進行,通過將其模板與圖像卷積完成。兩個具有不同灰度值的相鄰區域之間總存在灰度邊緣,而這正是灰度值不連續的結果,這種不連續可以利用求一階和二階導數檢測到。當今的邊緣檢測方法中,主要有一次微分、二次微分和模板操作等。這些邊緣檢測器對邊緣灰度值過渡比較尖銳且噪聲較小等不太復雜的圖像可以取得較好的效果。但對于邊緣復雜的圖像效果不太理想,如邊緣模糊、邊緣丟失、邊緣不連續等。噪聲的存在使基于導數的邊緣檢測方法效果明顯降低,在噪聲較大的情況下所用的邊緣檢測算子通常都是先對圖像進行適當的平滑,抑制噪聲,然后求導數,或者對圖像進行局部擬合,再用擬合光滑函數的導數來代替直接的數值導數,如Mart算子、canny算子等。在未來的研究中,用于提取初始邊緣點的自適應閾值選取、用于圖像層次分割的更大區域的選取以及如何確認重要邊緣以去除假邊緣將變的非常重要。

    1,3基于函數優化的分割方法

    此方法是圖像分割中另一大類常用的方法。其基本思路是給出一個目標函數,通過該目標函數的極大化或極小化來分割圖像。GA.Hewer等人提出了一個具有廣泛意義的目標函數。統計學分割方法、結合區域與邊緣信息的方法、基于貝葉斯公式的分割方法等是目前幾種活躍的函數優化方法。

    統計學分割方法是把圖像中各個像素點的灰度值看作是具有一定概率分布的隨機變量,且觀察到的實際物體是作了某種變換并加入噪聲的結果。統計學分割方法包括基于馬爾科夫隨機場方法、標號法、混合分布法等。

    區域增長法和分裂合并法是基于區域信息的圖像分割的主要方法。區域增長有兩種方式,一種是先將圖像分割成很多的一致性較強的小區域,再按一定的規則將小區域融合成大區域,達到分割圖像的目的。另一種實現是給定圖像中要分割目標的一個種子區域,再在種子區域基礎上將周圍的像素點以一定的規則加入其中,最終達到目標與背景分離的目的;分裂合并法對圖像的分割是按區域生長法沿相反方向進行的,無需設置種子點。其基本思想是給定相似測度和同質測度。從整幅圖像開始,如果區域不滿足同質測度,則分裂成任意大小的不重疊子區域,如果兩個鄰域的子區域滿足相似測度則合并。

    2 結合特定工具的圖像分割算法

    雖然圖像分割目前尚無通用的理論,但是近年來大量學者致力于將新概念、新方法應用于圖像分割,結合特定理論的圖像分割方法在圖像分割方面取得了較好的應用效果。如小波分析和小波變換、神經網絡、遺傳算法等數學工具的利用,有效地改善了分割效果。

    2,1基于遺傳算法的圖像分割

    遺傳算法是模擬自然界生物進化過程與機制求解問題的一類自組織與自適應的人工智能技術。對此,科學家們進行了大量的研究工作,并成功地運用于各種類型的優化問題,在分割復雜的圖像時,人們往往采用多參量進行信息融合,在多參量參與的最優值求取過程中,優化計算是最重要的,把自然進化的特征應用到計算機算法中,將能解決很多問題。遺傳算法的出現為解決這類問題提供了新而有效的方法,不僅可以得到全局最優解,而且大量縮短了計算時間。王月蘭等人提出的基于信息融合技術的彩色圖像分割方法,該方法應用剝殼技術將問題的復雜度降低,然后將信息融合技術應用到彩色圖像分割中,為彩色分割在不同領域中的應用提供了一種新的思路與解決辦法。

    2,2基于人工神經網絡技術的圖像分割

    基于神經網絡的分割方法的基本思想是先通過訓練多層感知器來得到線性決策函數,然后用決策函數對像素進行分類來達到分割的目的。近年來,隨著神經學的研究和進展,第三代脈沖耦合神經網絡(PCNN)作為一種新型人工神經網絡模型,其獨特處理方式為圖像分割提供了新的思路。脈沖耦合神經網絡具有捕獲特性,會產生點火脈沖傳播,對輸入圖像具有時空整合作用,相鄰的具有相似輸入的神經元傾向于同時點火。因此對于灰度圖象,PCNN具有天然的分割能力,與輸入圖像中不同目標區域對應的神經元在不同的時刻點火,從而將不同區域分割開來。如果目標區域灰度分布有重疊,由于PCNN的時空整合作用,如果灰度分布符合某種規律,PCNN也能克服灰度分布重疊所帶來的不利影響,從而實現較完美的分割。這是其一個突出的優點,而這恰恰是其他的分割方法所欠缺的,其在未來的圖像分割中將起主導作用。

    2,3基于小波分析和變換的圖像分割

    近年來,小波理論得到了迅速的發展,而且由于其具有良好的時頻局部化特性和多分辨率分析能力,在圖像處理等領域得到了廣泛的應用。小波變換是一種多尺度多通道分析工具,比較適合對圖像進行多尺度的邊緣檢測。從圖像處理角度看,小波變換具有“變焦”特性,在低頻段可用高頻率分辨率和低時間分辨率,在高頻段可用低頻率分辨率和高時間分辨率,小波變換在實現上有快速算法具有多分辨率,也叫多尺度的特點,可以由粗及精地逐步觀察信號等優點。近年來多進制小波也開始用于邊緣檢測。另外,把小波變換和其它方法結合起來的圖像分割技術也是現在研究的熱點。

    3 圖像分割的應用現狀

    在圖像處理中,圖像分割是一種重要的技術,是圖像分析的基礎。隨著圖像分割技術研究的深入,其應用日趨廣泛,幾乎出現在有關圖像處理的所有領域,并涉及各種類型的圖像。凡屬需要對圖像目標進行提取、測量的工作都離不開圖像分割。通常,圖像分割是為了進一步對圖像進行分析、識別、壓縮、編碼等,圖像分割的準確性將直接影響后繼的工作,因此,分割的方法和精確程度是至關重要的。目前,圖像分割在圖像工程中占據非常重要的位置,圖像分割已在交通、醫學、遙感、通信、軍事和工業自動化等諸多領域得到廣泛應用。表1是應用領域表。

    第3篇:卷積神經網絡現狀范文

    關鍵詞:圖像識別;OCR;題庫采集;移動終端;特征建模

    中圖分類號:G434 文獻標識碼:A 論文編號:1674-2117(2016)12-0075-04

    采集題庫的現狀

    隨著經濟和社會的發展、“互聯網+”的廣泛應用及教育觀念的更新,我們迫切需要科學、方便、完善的網絡型題庫管理系統。試題庫建設是教育現代化的需要,是考教分離、最大限度提高辦學效益的需要,因此,進行區域網絡試題庫系統的建設和研究具有十分重要的意義。

    受限于教材版本和區域應用層面的需求,采購商業化的題庫并不能完全滿足教育教學的實際要求。手握大量紙質試卷的老師們,迫切需要一個錄入神器,方便快捷地將其錄入到題庫系統里。

    利用基于移動終端的圖像文字識別技術將文字和圖片迅速錄入題庫是我們在移動端系統開發的應用亮點。它能夠大幅提高對質量不高圖像的識別率,其關鍵算法對圖像的噪聲、亮度明暗不一致和規格凌亂的問題進行了很好的處理。它能夠將圖像上傳到服務器進行在線識別,在識別過程中先對圖像進行消噪,然后對亮度進行均衡處理及對圖像閾值分割,提高了圖像識別的成功率。

    題庫采集系統工作流程

    題庫采集主要分為圖像采集、圖像識別和標注三個過程。整體的工作流程包括:①系統啟動,進入主界面,可選擇開始拍攝閱卷或讀取設備中已有的圖像,如選擇拍攝題目,進入圖像采集模塊,調用移動設備的攝像頭進行拍攝,拍攝成功后,跳轉至識別界面,如選擇讀取相冊已有圖像也跳轉至識別界面。②在識別界面上顯示出拍攝或者讀取的相冊圖像,首先調用圖像預處理模塊對圖像進行預處理,輸出預處理后的圖像,然后調用圖像校正模塊對預處理圖像進行校正,輸出校正圖像,最后調用圖像識別模塊對校正圖像進行識別,輸出識別結果。③調用標注模塊對識別結果進行分類管理,為題目添加系統屬性,如學科、章節、知識點類目、題型、難度系數等標簽。圖1為題庫采集系統工作流程示意圖。

    OCR智能模型設計思路

    在人工智能領域,模擬人類圖像識別活動的計算機程序,人們提出了不同的圖像識別模型――模板匹配模型。這種模型認為,識別某個圖像,必須在過去的經驗中有這個圖像的記憶模式,又叫特征模型。當前的刺激如果能與大腦中的模型相匹配,這個圖像也就被識別了。例如,有一個字母A,如果在腦中有個A模板,字母A的大小、方位、形狀都與這個A模板完全一致,字母A就被識別了。圖像識別中的模型識別(Pattern Recognition)利用計算機和數學推理的方法對形狀、模式、曲線、數字、字符格式和圖形自動完成識別、評價的過程。

    那么如何通過模型的學習提高OCR的智能判斷水平呢?我們主要從以下三個方面做了實踐研究。

    1.采集識別優化

    (1)二值化處理

    二值圖像在數字圖像處理中占重要地位,其在處理實際圖像過程中地位更加突出。要應用二值圖像,掃描文檔之后的第一步就是對灰度圖像根據所選閾值進行二值化處理。二值圖像是像素值為0或255的像素點集合,如此一來,圖像的數據量大大減少,但圖像的基本輪廓信息得以保留。此項的關鍵是所選取的閾值是否得當,不當則會減弱二值圖像的處理效果。常用的閾值選取方法有固定閾值法、平均閾值法、直方圖法、Means法四種。

    谷歌公司在HP公司Tesseract光學字符識別引擎的基礎上做了深度加工,其中對閾值的自適應分類器和兩步矯正法的應用大大提高了文本的識別效率。近幾年來,百度針對商業運用開發了自然場景OCR API服務,依托百度的OCR算法,提供了整圖文字檢測、識別、整圖文字識別、整圖文字行定位和單字圖像識別等功能。目前火熱的作業幫APP就是基于百度識別API做的延伸產品(如圖2)。

    (2)圖像去噪與矯正

    任何一幅原始圖像,在其獲取和傳輸的過程中,都會受到各種噪聲的干擾,使圖像質量下降,淹沒其特征,對圖像分析非常不利。為抑制噪聲、改善圖像質量所進行的處理被稱為圖像平滑或去噪。

    圖像平滑是用于突出圖像的寬大區域和主干部分(低頻部分)或抑制圖像噪聲和干擾(高頻部分),使圖像平緩漸變,減小突變梯度,改善圖像質量的圖像處理方法。它屬于圖像增強的一部分,主要的圖像平滑方法有均值濾波、中值濾波、灰度形態學濾波、小波濾波、高斯低通濾波以及統計方法濾波。

    已獲得的文本圖像有些不可避免地會發生傾斜,這樣會給后面文字的行切分和列切分以及文字的識別帶來困難,所以需要對獲取的圖像進行傾斜校正。圖像的傾斜校正最關鍵的是傾斜角的檢測,我們主要采用平行四邊形法進行文本圖像的校正(如圖3)。根據拍攝者給出的一系列文件位置點,用位置點的坐標結合模型擬合出文本線,根據文本線與水平線之間的差距進行精確恢復,以得到水平分布的文本行。

    2.特征提取與建模

    特征提取是圖像識別的重要步驟,為了保證后續處理的質量,生成的特征要具備描述物體的典型特性,如獨特性、完整性、幾何變換下的不變性、靈敏性以及抽象性。我們設計的系統的特征模型包括文字特征、圖片特征、公式特征等。

    提取圖像特征關系可以有兩種方法:一是對圖像進行合理地分割,劃分出圖像中所包含的對象或區域,然后根據這些區域提取圖像特征,并建立索引;二是簡單地將圖像均勻地劃分為若干規則子塊,然后對每個圖像子塊提取特征,并建立索引。

    圖像特征建模的基本原則是根據圖像的視覺內容和可獲得的指導信息來確定對應的文本語義描述。在圖像標注任務中會涉及兩種不同的媒體:一是圖像,二是文本。這兩種媒體具有良好的互補性,可以協作傳遞信息,正所謂“圖文并茂”。由這兩種媒體可以產生4種關系,即圖像間關系(IIR)、詞間關系(WWR)、由圖像到詞的關系(IWR)和由詞到圖像的關系(IR)。

    3.基于標注模型的學習與訓練

    我們通常采用兩兩圖像之間的視覺相似性(pairwise similarity)來建立以圖像為節點的相似圖,但這種方式由于沒有考慮到數據集或某個數據子集內的結構分布信息,效果不能令人滿意。因此我們引入了第二個以詞為節點的圖學習過程,用來實現對圖像標注的改善。

    最常見的是屬性相關性,如“李白”是“古詩文”的關系。除此之外,詞匯之間還存在多種相關性,如“凸透鏡”與“光”之間有著很強的聯系,這種相關性不依賴于特定數據集,它是人們在生活中大量知識的積累和反映。當一幅圖像已被標為“凸透鏡”“光”等詞匯后,初中物理作為該圖像標注詞匯的概率就會相應提升。為了獲取這種相關信息,一種方法是從訓練數據集中利用已標注詞匯間的共生概率來計算詞匯間的關系。該方法基于已標注信息,相對準確,但它不能反映更廣義的人的知識。于是,我們可以采用另一種方法,利用具有大量詞匯的、包含了人的知識的結構化電子詞典來計算詞匯間的關系。與統計方法相比,詞典包括了更加完整的大數據關聯信息。由此我們設計了基于標注的模型學習體系(如下頁圖4),通過提取題目圖像的特征點綁定其隱形屬性,再與拍攝者提供的顯性屬性做比對,進行數據建模,并引導系統修正其三大特征庫(文字、圖片、公式),實現自我學習。

    需要注意的是,基于標注信息描述由圖到標簽的關系,更適合按照多標記分類(multilabel classification)問題來解決。具體而言,假設標注詞匯服從多項式分布,由此將圖像標注歸為多類別分類問題,而題庫的分類方式恰恰符合這樣的多標記模型(相對固定是顯性標簽:學科、學段、知識點、章節、難度等)。

    注意事項

    1.基于API方式的接入能使產品得到快速開發

    例如,當前百度通過專業服務分發平臺APIStore開放百度文字識別技術,讓開發者可以零成本使用基于移動應用的OCR技術,為開發者創新應用提供了更多的選擇。

    2.題庫特征建模要考慮學科特征

    實踐證明,文科和理科的題目有著截然不同的特征屬性,如語文更注重詞匯與語法方面的訓練,而數學包含了大量的公式和二維化的圖像。往往數學在小學和中學階段的題目也會表現出不同的特征屬性,在建模的同時要注意抽取。

    3.未來的方向是要構建基于題庫圖像模型的題庫推送規則

    當題庫的建構達到一定數量之后,我們要將圖像和翻譯成的題目都保存下來,再根據拍攝者的需求做相關的推送,根據其使用的情況(如點擊率、評價等)再對模型進行修正。

    從目前的技術發展角度看,突破性來自于機器語言翻譯方面的研究成果:通過一種遞歸神經網絡(RNN)將一種語言的語句轉換成向量表達,并采用第二個RNN將向量表達轉換成目標語言的語句。而谷歌將以上過程中的第一種RNN用深度卷積神經網絡CNN取代,這種網絡可以用來識別圖像中的物體。此種方法可以實現將圖像中的對象轉換成語句,對圖像場景進行描述。概念雖然簡單,但實現起來十分復雜,科學家表示,目前實驗產生的語句合理性不錯,但還遠談不上“完美”,這項研究目前還處于起步階段。相信在不久的將來此項發明將應用于教學領域,那么基于云模式下的圖像識別系統將得到一個質的飛躍,它也將使圖像識別與深度學習更加緊密地聯系在一起,最終實現系統對互聯網上教育資源摘取和自學習的強大功能。

    參考文獻:

    [1]黃明明.圖像局部特征提取及應用研究[D].北京:北京科技大學,2016.

    [2]劉淼,楊鎮豪,謝韻玲,謝冬青,唐春明.Android圖文同步識別系統的設計和實現[J].計算機工程與設計,2014(06).

    [3]李龍卓.基于形狀特征的圖像檢索技術研究[D].青島:青島科技大學,2015.

    [4]付蘆靜,錢軍浩,鐘云飛.基于漢字連通分量的印刷圖像版面分割方法[J].計算機工程與應用,2015(05).

    第4篇:卷積神經網絡現狀范文

    關鍵詞:語音情感識別;情感描述模型;情感特征;語音情感庫;域適應

    DOIDOI:10.11907/rjdk.161498

    中圖分類號:TP391

    文獻標識碼:A文章編號文章編號:16727800(2016)009014303

    作者簡介作者簡介:薛文韜(1991-),男,江蘇常熟人,江蘇大學計算機科學與通信工程學院碩士研究生,研究方向為語音情感識別。

    0引言

    1997年,美國麻省理工學院的Picard教授提出了情感計算(Affective Computing)的概念。情感計算作為計算機科學、神經科學、心理學等多學科交叉的新興研究領域,已成為人工智能的重要發展方向之一。而語音情感識別作為情感計算的一個重要分支,亦引起了廣泛關注。

    許多國內外知名大學和科研機構也開始語音情感識別研究,國外如美國麻省理工學院Picard教授領導的情感計算研究小組,德國慕尼黑工業大學Schuller教授領導的人機語音交互小組等;國內如清華大學的人機交互與媒體集成研究所、西北工業大學音頻、語音與語言處理組等。

    1語音情感識別

    語音情感識別系統主要由前端和后端兩部分組成。前端用于提取特征,后端基于這些特征設計分類器。在語音相關應用中,運用比較多的分類器是支持向量機和隱馬爾科夫模型。目前,語音情感識別的重點主要集中于特征提取。在傳統的語音情感識別中,如何提取具有判別性的特征已成為研究的重點。隨著數據的大規模增長,傳統語音情感識別的前提(訓練數據和測試數據具有相同的數據分布)已不能夠被滿足,研究者提出了遷移學習的概念,利用域適應方法來解決跨庫的語音情感識別。

    本文將從情感描述模型、語音情感特征、語音情感庫、語音情感挑戰賽這4個方面對語音情感研究現狀進行總結,并給出現存語音情感識別的技術挑戰及相應的研究方法。

    2情感描述模型

    目前主要從離散情感和維度情感兩個方面來描述情感狀態。

    離散情感描述,主要把情感描述成離散的形式,是人們日常生活中廣泛使用的幾種情感,也稱為基本情感。在當前情感相關研究領域使用最廣泛的六大基本情感是生氣、厭惡、恐懼、高興、悲傷和驚訝。

    相對于離散情感描述,維度情感描述使用連續的數值來描述情感狀態,因此也稱作連續情感描述。它把情感狀態視作多維情感空間中的點,每個維度都對應情感的不同心理學屬性。常用的維度情感模型是二維的激活度-效價(Arousal-Valence)模型,其二維空間如圖1所示。其中橫軸表示效價屬性(Valence),用于衡量情感的正負面程度;而縱軸表示激活程度(Arousal),用于描述情感狀態的喚醒程度。通過不同的效價度和激活程度,就能區分出不同的情感,比如悲傷與生氣兩種負面情緒雖然效價相差無異,但兩者的激活度卻有很大差異。

    3語音情感特征

    傳統的語音情感特征可粗略地分為基于聲學的情感特征和基于語義的情感特征。基于聲學的情感特征又分為3類:韻律學特征、音質特征以及頻譜特征[1]。音高、能量、基頻和時長等是最為常用的韻律學特征,由于韻律學特征具有較強的情感辨別能力,已經得到了研究者們的廣泛認同。音質特征主要有呼吸聲、明亮度特征和共振峰等,語音中所表達的情感狀態被認為與音質有著很大的相關性。頻譜特征主要包括線性譜特征和倒譜特征,線性譜特征包括Linear predictor cofficient(LPC)、log-frequency power cofficient(LFPC)等,倒譜特征包括mel-frequency cepstral cofficient(MFCC)、linear predictor cepstral cofficient(LPCC)等。此外,基于這3類語音特征的不同語段長度的統計特征是目前使用最為普遍的特征參數之一,如特征的平均值、變化率、變化范圍等。然而到底什么特征才最能體現語音情感之間的差異,目前還沒有統一的說法。

    在2009年首次舉辦的國際語音情感挑戰INTERSPEECH 2009 Emotion Challenge(EC)的分類器子挑戰中,組織者為參賽者提供了一個基本特征集,選擇了在韻律學特征、音質特征和頻譜特征中廣泛使用的特征和函數,包括16個低層描述子(Low-Level Descriptors,LLDs)和12個函數,構建了一個384維的特征向量[2]。具體的16個低層描述子和12個函數如表1所示。

    4語音情感庫

    語音情感庫作為語音情感識別的前提條件,影響著最終語音情感識別系統的性能。目前,在語音情感庫的建立方面還沒有統一的標準,已構建的情感語音庫多種多樣,在語言、情感表現方式(表演型(acted)、引導型(elicited),自發型(naturalistic))、情感標記方案(離散情感或者維度情感)、聲學信號條件、內容等方面具有很大差異。從情感表現方式而言,表演型情感一般是讓職業演員以模仿的方式表現出相應的情感狀態,雖然說話人被要求盡量表達出自然的情感,但刻意模仿的情感還是顯得更加夸大,使得不同情感類別之間的差異性比較明顯,這方面的語音情感庫有Berlin Emotional Speech Database(Emo-DB)、Airplane Behavior Corpus(ABC)等[34]。早期對語音情感識別的研究都是基于表演型語料庫,隨著人們意識到引導型情感具有更加自然的情感表達之后,研究者們開始基于引導型情感庫進行研究,比如eNTERFACE[5]。隨著研究的深入,迫切需要一些自發的語音情感數據,目前出現了FAU Aibo Emotion Corpus(FAU AEC)、TUM Aduio-Visual Interest Corpus(TUM AVIC)、Speech Under Simulated and Actual Stress(SUSAS)和Vera am Mittag(VAM)[2,68]。常用的幾個語音情感庫如表2所示,描述了他們在年齡、語言、情感、樣本個數、記錄環境和采樣率之間的差異。

    5語音情感挑戰賽

    雖然已經有很多研究致力于語音情感識別,但是相對于其它語音任務(如自動語音識別和說話人識別)而言,語音情感識別中還不存在標準的語音情感庫和統一的測試條件用于在相同條件下進行性能比較。同時,為了處理更加現實的場景,需要獲得自然的語音情感數據。國際語音情感挑戰INTERSPEECH 2009 EC旨在彌補出色的語音情感識別研究和結果可比性之間的缺陷,它提供了自然的語音情感庫FAU AEC,以及開源工具包openEAR來提取基本的384維特征集,保證了特征的透明性,從而使得結果具有重現性和可比性[9]。FAU AEC庫包括了德國兩個學校(Ohm和Mont)10~13歲的孩子與索尼公司的機器狗Aibo進行交互的語音數據。為了實現說話人獨立的語音情感識別,通常學校Ohm記錄的數據用于訓練,而Mont記錄的數據用于測試。INTERSPEECH 2009 EC的情感分類任務主要包括2類情感(負面情感、所有其它情感)分類和5類情感(生氣、同情、積極、中立和其它)分類,目前已有很多研究基于FAU AEC庫進行情感分類。除了在FAU AEC庫上進行傳統的語音情感識別外,隨著跨庫語音情感識別研究的深入,很多研究者也將FAU AEC作為目標域數據庫進行域適應的研究。

    6語音情感識別的主要挑戰

    6.1語音情感特征

    在傳統語音情感識別中,提取具有判別性的特征已經成為一個重要的研究方向。在情感特征提取過程中,通常存在一些與情感無關的因素,如說話內容、說話人、環境等,這些不相關的因素將會使得提取到的特征包含這些因素方面的變化,從而影響情感分類性能。

    目前已有部分研究開始考慮這些與情感無關因素的影響。同時,隨著深度學習的提出與發展,越來越多的研究者開始使用深度神經網絡進行特征提取。Chao等[10]利用無監督預訓練去噪自動編碼器,減少了情感特征中說話人的影響。Mao等[11]提出了半監督卷積神經網絡模型,提取情感相關特征,通過實驗證明其對說話人的變化、環境的滋擾以及語言變化都有很強的魯棒性。Mariooryad 等[12]對特征構建音素層次的彈道模型,從聲學特征中分解出說話人的特性,從而彌補說話人對語音情感識別的影響。

    6.2跨庫的語音情感識別

    在傳統的語音情感識別中,訓練數據和測試數據一般來自同一個語料庫或者具有相同的數據分布。隨著數據的爆炸式增長,從不同設備和環境下獲得的語音數據通常在語言、情感表現方式、情感標記方案、聲學信號條件、內容等方面存在很大差異,這就造成了訓練數據和測試數據分布的不同,傳統的語音情感識別方法就不再適用。

    近年來,遷移學習(Transfer Learning)的概念被提出,指從一個或多個源域中將有用的信息遷移到相關的目標域,以幫助改善目標域的分類性能[13]。域適應(Domain Adaptation)作為一種特殊的遷移學習,已成功應用于跨庫的語音情感識別。Deng等[14]提出一種共享隱藏層自動編碼器(shared-hidden-layer autoencoder,SHLA)模型,相較于傳統的自動編碼器,SHLA的輸入數據包含了源域和目標域兩類數據,讓兩個域的數據共用編碼部分而解碼部分不同,目的是誘使兩個域的數據在隱藏層空間具有相似的數據分布。Huang等[15]利用PCANet沿著從源域到目標域的路徑提取特征,并用目標域空間來調整路徑上的特征,以此彌補域之間的差異。

    參考文獻參考文獻:

    [1]EL AYADI M,KAMEL M S,KARRAY F.Survey on speech emotion recognition:features,classification schemes and databases[J].Pattern Recognition,2011,44(3): 572587.

    [2]SCHULLER B,STEIDL S,BATLINER A.The interspeech 2009 emotion challenge[C].Proceedings INTERSPEECH 2009,10th Annual Conference of the International Speech Communication Association,2009:312315.

    [3]BURKHARDT F,PAESCHKE A,ROLFES M,et al.A database of German emotional speech[J].Interspeech,2005(5):15171520.

    [4]SCHULLER B,ARSIC D,RIGOLL G,et al.Audiovisual behavior modeling by combined feature spaces[C].IEEE International Conference on Acoustics,Speech and Signal Processing (ICASSP),2007:733736.

    [5]MARTIN O,KOTSIA I,MACQ B,et al.The eNTERFACE'05 audiovisual emotion database[C].22nd International Conference on Data Engineering Workshops,2006.

    [6]SCHULLER B,MULLER R,EYBEN F,et al.Being bored recognising natural interest by extensive audiovisual integration for reallife application[J].Image and Vision Computing,2009,27(12): 17601774.

    [7]HANSEN J H L,BOUGHAZALE S E,SARIKAYA R,et al.Getting started with SUSAS:a speech under simulated and actual stress database[C].Eurospeech,1997,97(4): 174346.

    [8]GRIMM M,KROSCHEL K,NARAYANAN S.The vera am mittag german audiovisual emotional speech database[C].2008 IEEE International Conference on Multimedia and Expo,2008:865868.

    [9]EYBEN F,WOLLMER M,SCHULLER B.OpenEAR―introducing the Munich opensource emotion and affect recognition toolkit[C].3rd International Conference on Affective Computing and Intelligent Interaction and Workshops,2009: 16.

    [10]CHAO L,TAO J,YANG M,et al. Improving generation performance of speech emotion recognition by denoising autoencoders[C].2014 9th International Symposium on Chinese Spoken Language Processing (ISCSLP),2014: 341344.

    [11]MAO Q,DONG M,HUANG Z,et al.Learning salient features for speech emotion recognition using convolutional neural networks[J].IEEE Transactions on Multimedia,2014,16(8):22032213.

    [12]MARIOORYAD S,BUSSO pensating for speaker or lexical variabilities in speech for emotion recognition[J].Speech Communication,2014,57(1): 112.

    [13]PAN S J,YANG Q.A survey on transfer learning[J].IEEE Transactions on Knowledge & Data Engineering,2010,22(10):13451359.

    第5篇:卷積神經網絡現狀范文

    關鍵詞:科學計算;大數據處理;超級計算機;模擬仿真;并行計算

    1引言

    在現代科學研究和工程實踐中,通常使用數學方程式來表示某些自然科學規律,產生了眾多復雜繁瑣的數學計算問題[1]。基于普通計算工具來解決這些問題,將耗費大量人力物力,甚至無法得到準確結果。而科學計算[2],利用計算機仿真、重現、預測或探索自然世界萬物運動規律和演變特性的全過程,通過研究合理的計算方法,設計高效的并行算法,研制合適的應用程序,能準確、高效地模擬各領域研究過程,分析計算結果。然而,普通計算機的科學計算能力往往是有限的,現有的計算能力無法高效地解決某些基礎學科和工程技術部門的科學計算問題,如長期天氣預報、石油勘探、飛機整體氣動力等等。

    與此同時,地震檢測儀、粒子碰撞器、天文望遠鏡以及高通量分析裝置等大型科學儀器的研制和發展[3],產生了大量非結構化或半結構化的數據,使得“大數據”趨勢變得越來越突出[4]。如今,許多科學發現和見解由大量數據集驅動,“大數據”被認為是除了實驗、理論和計算方法之外的第四種科學范式[5]。數據生成的容量、速度和多樣性構成了分析大數據的主要挑戰。

    為提高科學計算能力,解決大數據問題,高性能計算(HPC)[6]技術迅猛發展。高性能計算機代表用于解決計算密集型科學和工程問題的高端計算基礎設施。我國的高性能計算早已突破每秒浮點運算千萬億次的壁壘,并繼續解決性能、可擴展性、可編程性、能效和可靠性等問題,探索新的支持技術以達到e級計算能力。

    目前,高性能計算機已在多個領域得到了成功的應用[7],但仍存在大量可供多個研究機構使用的空閑節點。本文簡介了一些高性能計算機系統及其性能,針對近年來在高性能計算機上的各大領域應用實例進行總結,并對在其他領域的應用做出了展望,以促進更高效、全面地使用高性能計算機。

    2高性能計算機系統概述

    中國首臺千萬億次超級計算機,是“天河一號”。“天河一號”超級計算機使用由中國自行研發的“龍”芯片,其峰值計算速度能夠達到1.206TFlop/s,同時Linpack實測性能達到了0.563TFlop/s,該超級計算機位居當時公布的中國超級計算機前100強之首,中國成為了繼美國之后世界上第二個能夠自主研制千萬億次超級計算機的國家。

    天河一號采用6144個英特爾通用多核處理器和5120個AMD圖形加速處理器,其內存總容量98TB。至于點對點通信的帶寬就達到了40Gbps,而其用于共享的磁盤總容量則達到1PB。該超級計算機系統部署于天津濱海新區的國家超級計算天津中心作為業務主機。

    2013年,由國防科學技術大學研制的“天河二號”大型超級計算機以每秒33.86千萬億次的浮點運算速度成為全球最快的超級計算機,位列國際大型超級計算機TOP500榜首。隨后,“天河二號”實現了世界最快超算“六連冠”。天河二號采用基于加速器的架構[8]。在可接受的總成本、功率預算、支持可靠性、可用性和可服務性(RAS)的能力、應用開發和移植的復雜性下提供高的計算性能。

    天河二號的硬件系統由五個子系統組成,包括計算系統、通信系統、存儲系統、監控診斷系統和服務系統。它由16000個節點組成,每個節點有2顆基于IvyBridge-EXeonE52692處理器和3顆XeonPhi,每個節點的內存是64GB。所有的計算節點都通過專有的高速互連系統連接。還提供了一個服務子系統的4096個節點,以加快高吞吐量的計算任務,如大數據處理。存儲子系統包括256個I/O節點和64個容量為12.4PB的存儲服務器。天河二號文件系統命名為h2fs,采用麒麟操作系統、基于SLURM的全局資源管理。支持大多數現代編程語言,包括C、C++、Java、Python等。采用的是新型異構多態體系結構(Multipurpose-Heterogeneous)[9]。

    天河二號的系統配置列于表1中。

    “天河二號”集科學計算、大數據分析和云計算于一體,被認為是滿足工業和社會需求的戰略基礎設施。以超級計算機為支撐的高性能計算應用正加速向各個領域滲透。

    Table1SystemindicatorsofTianhe-2

    表1天河二號系統指標

    width=375,height=252,dpi=110

    在國內早期的高性能計算機研究中,2004年6月超級計算機曙光4000A研制成功,落戶上海超級計算中心,標志著繼美國和日本之后,中國是第三個能研制10萬億次高性能計算機的國家。曙光能夠每秒運算11萬億次,進入全球超級計算機前十名。經過十多年發展,曙光E級高性能計算機系統項目現在是國家“十三五”期間高性能計算的重點專項,其最顯著的特點是突破了制約E級計算發展的各個關鍵技術,通過這樣原型機的研制去驗證E級的技術路線,為未來真正實現國產E級系統做技術鋪墊。

    width=642,height=303,dpi=110

    Figure1StructureofSugon’sCPU

    圖1曙光CPU結構

    在2016年法蘭克福世界超算大會上,“神威·太湖之光”超級計算機系統成為新的榜首,速度較第二名“天河二號”快出近兩倍,效率提高三倍。

    神威·太湖之光超級計算機由40個運算機柜和8個網絡機柜組成。每個運算機柜包含4塊由32塊運算插件組成的超節點。每個插件由4個運算節點板組成,一個運算節點板又含2塊“申威26010”高性能處理器。一臺機柜就有1024塊處理器,整臺“神威·太湖之光”共有40960塊處理器。每個單個處理器有260個核心,主板為雙節點設計,每個CPU固化的板載內存為32GBDDR3-2133。

    在2018年的法蘭克福世界超算大會上,美國能源部橡樹嶺國家實驗室(ORNL)推出的新超級計算機“Summit”以每秒12.23億億次的浮點運算速度,接近每秒18.77億億次峰值速度奪冠,“神威·太湖之光”屈居第二。

    3高性能計算機各大領域應用實例分析

    為充分發揮高性能計算機的優勢,極大限度地滿足客戶需求,自超級計算機在中國開始發展以來,相關團隊都致力于擴展高性能計算在各個領域的利用,迎合各領域應用的計算要求,協助用戶配置應用環境,建立高效模型,設計合理并行算法,以實現各領域的科學計算和大數據處理在高性能計算機上的應用。

    3.1生物計算與精準醫療

    根據廣州國家超級計算中心的內部統計[10],生物醫學相關應用現在是超級計算中心的主要客戶。生物醫學研究主要包括生物大分子的結構模擬與功能建模,藥物設計與篩選,蛋白質序列分析,基因序列分析與比對,基因調控網絡的分析與建模,醫療衛生的雙數據分析及生物醫學文獻挖掘等。

    生物醫學數據繁多,且一直呈指數增長。如世界最大的生物數據保存者之一,歐洲生物信息學研究所(EBI),存儲超過20PB的數據,并且最近每年的數據量都增加一倍[11]。數據源的異質性,包括基因組學、蛋白質組學、代謝組學、微陣列數據、文獻等,使其更加復雜。

    針對典型類型的大數據——基因組大數據,在大數據框架(如Hadoop和Spark)的幫助下,云計算已經在大數據處理中發揮著積極作用。現在,HPC在中國的快速發展使得以不同的方式解決基因組大數據挑戰成為可能。Yang等人[12]強調了在現代超級計算機上增強大數據支持的必要性,提出只需單個命令或單個shell腳本就能使當前的大數據應用在高性能計算機上運行,并且支持多個用戶同時處理多個任務的Orion作為高性能計算機的大數據平臺。該平臺可以根據大數據處理需求,合理分配所需的資源量,并使用HPC系統軟件棧自動建立和配置可回收的Hadoop/Spark集群。以華大基因提供的基因組學大數據作為案例研究,測試基因組分析流水線SOAPGaea的FASTQ過濾、讀取對齊、重復刪除和質量控制四個過程,證明了Orion平臺的高效性。

    為更好地了解基因的精細結構、分析基因型與表現型的關系、繪制基因圖譜,DNA序列分析成為生物醫學中的重要課題[12]。

    DNA序列的排序是對DNA序列分析的基礎[13]。通常先使用測序儀得到生物體基因組的一些片段,再利用計算機對片段進行denovo拼接,從而得到DNA序列的排列順序。而隨著測序儀的發展,基因組的數據量增大,分析復雜性提高,普通計算工具分析數據會消耗大量時間和空間。張峰等人[14]基于高性能計算機,使用一種新型序列拼接工具SGA(StringGraphAssernbler),對任務之間數據耦合度小的分批構建FM-Index,采用粗粒度的多進程并行;對任務之間數據耦合度較大的FM-Index合并過程,采用多線程的細粒度并行。這種多進程與多線程的混合并行策略,使用并行計算代替通信開銷,測試小規模數據時,將索引構建時間的最佳性能提高了3.06倍。葉志強等人[15]在基因組排序時,引入隨機listranking算法,基于高性能計算機,使用MPI并行實現Pregel框架的線性化步驟,利用節點之間的通信和計算能力,減少了線性化步驟時間。

    SNP(單核苷酸多態性)檢測是DNA序列分析的關鍵步驟[16]。它將對齊的read、參考序列和被編排的數據庫(如數據庫SNPP)作為輸入,通過站點檢測對齊的read和引用站點的信息,生成SNP站點的列表。SNP檢測工具SoAPSNP可以用一個多星期的時間來分析一個覆蓋20倍的人類基因組。崔英博等人[17]通過重新設計SOAPSNP的關鍵數據結構以降低內存操作的開銷,設計CPU與XeonPhi協作的協調并行框架,以獲得更高的硬件利用率。并提出了一種基于讀取的窗口劃分策略(RWD),在多個節點上提高吞吐量和并行規模,開發了SOAPSNP的并行版本MSNP,在沒有任何精度損失的情況下,利用高性能計算機的一個節點實現了45倍的加速。

    方翔等人[18]利用高性能計算機,構建了由基因組與轉錄組測序數據分析、蛋白質結構預測和分子動力學模擬三個功能模塊組成的生物信息平臺分析水產病原,對約氏黃桿菌等多種水生動物病原進行生物信息學分析。

    從生物醫學文獻中提取有價值的信息的一種主流方法是在非結構化文本上應用文本挖掘方法。然而,大量的文獻需要分析,這對文本挖掘的處理效率提出了巨大的挑戰。彭紹亮等人[19]將針對疾病實體識別的軟件DNorm加入可高效識別基因、蛋白質、藥物、基因通路等實體關系的文本挖掘工具PWTEES流水線中,擴充了PWTEES的功能。使用LINNAEUS導入MEDLIN數據庫提供的摘要,并在個人賬戶目錄下,動態使用計算節點,編譯安裝配置了非關系型數據庫(MySQL),將大量非結構化數據(文獻)轉為結構化數據。將平時在普通服務器上需100天能完成的文本挖掘過程縮短為1小時,并利用200個進程并行挖掘7萬篇頭頸癌相關文獻中的關鍵命名實體,得到了80%以上的并行效率。Xing等人[20]開發了一個可運行的框架PARABTM,它能夠在超級計算機上實現并行文本挖掘。以GNormPlus、tmVar2.0、Dnorm三種命名實體識別任務為例,對多個數據集上PARABTM的性能進行了評價。結果表明,使用PARABTM并行處理策略中的短板匹配負載平衡算法(Short-Boardloadbalancingalgorithm),最大程度地提高了生物醫學命名實體識別的處理速度。

    3.2全數字設計與制造

    數字設計與制造是一種以計算機系統為中心的集成制造方法。隨著制造工廠中計算機系統數量和質量的提高,數字化趨勢迅速。越來越多的自動化工具被用于制造工廠,有必要對所有機器、工具和輸入材料進行建模、模擬和分析,以優化制造過程。而模擬能夠建模和測試一個系統行為特性,讓工程師能夠用更低耗、更快速同時更安全的方式來分析所做的設計會產生什么樣的影響。模擬的應用范圍廣泛,涵蓋了產品設計、過程設計以及企業資源安排[21]。在模擬過程中,利用超級計算機強大的計算能力,使工程師能在幾分鐘或幾小時內仿真和測試數千種設計方案。

    利用數字化的方式,可以對產品進行結構力學分析、流體力學分析、電磁設計和多物理場模擬等多種計算仿真。

    在計算流體力學CFD(CcomputationalFluidDynamics)領域的一大熱點研究問題就是如何在當前主流的眾核異構高性能計算機平臺上進行超大規模計算。楊梅芳等人[22]在高性能計算機的單個節點上,利用超然沖壓發動機燃燒數值模擬軟件LESAP模擬一個實際發動機燃燒化學反應和超聲速流動的問題,采用OpenMP4.0編程標準,向量化SIMD,優化數據傳輸過程,均衡基于網格塊劃分的負載技術,實現了軟件面向CPU+MIC異構平臺的移植,達到了3.07倍的性能加速比。王勇獻等人[23]面向高性能計算機探索了高階精度CFD流場數值模擬程序的高效并行性。在高性能異構并行計算平臺上進行了多個算例的數值模擬的結果顯示最大CFD規模達到1228億個網格點,共使用約59萬CPU+MIC處理器核,實現了移植后的性能大幅度提高。通過將算法移植到超級計算機進行大規模并行,能夠實現高效的流體力學分析。而文獻[24-26]都是針對空氣動力學中的具體分類利用高性能計算機進行模擬以驗證有效性的研究。利用數字化設計,能夠快速低成本地對設計性能進行分析評估。

    在圖像模擬中,Metropolis光傳輸算法能夠利用雙向路徑跟蹤構建出由眼睛到光源的路徑,是MonteCarlo方法的變體。然后,使用Metropolis算法靜態計算圖像中光線的恰當的散射狀態,由一條已發現的光到眼睛的路徑,能搜索到鄰近路徑。簡單地說,Metropolis光傳輸算法能夠生成一條路徑并存儲其上的節點,同時能通過添加額外節點來調整并生成新的路徑。隨著對照片級真實感圖像的要求越來越高,為Metropolis光傳輸算法開發高效且高度可擴展的光線跟蹤器變得越來越重要。主要是渲染圖像通常需要花費大量時間,開發高效且高度可擴展的光線跟蹤器的困難來自不規則的存儲器訪問模式、光攜帶路徑的不平衡工作量以及復雜的數學模型和復雜的物理過程。Wu等人[27]提出了一種基于物理的高度可擴展的并行光線追蹤器,并在高性能計算機上進行了實現,利用多達26400個CPU內核,證明了其可擴展性,能夠從復雜的3D場景生成逼真圖像。

    模擬高場非局部載流子傳輸同樣需要3DMonteCarlo模擬方法,通過適當的量子校正涵蓋散射效應,半經典的MC模擬能夠給出準確的結果。但是,MC方法中3D模擬和量子校正都需要巨大的計算資源[28],由效率出發超級計算機的計算能力就至關重要了。文獻[29]中,通過在高性能計算機上使用IntelMIC協處理器,進一步提高了之前工作中開發的3D并行的繼承MC模擬器的并行效率。

    對于高性能計算機在全數字設計和制造領域的集成應用,國家超級計算廣州中心推出了天河星光云超算平臺,以云服務的方式提供CAE計算和HPC訪問,大大降低了數字設計的門檻,支持產品設計的全工作流。目前基于該平臺支撐的項目有諸如國產大飛機、高鐵等,都是國家工業生產中重要項目[30]。

    3.3地球科學與環境工程

    基于該應用領域,超級計算機的主要作用在于變革對自然界中諸如地理狀況、海洋、大氣等種種元素的模擬方式。以超算為平臺,不僅能模擬出地球上每個時期的狀況,甚至是對宇宙中的種種同樣能進行模擬分析,讓地球科學和環境工程的研究范圍不再限于此時此地,而是更廣闊的空間。

    在宇宙學的層面,早在2015年就利用高性能計算機模擬出宇宙大爆炸后1600萬年之后至今約137億年的暗物質和中微子的演化過程,并將進一步尋找宇宙邊界的報告[31]。中微子雖然是自然界中的基本粒子之一,在宇宙大爆炸約1s后與其他等離子體物質退耦,形成看不見的宇宙背景,通過物理實驗和實際的天文觀測都無法精確測量中微子的質量。在高性能計算機平臺上,利用3萬億粒子來對宇宙中的中微子和暗物質的分布和演化進行模擬,開創了宇宙學中獨立測量中微子質量的道路。

    在地球外圍層面上,大氣變化同樣是一個關注點。Xue等人[32]提出了一種基于高性能計算機的全球性大氣動態模擬的混合算法。通過使用更靈活的域分區方案來支持節點中任意數量的CPU和加速器,算法能夠充分利用超算的優良性能。當使用8664個節點,包括了近170萬個核心時,可以有效地利用節點內的三個MIC卡,對兩個IvyBridgeCPU(24個內核)實現4.35倍的加速。基于成功的計算-通信重疊,算法分別在弱和強縮放測試中實現了93.5%和77%的并行效率。

    相較于廣袤無邊的宇宙,大部分人們對于腳下的土地更加關心。自然災害如地震、泥石流等,可能會造成巨大的生命財產損失,而地下油氣資源又是經濟社會發展所必需的,利用超級計算機去探索大地也是發展所需要的。

    中石油集團開發的用于石油油氣勘探的GeoEast系統已經經過了十幾年的發展更新,在數據模型、數據共享、一體化運行模式、三維可視化、交互應用框架、地震地質建模、網絡運行環境和并行處理方面取得了多項創新與重大技術突破,是地震數據處理解釋一體化系統。目前GeoEastV3.0版本軟件總體達到國際同類軟件先進水平,為推動中國石油勘探開發領域不斷取得新成果發揮了重要作用[33]。但是,這樣的一體化系統在使用中勢必會產生大量的數據,這就對計算機的性能有了要求。因此,在GeoEast系統聞名世界的過程中,高性能計算機在幕后是功臣之一,保證了系統的順利運行,助力石油勘探工作[34]。而文獻[35]專注于地震模擬,提出了針對英特爾至強處理器的對于軟件SeisSol的優化,以適用于高性能計算機的計算環境中,通過全摩擦滑動和地震波的耦合仿真實現了空前復雜的地震模型。移植到高性能計算機的SeisSol提供近乎最佳的弱縮放,在8192個節點上達到8.6DP-PFLOPS,在所利用的整個高性能計算機上能達到18~20DP-PFLOPS,成功模擬了1992年蘭德斯地震。

    3.4智慧城市云計算

    城市發展經過多年的調整,已經在經濟上有了相當進展,目前從如何讓人們生活更加便捷出發,許多地區開始建設智慧城市。智慧城市(SmartCity)是指利用各種信息技術或創新意念,集成城市的組成系統服務,以提升資源運用的效率,優化城市管理和服務,進而能夠提高居民生活質量。智慧城市的發展不僅僅是對生活的改變,還能促進生產方式的轉變,解決在城市擴張及經濟高速發展中產生的一系列“城市病”問題。智慧城市,代表的是城市的智慧,由智慧,能夠衍生出智能中、知識和數字等更廣泛的內涵[36]。

    迄今為止,廣州、北京、上海、寧波、無錫、深圳、武漢、佛山等國內城市已紛紛啟動“智慧城市”戰略,相關規劃、項目和活動漸次推出。高性能計算機云平臺應運而生,為智慧城市建立堅實、先進的基石。智慧城市由于其性能需求,對依賴的平臺的計算能力的要求會更高,而超算的計算能力就能為智慧城市的建設提供相當助力。在2014年,就有中國首臺千萬億次超級計算機“天河一號”在智慧城市中應用的報道,以其在天津濱海區的應用為例,“天河一號”的建筑信息領域的大數據平臺通過對建筑信息建模,實現對建筑物從規劃、設計、建造到后期物業管理理的全程數字化。此外,城市規劃、氣象預測、生物醫療、裝備制造、汽車碰撞模擬等行業,也能更多地通過“天河一號”,實現大批量數據計算、分析和存儲[37]。

    而高性能計算機的持續計算速度進一步達到了億億次,所能提供的服務質量也更高,麒麟云平臺被部署在1920個節點(15個機柜),其中64個節點(兩個機框)作為云平臺控制節點,其余節點為運行虛擬機的計算節點和分布式存儲的存儲節點。為方便管理,將計算節點進行分區管理,512個節點(4個機柜)為一區,用于滿足生產環境、適配環境、測試環境需要。分布式存儲沒有分區,所有節點形成一個全局的分布式存儲池,但在使用時可按需劃分指定容量的區域供不同用途使用[38]。這種云超算服務采用麒麟安全云系統實現虛擬化技術,將虛擬機資源遠程推送給用戶使用[39]。可通過互聯網遠程管理虛擬機資源,使高性能計算機云平臺資源能夠被更多人使用,超算的計算能力能夠更好地推動社會各個領域發展。2017年OpenStack的第15個版本中,麒麟云團隊在核心功能解決的Bug數,以及Commits的數量均進入全球前20,麒麟云的發展是非常迅速的,與開源社區緊密結合,貢獻突出[40]。

    3.5材料科學與工程

    在材料科學與工程的研究中,量子力學、經典動力學、統計力學是三大基礎且主要的研究方向。研究人員致力于材料參數的建模、多尺度平臺開發和新材料的設計、開發和優化。

    分子動力學模擬在材料科學、生物化學和生物物理學等領域得到了廣泛的應用。分子動力學(MD)是研究分子和分子的物理運動的計算機模擬方法,它提供分子尺度上的微觀取樣。基于能量細化的輔助建模AMBER(AssistedModelBuildingwithEnergyRefinement)[41]是用于MD模擬的使用最廣泛的軟件包之一。然而,對于具有百萬原子級的系統的AMBERMD模擬的速度仍然需要改進。彭紹亮等人[42]在單CPU上的細粒度OpenMP并行、單節點CPU/MIC并行優化和多節點多MIC協作并行加速方面進行了改進。在高性能計算機上實現AMBER的并行加速策略,與原程序相比,實現了25~33倍的最高加速比。同時,對于計算資源的限制,分子動力學軟件GROMACS不能大規模地進行滿意的操作。Wang等人[43]提出了一種利用卸載模式加速GROMACS的方法。為了提高GROMACS的效率,提出了異步化、數據重組和數組重用等一系列方法。在這種模式下,GROMACS可以與CPU和IntelXeonPHITM多個集成內核(MIC)協處理器同時有效地配置,充分利用高性能計算機資源。

    材料輻照效應(Materialirradiationeffect)是使用核能的重要關鍵之一。然而,由于高通量輻照設施和進化過程知識的缺乏,此效應的利用并不好。在高性能計算的幫助下,Hu等人[44]提出了一種新的數據結構,用于大規模并行模擬金屬材料在輻照環境下的演化。基于所提出的數據結構,開發了一種新的分子動力學軟件——CrystalMD,并在高性能計算機上進行了二兆個原子模擬,對MD輻射效應研究的模擬規模進行了擴展。

    3.6其他領域

    近年來,隨高性能計算的推廣,政府部門對超級計算機的重視,舊產業轉向新產業的變化及大量有高性能計算需求的企業對超級計算機的需求增大,超算人才培養初見成效[45]。在應用軟件開發等推動下,高性能計算機的適用范圍逐漸向更多領域滲透。

    源于人工神經網絡的研究深度學習作為人工智能的一個新研究領域,在模仿人腦的機制來解釋如圖像、聲音和文本數據上有了很大進展。例如,卷積神經網絡(CNN)能準確地對大型圖像進行識別處理,然而CNN的訓練密集程度很高,特別是對于大型具挑戰性的任務,卷積層的參數數據量龐大。而高性能計算機的易訪問、高峰值等性能使學術界和工業界都可以輕松訪問相關平臺,并可以在合理的時間內訓練中等和較大規模的CNN。使用基于輸入展開以將其投影為矩陣乘法(Unfold+Parallel-GEMM)的算法的CAFFE、Theano、Torch7、Chainer、CNTK和TensorFlow等最先進的CNN基礎設施已可以在高性能計算機上進行部署和應用。

    增強現實技術AR(AugmentedReality),將真實世界信息模擬至虛擬世界,讓人隨時產生真實感受。通過高性能計算機高效地實現算法,可以數字虛擬孕育“互聯網+”新業態,開發虛擬試衣、模擬試駕等應用項目。

    主站蜘蛛池模板: 成人久久久久久| 国产成人精品久久| 成人片黄网站色大片免费| 成人无遮挡毛片免费看| 成人Av无码一区二区三区| 国产成人欧美一区二区三区vr| 国产成人精品午夜视频'| 四虎国产欧美成人影院| 777久久成人影院| 成人免费ā片在线观看| 91精品欧美成人| 国产成人免费ā片在线观看 | 亚洲国产成人精品无码区花野真一 | 成人永久免费福利视频app| 成人3d动漫网址在线观看| 99久久亚洲综合精品成人网 | 成人免费看www网址入口| 777久久成人影院| 四虎成人精品无码| 国产成人精品午夜福利| 成人午夜短视频| 欧洲成人午夜精品无码区久久 | 国产成人无码午夜视频在线观看| 爽爽爽爽爽爽爽成人免费观看| 依依成人精品视频在线观看| 国产成人免费片在线视频观看| 国产精品成人va| 成人一级黄色大片| 成人精品视频99在线观看免费| 久久亚洲最大成人网4438| 四虎在线成人免费网站| 免费无码成人av在线播放不卡| 国产成人综合久久精品亚洲| 成人怡红院视频在线观看| 成人狠狠色综合| 成人影片一区免费观看| 成人免费v片在线观看| 国产成人精品亚洲一区| 国产成人综合久久精品尤物| 四虎成人精品在永久在线观看| 亚洲成人免费在线观看|