公務員期刊網 精選范文 卷積神經網絡情感分析范文

    卷積神經網絡情感分析精選(九篇)

    前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的卷積神經網絡情感分析主題范文,僅供參考,歡迎閱讀并收藏。

    卷積神經網絡情感分析

    第1篇:卷積神經網絡情感分析范文

    關鍵詞:人機大戰;人工智能;發展前景

    中圖分類號:TP391 文獻標識碼:A

    0.引言

    2016年3月15日,備受矚目的“人機大戰”終于落下帷幕,最終Google公司開發的“AlphaGo”以4∶1戰勝了韓國九段棋手李世h。毫無疑問,這是人工智能歷史上一個具有里程碑式的大事件。大家一致認為,人工智能已經上升到了一個新的高度。

    這次勝利與1997年IBM公司的“深藍”戰勝國際象棋世界冠軍卡斯帕羅不同。主要表現在兩個方面:

    (1)AlphaGo的勝利并非僅僅依賴強悍的計算能力和龐大的棋譜數據庫取勝,而是AlphaGo已經擁有了深度學習的能力,能夠學習已經對弈過的棋盤,并在練習和實戰中不斷學習和積累經驗。

    (2)圍棋比國際象棋更加復雜,圍棋棋盤有361個點,其分支因子無窮無盡,19×19格圍棋的合法棋局數的所有可能性是冪為171的指數,這樣的計算量相當巨大。英國圍棋聯盟裁判托比表示:“圍棋是世界上最為復雜的智力游戲,它簡單的規則加深了棋局的復雜性”。因此,進入圍棋領域一直被認為是目前人工智能的最大挑戰。

    簡而言之,AlphaGo取得勝利的一個很重要的方面就是它擁有強大的“學習”能力。深度學習是源于人工神經網絡的研究,得益于大數據和互聯網技術。本文就從人工智能的發展歷程與現狀入手,在此基礎上分析了人工智能的未來發展前景。

    1.人工智能的發展歷程

    AlphaGo的勝利表明,人工智能發展到今天,已經取得了很多卓越的成果。但是,其發展不是一帆風順的,人工智能是一個不斷進步,并且至今仍在取得不斷突破的學科。回顧人工智能的發展歷程,可大致分為孕育、形成、暗淡、知識應用和集成發展五大時期。

    孕育期:1956年以前,數學、邏輯、計算機等理論和技術方面的研究為人工智能的出現奠定了基礎。德國數學家和哲學家萊布尼茨把形式邏輯符號化,奠定了數理邏輯的基礎。英國數學家圖靈在1936年創立了自動機理論(亦稱圖靈機),1950年在其著作《計算機與智能》中首次提出“機器也能思維”,被譽為“人工智能之父”。總之,這些人為人工智能的孕育和產生做出了巨大的貢獻。

    形成期:1956年夏季,在美國達特茅斯大學舉辦了長達2個多月的研討會,熱烈地討論用機器模擬人類智能的問題。該次會議首次使用了“人工智能”這一術語。這是人類歷史上第一次人工智能研討會,標志著人工智能學科的誕生。其后的十幾年是人工智能的黃金時期。在接下來的幾年中,在眾多科學家的努力下,人工智能取得了矚目的突破,也在當時形成了廣泛的樂觀思潮。

    暗淡期:20世紀70年代初,即使最杰出的AI程序也只能解決問題中最簡單的部分,發展遇到瓶頸也就是說所有的AI程序都只是“玩具”,無法解決更為復雜的問題。隨著AI遭遇批評,對AI提供資助的機構也逐漸停止了部分AI的資助。資金上的困難使得AI的研究方向縮窄,缺少了以往的自由探索。

    知識應用期:在80年代,“專家系統”(Expect System)成為了人工智能中一個非常主流的分支。“專家系統”是一種程序,為計算機提供特定領域的專門知識和經驗,計算機就能夠依據一組從專門知識中推演出的邏輯規則在某一特定領域回答或解決問題。不同領域的專家系統基本都是由知識庫、數據庫、推理機、解釋機制、知識獲取等部分組成。

    集成發展期:得益于互聯網的蓬勃發展、計算機性能的突飛猛進、分布式系統的廣泛應用以及人工智能多分支的協同發展,人工智能在這一階段飛速發展。尤其是隨著深度學習和人工神經網絡研究的不斷深入,人工智能在近幾十年中取得了長足的進步,取得了令人矚目的成就。

    人工智能發展到今天,出現了很多令人矚目的研究成果。AlphaGo的勝利就是基于這些研究成果的一個里程碑。當前人工智能的研究熱點主要集中在自然語言處理、機器學習、人工神經網絡等領域。

    2.人工智能l展現狀與前景

    人工智能當前有很多重要的研究領域和分支。目前,越來越多的AI項目依賴于分布式系統,而當前研究的普遍熱點則集中于自然語言處理、機器學習和人工神經網絡等領域。

    自然語言處理:自然語言處理(Natural Language Processing,簡稱NLP),是語言學與人工智能的交叉學科,其主要功能就是實現讓機器明白人類的語言,這需要將人類的自然語言轉化為計算機能夠處理的機器語言。

    自然語言處理主要包括詞法分析、句法分析和語義分析三大部分。詞法分析的核心就是分詞處理,即單詞的邊界處理。句法分析就是對自然語言中句子的結構、語法進行分析如辨別疑問句和感嘆句等。而語義分析則注重情感分析和整個段落的上下文分析,辨別一些字詞在不同的上下文定的語義和情感態度。

    當前自然語言的處理主要有兩大方向。一種是基于句法-語義規則的理性主義理論,該理論認為需要為計算機制定一系列的規則,計算機在規則下進行推理與判斷。因此其技術路線是一系列的人為的語料建設與規則制定。第二種是基于統計學習的經驗主義理論,這種理論在最近受到普遍推崇。該理論讓計算機自己通過學習并進行統計推斷的方式不停地從數據中“學習”語言,試圖刻畫真實世界的語言現象,從數據中統計語言的規律。

    機器學習:機器學習(Machine Learning)是近20年來興起的人工智能一大重要領域。其主要是指通過讓計算機在數據中自動分析獲得規律,從而獲取“自我學習”的能力,并利用規律對未知數據進行判斷和預測的方法。

    機器學致可以分為有監督的學習和無監督的學習。有監督的學習是從給定的訓練數據集中練出一個函數和目標,當有新的數據到來時,可以由訓練得到函數預測目標。有監督的學習要求訓練集同時有輸入和輸出,也就是所謂的特征和目標。而依據預測的結果是離散的還是連續的,將有監督的學習分為兩大問題,即統計分類問題和回歸分析問題。統計分類的預測結果是離散的,如腫瘤是良性還是惡性等;而回歸分析問題目標是連續的,如天氣、股價等的預測。

    無監督學習的訓練集則沒有人為標注的結果,這就需要計算機去發現數據間的聯系并用來分類等。一種常見的無監督學習是聚類分析(Cluster Analysis),它是將相似的對象通過靜態分類的方法分成不同的組別或者是特定的子集,讓同一個子集中的數據對象都有一些相似的屬性,比較常用的聚類方法是簡潔并快速的“K-均值”聚類算法。它基于K個中心并對距離這些中心最近的數據對象進行分類。

    機器學習還包括如半監督學習和增強學習等類別。總而言之,機器學習是研究如何使用機器來模擬人類學習活動的一門學科,而其應用隨著人工智能研究領域的深入也變得越來越廣泛,如模式識別、計算機視覺、語音識別、推薦算法等領域越來越廣泛地應用到了機器學習中。

    人工神經網絡:在腦神經科學領域,人們認為人類的意識及智能行為,都是通過巨大的神經網絡傳遞的,每個神經細胞通過突出與其他神經細胞連接,當通過突觸的信號強度超過某個閾值時,神經細胞便會進入激活狀態,向所連接的神經細胞一層層傳遞信號。于1943年提出的基于生物神經元的M-P模型的主要思想就是將神經元抽象為一個多輸入單輸出的信息處理單元,并通過傳遞函數f對輸入x1,x2…,xn進行處理并模擬神經細胞的激活模式。主要的傳遞函數有階躍型、線性型和S型。

    在此基礎上,對神經網絡算法的研究又有諸多進展。日本的福島教授于1983年基于視覺認知模型提出了卷積神經網絡計算模型。通過學習訓練獲取到卷積運算中所使用的卷積系數,并通過不同層次與自由度的變化,可以得到較為優化的計算結果。而AlphaGo也正是采用了這種深度卷積神經網絡(DCNN)模型,提高了AlphaGo的視覺分類能力,也就是所謂的“棋感”,增強了其對全盤決策和把握的能力。

    3.人工智能的發展前景

    總體來看,人工智能的應用經歷了博弈、感知、決策和反饋這幾個里程碑。在以上4個領域中,既是縱向發展的過程,也是橫向不斷改進的過程。

    人工智能在博弈階段,主要是實現邏輯推理等功能,隨著計算機處理能力的進步以及深度學習等算法的改進,機器擁有了越來越強的邏輯與對弈能力。在感知領域,隨著自然語言處理的進步,機器已經基本能對人類的語音與語言進行感知,并且能夠已經對現實世界進行視覺上的感知。基于大數據的處理和機器學習的發展,機器已經能夠對周圍的環境進行認知,例如微軟的Kinect就能夠準確的對人的肢體動作進行判斷。該領域的主要實現還包括蘋果的Siri,谷歌大腦以及無人駕駛汽車中的各種傳感器等。在以上兩個階段的基礎上,機器擁有了一定的決策和反饋的能力。無人駕駛汽車的蓬勃發展就是這兩個里程碑很好的例證。Google的無人駕駛汽車通過各種傳感器對周圍的環境進行感知并處理人類的語言等指令,利用所收集的信息進行最后的決策,比如操作方向盤、剎車等。

    人工智能已經滲透到生活中的各個領域。機器已經能識別語音、人臉以及視頻內容等,從而實現各種人際交互的場景。在醫學領域,人工智能可以實現自動讀片和輔助診斷以及個性化t療和基因排序等功能。在教育領域,機器也承擔了越來越多的輔助教育,智能交互的功能。在交通領域,一方面無人車的發展表明無人駕駛是一個可以期待的未來,另一方面人工智能能夠帶來更加通暢和智能的交通。另外人工智能在安防、金融等領域也有非常廣闊的發展前景。總之,人工智能在一些具有重復性的和具備簡單決策的領域已經是一種非常重要的工具,用來幫助人們解決問題,創造價值。

    參考文獻

    [1]阮曉東.從AlphaGo的勝利看人工智能的未來[J].新經濟導刊,2016 (6):69-74.

    第2篇:卷積神經網絡情感分析范文

    關鍵詞:句子相似度計算;Word2Vector;編輯距離;Edit Distance

    中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2017)05-0146-02

    1 背景

    句子的相似度計算在自然語言處理中有著十分廣泛的運用。例如,機器翻譯中相似性文檔的判斷和提取,在問答系統中相似性問題的匹配或者問題與答案之間的匹配判斷等。對于這個相似度的刻畫,主要分為幾個不同的等級,具體為語法層面的相似度,語義層面的相似度,與語用層面的相似度。其計算難度也是層層遞進。在具體的應用中,只要能達到語義層面的判斷基本上就可以達到基本的需求了。目前對句子的語義層面的相似度計算方法主要有基于相同詞匯的方法,使用語義詞典的方法、使用編輯距離的方法,以及基于統計的方法等。其中,基于相同詞匯的方法比較簡單,但是其缺點也十分的明顯,就是對于句子中同義詞的判斷存在不足。相對于基于相同詞匯的方法,使用語義詞典可以很好的處理句子中同義詞的情形,但是語義詞典也存在著需要不斷地更新和維護詞典庫的缺點,而且如果只是單一的使用語義詞典會缺乏對句子本身結構的分析,對最后的計算結果也有較大的影響。編輯距離一般使用在對句子的快速模糊匹配上,由于其規定的編輯操作有限,而且對于同義詞的替換也缺乏判斷,因此最后的準確率也不是很理想。本文基于編輯距離的方法,利用深度學習模型Word2Vector來增強其編輯操作的靈活程度,從而克服了單純使用編輯距離對句子的語義理解不足的缺點。本文的第一部分主要介紹了相關的算法和基礎知識。第二部分主要描述了基于Word2Vector與編輯距離的句子相似度計算方法,第三部分給出了測試結果以及對該方法的優缺點討論,最后第四部分是結語。

    編輯距離方法是指兩個句子間,由一個句子轉換到另一個句子所需的最少的編輯操作次數。這里的編輯操作共有“插入”、“刪除”和“替換”三種。例如:

    我是中國人 -> 你是中國人 (把“我”替換為“你”)

    我是中國人 -> 我愛中國人 (把“是”替換為“愛”)

    我是中國人 -> 是中國人(把”我”刪除)

    利用這種方法對兩個句子進行相似度比較就像引言中分析的,其優點是簡單,速度快。但是缺點也十分明顯,由于編輯操作缺乏一定的靈活性,使得其無法進一步的判斷語義層面的含義,比如同義詞,同類、異類詞等,因此,該方法適合于句子間的模糊匹配。

    2.2 Word2Vector

    Word2Vector是一種將詞匯表示轉化為空間向量的技術,主要利用了深度學習的思想對語料進行訓練,通過將句子進行分詞,然后將每個詞匯映射成N維的向量,這樣可以將兩個詞匯的相似度比較轉化為對兩個向量的相似度比較,可以利用cosine 相似度、歐氏距離等數學工具對詞匯進行語義分析,其采用了一個具有三層的神經網絡,并且根據詞頻用Huffman編碼技術將相似詞頻詞匯的隱藏層激活的內容出于大致相同的位置,如果哪個詞匯出現的頻率很高,那么它激活的隱藏層的數目就很少,通過這樣處理可以使得計算的復雜度大幅度的降低。最后,通過Kmeans聚類方法,將相似的詞向量聚在一起,最后形成了Word2Vector的詞聚類模型。

    Word2Vector的輸出結果可以利用在NLP的很多地方,比如聚類,查找一個詞的同義詞,或者進行詞性的分析等。

    3 基于Word2Vector與編輯距離的句子相似度計算方法

    3.1 問題描述

    3.3 按照Word2Vector的詞向量距離來定義編輯操作的系數

    由Word2Vector訓練好的模型會將各個詞匯生成一個與其相對應的詞向量,計算兩個詞匯對應的詞向量便可以知道這兩個詞匯的相似度。如果值為1,說明這兩個詞匯完全一致,如果為0,則表示完全沒有關系。

    這里考慮一種情形,當利用替換操作進行兩個詞匯的替換時,如果兩個詞匯意思是相近的,那么它的替換代價會相應的低一點,反之,則會相應的高。舉個例子:

    我愛故宮

    我愛天安門

    我愛蘋果

    這三個句子我們可以知道1,2兩句更加的接近,因為它代表的都是景點。因此待匹配的句子1應該會匹配上句子2。為了將詞語的相似度考慮進去,這里引入Word2Vector的詞向量來改進替換操作的系數。

    假設兩個詞匯的向量距離為k,k∈[0,1]。考慮到k的值的大小與編輯距離的大小是相反的,這里將更新后的替換操作的系數設定為1/(1+k)。這樣更新后的替換操作會根據不同詞匯之間的距離發生變化,變化范圍在[0.5,1]之間。而且這個值的范圍不會打破編輯操作里面的平衡,即替換=插入+刪除。更新后的編輯距離公式L=a+1/(1+k)*b + c。

    4 實驗及結果分析

    為了驗證改進的編輯距離算法的有效性,本文自行構造了實驗所需的句子集合,本文所用的測試句子一共有400句。其中380句為來自各個不同領域類型的句子。比如,體育,娛樂,軍事,文化,科技,教育等。另外20句為沒有意義的干擾句。這里從380個句子中挑選100句作為參考句子,通過人工評價,比較測試結果。這里評價按照結果的質量分為3類:1、準確,2、相關,3、不相關。其中查準率P的定義如下所示:

    通過實驗可以發現,經過改進的編輯距離句子相似度匹配算法在準確度上有了一定的提高和改進,其中原因便是調整后的編輯距離算法將同義詞近義詞等通過詞向量給計算出來。但是在實驗中也發現了一個現象,就是相對來說判斷準確的句子都是一些短小句,即長度不是很長的句子,而判斷不相關的句子明顯長度要更長一些。事實也是如此,當句子的長度較長時,通過分詞將一個句子分為一個個短的詞匯來利用詞向量來理解會破壞句子的整體含義。

    5 結束語

    本文通過利用Word2Vector模型將詞向量計算引入到編輯距離算法的編輯操作中,從而使得改進后的編輯算法對句子具有一定的語義理解能力。通過實驗也比較好的驗證了此方法的有效性,尤其是對近義詞與同義詞的理解上有了很大的提升,而算法本身的時間復雜度相較于編輯距離算法則沒有改變多少。

    另外,通過實驗也發現,此方法對短句子的效果非常的明顯,而對于一些長句則還是具有較大的誤差。從對句子本身的分析角度上看,還需要通過對句子進行建模才可以達到比較好的理解匹配。

    參考文獻:

    [1] 李彬, 劉挺, 秦兵, 等. 基于語義依存的漢語句子相似度計算[J]. 計算機應用研究, 2003, 20(12): 15-17.

    [2] 孔勝, 王宇. 基于句子相似度的文本主題句提取算法研究[J]. 情報學報, 2011, 30(6): 605-609.

    [3] 賈明靜, 董日壯, 段良濤. 問句相似度計算綜述[J]. 電腦知識與技術: 學術交流, 2014 (11): 7434-7437.

    [4] 賈熹濱, 李寧, 靳亞. 用于文本情感極性分析的動態卷積神經網絡超限學習算法[J]. 北京工業大學學報, 2017, 43(1): 28-35.

    [5] Xu G, Cao Y, Zhang Y, et al. TRM: Computing Reputation Score by Mining Reviews[J]. 2015.

    [6] 萬翔, 劉挺, 秦兵, 等. 基于改進編輯距離的中文相似句子檢索[J]. 高技術通訊, 2004, 14(7): 15-19.

    [7] 汪衛明, 梁東鶯. 基于語義依存關系匹配的漢語句子相似度計算[J]. 深圳信息職業技術學院學報, 2014 (1): 56-61.

    [8] 裴婧, 包宏. 漢語句子相似度計算在 FAQ 中的應用[J]. 計算機工程, 2009, 35(17): 46-48.

    主站蜘蛛池模板: 成人综合国产乱在线| 青青草成人影院| 78成人精品电影在线播放日韩精品电影一区亚洲 | 91成人午夜在线精品| 欧美成人三级一区二区在线观看| 欧美成人免费全部观看天天性色| 国产成人精品电影| 久久久久成人精品一区二区 | 亚洲国产精品成人午夜在线观看| 668溜溜吧成人影院| 国产成人精品视频一区| 久久亚洲国产成人精品无码区| 成人免费观看视频高清视频| 亚洲天堂成人网| 国产成人精品亚洲精品| 69国产成人精品午夜福中文| 国产成人久久av免费| 成人中文乱幕日产无线码| 欧美成人午夜影院| 亚洲成人午夜电影| 国内成人精品亚洲日本语音| 欧美成人精品第一区二区三区| 国产成人无码专区| 成人合集大片bd高清在线观看| 久久久久亚洲AV成人片| 亚洲精品亚洲人成人网| 国产成人精品怡红院| 成人区视频爽爽爽爽爽| 日本成人在线免费观看| 欧美成人手机视频| 成人毛片18岁女人毛片免费看| 日本成人在线免费| 成人国产精品免费视频| 成人污视频在线观看| 成人免费看黄20分钟| 成人久久精品一区二区三区| 成人毛片免费视频| 成人午夜高潮A∨猛片| 成人免费观看网欧美片| 天天成人综合网| 亚洲国产精品一区二区成人片国内 |