公務員期刊網 精選范文 社交媒體文本分析范文

    社交媒體文本分析精選(九篇)

    前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的社交媒體文本分析主題范文,僅供參考,歡迎閱讀并收藏。

    社交媒體文本分析

    第1篇:社交媒體文本分析范文

    挖掘社交媒體的商務價值

    3月11日日本發生9.0級大地震以后,很多人通過微博及時得到親人、朋友安全的消息,也有很多人通過微博了解到震區的實時情況。社交媒體在此次地震中更加彰顯了其巨大的威力。國外Facebook、Twitter等社交媒體深受歡迎,國內人人網、開心網、新浪微博等社交媒體也被廣泛應用。

    在過去,社交媒體更多地被作為個人娛樂、休閑,以及獲取感興趣的信息的一個途徑。在商業領域,社交媒體也越來越被企業用來進行市場營銷等工作。比如說,新產品推出早期,可以借助社交媒體得到產品特性的優劣評價,以及需要進行哪些改進。再比如說,可以在社交媒體的關系網絡里找到關鍵節點的關鍵人物,從而有針對性地對產品進行有效推廣。充分挖掘社交媒體中的信息,成為輔助企業進行正確決策的有效工具。

    但是在過去,社交網絡中的這些非結構化的數據很難被整理和挖掘。隨著社交媒體信息的商務價值的不斷提升,BI廠商開始考慮通過有效手段挖掘這些信息。

    SAP中國區首席技術官張俠在接受記者采訪時指出,BusinessObjects 4.0中的深層文本分析能整合人們在社交媒體流、博客和電子郵件中所表達的想法和觀點,并輔助企業做出更加正確的商業決策。這樣,人們不僅可以準確地監控、分析、搜索、報告和處理他們的交易數據,而且還可以充分地了解博客、電子郵件和社交媒體流等非結構化內容中所表達的趨勢和觀點。這種新的多源、多維語義層及共同編程體驗,簡化了即時分析和內容創建過程,能以更快的速度向用戶提供更全面的建議。

    關注三大特性

    BusinessObjects 4.0是BusinessObjects產品近三年以來最重要的一次更新。SAP于2008年收購了BusinessObjects公司后,以最快的速度將其產品轉化為自身的商業智能軟件平臺。

    在此次的產品中,SAP將整合了BI和EIM(企業信息管理)的解決方案稱為商業分析軟件,并指出實時、移動和社交是商務分析軟件的發展趨勢:基于內存計算,實現實時商務分析;用戶手中瞬間擁有強大的商業智能能力,并且能夠得到比以往任何時候都多的移動終端的支持;借助準確的企業和社交數據,結合結構化和非結構化信息,提供信息管理工具。

    在實時方面,BusinessObjects 4.0借助SAP內存計算工具(SAP HANA)的優化應用使客戶能夠借助內存計算功能處理大數據量,從而使實時商務成為可能。內存設備以閃電般的速度處理海量數據催生了一種新分析模式――這種分析可以立即將大規模、復雜的數據轉換成更加明智的商業決策。

    第2篇:社交媒體文本分析范文

    【摘 要】“周一見”娛樂事件以其喧鬧的微博文本成功吸引了線上、線下媒體以及千百萬網民的熱烈關注和討論,制造了一個由微博首發的全民消費現象,成為中國娛樂事件通過微博文本傳播消費產生聚集討論和強大影響力的典范。本文通過對“周一見”事件微博文本元文本的互文性的研究,力求解答為何以微博首發的“周一見”會產生如此喧鬧的微博文本。

    關鍵詞 微博文本 文本消費 互文性

    微博自誕生以來一直扮演著媒介事件升溫爐與加速器的角色,不論是近期火爆的“鋒菲戀”等娛樂新聞,還是早在4月份轟動一時的“周一見”事件都是微博傳播的典范。而作為引路石的“周一見”事件的微博傳播雖然事件已經淡出了公眾視線,但由于明星的私生活報道產生微博轉發破百萬、登上傳統媒體頭版頭條,網民集體議論、網絡造句大批出現、國外媒體投入關注等現象在國內還是首次,也是微博擔任娛樂事件文本傳播的典范,其事件本身的消費特點與傳播,對后來娛樂事件及社會熱點事件傳播的意義與影響是不可忽視的。本文通過互文性的文本分析研究,解釋產生于微博時代的“周一見”事件媒介文本的生產意圖與消費意義。

    一、微博文本的交互呈現

    一方面,微博等自媒體提供的平臺使得言論相對自由,轉發、評論等功能更是文本快速傳播的引擎,網絡刮起造句風潮,“咎由自取體”、“伊琍體”一時成為熱門句式。從馬伊琍回復文章致歉聲明的微博來看,“戀愛雖易,婚姻不易,且行且珍惜”被網友大量仿造,“畢業雖易,求職不易,且行且珍惜”、“駕駛雖易,安全不易,且開且珍惜”、“網站雖易,賺錢不易,且行且珍惜”等等造句既是在句式和意境上參照了馬伊琍微博原文,又是網友們結合求職難、駕駛事故多發、網站盈利機制不成熟等社會現實,對原信息進行的解碼又重新編碼的過程,互文性的文本生產方式貫穿始終。

    另一方面,由于微博的加入,其實時性、開放性與交互性使得整個“周一見”事件文本的生產與消費方式越來越高明,每一個媒介文本的出現都恰如其分,整個事件的媒介文本邏輯嚴密,文本的交互性呈現無處不在。這兩個方面的傳播現象共同的介質就是媒介文本,并且在微博的推波助瀾下,媒介文本的“互文性”生產愈加靈活多樣。

    網絡造句的熱度反映著受眾對事件和文本的消費熱情,這種熱情也在推動著媒介文本連續劇式的呈現。從謝曉的“微博預告”開始,小道消息滿天飛,網友猜測,真實圖文報道,到文章的供認不諱和致歉聲明,馬伊琍的微博回應,文本的呈現至此將事件引入一個高峰。輿論的壓力讓文章微博繼續發聲“我賤命一條,陪你們到底!”直接叫板《南都娛樂》,讓網友們聯想是否是《南都娛樂》報私仇,《南都娛樂》官微回應否認“報私仇”傳聞,隨即署名為“馬伊琍爸爸”的微博號發文質問《南都娛樂》,希望還家庭安靜,事情發展接近尾聲,喧鬧的文本現象也逐漸平息。但我們從主要媒介文本的呈現經過可以看出,每一次媒介文本的生產及呈現都恰如其分,有嚴密的邏輯性和故事發展情節。事情的發展以《南都娛樂》發起,并于每次與當事人交鋒引起輿論,文章的反應和其岳父的發文以及網友一邊倒的譴責文章同時也暗示著《南都娛樂》的傳播目的成功實現。

    二、互文性文本的兩個維度

    互文性不僅體現在文本交互性呈現的表現形式上,通過互文性的文本呈現也深刻揭示著整個事件中媒介文本生產與消費的意義。著名媒介文化研究學者約翰·菲斯克在《電視文化》中從水平和垂直兩個維度分析電視文本的互文性,筆者借用菲斯克分析電視互文性的兩個維度的研究思路,并結合互文性的廣義(解構主義)視角——發生性互文與接受性互文分析“周一見”事件涉及的媒介文本的互文性生產,將文本按水平維度分為事件當事人文章、馬伊琍的言論;按垂直維度,將事件當事人文章、馬伊琍的文本分為一級文本,將媒體報道、網友評論分為二級文本(見下表)。

    發生性互文和接受性互文是分別從文本的生產和接受兩個角度對媒介文本進行剖析的。而在利用互文性視角解析文本生產時,接受與生產是必不可少的兩個過程。“周一見”事件的二級文本基本是對一級文本的回應,是在對一級文本接受、解構的前提下并結合歷史文本生產的結果。而一級文本的生產過程也是基于對先時文本的接受、解構進而產生的回應與結合。正如大量網友指出的文章的致歉聲明有抄襲高曉松之前酒駕致歉聲明之嫌,說明文章的微博致歉聲明或多或少是對高曉松版致歉聲明有某種程度上的接受,而又因事件性質的不同和身份的不同,存在具體內容的差異,因而最終產生的文本是一個對先時文本的接受、解構與再生產的過程。又如“伊琍挺住”、“伊琍不哭”等網友評論,首先是對一級文本文章致歉聲明的抗拒性解讀與對馬伊琍“且行且珍惜”微博的接受性解讀;其次,“挺住”“不哭”等句式初在2008年汶川地震時便已出現,成為一種流行的固定的網絡文體,用以表示對汶川的支持,后來在玉樹地震、雅安地震中也大量出現。網友將這個文體用在這里,顯然是借對這個歷史文本的互文性生產表達對馬伊琍的同情與支持。因此,在互文性的文本分析視角下,不論是一級文本還是二級文本,都是在對先前文本的接受或解構的前提下,或結合歷史文本,或結合現實環境生產的結果。

    而這些文本生產與消費對于事件的內涵意義的生產方面,也從水平和垂直維度的文本中得到體現。從水平維度來看,媒介文本是由事件的當事人文章所發,代表了當事人的傳播意圖和立場。文章的致歉聲明與之后的微博因互文性相互關照,后文是對前文意義的強調。文章所發微博雖然言辭粗魯,但是很急切的表達了他不希望事情繼續發展,希望媒體息事寧人。但當事者生產文本的本意卻并沒能夠得到受眾的完全解讀。因為從垂直維度來看,媒體的報道和網友的評論呈現愈演愈烈的態勢,并且輿論的導向也偏離文章減輕形象傷害的意圖。在此事件中,二級文本的生產者站在一級文本生產者的對立面,例如謝曉接受騰訊訪談稱“馬伊琍給我發了一條感謝短信”,更加印證事件的真實性和文章出軌男的形象,以及《南都娛樂》所發表的言論始終堅持一個態度和立場,引導受眾按自己的傳播意圖去解讀這些文本。在這場對立文本生產與消費過程中,網民受眾是一群基礎性的存在,他們的評論和立場推動著一級文本和二級文本的生產,他們的評論即構成了對所有媒介文本的消費。

    三、微博文本生產與消費的背后

    “周一見”事件的發生、發展過程的報道表面上是一個新舊媒體爭相爆料、共同發聲、合理推進的過程。實際上,在新興媒體和移動互聯網的沖擊下,傳統媒體面臨激烈的競爭壓力,該事件某種程度上可以看做《南都娛樂》為提高自身公信力和影響力而制造的一次對自身傳統報業品牌的營銷活動。

    微博具有傳播速度快、流傳廣的特點,同時它也是一個負面消息散布極快的平臺。《南都娛樂》最先選擇微博發聲是刻意為之,意在利用微博的傳播特點和強大用戶群體,使話題迅速擴散,產生社會影響。從對文本的分析以及事件的發展可以看出,《南都娛樂》一直掌控著報道的導向和受眾的導向,比如最先的微博預告中“我也理解當事人此時的焦灼,但請相信此報道絕無任何陰謀論,記者也拒絕了巨大的利益誘惑”表明信源的真實公正客觀,樹立傳統媒體的權威性。不論是“周一見”熱詞的火爆、網民的全體參與,還是文章的回應“我賤命一條,陪你們到底!”都在印證著《南都娛樂》的借勢營銷、傳播意圖取得成功。

    通過對“周一見”事件的微博文本分析說明,一個熱點娛樂事件或熱點社會事件的產生和發展、其文本的生產與消費既有宏觀層面受眾、媒體和技術發展的因素,也有微觀層面文本生產的方式的影響,文本的互文性生產與呈現、文本生產者的立場與文本傳播的意圖都對整個事件的文本的產生與消費起著重要作用,特別是在新媒體技術的支持下,對社交軟件的精心駕馭能夠一定程度上促進事件的傳播。

    參考文獻

    ①胡曉云、陸琪男,《“故宮星巴克”事件中的媒介文本研究》[J].《廣告大觀》,2007(5)

    ②約翰·菲斯克:《電視文化》[M].商務印書館,2005

    ③鮑海波,《喧鬧的文本——媒介文化文本視閾中的“李剛門”事件》[J].《山西大學學報》,2011(2)

    ④張穎,《網絡新聞話語建構的互文性分析》[D].中央民族大學,2012

    第3篇:社交媒體文本分析范文

    關鍵詞:預測分析 大數據處理 大數據應用 數據挖掘

    中圖分類號:TP393 文獻標識碼:A 文章編號:1672-3791(2017)06(c)-0053-03

    隨著云計算、大數據、物聯網和移動互聯網等新一代信息技術的發展,傳統企業級IT架構正在朝基于互聯網的分布式新架構轉型。大數據作為新一代信息技術的核心,正在使各個領域變得越來越可感知,并走向智能化。大數據將會發揮自身獨特的優勢,帶給我們更多的方便和便捷。大數據分析的方法理論有哪些、在行業、企業的活動中有哪些應用。

    1 大數據分析的五個基本要素

    1.1 大數據預測性分析

    大數據技術的主要應用是預測性分析,如在線教學資源網站通過數據分析用戶會對推薦的教學模是否感興趣,保險公司通過數據預測被保險人是否會違規,地震監測部門通過對大數據的分析,預測某地點發生地震的大致時間,氣象部門利用數據預測天氣變化等。預測是人類本能的一部分,通過大數據預測人類才可以獲得有意義的、智能的信息。許許多多的行業應用都會涉及到大數據,大數據的豐富特征表述了快速增長的存儲數據的復雜性。大數據預測分析打破了數據預測一直是象牙塔里數據科學家和統計學家的工作,伴隨著大數據的出現,并融合到現有的MIS、MRPII、DSS 、CIMS和其他核心業務系統,大數據預測分析將起到越來越重要的作用。

    1.2 數據管理和數據質量

    大數據分析跟數據質量和數據管理緊密相關,而質量高的數據和有效的數據管理可以使分析結果有價值、真實并得到有力的保證。

    1.3 可視化分析

    普通用戶和大數據分析專家是大數據分析的直接使用者,因此他們對大數據分析的基本要求就是要可視化,因為他們想通過可視化分析獲得可觀的大數據特征,讓用戶直觀看到結果。

    提高解釋信息的能力可以通過數據的可視化展示來實現,而可視化展示主要由圖形和圖表來呈現。要從大量的數據和信息中找尋相關性非常的不容易,而圖形或圖表能夠在短時間內展示數據之間的相關信息,并為用戶提供所需的信息。

    1.4 語義引擎

    語義引擎是把現有的數據標注語義,其實可以把它理解為結構化或者非結構化的數據集上的一個語義疊迭層。它是數據分析及語義技術最直接的應用,好的語義引擎能夠使大數據分析用戶快而準地獲得比較全面的數據。

    數據分析的新挑戰及困難主要表現在非結構化數據與異構數據等的多樣性,必須配合大量的工具去分析、解析、提取數據。語義引擎的設計可以達到能夠從文檔中自動提取有用信息,使語義引擎能挖掘出大數據的特征,在此基礎上科學建模和輸入新的數據,來預測未來的可用數據。

    1.5 數據挖掘算法

    大數據分析的理論核心就是數據挖掘。各種數據的算法基于不同的數據類型和格式,能更加科學地呈現出數據本身的特點,能更快速地處理大數據。如果采用一個算法需要花好幾年才能得出結論,那大數據價值也就無從f起了。可視化是給人看的,數據挖掘是給機器看的。集群、分割、孤立點分析還有其他的算法可以使我們深入挖掘數據內部的價值,并且這些算法能夠處理大數據的數據量,也可以滿足處理大數據的效率要求。

    2 大數據處理方法

    大數據處理技術在社會的發展中占有重要的地位,現在有很多的研究者對大數據處理技術進行研究,將大數據處理技術與交互設計結合,讓交叉科學得到發展,計算機技術的進步,讓交叉技術被廣泛應用,并引起了很多人的重視,例如:計算機技術可以在藝術中被應用,進行色彩搭配,還可以將計算機技術應用到垃圾分類里,這些都是研究人員對計算機和交叉設計的結合。這種結合讓設計學與計算機技術緊急的結合在一起,將傳統的調研方式和測試方式應用到交叉科學領域,這種方法的研究可以為用戶調研和測試方法提供依據,能夠減少人工的成本。大數據處理方法其實有很多,筆者根據長時間的實踐,總結了幾種基本的大數據處理方法,如非結構數據處理法、自然語言處理法等,該文主要介紹非結構數據處理流程涉及到的主要方法和技術。非結構化數據處理流程主要以網頁處理為例來闡述,包括3個階段,分別是信息采集、網頁預處理和網頁分類。

    2.1 信息采集

    信息采集主要是根據相關主題由固定的專業人士來完成,其采集的數據只能用于所針對的主題和相關的模塊,出于對效率和成本的考慮完全不必對整個互聯網進行遍歷,因此,模塊信息采集時往往需要研究以哪種方式預測鏈接指向的頁面與主題的關聯性,并測算其是否值得訪問;然后研究以哪種相關策略訪問Web,以在采集到主題相關頁面的同時,盡可能地減少采集到主題無關的頁面。

    預先設定好種子鏈接是信息采集的基本方法,充分使用HTTP協議下載被訪問的頁面,運用分析算法對頁面與主題的相關性進行分析,然后確定待訪問的相關鏈接,預測可能指向主題相關頁面的鏈接,最后循環迭代地運用不同的相關策略訪問網頁。

    2.2 網頁預處理

    網頁預處理最主要涉及到網頁去重處理,網頁去重可以歸為兩類:一類是基于URL的對比去重,它適用哈希算法;另一類是基于內容的對比去重,它適用基于信息指紋的文本相似度算法。

    網頁去重是先抽取文檔對象的特征,再對文檔內容進行分解,將文檔的特征集合表示出來,然后有目的針對特征集合的壓縮編碼,通過將哈希編碼等文本轉為數字串映射方式,為后續的特征存儲以及特征比較提供方便,這樣可以起到減少存儲空間,提高比較速度的作用,最后就是計算文檔的相似度,此步需要根據文檔特征重復比例來確定文檔內容是否重復。一般是提取網頁的某一個信息特征,通常是一組關鍵詞,或者是關鍵詞加權重的組合,調用相應的算法,轉換為一組關鍵代碼,也被稱為指紋,若兩個頁面有大數量的相似指紋,那么可以預測這兩個頁面內容具有很高的重復性。

    2.3 網頁分類

    網絡時代,人類所面臨的一個非常重要且具有普遍意義的問題就是網頁分類。將網絡信息正確分類,方便人們更好地使用網絡資源,使雜亂無章的網絡環境變得有條理。而網頁分類一般是先對網頁中的文本素材進行分類,通常采用文本分類來完成。文本分類主要應用于電子郵件分類、信息過濾、文獻翻譯、數據檢索等任務,文本分類的一個關鍵問題是特征詞的選擇問題及其權重分配。

    在搜索引擎中,文本分類主要有以下用途:相關性排序會根據不同的網頁類型做相應的排序規則;根據網頁是索引頁面還是信息頁面,下載調度時會做不同的調度策略;在做頁面信息抽取的時候,會根據頁面分類的結果做不同的抽取策略;在做檢索意圖識別的時候,會根據用戶所點擊的URL所屬的類別來推斷檢索串的類別等。

    網頁分類方法有SVM分方法和樸素貝葉斯方法,其中比較推薦的是支持向量機分類方法(SVM),該算法主要基于統計學理論及線性分類器準則之上,從線性可分入手,再擴展到線性不可分的情況。甚至有時會擴展到使用非線性函數中去,這種分類器統稱為支持向量機。近年來,支持向量機分類方法越來越多的受到網頁分類技術人員的青睞。

    3 大數據分析在行業活動中的應用

    非結構數據處理和數據挖掘的應用范圍較廣,它可能應用于運營商、銀行、傳統企業和電商,挑選幾個具有代表性的案例與大家分享。

    3.1 電信行業

    某城市電信運營商的上網日志分析系統,該系統通過收集用戶上網日志歷史記錄數據,分析出每個用戶的偏好。首先該系統通過并行統計出每個人有效歷史上網日志URL;然后從日志URL中抓取網頁內容,提取正文,并通過文本分類算法計算分類;最后通過統計出每個用戶上網關注類別總數,分析出每個用戶的偏好。

    3.2 地產行業

    某房地產企業的社會化品牌實時營銷系統,該系統通過社交媒體數據,進行網絡口碑監測,負面情緒被及時地發現并制止;通過與客戶進行互動,爭取客戶忠誠度;通過監控同行及競爭對手的各方面資訊,量化評估競爭態勢;快速提升品牌知曉度和美譽度,將媒體影響力轉換為客戶量,縮短人氣聚集周期。

    3.3 證券行業

    某證券商戰略信息監測通過歷史回顧與信息摘要,提供題目、摘要、原文URL,今日輿情焦點,今日輿論,展示抓取的所有期貨產品相關信息的縮略,并提供全文鏈接。通過熱點事件列表可以看到歷史相似事件對趨勢的影響,通過天氣指數與趨勢對應曲線可以看到歷史相似天氣與歷史趨勢的對照。

    3.4 金融行業

    某大型股份制商業銀行供應商風險評估系統,該系統通過抓取供應商內部數據,如企業年報、公司變動、領導情況、財務狀況等數據,分析公司運營指數;通過計算各供應商社交數據,對其社會影響力做評估;通過同行之間的數據分析對比,對供應商進行實力評估,這些數據指數可以有效協助商業銀行進行供應商風險評估。

    4 結語

    大數據處理數據的基本理念是用全體代替抽樣,用效率代替絕對精確,用相關代替因果。證券、微商、地產等行業每天都會產生巨大的數據量,大數據分析與處理已成為大數據技術的最重要的應用,通過大數據技術從海量數據中提取、挖掘對業務發展有價值的、潛在的信息,找出產品或服務未來發展趨勢,為決策者提供有力依據,有益于推動企業內部的科學化、信息化管理。

    參考文獻

    [1] 孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,50(1):146-149.

    [2] 國際電子商情2013年大數據應用與趨勢調查[Z].

    [3] 大數據時代來臨:國內IT企業布局已然落后[EB/OL].新浪網,2012-06-01.

    [4] 大數據時代降臨[EB/OL].半月談網,2012-09-22.

    [5] 王惠.大數據時代下數據分析理念研究[J].中國市場,2015(22):74.

    第4篇:社交媒體文本分析范文

    關鍵詞:文本挖掘 新聞 支持向量機 貝葉斯分類 粗糙集 股票價格

    注:2014年國家級創新基金項目(項目編號201410287046):基于文本挖掘技術的網絡新聞對中國股市影響的分析預測

    隨著互聯網技術的不斷發展,互聯網新聞中包含了越來越多的財經資訊。財經網站已經演變成投資者用來交換想法與新聞媒體傳播的主流載體,行業新聞與個股新聞在證券市場上對投資者的投資決策起到關鍵性作用。但是,投資者從海量的財經新聞中分離出有效的信息仍然存在著較大困難。因此,提供一種科學有效的方法來幫助投資者判斷新聞的影響力是至關重要的。

    目前,探索互聯網媒體與股市關系的傳統研究較少,大多數學者在有限理性假說的基礎上,對投資者心理、投資行為、市場信息非對稱性、政府對新聞媒體的控制以及財經新聞語義分析等方面進行研究,其研究結果偏理論性和概括性。而近幾年,隨著大數據的不斷成熟,數據挖掘技術在證券市場預測上的運用也逐漸增加。

    互聯網財經新聞所蘊含的數據是非結構化的,所以將新聞量化成可視化的時間序列數據具有一定的挑戰性。國內學者運用文本分類的基本方法對新聞標題或者板塊個股的新聞進行情感分類,構建中文分詞詞典和情感詞典。分詞方面,羅海飛等在不斷改進貝葉斯算法的基礎上進一步提高文本分類的正確率。西南財經大學趙麗麗等主要應用文本挖掘技術和多元線性回歸分析方法,結合股票主要技術主表就互聯網財經新聞對股市影響進行了實證分析與定量研究。國外機器學習領域的學者以互聯網社交媒體為主要研究對象,根據用戶表達的投資意愿來分析其與股價之間的聯系,運用支持向量回歸模型、多核學習方法等建立股價預測模型。歷史研究表明,智能方法與傳統的CAPM和Fama四因素股價預測模型相比具有更高的準確性。

    本文將運用數據挖掘技術分別預測個股新聞與行業新聞對股價的影響,建立智能方法模型,比較股價預測模型的準確性,在國內研究中具有創新意義。

    一、方法

    (一)系統概述

    圖一闡述了我們預測系統的全面流程。首先,我們需要搜集數據。在這過程中,我們運用文本挖掘技術抓爬財經網站上的數據,并建立相關股票新聞數據庫。其次,我們在這些無結構數據中分離出有用的信息。我們去除HTML的標簽,并且分離出有用的新聞特征,例如時間、新聞文本等,對新聞進行文本情感分類,將無結構數據量化。最后,我們的系統能夠通過運用支持向量機(SVM)、貝葉斯算法、粗糙集模型對證券價值分別進行預測。

    (二)數據搜集

    我們選擇證券行業為主要研究對象,在新浪財經網站(http://.cn/stock/)上搜集了證券行業18家股票的個股新聞和行業新聞。本研究抓取了2012年12月至2014年9月期間的行業新聞5063條,個股新聞10309 條。其中,將2012年12月至2014年7月作為訓練集時間段,選取2014年8月至9月作為預測集時間段,采用訓練好的模型預測2014年8至9月期間每一則新聞報道對股票收益所產生的影響。本文以前一天15點到次日15點為T日,建立2012年12月4日至2014年9月26日期間的新聞文本資料庫。

    (三)情感分類

    對于情感分類引入評價理論,通過從文本中提取形容詞及修飾語構成的短語作為特征,進行語義傾向分析。本文將股票新聞的情感特征詞劃分為情感詞和行為詞兩類,并進一步分為5個維度(正、負、程度、否定詞、不確定詞),利用ICTCLAS程序接口以及C++對所有新聞文本進行了分詞,建立金融特征詞庫。

    (四)文本結構化處理

    在處理數據的過程中,本文基于金融特征詞庫,進行特征選擇,利用向量空間模型(Vector Space Model,簡稱VSM)將無結構數據的新聞文本轉換成計算機可以處理的結構化向量。通過TFIDF方法評估每個特征詞在整個文檔集中的重要程度。

    (五)學習模型

    1、SVM模型

    SVM模型由Vapnik首先提出,主要思想是建立一個超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。本文選用的是SVM模型中的C-SVC的分類器,其過程如下:

    基于libsvm工具箱,本文選用多項式核函數,以結構化的文本向量及股票收益率為模型的輸入。其中,每日股票收益率采用的是新聞當天數據,周末新聞算為下周一數據,對應下周一股票收益率,以此類推。同時,將停牌股的股票收益與當日新聞予以去除。在進行預測時,由于特征歸一化對預測結果有影響,本文考慮分別保留未歸一化和歸一化的兩類預測數據,模型分別用SVM1,SVM2表示。

    2、樸素貝葉斯分類

    貝葉斯分類原理是通過選取適當的模型的先驗分布,利用貝葉斯公式計算出其后驗概率。本文樸素貝葉斯分類器所選擇的訓練集和預測集與SVM的所選擇數據相同,模型用Bayes表示。

    3、粗糙集預測

    由于分類器與新聞因素的差異對預測的數據都有影響,本文構建了一種基于粗糙集的組合預測方法,進而比較分類數據預測的準確性。

    本文將SVM1,SVM2,Bayes三種模型求解的行業新聞與公司新聞的預測值作為條件屬性集C的元素,將預測真實值y視為決策屬性D{y}。論域為各公司預測集內各日數據的集合,該論域中對象的屬性即為對應日的屬性集C。考慮粗糙集理論中屬性集等價類的概率分布[X;p]、[Y;p],引入信息論中信息熵,構建如下公式:

    <E:\123456\財經界?學術版201513\6下-7.TIF>

    經過運算:

    <E:\123456\財經界?學術版201513\6下-8.TIF>

    得出C各元素重要性,即各公司不同預測方法,不同新聞因素的重要性。在此基礎上,加權不同的預測方法的預測值,可以得出新的預測值;加權不同方法對新聞因素的影響,可以得出兩新聞因素影響的重要性。

    二、實驗與結果

    (一)組合預測與其他預測結果比較

    本文分別研究了互聯網行業與個股新聞對證券行業股票影響強度,比較SVM、貝葉斯以及粗糙集三種模型的預測結果,得出結果如表1所示。

    <E:\123456\財經界?學術版201513\6下-5.TIF>表1組合預測與其他預測結果的比較

    從表1中可以看出,基于粗糙集組合預測結果的準確率總體而言相對于其他兩種方法較高。由于粗糙集組合預測需要在預測期間內相同時間段內同時存在行業與個股新聞,其可采用的新聞數據數量比其他兩種預測方法會有所減少,影響了結果。所以在綜合考慮行業與個股新聞時,同時考慮公司新聞因素和行業因素準確性并不見得會比單獨考慮高,反而會出現更低的準確度,具體表現以中信、西南、招商、國金、光大、東吳為例。

    但對于整個證券行業而言,粗糙集組合預測綜合了各個模型的優缺點以及各新聞因素對各公司的影響程度大小,較大的提升了預測準確率。

    (二)公司新聞和行業新聞對各公司影響結果分析

    <E:\123456\財經界?學術版201513\6下-6.TIF>

    表2 行業新聞與公司新聞影響因素比較

    根據表2可以得知,公司新聞因素為股票價格的主導因素。當我們去除預測率較低的個股后,這一現象表現的更為顯著,這是因為公司新聞中所含的有價值信息超過行業新聞中的有價值信息。

    三、結束語

    本文采用文本挖掘技術和向量空間模型,引入了機器學習方法,結合股票技術指標,就證券行業與個股新聞對股市的影響進行了分析研究。在研究過程中,本文發現,互聯網新聞對股票收益率存在一定的影響,并且個股新聞對股票收益率的影響高于行業新聞。互聯網新聞的樣本數量和質量也會影響預測的準確性,樣本新聞信息處理的越好,預測則更加精準。

    由于股票新聞存在不完整、不確定的特性,考慮到這個因素,本文在運用SVM模型和貝葉斯分類方法的基礎上,創新運用粗糙集模型組合不同預測模型,得到了更加精確的預測結果。由此可以看出,運用數據挖掘預測股票收益具有較大的前景。

    然而,互聯網財經新聞不是一直可信賴的,投資決策還應該結合更多的技術指標和信息來進行分析。在未來的研究中,作者將進一步結合影響股票價格收益率的更多因素綜合預測價格的波動。

    參考文獻:

    [1]鄒亞寶.媒體對有限理性投資者投資行為的影響研究[J].金融教育研究.2012.第25卷第5期

    [2]譚華.不確定時態數據挖掘方法及其在證券行情預測中的應用[D].長沙:湖南大學.2008

    [3]高D,周莉,張勇,邢春曉,孫一鋼,朱先忠.面向股票新聞的情感分類方法[J].軟件學報.2010. Vol.21.P349-642

    [4]陳華,梁循.互聯網股票新聞歸類和板塊分析的方法[J].電腦開發與應用,2006,11:2-3+6.

    [5]李丹.基于樸素貝葉斯方法的中文文本分類研究[D].河北大學,2011

    [6]趙麗麗. 互聯網財經新聞對股市影響的定量分析[D].成都:西南財經大學.2012:1-49

    [7] Yang Yu,WenjingDuan,Qing Cao.The impact of social and conventional media on firm equity value: A sentiment analysis approach.Decision Support Systems 55 (2013) 919C926

    第5篇:社交媒體文本分析范文

    關鍵詞: 多模態語言 多元識讀能力 大學生

    1.研究背景

    隨著國際化進程的加快,傳播媒介新技術的發展及普及,人與人之間的多模態交流日益頻繁。傳統以語言為主符號單一的傳統識讀能力在當今社會已不夠用,因而由圖像、聲音、動作和顏色等表達意義的符號元素,正在與語言符號一起形成構建意義的多模態系統,并給識讀教育帶來重大變革(胡壯麟,2007)。如今,多模態構建成為主流表達形式,使得傳統與現代化教學相互補充與滲透,有利于更好地發揮教學的整體功能。在外部學習環境和媒介發生變化的同時,多元識讀能力在一定程度上決定大學生獲取知識和資源的廣度和深度,因此,提高大學生的多元識讀能力是多模態輸入環境下應運而生的內在需求。

    關于多模態語言的輸入和多元識讀能力的培養,目前已有許多學者作過相關研究和分析。Kress和van Leeuwen(2001)認為,模態可以定義為參與交際的所有渠道和媒介,除了傳統的語言符號外,還包括圖像、顏色、音樂、技術等符號系統。各種符號資源(如有聲語言、形象、聲音、設計、動作等)共同參與日常的人際交往活動,形成多模態交流。張德祿(2009)指出,在現代技術條件下,在多模態話語交際的框架下,對模態的選擇可以為外語教學提供盡可能的便利條件和輔助條件,提高教學效率,還可以為多模態話語交際提供多通道話語意義的表達方式。胡壯麟教授(2007)認為多元識讀能力既包含文化識讀又包含技術識讀,也就是說這種能力不僅包括傳統的讀寫識讀能力,還包括文化、視覺、聽覺、空間、姿態及現代信息網絡時代的技術識讀和信息識讀等多種識讀能力。顧曰國(2007)分析了利用多模態進行教學的重要性。此外,研究者還相繼探索了多元識讀的教學實踐(葛俊麗、羅曉燕,2010;張義君,2011)。

    然而,在前人的研究范疇里,面向學習主體開展的實證類研究為數不多。本研究試圖回答以下四個問題:(1)大學教學中多模態語言的輸入現狀?(2)大學生進行多元識讀的具體學習表現?(3)大學生多元識讀能力提高的具體表現?(4)多模態語言輸入和識讀能力提高之間存在的問題?

    2.調查對象與方法

    2.1問卷調查對象

    本實驗從某高校隨機選取150名大學生作為問卷調查對象,理工科學生為100人(67%),文科英語專業學生為50人(33%)。

    2.2調查工具

    2.2.1多元識讀能力調查問卷的設計

    問卷共20題,涉及4個方面,每個方面設計5個選擇題。四個方面分別為:多模態語言的輸入現狀、多元識讀的學習表現、多元識讀能力提高的表現和目前多模態語言輸入和識讀能力提高之間還存在的問題。選項采用五級制,分別為完全同意、同意、基本同意、不同意、完全不同意。

    2.2.2學生作業樣本

    英語專業三年級的預習作業。形式是PPT,預習課文選自高級英語第二冊Lesson10 The Sad Young Man。

    2.3數據收集

    共計發放150份調查問卷,回收150份,全部有效,有效回收率100%。共計收取25份PPT作業,每班各5份作業樣本。

    3.結果與討論

    3.1調查問卷數據及結果

    3.1.1英語教學中多模態語言的輸入現狀

    表1很明確地說明了一個事實:多媒體設備已基本完備(A組數據選擇基本同意以上總計為90.4%),多模態語言輸入的教學模式已基本在該所高校的課堂普及(B組數據選擇基本同意以上總計為100%),并且多數教師和學生都已積極接受多模態語言輸入的教學模式,教學過程中多數教師積極采用PPT等多模態輔助教學工具,而PPT形式多樣(C組數據選擇基本同意以上總計為94%),內容生動有趣,使學生積極地采用此類學習模式。此外,除了以PPT為主要形式外,一些任課教師也開始使用其他類型的多媒體輔助教學工具,如CAD等(D組數據選擇基本同意以上總計為80%)。另外,網絡作為多模態的載體在教學和學習中的作用凸顯。該所高校已開通網絡學習平臺,凸顯了學習資源豐富,集各種語言輸入模式為一體的特色,但是課程覆蓋率還處于較低狀態(E組數據選擇基本同意以上總計為75.2%)。

    3.1.2多元識讀的學習表現

    從表2可以看出:多數學生具備上網獲取各類學習輔助資料的能力,包括網頁文本、網頁圖片、音頻、視頻等多種形式資料,同時也能夠在課外多渠道獲取各類信息和資料(A組和C組數據選擇基本同意以上總計分別為86.4%和82.4%)。以英語學習為例,學生經常使用新聞報刊、影視劇集、論壇貼吧等開展自主聽說讀寫練習。該校部分課程已開通課程網絡學習平臺,在任課教師的要求和學生學習主動性的激發下,一般都會使用網絡平臺開展自主學習;但是許多課程暫時還處于網絡課程開放之前的建設過程中,因此從數據顯示來看(B組和E組數據選擇基本同意以上總計分別為64%和69.6%),大學生通過課程網絡平臺加強多元識讀的學習方式亟待開發和推進。此外,隨著課堂互動的日益增加,學生由主要知識接收者逐漸轉變為知識輸出者,進行課堂講演的機會越來越多。目前PPT是學生進行講演時使用的主要工具(D組數據選擇基本同意以上總計為87.4%)。

    3.1.3多元識讀能力提高的表現

    隨著網絡的普及,學生對網絡技術日漸熟悉,大部分學生的多元識讀能力明顯得到提高,能夠主動獨立地發揮多元識讀能力開展學習和參與演講活動。多數學生能夠熟練使用信息技術檢索資料,包括論壇貼吧、各種新聞網站和電影網站等。根據表3數據顯示,該校學生自我評價相對較高,A組顯示88%以上基本同意熟練使用信息技術檢索資料;B組顯示92.8%正確刪選資料;C組顯示高達95.2%的學生利用PPT進行課堂講演;E組顯示89.6%的學生利用網絡合作解決學習問題;D組是唯一顯示學生多元識讀能力不足的方面,即在參加網絡學習討論并提出意見方面還有待提高。

    3.1.4存在問題

    根據表4,不難發現存在的問題:雖然學生在多模態語言輸入環境下有較好的聽覺、視覺、空間及網絡信息識讀能力,但學生對于搜索信息技術的掌握、刪選重組網絡信息的自學能力和轉化信息的能力仍然不足(C組、D組和E組認可該能力的總和分別是81.9%、73.3%和75.3%)。此外,學生普遍認為教學中的多模態形式不但局限于靜態PPT,而且大多數PPT畫面過于花哨,對學習者多元識讀的接受能力將會產生消極影響(A組和B組認為有以上兩組情況的數據分別為88%和92.8%)。

    3.2學生作業樣本分析及結果

    通過統計學生的作業樣本(見表5),主要有三項發現:第一,文字和圖片模態是學生較喜歡的兩種呈現方式,只有9份作業選擇增加音頻視頻資料進行課堂演示,說明學生對多模態信息輸入的重要性和必要性已經有所認識,少數學生會通過運用聲音模態的信息表達自己的觀點;第二,在資料收集方面,25組作業完成者都會運用網絡收集自己所需的資料,對大量資料也有一定的篩選能力,但是發現只有4組學生能運用網絡社交平臺進行討論和收集問卷資料,由此可以看出利用網絡社交平臺促進學習的優勢還沒有得到充分的挖掘;第三,通過仔細對照在PPT作業中的圖片,筆者認為多數學生對圖片的選擇比較隨意,有些圖片的表現內容并不與其想表達的主題相符,反而影響PPT的整體性和趣味性。這些都說明學生對資料的辨別篩選能力還有待提高。

    3.3對策及建議

    3.3.1多模態化學習資源的充分運用和輸入

    首先,在多模態語言輸入條件下,學習內容不應該只局限于紙質的書本,可以多加入一些其他模態的信息。例如,在英語教學中,應該借助多種信息資源,如文化、語言、宗教、地域、歷史、語境等,融視、聽、觸等多感官刺激于一體,為學習者提供文、圖、聲、像交互并存的語言環境,激活學生知識體系中已有的相關經驗,并借助多模態的互動效果,引導學生了解、探討、研究與語言相關的文化現象,從多維的角度理解語言、分析語言。其次,多模態PPT設計可以通過文本、音頻、視頻等引導,有選擇地對學習內容的背景知識和傳達的價值觀念進行補充。特別值得引起重視的是,網絡課程平臺的建設和在教學中的運用將在未來起到舉足輕重的作用,教師應積極開設網絡課程,為學生提供全面豐富的學習資源,在課余搭建健康的學習交流平臺,幫助學生開拓更寬更廣的學習視角。

    3.3.2多元識讀能力的有效培養和輸出

    調查結果顯示大部分學生已擁有較好的多元識讀能力,且該能力不斷提高。雖然學生對自己的多元識讀能力評估較高,但是內心深處還是期待有質的改變。比如,在調查問卷中學生多選“同意”或“基本同意”,而不是“非常同意”可以看出學生的期待值。此外,從學生的作業樣本分析中可以看出,多數學生明顯將多模態語言輸入局限于一種單純的網絡資料堆積,而不是利用各種符號系統建構意義,事實上,大多數學生并沒有從多模態的網絡資源中獲得充分合理的支持。早在2009年,研究者就已經提出學生對電腦的網絡操作能力還有待提高,資料收集和利用網絡資源進行主動學習的能力較差(韋琴紅,2009)。時隔三年,盡管網絡資料和媒體模式日新月異地發展,大學生對于合理運用多模態語言輸入的觀念還不曾有明顯的改變。教師在當前多模態輸入的網絡環境下,有必要繼續提高學生對多模態語言輸入的認識及加強多元識讀能力的培養。在選擇多模態語言輸入信息時,要首先確保這種輸入是可理解性的輸入,同時,學生應該自主設定學習目標和進程,有意識地提高信息檢索能力和刪選能力,多參與在線作業和討論,多與老師同學開展以課程網絡為平臺的交流活動。

    4.結語

    隨著課堂上多媒體運用的日益普及,大學教學多模態化的迅速發展,學生多元識讀能力的培養和提高值得深入探討。當然,多元識讀能力的培養是一個漫長的過程,大學生從容應對經濟全球化、信息技術多模態化和語言文化的多元融合,與多模態化和多元識讀能力的培養息息相關。

    參考文獻:

    [1]Kress,G.&van Leeuwen,T.Multimodal Discourse:The Modes and Media of Contemporary Communication[M].London:Arnold,2001.

    [2]葛俊麗,羅曉燕.新媒介時代外語教學新視覺角[J].外語界,2010,(5).

    [3]顧曰國.多媒體_多模態學習剖析[J].外語電化教學,2007,(4).

    [4]胡壯麟.社會符號學研究中的多模態化[J].語言教學與研究,2007,(1).

    [5]韋琴紅.多模態化與大學生多元識讀能力研究-韋琴紅[J].外語電化教學,2009.

    [6]張德祿.多模態話語理論與媒體技術在外語教學中的應用[J].外語教學,2009,(7).

    [7]張德祿.多模態外語教學的設計與模態調用初探[J].中國外語,2010(5).

    第6篇:社交媒體文本分析范文

    【關鍵詞】 互動易; 信息披露; 新媒體; 股票收益率; 交易量

    【中圖分類號】 F830.9 【文獻標識碼】 A 【文章編號】 1004-5937(2017)08-0048-08

    一、引言

    隨著互聯網技術的快速發展,各種各樣的新媒體層出不窮,不少企業已經擁有自己的微博、微信等交流平臺。新媒體已逐漸成為當今世界非常重要的信息集散樞紐,其開放性、及時性和互動性等特點契合資本市場的公平、公開和公正原則。

    基于此,近年來新媒體對證券市場的作用逐漸引起了學者的重視[1-5]。作為傳媒手段之一,新媒體將公司信息及時、高效地傳遞給投資者。上市公司和投資者傳統的溝通方式主要包括年報、半年報、季報等定期報告的渠道,然而時效性差是其最大缺點。而新媒體的出現恰恰補了這一缺陷。

    得益于網絡技術的加入,對傳統的信息披露制度進行改進是大勢所趨。近年來監管機構對待使用新媒體披露信息的態度也愈加開放。美國證券交易委員會(SEC)在2013年就曾發表聲明,允許上市公司使用Twitter、Facebook等社交媒體披露公司信息,只要上市公司提前告知投資者將要在何種社交平臺上信息即可。

    本文的研究對象“互動易”平臺就是深交所為適應新形勢下信息披露的需求而設立的。它由深圳證券交易所于2010年1月1日推出,在2011年11月12日基于Web 2.0平臺(類微博模式)進行系統升級,并改名為“互動易”。投資者可通過該平臺直接向上市公司提問,上市公司在“互動易”平臺上答復。其成立的初衷在于提高上市公司和投資者之間的溝通效率,幫助投資者將市場信息化繁為簡,使投資者在信息獲取、信息鑒別、與上市公司之間的互動交流方面更加容易。從形式上來看,“互動易”平臺上的公司回復實質上可以視為上市公司進行的自愿性信息披露①。深交所在《上市公司信息披露工作考核辦法》(2011年修訂)第十六條也增加了對“互動易”的監管要求,以此引導上市公司充分重視,不斷提高投資者關系管理水平。

    目前對信息披露經濟后果的研究主要集中在定期報告中自愿性信息披露對股權資本成本的影響方面[6-7]。文獻研究表明,信息披露主要存在兩方面潛在的益處:(1)幫助糾正公司的錯誤估值;(2)提高股票的流動性,降低資本成本[8]。理論上說,及時的信息披露使財務信息得以迅速在資本市場中擴散,將信息的滯后性影響減少到最低水平,有效地解決信息披露的及時性問題,在短時間內降低信息不對稱[3]。傳統渠道下信息披露的經濟后果已取得較為豐富的研究成果,然而對于新媒體形式下的信息披露鮮有研究。

    那么新媒體是否真的如上所述在資本市場中起到積極作用呢?本文采用“互動易”平臺上公司的回復作為研究對象,引入回復指數對公司回復質量進行刻畫,嘗試探究新媒體平臺上的公司信息披露對于股票收益率和交易量的作用。

    本文的創新點在于針對新媒體形式下信息披露的作用進行研究,以“互動易”平臺為例,首次對該平臺上的公司回復進行挖掘分析,證明了及時的公司回復是有效的。新媒體對于公司信息披露的重要性逐漸提升,在此背景下研究“互動易”這類平臺的公司回復將更具現實意義。此外,根據“互動易”這類新媒體平臺的特性,本文設計了可行且具有較強推廣性的新媒體披露質量測度指標,對之后類似的研究具有積極的借鑒意義。

    二、文獻回顧與假設提出

    傳統的自愿性信息披露渠道以定期報告為主,其對資本市場的作用已有大量研究成果[9-12]。對公司來說,進行廣泛自愿性信息披露主要有三種資本市場效應:提高股票流動性、降低資本成本、提升公司價值。但是由于定期報告時間跨度過大,無法滿足普通投資者日益增長的信息需求,并且是以公司為主導對外披露,受到公司特質等諸多因素的限制。隨著互聯網技術的不斷發展,各種新媒體層出不窮,微博、微信等社交媒體因其傳播速度快、時效性強、互動性強等特點發展迅速,開始在企業的投資者關系中扮演重要的角色。

    國外學者較早開展新媒體對資本市場的作用研究。Wysocki[13]以發帖量度量論壇信息,考察其和公司基本面、股市表現之間的關系,發現發帖量的確能夠預測第二天股票的交易量與異常收益率。Antweiler et al.[14]通過分析Yahoo Finance和Raging Bull兩大金融論壇的帖子,構建情緒指數,結果發現論壇信息可以用來預測股票波動率。

    國內類似的研究起步稍晚。張永杰等[15]不局限于特定論壇,將社交媒體信息內容的抓取范圍擴展至整個中文互聯網,以此研究社交媒體信息在資產定價方面的影響,發現不斷發展的中文社交媒體蘊含著對股票收益率有著顯著解釋能力的信息內容。金雪軍等[16]抓取了股吧在2012年10月至2013年9月期間共580萬條發帖數據,借助文本分析技術研究發現,看漲指數與股票收益率呈正向相關,論壇發帖量對股票成交量有著顯著的正向影響,證實了中小投資者在股票論壇的討論確實會對股票的收益率與成交量產生影響。

    早期的研究對象主要集中于論壇信息。近年來隨著社交媒體的迅猛發展,信息的流動得到快速提高,其對資本市場的作用引起了大量學者的興趣。

    因為單純的回復數還可能受到不同公司的被關注程度影響,為了消除由于關注度不同所造成的影響,對指標進行歸一化處理,最后得出回復指數的計算公式:

    其中i為回答日期與提問日期之差,ni為第i天前的問題總數。相比較傳統的以絕對數量代替信息披露質量的測度方式,該回復指數進一步考慮了信息的及時性特征,同時還能夠較好地衡量不同公司之間回復質量的差異。

    2.因變量

    本文的交易量指標(Volume)采用日個股交易股數,而收益率指標(Return)采用不考慮現金紅利的日個股回報率,上述數據均來源于國泰安數據庫。

    3.控制變量

    在控制變量選擇上,本文加入深圳A股每日市場回報率(Market Return)和公司回復的絕對數量(Reply Count),分別控制整體的市場效應和投資者關注度不同造成的影響。

    具體變量的說明和計算方法見表1。

    (三)模型設計

    樣本數據既包含時間序列又包含截面數據,為了更好地分析各變量間相互關系并預測其變化趨勢,本文采用面板回歸進行數據分析。同時由于投資者的反應可能存在滯后效應,因此本文參考Tetlock[19]的模型設計,引入了滯后5階的回復指數,使用L5(Reply Index)表示(其中L5(xt)=[xt-1xt-2xt-3xt-4xt-5])。

    為確定面板回歸模型,本了如下檢驗,即Hausman檢驗(用于確定選擇固定效應還是隨機效應)以及F檢驗(用于確定選擇混合效應還是固定效應)。根據表2的檢驗結果,F檢驗顯示固定效應模型優于混合效應模型,Hausman檢驗顯示固定效應模型優于隨機效應模型。所以,最終對模型統一選擇固定效應模型。

    回歸模型如下:

    其中,Reply Indexi,t表示i公司第t天的回復指數,Market Equityi,t和Asseti,t分別表示對應時間公司的流通市值和資產規模,Reply Indexi,t表示對應時間的回復總數,Market Returnt表示第t天不考慮現金紅利再投資的日市場回報率(流通市值加權平均法),在回歸方程中Market Equity、Asset和Reply Count均已進行對數化處理,以消除量綱的影響。

    四、實證檢驗結果與分析

    (一)描述性統計

    針對本研究所選取的樣本,本文對上市公司披露情況以及其他解釋變量進行了描述性統計,結果如表3所示。從描述性統計結果來看,由于回復數據的稀疏性導致80%以上與回復相關的數據為0,因此整體回復指數均值較小,只有0.041,個股每日回復量也從0至262條不等,這與“互動易”平臺推出時間比較短,整個市場的參與度較小相關。市場日回報率比較穩定,在-0.066至0.055之間波動,其均值也趨于0。相比較而言,個股回報率變化較大,最低為-0.263,最高則為16.773,但是兩者標準差比較接近。資產和市值的變化波動較大,最大和最小值之間相差103以上數量級,說明A股市場存在較大的分化現象,這也為下文對資產和市值分組進行穩健性檢驗提供了依據。雖然參與互動的公司數在逐年增加(未列出),這表明我國上市公司日益認識到與投資者保持良好關系及信息披露的重要性,也說明越來越多的投資者開始關注“互動易”平臺,但是也應當看到,仍有眾多的上市公司并沒有參與到投資者的提問互動中來,說明“互動易”平臺建設和上市公司與投資者的互動還有很大的提升空間。

    (二)面板回歸檢驗

    公司回復指數對股票收益率和交易量影響的實證結果如表4所示,滯后一天的公司回復對于收益率的影響為負,公司回復指數每增加一個單位,將導致隔日收益率降低0.056%,而滯后2天和3天的回復對于收益率的影響顯著為正。通過對公司回復時間的深入分析,本文發現“互動易”平臺上的公司平均回復時間間隔為2.61天,因此本文認為上述現象可能是投資者對于公司回復不及時的“懲罰”所致,具體主要有兩種原因:(1)投資者看到公司的回復,但是由于公司回復過晚導致消息的價值(時效性)大大降低,雖然公司回復了投資者的提問,但投資者對此作出負面的評價,之后才逐漸修正之前有偏的評價,對公司回復價值的認識呈先降后升的變化。(2)由于公司回復得不及時,存在間隔數天登錄一次并集中回復的現象,長此以往造成投資者和公司的低效溝通,投資者也并未每天關注平臺更新,導致新的回復可能未被消化,此時投資者認為公司仍“未回復”,從而作出消極的評價。受限于數據及處理能力,本文并未對上述原因進行進一步的驗證和分析。

    “互動易”平臺本是為投資者和公司提供高效互動的平臺,但是有很大一部分公司的回復并不及時,個別公司漠視投資者的心聲,如烯碳新材(000511)、中信國安(000839)、陜國投A(000563)等公司在樣本中的平均回復時間達16天以上,回復間隔時間過長已經引起了投資者的強烈質疑③。因此考慮到回復的滯后效應,本文將滯后5期的回復指數聯合考慮,發現公司回復的作用顯著為正,回復指數每增加1個單位,將導致股票收益率增加0.027%,這就說明,公司回復指數在以周為基本單位的時間軸上對股票收益率呈正向促進作用。然而作為控制變量的回復數量對個股回報率的作用為負,回復數量每變化1%將引起股票收益率變化0.006%,從量級上來看,其影響力低于公司回復指數。這說明公司的回復數量雖然起到了反向修正股票收益的作用,但其作用甚微,不足以抵消公司回橢甘對于股票收益的整體正向促進作用。

    交易量對公司回復的回歸結果顯示,除滯后第3期外,滯后期的公司回復對于交易量的作用均顯著為正,在0.1%的水平拒絕了公司回復對于交易量無影響的原假設。聯合5期同時考慮,發現公司回復指數每增加1個單位,將導致股票成交量變化2.28%,有效地支持了假設2,說明“互動易”平臺上公司的披露確實大大降低了信息不對稱程度,降低了買賣價差,提升了交易量。

    (三)穩健性檢驗

    為了驗證上述結果的穩健性,本文分別采用了對每年分組回歸和按不同市值、資產分組回歸以及換用總市值及對應的收益率等方法,以檢驗公司回復對股市的作用。

    如表5所示,公司回復對于股票收益率的作用除了2013年的系數在1%的水平顯著為正,其余年份均不顯著,這可能是因為2013年之前的年份公司回復的數據量過少。通過對“互動易”平臺上公司回復數的深入分析,發現平臺上每年的問題數量逐步上升,由2011年的36 249條猛增至2013年的239 194條,說明“互動易”逐漸得到了廣大投資者的認可,參與程度大大提高,其在股票市場的作用也隨之增強。雖然2014年平臺回復數依舊增長迅速,但本文并未發現該年度公司回復對于股票收益率有顯著影響的證據,需要做進一步的研究和分析。

    公司回復對于交易量的回歸結果顯示,除2011年外,2012年至2014年的系數均為正,1單位回復指數的變化將導致隔日交易量1.6%以上的波動,其預測作用依舊顯著。上述結果同時說明交易量對于公司回復的信號感知程度比收益率更高,也證明了公司回復在不同年份,確實起到了降低信息不對稱、提高股市的流動性的作用,從而促進了股市的成交量。

    本文按照流通市值和總資產的大小分別劃分成高(約25%)、中(約50%)、低(約25%)三組,其中流通市值大于100萬元為中,大于400萬元為高,其余均為低;資產大于10億元為中,大于40億元為高,其余均為低。由表6和表7可以看出,公司回復對于股票收益率的影響主要在低市值和低資產的兩個分組中作用顯著,說明低市值和低資產的公司需要高度重視投資者關系管理。其余分組表現不顯著可能是上述公司由于其資產或市值規模大,本身就擁有較高的關注度和知名度,信息披露渠道相對公開,除“互動易”平臺外,還有其他的披露渠道,比如官網、新聞媒體報道等,因此“互動易”平臺上公司回復對于其收益率的變化影響并不顯著。

    反觀交易量的回歸結果,發現公司的回復在低資產和中低市值的分組中作用顯著。和上述結果類似,說明以上公司需在平時多關注投資者的問題,及時進行回復和披露,以增強本公司在股票市場的競爭力。

    另外,本文換用總市值和總市值加權平均法的日市場回報率作為股價效應的衡量指標,并對前文結論進行了重新檢驗。結果顯示,并未對前文結論的穩健性產生影響。

    整體來說,公司回復對于股票收益率和交易量的作用均通過了穩健性檢驗,證明了“互動易”平臺確實在減少信息不對稱,提高投資者和公司互動效率方面起到了積極的作用。

    五、結論

    本文通過對“互動易”平臺上的公司回復進行分析,發現公司回復確實對股票收益率和交易量產生了正向影響,從而肯定了“互動易”平臺作為新媒體的披露方式在股票市場中所起的積極作用。對于投資者而言,“互動易”平臺提供了獲取上市公司一手信息的渠道,要善于利用這部分信息,但是利用其進行投資獲利,其實踐意義比較有限。對于公司而言,投資者的問題往往是關系公司發展的根本問題,如果一味漠視其心聲,將導致一些不必要的后果。公司需要增加自己的透明度,提高回復的效率,和投資者進行有效的溝通。對于監管機構而言,需要在日后加強對上市公司的監管,特別是鼓勵資產和市值規模比較小的公司積極⒂牖ザ。雖然“互動易”平臺起到了維護證券市場公開公平公正的積極作用,但是其時效性和影響力有待加強,證券市場的參與方都應參與其中,共同致力于打造一個有效率、公平的證券市場。

    本文的創新點在于首次對“互動易”平臺上的公司回復進行挖掘,分析其對股票市場的作用,證明了及時的公司回復是有效的,對于股票收益率和成交量呈正向促進作用。結合公司在“互動易”平臺上回復的特點,本文設計了一種適用于非定期報告的信息披露質量指標,在類似的互動平臺均具有較好的推廣性。

    當然本文還存在如下不足:首先,并未對公司回復的文本進行進一步的分析和挖掘,公司的回復可能包含了一些重要的信息,比如研發、發展戰略等,下一步的研究可以在文本理解這個角度進行深入挖掘。此外,本文只關注了公司回復這個角色,然而“互動易”這個平臺上不僅有公司的回復,更重要的還有投資者的參與,對于公司和投資者互動的作用也是日后研究的重點之一。

    【參考文獻】

    [1] BOLLEN J, MAO H, ZENG X. Twitter mood predicts the stock market[J]. Journal of Computational Science, 2011,2(1):1-8.

    [2] SAXTON G D. New media and external accounting information: A critical review[J]. Australian Accounting Review, 2012,22(3):286-302.

    [3] 文雄. 新媒體對財務信息披露的影響[J]. 會計師, 2014(12):15-17.

    [4] LEE L F, et al. The role of social media in the capital market: evidence from consumer product recalls[J]. Journal of Accounting Research,2015,53(2):367-404.

    [5] 譚松濤,闞鑠,崔小勇.互聯網溝通能夠改善市場信息效率嗎?――基于深交所“互動易”網絡平臺的研究[J].金融研究,2016(3):174-188.

    [6] 曾穎,陸正飛.信息披露質量與股權融資成本[J]. 經濟研究,2006(2):69-79.

    [7] 李明毅,惠曉峰.上市公司信息披露與資本成本:來自中國證券市場的經驗證據[J].管理學報,2008,5(1): 88-127.

    [8] HEALY P M, et al. Stock performance and intermediation changes surrounding sustained increases in disclosure[J]. Contemporary Accounting Research,1999,16(3):485-520.

    [9] VERRECCHIA R E. Information quality and discretionary disclosure[J]. Journal of Accounting and Economics,1990,12(4):365-380.

    [10] HEALY P M, PALEPU K G. Information asymmetry,corporate disclosure, and the capital markets: A review of the empirical disclosure literature[J]. Journal of Accounting and Economics,2001,31(1-3):405-440.

    [11] 何玉,張天西.信息披露,信息不對稱和資本成本:研究綜述[J].會計研究,2006(6):80-86.

    [12] 孫光國,楊金鳳.財務報告質量評價研究:文獻回顧、述評與未來展望[J].會計研究,2012(3):31-38.

    [13] WYSOCKI P D. Cheap talk on the web: The determinants of postings on stock message boards[D]. University of Michigan Business School Working Paper,1998.

    [14] ANTWEILER W, FRANK M Z. Is all that talk just noise? The information content of internet stock message boards[J]. The Journal of Finance,2004,59(3):1259-1294.

    [15] 張永杰,張維,金曦,等.互聯網知道的更多么?――網絡開源信息對資產定價的影響[J]. 系統工程理論與實踐,2011,31(4):577-586.

    [16] 金雪軍,祝宇,楊曉蘭.網絡媒體對股票市場的影響――以東方財富網股吧為例的實證研究[J].新聞與傳播研究,2013(12):36-51.

    [17] 程琬|,林杰.社交媒體的投資者漲跌情緒與證券市場指數[J].管理科學,2013,26(5):111-119.

    [18] CHEN H, et al. Wisdom of crowds: The value of stock opinions transmitted through social media[J]. Review of Financial Studies, 2014,27(5):1367-1403.

    [19] TETLOCK P C. Giving content to investor sentiment: The role of media in the stock market[J]. The Journal of Finance, 2007,62(3):1139-1168.

    [20] NADER J. A rose by any other name[J]. Bar news:The Journal of the NSW Bar Association,2013,Autumn:5-6.

    [21] LEUZ C,VERRECCHIA R E. The Economic Consequences of Increased Disclosure (Digest Summary)[J]. Journal of Accounting Research,2000,38(5):91-124.

    [22] FAMA E F, FRENCH K R. Common risk factors in the returns on stocks and bonds[J]. Journal of Financial Economics, 1993,33(1):3-56.

    第7篇:社交媒體文本分析范文

    與即時通訊類的網絡應用不同,博客、個人空間、微博都具有一定的公共性質,并被統稱為自媒體。自媒體的興盛,使其成為熱點輿情形成的重要推動者,而網絡輿情也成為社會輿情的重要組成部分。

    自媒體幾乎沒有準入門檻,同時又具有匿名性,使用者的媒介素養良莠不齊,很容易產生各種失范現象;自媒體也不像傳統媒體那樣容易監督,對于失范現象難以追溯源頭,同時給各方主體帶來影響輿論、把控輿論走向的機會,使得網絡輿情處于更加復雜的環境中。自媒體的網狀結構又決定了網絡輿情可以快速發酵,甚至在短時間內多次轉向,因此更加難以監控和把握。

    而對自媒體勃興之后網絡輿情的監測,傳統的現場調查、訪問調查、問卷調查等方式收效不佳,早期曾經廣泛使用的網絡輿情監測手段也暴露出了越來越多的問題。早期的網絡輿情監測,主要是針對Web1.0設計的。互聯網發展至今經歷了兩個階段:Web1.0和Web2.0。兩者的主要區別并不在于技術規范或物理設備,而是用戶之間以及用戶和網絡應用之間的交互方式。

    在Web1.0時代,互聯網內容主要由各大網站生產,用戶和網站的交互主要體現為尋找和接受相應的內容,用戶之間也只能通過有限的方式進行散落聯系。早期的網絡輿情監測,就是針對這樣層次的交互而設計。流程大致是:一、通過相關樣本庫,把需要監測的網頁進行模板匹配,并設定為監測數據源;二、應用爬蟲程序抓取數據,存儲到本地,再進行數據的凈化和簡略的分析;三、利用簡單的圖表模板和文字描述,呈現監測和分析的結果。

    早期的網絡輿情監測方式有一些原生的問題,譬如:一、由于處理能力有限,只能抽取部分樣本進行監測,無法避免偶然誤差;二、文本分析算法的準確度、監測對象和系統模板匹配的程度、對數據的凈化,以及分析的算法等因素對于最后監測結果的準確度都有決定性的影響,無法避免系統誤差;三、將監測的對象簡化為獨立的信息元,欠缺分析網絡內容之間聯系的能力和預測能力。

    早期的網絡輿情監測方式,盡管有很多問題,對Web1.0時代的離散的網絡內容和單向的交互方式來說還可以適用。隨著互聯網發展到了Web2.0時代,早期網絡輿情監測方式的局限性表現得日漸明顯,其監測功能已經弱化而無法適應新的輿論環境。

    二、大數據技術下的網絡輿情監測

    Web2.0時代最突出的特征就是更緊密的網狀結構。用戶自主生成內容使網絡內容生產者數量呈幾何級增長,用戶與網站之間雙向交互,用戶與用戶之間也在進行多渠道、多層次的立體的交互。Web2.0的網絡內容不再是離散的,具有強烈的“關系”屬性。這種基于各種強弱關系的網狀結構,也直接使網絡輿情能夠快速成型、發酵,短時間內可以多次轉向。Web2.0時代的輿情監測,更關注“關系”,能夠更快速、更準確地跟蹤輿情變化。這正是早期網絡輿情監測的缺陷。

    新的輿論環境,需要加強網絡輿情的監測,而新的網絡輿情,需要新的監測方式。大數據技術下的網絡輿情監測,就是這樣一種新的方式。

    自1980年以來,全球的數據存儲能力每40個月就翻一倍。不斷進行量級上的增加的龐大數據量和數據背后蘊藏的信息,帶來了大數據時代。

    大數據通常指的是龐大、復雜,難以用傳統的軟件工具來分析處理的數據集。對大數據的處理,又牽涉到從數據抓取、整理、分析、共享、可視化到存儲、傳輸等一系列問題。大數據集合常常來源于日常生活,與人的行動、交往有一定的同構性,部分條目直接附加了時間、地理等信息。可以說,在大數據的數據集合中天然蘊含著各種關系。因此,大數據集合能提供同數據量的若干小數據集合無法帶來的新信息。人們可以通過數據挖掘尋找數據之間的聯系,確立數據之間相關關系的規律,進而提供多方面的預測。

    顯而易見,大數據處理技術的優勢,正契合了Web2.0時代的特點。正因為大數據在挖掘數據之間的關系、進行發展趨勢預測方面的能力,已經有很多機構借助其進行輿情監測和呈現,并取得了不俗的成績。譬如在新聞業,就有不少國際傳媒機構已經在各種項目中采用了大數據分析和數據可視化技術,如BBC以及《衛報》《華盛頓郵報》《紐約時報》等。

    三、大數據帶來輿情預測的新可能

    “預測”本身就是大數據的一個重要應用。針對同一主題的海量數據進行分析,經過數據挖掘和建模后,可以得到相應的預測模型,進而預測將來的發展趨勢。譬如奧巴馬競選團隊,就在2012年競選的多個環節運用了大數據技術,特別是在實時監測選民意向、預測投票情況方面。競選團隊每晚都會使用特制的模擬大選的模型,根據實時監測的選民意向模擬大選,并在第二天上午根據模擬結果對各州重新分配競選資源。這種對輿情的實時監控和預測對奧巴馬2012年總統連任起到了重要作用。

    麻省理工學院博士內森·凱樂斯的一項以2013年埃及爆發的民眾抗議活動的大數據預測為主要案例的研究,獲取了全球范圍主流媒體新聞、政府出版物、社交媒體、博客等各種類型超過三百萬個數據源的目標數據。其證明可以通過大數據技術和特定模型來發掘公眾的情緒、態度變化,并最終預測以大型抗議活動為代表的大型公共事件的發生,包括事件即將發生的時間地點。

    而這還僅僅是一個開始。大數據有不同的來源,互聯網中以自媒體為代表的各種原創內容持續爆炸式增長,各種移動通訊設備、可穿戴設備也在不停地產生和存儲、傳遞各種數據,除此之外的數據來源還有麥克風、攝像頭記錄的音頻、視頻數據,運營數據,遙感數據等等。

    按照來源不同,數據大致可以分為三類,即以自媒體內容為代表的用戶原創數據、各種經營活動中產生的運營數據(如銷售記錄、醫療記錄等)、感知數據(如各種可穿戴設備獲取的數據)。其中用戶原創數據對輿情監測的重要性已經顯現,而對其他數據來源的大數據分析、不同數據來源的融合分析,也蘊含著巨大的輿情預測潛力。

    第8篇:社交媒體文本分析范文

    近年來, 一點資訊巧妙運用強迫癥的廣告形式,意圖目標明確,不彎不繞。在信息多元時代,用戶記憶每天反復被大量冗雜信息覆蓋,這種通俗式的廣告往往奪人眼球,令人記憶深刻繼而引發關注和討論,毫無疑問,一點資訊在此次文案上有效抓住了移動資訊時代趨勢的命脈,能夠有利于自身品牌知名度提升,有策略地引導用戶。

    全球首創“興趣引擎”,新一代門戶誕生

    一點資訊是融合關鍵字搜索、訂閱和個性化推薦的咨詢聚合產品,用獨創的興趣引擎技術,將搜索整合到資訊APP中,推薦與用戶搜索關鍵字、瀏覽軌跡相匹配的資訊,并在過程中幫助用戶更好地發現、表達、獲取和管理有價值的內容。

    “興趣引擎”是一點資訊獨創的專利技術,他是在底層技術架構上把搜索引擎和推薦引擎有機交融,提取了搜索引擎的數據爬取、文本分析等技術優勢,結合了推薦引擎利用個人畫像推送內容的形式,可智能分析用戶興趣愛好,從而用戶精準推薦他們真正感興趣的內容。一點資訊在全網內容抓取,覆蓋圖文、視頻及音頻,日更新量50萬,收錄超過300萬個頻道,并有針對時尚、養生、科技等垂直領域的一點X系列資訊應用,滿足各種興趣,實現私人定制的精準分發,

    另外一項優勢便是精準的算法,像現在傳統的APP根據點擊的情況來推送你感興趣的內容,再加上一部分正常媒體的推廣,比如說我感興趣旅游的東西,傳統APP慢慢地就只會推送這些給我,這個范圍就會越來越窄,而一點的搜索引擎會對同興趣同年齡喜歡范圍內的我們都會推送給你,這樣你的興趣圈子就擴大了,了解度也會更多。

    以此為出發點,一點資訊不斷創新,近日先后推出“興趣夾”、“興趣身份”等創新功能,據了解,以后還將推出“興趣社交”,以興趣為引找到志同道合的朋友,以及“興趣廣告”,最大化商業價值。

    多年沉淀后,引來厚積薄發的時代

    一點資訊多年來一直只做自己的產品、完善自己的客戶端,直到2013年在中國正式開始運營APP,短短兩三年的時間就參與了兩屆廣告節,并在業界有不小知名度。在嶄露頭角后,和以往的推廣不同,這次一點資訊在全國范圍內統一時間投放,不論是地鐵公交還是線上,都進行了相應位置的宣傳,從近日線上多家媒體平臺的幾番預熱,到《新京報》、《重慶晨報》、《每日新報》、《今晚報》4家紙媒頭版醒目登場,至北、上、廣、深、武漢、海口等全國一二線主要城市全覆蓋的地鐵、公交站牌、機場、公交車身、戶外大屏等線下場所的集中“轟炸”,再到與杜蕾斯、IMAX、樂視、神州專車等80余家國內外重量級企業的“魔性打碼”微博互動,“一點藍”打碼品牌投放可謂真正實現了“線上線下”營銷的有機打通。多家營銷界專業媒體紛紛對一點資訊此次品牌推廣贊譽有加,并稱贊其或許是近年來在移動資訊行業中最優秀的內容營銷案例。

    而這一次在全國范圍內大規模廣告投放,引發了公眾的強烈關注,海口也在其范圍之內,一點資訊選擇在海口進行宣傳也正是因為看中海南作為國際旅游島能帶來大量的人流量。通過這次廣告節一點資訊拿到了很多海南本地的廣告合作需求。

    現代廣告宣傳的方式進入新時代

    20世紀以來,世界上一些發達國家的消費者已逐步形成對廣告的依賴性。這是因為廣告可以不斷地向廣大消費者提供許多有關生活的信息,為消費者進行消費活動創造便利,從而豐富了消費者的生活,增長了消費者的知識,開闊了消費者的視野,尤其是借助技術,大數據驅動的創意廣告,再通^精準分發給需要的人群。現在來說廣告不是打擾,而是有價值的信息。

    近年來廣告業的發展,已經由傳統的模式進入到科技新時代,互聯網移動也從一個簡單的信息推廣平臺,變成了人與人之間、人與物之間、人與品牌之間的鏈接載體,通過互聯網,消費者可以迅速的、便捷的獲取全面廣泛的信息,現代廣告比以前更加精準,有效轉化率更高(您看到廣告以后是否能夠引起您對他的興趣,轉換成消費,這個就叫做有效轉化。)精準推廣,這個是傳統廣告做不到的。

    未來產業鏈將繼續細分,媒體將集中創造內容,因為媒體的真正價值是內容的生產,這個價值是技術、人工智能永遠無法取代的。而一點資訊可以以最高效地把內容傳遞給用戶,讓他們最后能夠有所收獲。

    一點資訊,實現人與資訊的高效連接

    第23屆中國國際廣告節作為全球廣告行業的一大盛事,來自國內外的多家知名廣告主、領軍企業、主流媒體和業內專家匯集于此。在品牌營銷創意方面,一點資訊以“1.”進行打碼的方式引爆全國大中小城市,從而提高品牌與用戶的互動性。現代青年記者對一點資訊商業化部經理雷磊進行了采訪。

    現代青年:近段時間在各大城市公交車站的打碼廣告引起了很大的關注,這個創意方式從何而來?

    雷磊:首先說說公交站牌的廣告,因為大家在公交站停留的時間很短,由于廣告載體的限制,決定了這個廣告的載體只能做廣告推廣,為了加強大眾對我們的品牌印象,我們選擇了強迫癥的方式,旨在引起大眾的好奇心和興趣,這也是我們的本原。但總的來說,我們強項是在內容策劃上。

    現代青年:據了解此次是你們第二次參加廣告節,本次廣告節有何收獲和感受?

    雷磊:這屆廣告節一點資訊獲得了37個大獎,其中最有含金量的是長城獎。通過這次廣告節而言,收獲就是我們發現廣告的推廣,做內容的話對品牌還是很有效果的,同時要做一些相關的活動,要全方位組合推廣。

    現代青年:一點咨詢最大的優勢在哪里?

    雷磊:像現在傳統的APP根據您點擊的情況來推送你感興趣的內容,再加上一部分正常媒體的推廣,比如說,我感興趣旅游的東西,傳統APP就限定的只推送旅游咨詢,而我們的搜索引擎,會將同興趣愛好的人還感興趣的事情,或同興趣同年齡喜歡的內容也會推送給你,這樣你的興趣圈子就擴大了,了解度也會更多,不會越來越窄,我們還可以創建自己興趣愛好的關鍵詞,可以在APP里建立自己的文件夾,這個不限制專用的詞匯。

    現代青年:傳統的廣告宣傳方式與現在的有何不同?

    雷磊:現在比以前更精準,轉化率更高,當您看到廣告以后是否能夠引起您對他的興趣,轉換成消費,這個就叫做有效轉化。可以做到精準推廣,這個是傳統廣告做不到的。

    第9篇:社交媒體文本分析范文

    [關鍵詞]目的論;廣告;廣告翻譯

    經濟全球化深深影響著翻譯界。隨著國際化經濟交往的日益增加,廣告翻譯也以驚人的速度增長。傳播媒體越來越多樣化,如報紙、廣播、電視、國際互聯網等,而他們的生存都要依靠廣告。翻譯者發現自己無時無刻不在進行跨文化交際。

    一、功能派翻譯理論的目的論

    什么樣的譯文才是好譯文?大部分人都認為譯文應該準確清楚地表達原文的意思。確實,傳統上許多語言學家都認為譯文應該從文體以及其他語言學特征上與原文相同。然而20世紀60年代以來,在翻譯理論和實踐上出現了一種熱潮,人們認為應該讓譯文和原文在語言的功能上對等,而不是在語言的形式上對應,即看讀者是否能獲得和原文一樣的心理反應。

    Nida認為功能對等就是要讓譯文和原文在語言的功能上對等,是讀者心理反應的對等,而不是在語言的形式上對應。對等不能只局限在文字本身,他把判斷對等與否的大權交給了讀者的心理反應[1]。在Nida看來,翻譯就是要在目的語中以最自然的方式重現原文中的信息,首先是重現意義,然后是風格。最好的譯文讀起來應該不像譯文。要讓原文和譯文對等就必須使譯文自然,使譯文在譯文讀者心中的反應和原文在原文讀者心中的反應相似。

    Vermeer的目的性理論(skopostheories)就很好地解決了這個問題。目的論是功能翻譯理論中最重要的理論,最早是由德國學者費米爾(VemeerHansJ)于1978年在《普通翻譯理論框架》一書中首次提出的,是功能派翻譯理論中最重要的理論。德國的功能翻譯派理論始于20世紀70年代。其代表人物是卡塔琳娜萊斯(KatharinaReiss),費米爾(HansJ.Vermeer)和克里斯蒂安諾德(ChristianeNord)。諾德進一步完善了目的論。諾德給翻譯下的定義為:“翻譯是創作使其發揮某種功能的譯語文本。它與其原語文本保持的聯系將根據譯文預期或所要求的功能得以具體化。翻譯使由于客觀存在的語言文化障礙而無法進行的交際行為得以順利進行。”[2]諾德以譯文的目的為準則,為譯文的改譯和增刪提供了標準。根據目的論,翻譯遵循的首要法則就是目的,即一切翻譯行為所要達到的目的決定整個翻譯行為的過程(Theendjustifiesthemeans)(Nord,2001)。諾德將翻譯的目的分為三種:譯者的目的(如賺錢),譯文在譯語文化中的交際目的(如傳遞信息)以及使用特定的翻譯策略或手段所要達到的目的(如使用直譯以體現源語的語言結構)。通常情況下,“目的”是指譯文的交際目的。那么目的從何而來呢?目的論認為,翻譯過程的發起者(initiator)決定譯文的交際目的,但當發起者因專業知識不足或其他原因對譯文目的不甚明了的時候,譯者可以與發起者協商,從特殊的翻譯情況中得出譯文目的[3]。目的性原則要求譯者在整個翻譯過程中的參照系不應是對等翻譯理論所強調的原文和功能,而應是譯文在譯語文化環境中所要達到的一種或幾種交際功能,即應以實現譯文在譯語文化中的預期功能為首要原則[4]。

    功能派創造性地提出的目的性原則,突破了對等理論的限制,修正了傳統的“忠實”標準,擴展了可譯性范圍,并增加了翻譯策略,要求翻譯活動必須依據翻譯目的,以文本目的為翻譯過程的第一準則使得翻譯更貼近實際,對廣告翻譯工作具有重要的指導意義。

    二、廣告翻譯的目的性和特征

    目的論認為,譯文的預期目的和功能決定翻譯的方法。英國翻譯理論家紐馬克(PeterNewmark,1981)在他的《翻譯方法》(ApproachestoTranslation)一書中,根據文本不同的內容、文體和功能,把文本分成三種類型:信息文本、表達文本、呼喚性文本。廣告被列入呼喚性文本[5]。不同類別的文體有不同的目的和功能,因而對翻譯的要求和翻譯策略的選擇也各有不同。要做好廣告翻譯,首先要弄清廣告文本的目的和功能。

    著名的美國市場營銷協會(AmericanMarketingAssociationAMA)給廣告下了這樣的定義:Advertisingisthenonpersonalcommunicationofinformationusuallypaidforandusuallypersuasiveinnatureaboutproducts,servicesorideasbyidentifiedsponsorsthroughthevariousmedia.(廣告是由特定的廣告主通常以付費的方式,通過各種傳播媒體對產品、勞務或觀念等信息的非人員介紹及推廣)。另外有種說法是“廣告是個人或組織通過有償取得的媒介,向一定的社會群體宣傳其商品、服務或觀念,并勸說他們購買或采取相應行為的活動”。據此可知,廣告作為一種競爭性的商業行為,其目的是爭取消費者,因而必然是以消費者為中心,投消費者之所好,供消費者之所需,以打動他們的心弦,促成其購買活動。這是商業廣告的唯一目的,也是商業廣告翻譯的唯一目的。

    一般來說,廣告須遵循KISS原則,即“Keepitshortandsweet”。廣告應力求簡潔,一方面為商家節約投資,另一方面利于消費者的接受。不同文化的消費者有不同的價值取向,因此,廣告文體風格也會因地域和文化背景而有所不同。在翻譯廣告時,譯者要特別注意去了解目的語文化的廣告規范,使譯文風格符合譯語讀者的品味。也就是說,廣告翻譯要遵循譯入語的廣告語體風格,要尊重譯語文化,注重譯文讀者的反映。只有這樣,才能確保廣告翻譯實現它的預期功能,有效地把產品介紹給譯入語消費者,并促其購買產品。

    目的論在廣告翻譯中的運用

    三、目的論在廣告翻譯中的應用

    目的性法則決定了譯者在廣告翻譯中應考慮以下三個因素:譯文語體、讀者反映和譯語文化。廣告翻譯方法的選擇要由具體語篇的目的或功能來決定。也就是說,翻譯行為所要達到的目的決定整個翻譯行為的過程。

    (一)廣告翻譯要符合譯語廣告文體的語言風格

    由于地理環境、社會環境、生活方式的不同,中西民族形成了不同的審美習慣。中國美學強調中和之美、含蓄之美,重主觀印象。這種美學標準表現出注重平衡、協調、融和的審美特征。表現在語言上就是講求音韻和諧,形式對稱,用詞空泛含蓄,具有強烈的主觀色彩。西方哲學強調分析型抽象理性思維,重理性,重形式,強調主客體分明。這種審美觀表現在語言形式上就形成了用詞平實明快,句式結構嚴謹,修辭重簡潔的特點。這種思維審美心理上的差別表現在廣告語言上就是英語廣告常使用一些簡單樸實的詞句,體現為一種簡潔明快的美;而漢語廣告常常辭藻華麗,成語迭用,體現出一種華麗的美[6]。如:

    嶗山,林木蒼翠,繁花似錦,到處生機盎然,春天綠芽紅花,夏天濃蔭蔽日,秋天遍谷金黃,冬天玉樹瓊花。其中更不乏古樹名木。景區內,古樹名木有近300株,50%以上為國家一類保護植物,著名的有銀杏、檜柏等。

    這則介紹嶗山的漢語廣告采用了中國人喜愛的四言八句式,形式對稱、辭藻華美,讀起來音韻和諧,迎合中國人的審美心理,很容易獲得預期的效果。但譯成英語時,就需要考慮社交語境的審美心理,刪去無意義的信息,再現原文的內涵意義,突出信息傳遞的客觀性和可靠性。因此可譯如下:

    LaoshanScenicAreaisthicklycoveredwithtreesofmanyspecies,whichaddcreditforitsscenery.Amongthemover300areconsideredrareandprecious,halfofwhichareunderStatetop-levelprotection.Themostfamousspeciesincludegingkoandcypress.

    又如我們通常會碰到這樣的廣告:“XX已獲得國際和國內大獎”、“省優部優”等等,這主要與中國人較相信權威有關,但在提倡“個性”的西方國家,人們可能更注重個人的品位,不大在意官方的評論,這樣的廣告對西方人來說是晦澀難懂。我們更多地應該以實驗數據、客觀事實來說話,以符合西方文化觀念和習用語言結構模式,達到刺激購買欲望的目的。

    (二)廣告翻譯應注重譯文讀者的感受

    目的性法則決定了廣告翻譯應注重譯文讀者的感受,迎合消費者心理。由于宣傳對象在政治、經濟、文化等方面的不同背景,為了投其所好、避其所忌,同一條廣告的翻譯,針對不同的宣傳對象會有不同的版本。為了達到商業目的,譯者甚至可以不顧原文而再造一條廣告。

    例如Whisper衛生巾漢語音譯為“護舒寶”。“Whisper”的英文意思是耳語、密談,其意富含女性用品的形象性和女性味。而翻譯為中文時,則傳達給中國女性消費者該產品的功能和優良品質。寶潔公司的洗發用品Head&Shoulder漢譯為“海飛絲”也是一個佳例。如果僅根據原文直譯為頭和肩或像臺灣翻譯為“海倫仙杜絲”,消費者聽到或讀到都茫然不知所謂。而譯為“海飛絲”,詞義的高雅文體和語用特征很容易就使人們聯想起洗發類產品。電視廣告配以青春少女飄逸柔順的秀發隨風飛揚的畫面,在消費者中自然會激發強烈的購買欲望。又如舉世聞名的“CocaCola”的中文譯名“可口可樂”。Coca乃南美產的藥用植物,Cola則為非洲產的硬殼果樹木。這兩個詞除了表示兩種植物的名稱,似無其他的含義。它的中譯不僅雙聲(可、口)疊韻(可、樂以國語為準)順口,還可口,還可樂,符合中國的消費者的傳統觀念,也就是凡事圖喜慶,可以說這種譯名對此汽水在中國的風行有著巨大的影響。

    (三)廣告翻譯應尊重譯語文化

    從目的論上看,翻譯要求由目的語文化決定,原文只是起提供信息的作用,譯者只有綜合考慮了廣告的翻譯要求才能在翻譯中更好實現廣告目的,最有效的翻譯不一定是忠實地再現原文。因此在廣告翻譯中,必須避免由于過分強調忠實而忽略翻譯目的,忽略目的文化環境而導致的翻譯失敗。一種出口干電池的商標叫“白象”,英譯成“WhiteElephant”。象在中國是吉祥的象征,可是awhiteelephant在英語中意為“沉重的負擔”(aburdensomepossession)或“無用而累贅的東西”(useless)。這樣的翻譯顯然是失敗的。再如,“鴛鴦枕”在中國文化中象征夫妻恩愛,但如果譯成“MandarinDucksPillowcase”,其語用效果就會大打折扣,難以實現廣告翻譯的目的,不妨將其譯為“LovebirdsPillowacse”更符合西方消費者的審美心理,并促成其購買行動的實現。又如:

    在四川西部,有一美妙去處,它背依岷山主峰雪寶頂,樹木蒼翠,花香襲人,鳥聲婉轉,流水潺潺,它就是松潘縣的黃龍。

    OneofSichuan''''sfinestspotsisHuanglong,whichliesinSongpanjustbeneathXuebao,themainpeakoftheMinshanMoutain.Ithaslushgreenforestsfilledwithfragrantflowers,bubblingstreamsandsingingbirds.

    翻譯這段旅游廣告時,譯者注意到了中西方的文化差異,沒有把黃龍譯成“YellowDragon”,而是根據譯文的文化語境譯為“Huanglong”。在多元化的世界里,因各民族制度、信仰、道德觀和價值觀千差萬別,人們往往對同一事物有著不同的聯想、看法和理解。語言是文化的一部分,但語言像一面鏡子反映著民族的全部文化。語言禁忌反映了風俗的不同。文化差異影響著廣告譯文預期目的的實現。因此,一個成功的廣告翻譯需要譯者巧妙處理廣告所要傳達的信息及不同國家間的語言文化差異。譯者不能僅僅局限于原文,還必須注意原廣告中的文化意義,甚至還要根據受眾國的情況表現和豐富原文中沒有的文化內涵,使廣告中的民族和傳統文化更好地表達出來,從而達到宣傳產品,促進銷售的目的。廣告翻譯中文化意義的有效轉換不僅能產生經濟效益,還能產生良好的社會效益。

    四、結語

    翻譯是一項有目的的活動,應以實現譯文的預期功能為首要原則,即遵循譯文的目的性原則。廣告是一種功能性很強的實用文體,廣告翻譯也應遵循譯文的目的性原則,使廣告功能在譯語文化中順利再現。為此,廣告翻譯應從譯文語體、讀者反應以及譯語文化三個方面著手,采取各種靈活的譯法,最終確保譯文功能的順利實現。

    [參考文獻]

    [1]NidaEA.TowardaScienceofTranslating[M].Leiden:Brill,1964:23-25.

    [2]NordChristiane.TextAnalysisinTranslation[M].Amsterdam-Atlanta:GA,1991:28.

    [3]仲偉合,鐘鈺.德國的功能派翻譯理論[J].中國翻譯,1999(3):49.

    [4]陳小慰.翻譯功能理論的啟示[J].中國翻譯,2000,(4):9-12.

    主站蜘蛛池模板: 日本成人免费在线观看| 四虎国产成人永久精品免费| 欧美成人秋霞久久AA片| 窝窝视频成人影院午夜在线| 欧美人成人亚洲专区中文字幕| 成人免费看www网址入口| 四虎影视成人永久在线观看| 亚洲2022国产成人精品无码区| 成人欧美精品大91在线| 国产成人综合欧美精品久久| 久久久久亚洲AV成人网| 成人区人妻精品一区二区不卡视频| 国产成人高清精品免费鸭子| 亚洲国产成人综合| 成人免费一区二区三区在线观看 | 成人试看120秒体验区| 成人18网址在线观看| 免费成人在线观看| 成人午夜视频免费| 久久精品成人国产午夜| 成人一级片在线观看| 成人无遮挡裸免费视频在线观看| 国产激情一区二区三区成人91 | 欧美成人性色区| 亚洲精品成人a在线观看| 欧美亚洲国产成人综合在线| 亚洲成人aaa| 国产成人精品日本亚洲专区6| 日韩欧美国产成人| 一级成人黄色片| 亚洲免费成人网| 亚洲国产成人久久77| 国产成人www| 国产成人亚洲综合无| 国产成人精品午夜二三区波多野| 色噜噜狠狠成人网| 久久精品成人欧美大片免费| 亚洲欧美成人综合久久久| 四虎永久成人免费| 亚洲成人福利网站| 亚洲国产成人久久一区www|