公務員期刊網 精選范文 大數據時代的缺點范文

    大數據時代的缺點精選(九篇)

    前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的大數據時代的缺點主題范文,僅供參考,歡迎閱讀并收藏。

    大數據時代的缺點

    第1篇:大數據時代的缺點范文

    關鍵詞:“互聯網+”;大數據;高校學生;黨建

    一、“互聯網+”時代和大數據思維的基本概念

    2015年的政府工作報告中提出:政府將制定“互聯網+”行動。“互聯網+”,不是簡單的互聯網相加傳統行業,而是互聯網與傳統行業創新融合,指的是互聯網借助于其信息透明化、低成本、深化分工和提升效率等功能特點,推動各行各業轉型升級?!盎ヂ摼W+”時代將互聯網與社會各領域建立有效連接,疊加云計算、物聯網和大數據等信息技術,打破信息的不對稱,將各個領域的數據信息、科學資源整合優化,并結合各自優勢,實現融合發展,改變了人的工作、生活和思維方式。隨著“互聯網+”時代大數據技術的發展,我國教育數據不斷豐富,現代教育信息技術不斷發展,使得教育領域的大數據應用成為可能。

    大數據是由多種數據類型組成,體量巨大,并以高速巨量的特點增加的具有潛在價值的信息資產。大數據時代的主要特點:一是數據量十分龐大,傳統的計算機一般無法進行有效的深度處理,并呈幾何指數增長。二是數據類型多種多樣,除傳統的數字、文字、符號等結構化數據外,音頻、視頻、圖片、郵件、GPS數據及各種傳感器產生的非結構化數據增長速度十分驚人?!洞髷祿r代》作者維克托?邁爾-舍恩伯格認為:大數據是一種價值觀、方法論,我們面臨的大數據不是隨機樣本,而是全體數據;不是精確性,而是混雜性;不是因果關系,而是相關關系。從中可以得到啟示,大數據時代需要樹立全局性思維、個性化思維、相關性思維和智能化思維。

    二、“互聯網+”時代高校學生黨建領域的大數據思維

    (一)傳統互聯網與高校學生黨建結合的缺點和不足

    高校黨建管理部門在傳統的互聯網與高校學生黨建相結合曾做了一些嘗試與努力,如建立黨員信息管理庫、建立紅色陣地專題網站、開設黨校培訓學習園地等形式,在一段時期內一定程度上激發了學生的熱情,但還有不少缺點和不足。傳統的互聯網與高校學生黨建的簡單結合存在功能單一,吸引力不足,宣傳內容偏教條化,可讀性不強等情況。近年來,雖有利用博客、微博、微信公眾號與高校學生黨建相結合的嘗試,也存在用戶持久關注不夠,活躍度不夠,互動交流少,傳播力、影響力不足等現象,與傳統的黨建工作存在同質化趨向,出現內容與形式單調、功能單一等問題,沒有充分考慮到大學生黨員在價值實現、社交、情緒表達等方面的需求,亦沒有考慮到大學生黨員的多樣化和個性化需求。

    (二)“互聯網+”時代大數據思維在高校學生黨建領域的應用

    “互聯網+”時代,隨著大數據技術和思維的不斷發展,通過數據挖掘技術,人們可以獲得與分析高校學生黨建領域更多的數據,甚至是與之相關的所有數據,從而可以帶來更全面的認識,可以及時發現高校學生黨建領域所包含樣本無法揭示的細節信息,相應的,思維方式也可由樣本思維轉向全局性思維。大數據時代,人們可以通過大數據技術挖掘出高校學生黨建各子領域存在的相關關系,運用這些認知與洞見就可以幫助人們直觀現在和預測未來,而建立在相關關系分析基礎上的預測正是大數據的核心議題,思維方式應向個性化教育思維和相關性思維轉變。大數據時代也將不斷提升系統的社會計算能力和智能化水平,從而獲得具有洞察力和新價值的東西,甚至類似于人類的“智慧”,這將推進思維方式由自然思維轉向智能化思維。

    1.高校學生黨建須關注全體學生的全體數據,樹立全局性思維

    “互聯網+”時代,高校學生黨建須關注全體學生樣本的全部數據信息,而不是一個學生的單一數據信息。在“互聯網+”時代,采用大數據分析方法,了解學生最自然、最真實狀態下相對準確的全部思想動態和行為走向將成為可能,高校學生黨建工作者需要樹立全局性思維。高校學生黨建載體需要多元并進,建立多層次全方位的綜合平臺,在做好黨員信息管理庫、建立紅色陣地專題網站、開設黨校培訓學習園地的同時,開通課程微信公眾號平臺、微博平臺、QQ群、APP應用平臺,利用互聯網資源,嘗試開發慕課教程,為學生提供多種選擇,并允許多環節使用手機或便攜式筆記本作為工具參與學習,跟蹤了解全體學生的學習與思想動態,保留全體學生的相關平臺數據,通過大數據技術對這些數據進行分析,發現相應問題,并進行改革和更新。大數據技術使得高校學生黨建數據來源覆蓋范圍更加廣泛,可以獲取學生參與過程中所有數據,大數據發展到一定程度后,甚至復雜的非結構化數據如連學生在應用端訪問的停留時間、鼠標或指頭滑行軌跡、是否有效地學習規定內容等數據信息都將可能獲得,數據覆蓋面可以非常廣,數據源更寬泛,數據層次更豐富,只要產生數據活動的記錄都可被獲取,并進行數據挖掘和分析,得出有效結果。

    2.高校學生黨建須關注的內容可從混雜的數據中提取潛在價值,樹立個性化教育思維

    “互聯網+”時代,采用大數據技術獲取大學生的所有數據時,會得到一些混雜的數據。但紛繁復雜的數據并非一無是處,而是有其潛在的可挖掘的價值。尤其是新時代大學生個性鮮明,想法各異,從混雜的數據中提取有潛在價值的信息,能更有針對性地開展好黨建育人工作。因此,高校學生黨建工作者應樹立個性化教育思維。由于黨建工作對象的個人經歷、知識儲備各異,為了使高校學生黨建工作更具針對性,應該為黨建工作對象提供個性化的“自助式”選擇菜單。高校學生黨建網站、微博、微信、QQ群、APP應用等新平臺可根據工作對象的不同情況開設“自助式”菜單,學生可根據自身實際情況、優缺點、興趣愛好等選擇自己需要的內容。高校學生黨建通過大數據挖掘技術和信息反饋,在資源推送時把學生的個性需求擺在首位,將內容有針對性地傳遞給每位學生,促進學生均衡發展。

    3.高校學生黨建的內容具有數據相關關系,須樹立相關性思維和智能化思維

    在“互聯網+”和大數據時代,了解數據之間的相關關系可以促進我們更好地開展教育工作。學生思想動態出現大的變化不會是瞬間的,通過收集分析學生的所有數據我們可以預先捕捉到學生的相關信號,預測可能發生的事件,早發現、早化解、早處理。大數據時代提升智能化水平后,使得獲得具有洞察力和新價值的東西更為容易,這就需要高校學生黨建工作者將推進思維方式由注重因果關系轉向相關性思維,由自然思維轉向智能化思維。傳統的高校學生黨建模式主要是關注和分析學生的歷史信息,數據少,時效性差。而在“互聯網+”時代,借助大數據技術,高校學生黨建可積極關注數據的相關性,實現數據之間實時互動,收集整理海量數據。大數據的真正價值在于將海量數據和全樣本數據進行相關性分析,通過精準分析后能夠更準確地將結果進行量化,從數據中獲取價值,實現智能化結果,得到的結果也將更全面、更準確。高校學生黨建領域通過把握數據相關關系實現智能化的分析、預測和判斷在今后一段時間里將成為可能。

    三、“互聯網+”時代大數據思維在高校學生黨建領域應用面臨的主要問題

    (一)高校學生黨建參與者運用“互聯網+”和大數據思維的觀念淡薄

    一些高校學生黨建參與者對運用互聯網和大數據技術開展黨建工作的必要性和緊迫性認識不足,往往擔心互聯網和大數據等新形式的應用會給黨建工作帶來問題和不便,對運用網絡和大數據技術開展黨建工作持十分謹慎的態度。更有甚者,有些高校學生黨建工作者對網絡信息和模式等新形式采取回避態度,忽略了互聯網和大數據技術對人們生活方式產生的重要影響。另一方面,目前高校學生黨建領域信息化建設還停留“+互聯網”模式上,“互聯網+”平臺的融合創新基本沒有涉及,大數據技術的建設還未啟動或者提及。傳統管理模式還占主導地位,憑經驗和感覺辦事占比較高,高校學生黨建參與者缺乏“互聯網+”的融合應用意識和大數據思維,覺得大數據復雜,不注重數據采集和儲存,不會數據分析和處理,也不愿意學習或者培養專門人才。

    (二)高校學生黨建參與者對“互聯網+”和大數據思維的運用存在較大的難度

    高校學生黨建參與者雖然也使用了一些互聯網形式,如建立專用的黨建網站,但實際功能發揮不足,吸引力不強,在線平臺或反饋平臺通常處于休眠狀態,信息化建設水平相對低下,更難提“互聯網+”各領域各平臺的大數據技術應用。高校學生黨建使用大數據技術的統一平臺尚難以創建,缺乏統一規范,各系統和平臺之間的兼容存在問題,數據存儲、挖掘和分析技術水平較低,大數據信息的內在關聯隱蔽,有用數據的挖掘存在困難,大數據建設發展受限。另一方面,高校學生黨建領域缺乏專業從事大數據分析專門人才,數據信息使用、收集、存儲沒有統一標準,影響大數據技術的精準性;面對海量信息資源,缺乏有效篩選、挖掘、分析和處理的能力。

    (三)高校學生黨建參與部門各自為戰,數據信息共享存在壁壘

    在“互聯網+”時代,高校學生黨建的數據和信息需要通過云計算、大數據技術在云端進行充分融合,但因與高校學生黨建存在密切關聯的部門多,信息分布廣,數據信息共享尚存在壁壘,更難提云端共享。黨建工作過程中產生的大量數據,各領域各部門應用平臺不一,數據信息存儲和管理模式不一,數據規模不等,格式各異,對數據采集的重視程度不一,沒有共享平臺,各部門各自為戰,難以實現互聯互通,數據共享難度大。再加上受目前的體制機制影響,各領域各部門之間的信息壁壘難以根除,相互之間非但存在數據共享的困難,甚至還互相抵觸,造成數據質和量的不均衡,嚴重制約高校學生黨建領域大數據技術的發展。

    (四)高校學生黨建網絡信息泄密隱患大,安全防范力量不強

    目前,高校雖然在信息技術和管理上得到了一定的加強,但在信息安全領域還存在極大的安全挑戰。因缺乏信息安全專業技術人才,再加上信息安全核心技術受制于人,通常依賴外界廠商提供,給信息安全埋下隱患。同時,現階段亦缺乏有針對性的信息安全保護制度,比如黨建工作云端信息和各領域各部門信息歸屬誰管轄,誰有權限收集和使用大數據,大數據銷毀的時限和準則,大數據信息的轉讓和共享范圍等沒有清晰和明確的規范制度和法律。如近幾年社會上頻頻出現因信息泄露造成的電信詐騙問題,尚難以處理和解決。

    四、“互聯網+”時代大數據思維在高校學生黨建領域應用的對策與建議

    (一)加強高校學生黨建育人模式改革,做好“互聯網+”時代基于大數據思維的高校學生黨建模式頂層設計

    “互聯網+”時代基于大數據思維的高校學生黨建模式創新重在數據化上,量化一切信息是數據化的核心,包括文字、方位、社交信息等的數據化,提高大數據意識,主動學習新媒體和大數據思維。以蘇州大學為例,可以建立以黨委組織部、黨校和黨委辦公室作為聯合牽頭單位,從戰略上將“互聯網+”與大數據思維納入高校學生黨建工作,總體謀劃,整體推進。同時,學校黨建育人相關單位將作為支撐單位,研究和部署大數據的數據化管理機制,各學院(部)及輔導員具體落實的一套運行機制。讓“互聯網+”時代大數據決策成為一種新的決策方式,依據大數據進行決策,讓數據主導決策。大數據時代的高校學生黨建需要各部門、各組織、黨建工作隊伍之間相互協同才能完成,在樹立數據意識的基礎上做出科學決策。通過頂層設計,建立通用標準,明確職責劃分,打破部門限制,使得“互聯網+”時代基于大數據思維的高校學生黨建能以科學、高效的模式運行。

    (二)加強“互聯網+”和大數據領域專業技術人才培養,提高大數據思維素養

    大數據建設的每個環節都需要依靠專業人員完成,高校學生黨建需要加緊制定大數據相關人才培養計劃和方案,把培養數據骨干力量作為重中之重建設來抓,努力培養和造就一支懂管理的大數據建設專業隊伍。數據是“互聯網+”時代高校學生黨建工作創新的基礎,高校內部要進行數據資源整合,搭建校級大數據基礎平臺。高校也要積極走出校外,尋求與相關教育部門和網絡媒體合作,獲取數據充實到大數據庫中。同時,高校學生黨建育人也要順應“互聯網+”時代的發展需要,充分利用內部資源,拓寬人才培養渠道,培養一批具有較強數據抓取、數據篩選、數據分析、數據綜合等能力的黨建工作隊伍,打造一支復合型的專業化團隊。

    (三)著手建立數據共享平臺,整合“互聯網+”時代高校學生黨建數據資源

    “互聯網+”和大數據技術是高校學生黨建未來的發展方向,需要整合發展過程中的分散資源,建立統一應用平臺和應用系統,在各專用數據庫建設的基礎上,實現各級各類信息系統的數據交換和數據共享。在建設過程中,建立信息共享交換機制,打破部門壁壘,統一高校學生黨建相關的數據標準和數據格式,消除部門間的信息“孤島”,提升各領域各部門的數據整合能力。將可以公開的數據統一共享到專用云平臺,避免數據割據,做到數據互通,使得各領域各部門的數據在統一的云平臺內交換暢通。

    (四)加強信息安全管理,增強高校學生黨建信息的風險防御能力

    大數據技術在高校學生黨建領域的應用是一把雙刃劍,管理不善可能帶來不良后果。高校學生黨建參與者在實施大數據技術過程中一定要樹立安全觀念,制定安全規范規章制度,防止數據泄露,明確大數據使用渠道和范圍,提高網絡安全防范能力,保障“互聯網+”時代大數據思維在高校學生黨建領域應用的有序發展?!盎ヂ摼W+”時代在數據收集時亦可能會侵犯學生的隱私權,這就對數據使用者提出了更高的要求,在數據使用時需要保障學生的合法權益。高校學生黨建管理部門也要提高風險預判能力,通過大數據技術來加強應用平臺的風險防控水平,建立風險控制機制,嚴格監管,維護信息安全。另外,大數據也可能沒有那么可靠,數據的質量可能很差,數據分析可能存在錯誤或者具有誤導性,需要制定詳細、縝密的數據質量管理制度。

    參考文獻:

    [1]陳麗珊.“互聯網+大數據”與創新營銷[J].通信企業管理,2015,06:18-19.

    [2]俞立平.大數據與大數據經濟學[J].中國軟科學,2013,07:177-183.

    [3]張巖.“互聯網+教育”理念及模式探析[J].中國高教研究,2016,02:70-73.

    作者簡介:

    第2篇:大數據時代的缺點范文

    關鍵詞:大數據;大數據時代;云計算

    一、什么是大數據

    1980年,著名未來學家阿爾文?托夫勒便在《第三次浪潮》一書中,將大數據熱情地贊頌為“第三次浪潮的華彩樂章”。自2009年開始,“大數據”成為互聯網信息技術行業的流行詞匯。那么何謂“大數據”呢?“大數據”(big data),或稱巨量數據、海量數據,是由數量巨大、結構復雜、類型眾多數據構成的數據集合,是基于云計算的數據處理與應用模式通過數據的集成共享、交叉復用形成的智力資源和知識服務能力。還有研究機構如此定義“大數據”:“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。從某種程度上說,“大數據”是數據分析的前沿技術,是從各種各樣類型的數據中,快速獲得有價值信息的能力。

    在我國,“大數據”作為一個較新的概念,目前尚未直接以專有名詞被政府提出來給予政策支持。不過,在2011年12月8日工信部的物聯網“十二五”規劃上,把信息處理技術作為4項關鍵技術創新工程之一被提出來,其中包括了海量數據存儲、數據挖掘、圖像視頻智能分析,這都是大數據的重要組成部分。而另外3項關鍵技術創新工程,包括信息感知技術、信息傳輸技術、信息安全技術,也都與“大數據”密切相關。2013年5月10日,阿里巴巴集團董事局主席馬云在淘寶十周年晚會演講時說,大家還沒搞清PC時代的時候,移動互聯網來了,還沒搞清移動互聯網的時候,大數據時代來了。是的,大數據時代真的來了。

    二、大數據的特點

    1.數據體量巨大。以互聯網為例,一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多;發出的社區帖子達200萬個,相當于《時代》雜志770年的文字量。截止到2012年,全球數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,2008年全球產生的數據量高達1.82ZB,相當于全球每人產生200GB以上的數據。而到2012年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規模將達到今天的44倍。

    2.數據類型繁多。大數據時代來臨首先由數據豐富程度決定的,大數據來源于各種各樣的渠道?;ヂ摼W、社交網絡的全球化普及,大量的UGC(互聯網術語,全稱為User Generated Content,即用戶生成內容的意思)內容、音頻、文本信息、視頻、圖片等非結構化數據出現了。云計算、移動互聯網、車聯網、手機、平板電腦、PC以及各種各樣的傳感器,無一不是數據來源或者承載的方式。

    3.數據允許不精確。在越來越多的情況下,使用所有可能獲取的數據變得更為可能,但為此也要付出一定的代價。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。然而,在不斷涌現的新情況里,允許不精確的出現已經成為一個新的亮點,而非缺點。大數據時代要求我們重新審視精確性的優劣,不僅讓我們不再期待精確性,也讓我們無法實現精確性。

    4.數據要求處理速度快。速度要求是大數據處理技術和傳統的數據挖掘技術最大的區別。大數據是繼云計算、物聯網之后IT產業又一次顛覆性的技術變革。云計算主要為數據資產提供了保管、訪問的場所和渠道,而數據才是真正有價值的資產。企業內部的經營交易信息、物聯網世界中的商品物流信息,互聯網世界中的人與人交互信息、位置信息等,其數量將遠遠超越現有企業IT架構和基礎設施的承載能力,實時性要求也將大大超越現有的計算能力。

    三、大數據時代下的變革

    “這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程?!报D―哈佛大學 社會學教授加里?金如是說。大數據時代下網民和消費者的界限正在消弭,政府、企業或社會的疆界變得模糊,數據成為核心的資產,并將深刻影響政府的管理模式、企業的業務模式。大數據對國家治理模式,對企業的決策、組織和業務流程,對個人生活方式都將產生巨大的影響。未來大數據將會如基礎設施一樣,有數據提供方、管理者、監管者,數據的交叉復用將大數據變成一大產業。2012年3月22日,奧巴馬政府宣布投資2億美元拉動大數據相關產業發展,將“大數據戰略”上升為國家戰略,甚至將大數據定義為“未來的新石油”。

    第3篇:大數據時代的缺點范文

    關鍵詞:云計算 數據模型 云數據庫 NoSQL數據庫

    0 引言

    從2006年Google提出“云計算”的概念至今,云計算正以史無前例的速度發展,國內外各大IT企業都在開署各自的云計算平臺,云計算的應用更趨多樣化,目前在互聯網上我們看到的很多應用都可以看到“云”的身影,諸如“云存儲”、“云安全”、“云物聯”、“云郵件”、“云輸入法”等等??偟膩碚f云計算包括三個層次的服務:基礎設施即服務(IaaS),平臺即服務(PaaS)和軟件即服務(SaaS)。云服務模式實現了資源集中配置和管理,實現按需采購、配置,避免資源浪費,能夠更好滿足用戶不斷變化的需求。同時降低管理維護成本,隨著云計算技術的不斷發展,系統的可靠性、擴展性、穩定性也會更好,云計算將影響傳統數據庫的發展趨勢,云服務模式將逐步得到市場認可,反過來講,傳統數據庫必須能更好適應云計算環境的需求。傳統的關系型數據庫由于其天生的限制,已經越來越無法滿足目前時代的要求,云計算時代對數據庫技術提出了新的需求,主要表現在海量數據處理,大規模集群管理,低延遲讀寫速度,建設及運營成本。雖然它在數據存儲方面占據了不可動搖的地位,但對數據擴展、讀寫速度、支撐容量以及建設和運營成本的要求方面,就稍顯遜色。下面我們來探討適應于云計算的數據庫所支持的數據模型。

    1 云數據模型的類型

    無論是關系型數據庫還是非關系型數據庫,都是某種數據模型的實現,不同的數據模型可以滿足不同的應用需求。數據模型會影響客戶端通過API對數據的操作,決定了客戶端如何對數據進行編碼存儲。云數據庫的設計可以采用不同的數據模型,目前適應于云計算平臺的數據模型有以下幾類:

    1.1 基于云計算的關系模型。關系型云數據庫的數據模型涉及行組和表組等相關概念。此模型的數據結構為一個表是一個邏輯關系,它包含一個分區鍵,用來對表進行分區。具有相同分區鍵的多個表的集合稱為表組。在表組中,具有相同分區鍵值的多個行的集合稱為行組。一個行組中包含的行總是被分配到同一個數據節點上。每個表組會包含多個行組,這些行組會被分配到不同的數據節點上。一個數據分區包含了多個行組。因此,每個數據節點都存儲了位于某個分區鍵值區間內的所有行。微軟的SQL Azure云數據庫就是基于此模型的。

    1.2 NoSQL數據庫數據模型。由于在設計上和傳統的關系型數據庫相比有很大的不同,故稱此類數據庫為“NoSQL(Not only SQL)”系列數據庫,即非關系型的數據庫。與關系型數據庫相比,此類數據庫非常關注對數據高并發讀寫和海量數據的存儲,在架構和數據模型方面做了簡化,而在擴展和并發等方面做了增強。此類數據庫種類繁多,且各有優缺點,其數據模型有如下四類:①鍵值(key-value)存儲模型。使用一個哈希表,這個表中有一個特定的鍵和一個指針指向特定的數據。其數據模型為一系列的鍵值對。它能提供非常快的查詢速度、大的數據存放量和高并發操作,非常適合通過主鍵對數據進行查詢和修改等操作,缺點是存儲的數據缺少結構化,不支持復雜的操作。運用此模型的數據庫有BigTable、Tokyo cabinet/Tyrant、Redis、Voldmort、Berkeley DB等。②列式存儲模型。列式存儲和關系模型相似,與關系模型存儲記錄不同,列式存儲以流的方式在列中存儲所有的數據。其數據模型為以列簇式存儲,將同一列數據存放在一起。屬于同一列的數據會盡可能地存儲在硬盤同一個頁中,而不是將屬于同一個行的數據存放在一起。使用列式數據庫,將會節省大量I/O,并且大多數列式數據庫都支持Column Family這個特性,能將多個列并為一個小組??傮w而言,這種數據模型的優點是查找速度快,可擴展性強,更容易進行分布式擴展,缺點是功能相對局限。運用此模型的數據庫有Cassandra、HBase、Riak等。③文檔模型。在數據結構上,文檔型和鍵值型很相似,也是一個key對應一個value,但是這個Value主要以JSON或者XML等格式的文檔來進行存儲,是有語義的,并且文檔數據庫一般可以對Value來創建Secondary Index來方便上層的應用,而這點是普通鍵值數據庫所無法支持的。這種數據模型的優點是對數據結構要求不嚴格,缺點是對查詢性能不高,而且缺乏統一的查詢語法。運用此類模型的數據庫有MongoDB、CouchDB等。④圖形模型。圖形結構的數據庫同其他行列以及剛性結構的SQL數據庫不同,它是使用靈活的圖形模型,并且能夠擴展到多個服務器上。其數據模型為圖結構,其優點是可以很方便地利用圖的相關算法,缺點是需要對整個圖做計算才能得出結果,不容易做分布式的集群方案。運用此類模型的數據庫有Neo4J、InfoGrid、Infinite Graph等。數據模型有著各自的優缺點,它們適用于不同的領域。不管選擇關系模型,還是非關系模型,都要根據實際應用的場景做出選擇。有時候單一的數據模型并不能滿足我們的需求,對于許多大型的應用可能需要集成多種數據模型。

    第4篇:大數據時代的缺點范文

    [關鍵詞]:大數據 高校學困生 立體精準 幫扶模式

    伴隨著移動互聯技術普及、社交網絡快速興起、電子商務井噴式發展等信息技術的迅猛推進,人類社會正悄然步入大數據時代――以數據為核心的全新信息時代。面對大數據浪潮全面來襲,傳統的學業指導理念、方式和方法勢必受到數據革命的挑戰,特別是針對高校學習困難學生(以下簡稱“學困生”)的幫扶工作也將迎來新的機遇與挑戰。因此,高校教育工作者(以下簡稱“教育者”)應該基于大數據的背景下,認真思考如何依靠分析數據構建立體精準的學困生幫扶模式,幫助他們盡早走出學業困境,促使其自覺完成從“后進”到“先進”的轉化。

    1大數據概述

    《大數據時代》的作者維克托?邁爾?舍恩伯――“大數據時代預言家”從價值的角度生動的闡述了大數據的概念,人們通過掌握海量數據,從而發現和挖掘隱藏在數據背后的規律和價值,證明了大數據不僅是一種新技術,更為重要的是一種全新的思維方式和認知能力,我們將其生動的稱之為“大數據思維”和“大數據能力”。

    2大數據視角下高校學困生幫扶工作面臨的現狀與挑戰

    2.1 高校學困生幫扶工作的現狀

    學困生問題在國內高校中普遍存在,這個困難學生群體的存在是一個不容忽視的問題,也成為了高校教育工作的重點與難點。筆者通過學困生案例研究發現,學困現狀的形成是一個動態的復雜過程,前期成因識別和后期幫扶應該是基于科學的分類和“社會化支持”而開展相應的工作,但是傳統的學困幫扶工作大多數獨立了前期和后期的聯系,還存在以下弊端。

    2.1.1 成因識別精準度低

    傳統學困成因識別僅限于“課堂表現”和“考試成績”兩項指標,沒有深挖學生學困現狀背后的因素,未建立科學系統的學困篩選體系,突出存在靜態識別、考量指標過少、缺乏數據分析等缺點。

    2.1.2 缺乏精準個性化幫扶

    在開展學困生幫扶工作時,往往采取“一刀切”的方式,缺乏精確的分類指導、分層幫扶和動態管理的實施原則,沒有遵循學生特點,導致了幫扶效果不佳。

    2.1.3 助困群體單一

    以往的學困生幫扶工作一直依賴帶班輔導員(班主任)開展,而輔導員個體的時間、精力和幫扶手段受限,導致了“花大力氣,收小效果”的工作成效,間接形成了學困生教育工作難點。

    2.2 大數據視角下高校學困生幫扶工作面臨的挑戰

    2.2.1 數據的非結構化類別增多,幫扶信息篩選難度增大、精確度更高

    傳統學困生信息的采集來自于小規模結構性數據樣本的收集,不僅數據精確度高,而且采集過程也要求零失誤,其工作量和干擾因素較小,但最大不足就是取得的信息寬度十分有限。而大數據時代涌現了大量的非結構化數據,包括學生的心理特征、行為習慣、個人性格偏好等類型數據,使得教育者掌握的數據總量無限的接近學生個體,其采集過程的精確度也有較大差別,所以其中必然包含了很多不準確、甚至是錯誤的信息,容易對我們的信息篩選工作產生誤導和增大難度,這就要求學生管理工作者處理海量的非結構化數據,更加全面精準的掌握學生的個體信息,更加客觀的分析和研判學生的個體化差異,接納學生個體的復雜性。

    2.2.2 數據的整體性增強,精準、清晰的個性化幫扶趨勢更為明顯

    以往我們開展學困生幫扶工作時,往往采用小規模的數據抽樣調查的方式作為方案制定依據,比如單純根據學生成績開展學業指導工作,而忽略學生個體在學習上真正的困難原因和根本訴求,不符合教育規律和學生個人發展。隨著信息化教育管理體系的推進,趨于完整的學生信息數據采集和分析也即將成為新常態,所以必然會強調教育者重視數據的整體性,在此基礎上運用先進的數據挖據技術分析學生個體差異,才能制定加符合學生的身心發展規律的個性化幫扶計劃。

    3大數據視角下構建高校學困生立體精準幫扶模式

    學困生幫扶工作從本質而言是遵從“為了一切學生”的工作理念,是踐行尊重教育規律和學生身心發展規律的實際行動,應該接納不同的學生個體特點,推行學業、心理、生活的全方位輔導。那么整個幫扶工作的模式應該定位為:基于學困生數據的全面采集和精確分析,并且依托幫扶方式、助困群體、幫扶角度三個維度建的“立體精準幫扶體”。

    3.1 搭建科學動態的學困生數據平臺,精準識別學困成因

    大數據技術的應用基礎必須依靠數據平臺的搭建,而開展學困生幫扶工作的第一步就是要全面、準確的掌握學生個人信息,分析、判斷學困成因和根源。教育者應實時采集校內各信息平臺的共享數據,并進行研究整理,提取課堂出勤情況、學期GPA成績等數據,籍此建立科學動態的數據平臺,掌握學困生的學習特征,精準分析學困成因,并進一步對成因進行分類和歸納,制定個性化的學業指導。

    3.2 引入融合多樣幫扶元素,構建“立體幫扶網絡”

    教育者擁有大數據思維模式,改變教育者 “單兵作戰”的慣性思維模式,加深對大量非結構化數據的分析挖掘,在堅持“個體為單位、一幫一助、控制助困規模、分類指導、分層幫扶”的實施原則,引入多樣化的幫扶元素應對多元化的學困成因,進一步組建“學業幫扶團”和“學業指導團”、開展“兩輔”(線上輔導和線下輔導)、保持“三聯”(聯系學困生、聯系學生家長、聯系教師),構建教師、學生、家長組成“全員育人網絡”,推行學業、心理、生活的“全方位立體幫扶網絡”。

    3.3 建立學習評價體系,動態跟蹤管理和前置學困幫扶工作

    筆者通過調查研究發現,教育者一般都依據學習效果對學生進行評價,忽略了學習這個動態的結果,而大數據則是將結果性指標轉變為發展性指標,有利于教育者動態跟蹤學困生的學習過程,及時發現問題、解決問題,從而更好地對教育進行調控,修改和制定更加切合實際情況的決策。

    參考文獻:

    [1]卞友江.“大數據”概念考辨[J]. 新聞研究導刊,2013(05).

    [2]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,50(1):146-169.

    第5篇:大數據時代的缺點范文

    事實可能不是這樣。道高一尺,魔高一丈。在商業企業利用大數據提高自己營銷能力的同時,消費者也在進步,甚至聰明進化的速度還可能超過商家,因此而形成新的買賣能力平衡。大數據只是工具,商家可以用,消費者也可以用,而且,很可能消費者的利用程度更高,能力也更強。

    借助互聯網,消費信息的獲取更加容易,信息越來越透明

    信息不對稱是商業得以發展的本質。傳統的商業時代,買賣之間的信息獲取能力差異非常大,地域分隔、時空隔絕、傳播困難,消費者獲取信息的成本非常高,在這種情況下,只要稍有頭腦的商家都可以借助信息差異獲取利益。

    在互聯網時代,信息呈現爆炸性發展和蔓延,購物的時間差和區域差已經在互聯網以秒計時的全球化傳播沖擊下不再成為壁壘。每個消費者都可以上網查詢資料、比較價格甚至可以借助一些信息化技術進行虛擬試用,信息透明化讓商家徹底曝露在消費者面前。

    即便是大數據本身,不僅僅能服務商家企業,也能夠服務消費者,成為消費者購物時的重要參謀和助手。有經驗的消費者,日積月累就會形成自己的大數據,還有一些專業機構綜合匯總各種數據提供更加專業化的建議和參考服務,與一些商家孤立和割裂的數據相比,社會化的大數據更具有優勢,也成為對抗商家大數據“忽悠”的利器。

    商家銷售行為的傳播速度極快,很容易形成效仿和其他競爭者的及時應對,脫穎而出更難

    與消費者博弈大數據的使用還只是一個側面,更嚴重的威脅來自與直接競爭對手或者潛在進入者的面對面對抗。

    在世界各地擁有1200家酒店的喜達屋酒店及度假村集團系統分析當地及世界經濟因素、活動和天氣預報,以此優化房價。由于知道了北美核心客戶群的本國天氣如何影響那些客戶在陽光燦爛的加勒比海度假一周愿意花的錢,他們知道了什么時候降低房價或開展營銷促銷活動最合適,其每間客房的收入增長了近5%。這樣的策略當然有效,可會是其一家獨享的方案嗎?

    大數據時代,信息傳播的速度極快,大數據也成為信息搜集和分析的重要方式。在這種情況下,一家企業開展的營銷活動,很可能在發起的初期甚至還沒有正式上線的時候就被對手獲知,針對性的營銷方案已經在制定中,商家已經很難建立起差異化的營銷優勢。

    一種新產品上市,即便有專利的壁壘,但通過大數據的方式很可能被競爭對手反向工程,或者通過大數據分析出產品的優缺點與消費者的痛點,在競爭對手刻意的模仿與微創新之下,產品的優勢也很難長期保持。

    還有潛在的競爭對手在蠢蠢欲動,以往行業的門檻在大數據時代越來越低,一些跨界的巨頭借助自身掌握的大數據能力切入新領域更加容易,也給不同的行業帶來了格局上的變化,新老企業都面臨巨大的挑戰和壓力。

    信息爆炸造成信息風暴,一招可以制勝,反過來,一個爛招就可能變得一敗涂地

    大數據也不會是百戰百勝的。事實上已經有過很多大數據營銷失敗的教訓,有平臺預測過的某電影的票房會很高,可結果卻以慘淡收場,至于那些號稱用大數據預測球賽結果與競選獲勝的,更是屢屢失算。

    在有些時候,大數據真有點向算命先生,即便很多次預測準確,但只要一次失手,就有可能前功盡棄,一世英名付于流水。2008年,Google第一次開始預測流感就取得了很好的效果,比美國疾病預防控制中心(Centers for Disease Control and Prevention)提前兩禮拜預測到了流感的爆發。但是,幾年之后,Google的預測比實際情況(由防控中心根據全美就診數據推算得出)高出了50%。媒體過于渲染了Google的成功,出于好奇目的而搜索相關關鍵詞的人越來越多,從而導致了數據的扭曲。

    借助大數據的研究成果和大數據的手段,可以使用一個妙招或開發一個產品實現爆款,但也有很大的風險因為一個失誤而馬失前蹄功敗垂成。

    如今,大數據的基礎是信息大爆炸,同時伴隨的也是信息的傳播風暴,風暴口上站著,有可能被吹得飛將起來,也有可能被吹到大海里變得杳無音信。

    消費者的信息太多,選擇太多,大數據分析結果的適用性在下降

    信息多是好的,但信息太多也有可能呈現負面結果。大數據需要大量的全面的數據資料,可越大的數據越全面的數據,就越容易受到噪聲的影響,分析結論的可靠性反而會下降,錯誤的使用大數據,還不如沒有大數據。

    一家保險公司想了解日常習慣和購買生命保險意愿之間的關聯性。由于隨后覺得習慣太過于寬泛,該公司將調查范疇限定到是否吸煙上。但是,工作仍然沒有實質進展。不到半年,他們就終止了整個項目,因為一直未能發現任何有價值的信息。

    就消費者行為分析來說,商家借助各種手段來研究消費者,包括消費者的個人資料、家庭信息、收入情況、歷史消費行為、愛好,甚至開什么車、吃什么飯、經常與怎樣的異性約會,但這些信息太多太雜以后,也會讓分析者無所適從。

    第6篇:大數據時代的缺點范文

    一、就業形勢分析

    現階段,高校學生就業率與就業質量正逐漸成為衡量各高校辦學水平及教學質量的重要指標,已經引起了各高校的強烈關注并為此出臺了各種幫助學生就業的計劃。根據教育部官網畢業生數據統計,預計2021年高校畢業生人數將達到909萬人,各高校畢業生依舊呈快速上升趨勢,同時,部分行業高校人才需求逐漸飽和、高校人才培養跟不上行業結構性調整需要和企業招聘時效性低的情況仍然存在,極大影響了高校畢業生的高質量就業。目前,大數據技術早已加入國家發展戰略計劃中,社會就業情況也加入政府工作報告中,大數據技術在高校學生就業方面的運用更是為高校提升學生就業與人才培養質量提供了新的機遇與方向,為高校精準就業服務提供了更加科學的技術指導。近年來,部分高校已經開始運用大數據技術分析社會行業發展狀況,完善人才培養方案與實現學生和企業精準對接以提高學生就業質量。運用互聯網、云計算和大數據等技術,搭建學生與企業線上“智能配對”線下“精準就業”的高校智能就業平臺,探索培養更符合行業所需的個性化高校人才培養方案與適應新時代行業發展的精準就業服務新模式,為各高校學子提供更高質量的就業信息,已成為新時代各高校學生就業服務的目標。對此,高校應該基于大數據技術精準把握行業發展狀況,以大學生高質量就業為目標,進行高校人才培養戰略的制定。因此,高校智能就業服務平臺的出現,不僅可以解決社會上企業招不到所需人才和學生所學知識已被淘汰的問題,而且對提升高校人才培養質量與辦學水平具有顯著作用。

    二、大數據在高校就業工作中的定位

    現如今,人工智能、大數據和區塊鏈技術正在教育領域引發一場全新的革命浪潮,為提升高校培養人才質量和辦學水平,使學生更加快樂、高效、智能地學習知識提供了重要的技術支撐。大數據作為互聯網時代“萬物互聯”階段的推動力也推動著教育的發展,其數據科學思維和技術促進了教育決策的科學化、高校發展的智能化、人才培養的個性化。大數據技術將重新定義高校就業生態系統,高校知識將更加滿足行業需求,學生在校就能接觸行業發展的最新消息,學生都將找到最適合自己的工作。大數據技術在高校就業中的應用,將突破傳統高校就業推薦方式的次元壁,為高校大學生高質量的就業帶來新的機遇。

    三、大數據在高校就業工作中的應用

    將大數據應用于高校就業的實際問題,將突破傳統的就業方式,為廣大學生和用人單位提供便利,最終實現既定的雙贏目標。在以往的就業模式中,對于應屆大學生的就業,通常是由學校建立關系,然后由用人單位和學生本人進行雙向選擇,最后簽訂三方協議。但這種就業模式也存在“學生所學”與“企業所需”不匹配的問題。為更好地服務社會,協調好學生、高校和企業的關系,應全面實現高校學生培養至企業人才供給的流程化信息服務,從而滿足大學生對行業就業信息了解和個性化咨詢服務的需求,提高學生就業教育的精準性,從根本上解決師資匱乏、與行業把握不精準的問題。同時,利用大數據技術對社會上海量就業創業信息數據進行挖掘和分析,獲取精準、有效的信息,并根據學生個性化需求完善高校人才培養方案,提升學生就業能力,從而解決人才培養與市場就業需求不匹配的結構性矛盾。為了滿足上述業務需求,建立采用分層結構的智能就業平臺,其通過不同的主題庫,以滿足學生不同的業務需求。

    (一)為學生檢測學習服務

    大學生首次注冊登錄時,平臺將收集他們的興趣、專業、特長、愛好等基本信息,為每個用戶進行個性化定制職業生涯規劃,然后幫助用戶設定學習目標,包括短期目標和長期目標。目標的內容主要來源于企業招聘服務信息庫中的招聘需求,從而實現學生的學習目標,學會應用,學以致用。同時,學生的學習情況也會隨時更新,根據自己的學習能力來提升目前適合企業的能力。

    (二)為企業招聘服務

    企業用戶通過企業賬號登錄,不定期向智能平臺企業對人才的需求。后臺通過企業需求分析,將其招聘需求更新為學生私人定制的學習目標,相當于企業直接培養他們所需要的人才。同時,將學生的學習數據通過后臺大數據推送到企業分析行業,供企業選擇,從而減少招聘過程中人力資源效率低下的問題。

    (三)為高校教育理念提升服務

    高??梢愿鶕约旱馁~號登錄,關注本校學生和留學生的學習能力,以及企業招聘的需求信息,使高校能夠根據企業的需求和本校學生的學習情況進行準確地教育學生。同時,學校還可以分析自身的優缺點,提高競爭力、知名度、就業率。

    四、大數據時代大學生就業趨勢展望

    第7篇:大數據時代的缺點范文

    【關鍵詞】大數據;數據分析;應用領域

    1.大數據的定義

    美國國家標準和技術研究院對大數據做出了定義:“大數據是指其數據量、采集速度,或數據表示限制了使用傳統關系型方法進行有效分析的能力,或需要使用重要的水平縮放技術來實現高效處理的數據?!蔽覀冋J為大數據價值鏈可分為:數據生成、數據采集、數據儲存以及數據分析。數據分析是大數據價值鏈的最后也是最重要的階段,是大數據價值的實現,是大數據應用的基礎,其目的在于提取有用的值,提供論斷建議或支持決策,通過對不同領域數據集的分析可能會產生不同級別的潛在價值。

    可用于大數據分析的傳統數據分析方法:(1)聚類分析。聚類分析是劃分對象的統計學方法,指把具有某種相似特征的物體或者事物歸為一類。聚類分析的目的在于辨別在某些特性上相似(但是預先未知)的事物,并按這些特性將樣本劃分成若干類(群),使在同一類內的事物具有高度的同質性,而不同類的事物則有高度的異質性。聚類分析是一種沒有使用訓練數據的無監督式學習。(2)因子分析。因子分析的基本目的就是用少數幾個因子去描述許多指標或因素之間的聯系,即將相互比較密切的幾個變量歸在同一類中,每一類變量就成為一個因子(之所以稱其為因子,是因為它是不可觀測的,即不是具體的變量),以較少的幾個因子反映原數據的大部分信息。(3)相關分析。相關分析法是測定事物之間相關關系的規律性,并據以進行預測和控制的分析方法。社會經濟形象之間存在著大量的相互聯系、相互依賴、相互制約的數量關系。這種關系可分為兩種類型。一類是函數關系,它反映著現象之間嚴格的依存關系,也稱確定性的依存關系。在這種關系中,對于變量的每一個數值,都有一個或幾個確定的值與之對應。另一類為相關關系,在這種關系中,變量之間存在著不確定、不嚴格的依存關系,對于變量的某個數值,可以有另一變量的若干數值與之相對應,這若干個數值圍繞著它們的平均數呈現出有規律的波動。(4)回歸分析?;貧w分析是研究一個變量與其他若干變量之間相關關系的一種數學工具,它是在一組實驗或觀測數據的基礎上,尋找被隨機性掩蓋了的變量之間的依存關系。通過回歸分析,可以把變量間的復雜的、不確定的關系變得簡單化、有規律化。

    雖然這些傳統的分析方法已經被應用于大數據領域,但是它們在處理規模較大的數據集合時,效率無法達到用戶預期,且難以處理復雜的數據,如非結構化數據。因此,出現了許多專門針對大數據的集成、管理及分析的技術和方法。

    2.大數據分析方法

    布隆過濾器:其實質是一個位數組和一系列HASH函數。布隆過濾器的原理是利用位數組存儲數據的HASH值而不是數據本身,其本質是利用HASH函數對數據進行有損壓縮存儲的位圖索引。其優點是具有較高的空間效率和查詢速率,缺點是有一定的誤識別率和刪除困難。布隆過濾器適用于允許低誤識別率的大數據場合。

    HASH法,其本質是將數據轉化為長度更短的定長的數值或索引值的方法。這種方法的優點是具有快速的讀寫和查詢速度,缺點是難以找到一個良好的HASH函數。

    索引:無論是在管理結構化數據的傳統關系數據庫,還是管理半結構化和非結構化數據的技術中,索引都是一個減少磁盤讀寫開銷、提高增刪改查速率的有效方法。索引的缺陷在于需要額外的開銷存儲索引文件,且需要根據數據的更新而動態維護。

    TRIE樹:又稱為字典樹,是HASH樹的變種形式,多被用于快速檢索,和詞頻統計。TRIE樹的思想是利用字符串的公共前綴,最大限度地減少字符串的比較,提高查詢效率。

    并行計算:相對于傳統的串行計算,并行計算是指同時使用多個計算資源完成運算。其基本思想是將問題進行分解,由若干個獨立的處理器完成各自的任務,以達到協同處理的目的。

    傳統數據分析方法,大多數都是通過對原始數據集進行抽樣或者過濾,然后對數據樣本進行分析,尋找特征和規律,其最大的特點是通過復雜的算法從有限的樣本空間中獲取盡可能多的信息。隨著計算能力和存儲能力的提升,大數據分析方法與傳統分析方法的最大區別在于分析的對象是全體數據,而不是數據樣本,其最大的特點在于不追求算法的復雜性和精確性,而追求可以高效地對整個數據集的分析??傊瑐鹘y數據方法力求通過復雜算法從有限的數據集中獲取信息,其更加追求準確性;大數據分析方法則是通過高效的算法、模式,對全體數據進行分析。

    3.大數據應用領域

    目前根據數據的生成方式和結構特點不同,可以將數據分析劃分為6個關鍵技術領域:(1)結構化數據。一直是傳統數據分析的重要研究對象,目前主流的結構化數據管理工具,如關系型數據庫等,都提供了數據分析功能。(2)文本。是常用的存儲文字、傳遞信息的方式,也是最常見的非結構化數據。一直演化到21世紀初新興的在線社交網絡分析。(3)WEB數據。WEB技術的發展,極大地豐富了獲取和交換數據的方式,WEB數據高速的增長,使其成為大數據的主要來源。(4)多媒體數據。隨著通訊技術的發展,圖片、音頻、視頻等體積較大的數據,也可以被快速地傳播,由于缺少文字信息,其分析方法與其他數據相比,具有顯著的特點。(5)社交網絡數據。從一定程度上反映了人類社會活動的特征,具有重要的價值。(6)移動數據。與傳統的互聯網數據不同,具有明顯的地理位置信息、用戶個體特征等其他信息。

    大數據未來的應用領域和方向還包括以下幾個方面:(1)大數據可視化。在許多人機交互場景中,都遵循所見即所得的原則,例如文本和圖像編輯器等。在大數據應用中,混雜的數據本身是難以輔助決策的,只有將分析后的結果以友好的形式展現,才會被用戶接受并加以利用。報表、直方圖、餅狀圖、回歸曲線等經常被用于表現數據分析的結果,以后肯定會出現更多的新穎的表現形式,例如微軟的“人立方”社交搜索引擎使用關系圖來表現人際關系。(2)面向數據。程序是數據結構和算法,而數據結構就是存儲數據的。在程序設計的發展歷程中,也可以看出數據的地位越來越重要。在邏輯比數據復雜的小規模數據時代,程序設計以面向過程為主;隨著業務數據的復雜化,催生了面向對象的設計方法。如今,業務數據的復雜度已經遠遠超過業務邏輯,程序也逐漸從算法密集型轉向數據密集型??梢灶A見,一定會出現面向數據的程序設計方法,如同面向對象一樣,在軟件工程、體系結構、模式設計等方面對IT技術的發展產生深遠的影響。

    4.結束語

    大數據引發思維變革。在大數據時代,數據的收集、獲取和分析都更加快捷,這些海量的數據將對我們的思考方式產生深遠的影響。分析數據時要盡可能地利用所有數據,而不只是分析少量的樣本數據。相比于精確的數據,我們更樂于接受紛繁復雜的數據。我們應該更為關注事物之間的相關關系,而不是探索因果關系。大數據的簡單算法比小數據的復雜算法更為有效。大數據的分析結果將減少決策中的草率和主觀因素,數據科學家將取代“專家”。 [科]

    【參考文獻】

    第8篇:大數據時代的缺點范文

    大數據對傳媒業產生了革命性的影響,其實,不僅傳媒行業會受到大數據帶來的影響,大數據也對傳媒學術研究產生巨大的沖擊和挑戰。目前已經有學者開始就大數據對傳媒研究的影響進行了初步分析,但總體而言,新聞傳播學界對大數據的研究偏重于現象描述和情況介紹,對大數據給學術研究帶來的挑戰和學術創新問題的研究卻較少?;诖?,本文以傳媒經濟研究為對象,考察大數據對傳媒經濟研究帶來的挑戰,為大數據背景下傳媒經濟研究的發展提供行動路線圖。

    大數據對傳媒經濟研究帶來的挑戰

    傳媒經濟學的理論背景來自經濟學,包括微觀經濟學理論、產業經濟學理論、制度經濟學理論等。有學者認為,大數據在研究對象、研究工具、研究理論和研究方法等方面對傳統經濟學形成了沖擊,由此提出大數據經濟學(Big Data Economics)概念,認為應該運用大數據思想對傳統經濟學進行深化研究。在傳媒經濟學研究方面,大數據在研究范式、研究理論、研究方法、研究工具以及研究對象等方面都會對既有研究產生沖擊,傳媒經濟學研究面臨著理論創新的挑戰。

    1.研究范式

    按照庫恩的界定,范式是一個學術群體中大部分成員共同認可的一整套前提假設,是學術共同體公認并共享的世界觀。傳媒經濟學基本遵循著新古典主義經濟學的研究范式,新古典主義經濟學的核心是理性人假設。理性人假設認為人是追求自身效用最大化的理性個體,在制定每一項決策時都會嚴格按照成本收益比進行考量和計算。但批評者指出,完全理性假設在現實中并不存在。在現實中,一方面,搜索信息需要花費巨大的時間成本和精力;另一方面,人們缺乏分析和處理巨量信息的工具和方法。因此,人們只會搜索有限信息,以此作為決策的依據,這就是有限理性假設。

    有限理性假設比完全理性假設更加接近現實,但這兩種假設有著共同的前提,即個體對信息的搜索和處理需要巨大的成本。因而,決定采用完全理性假設還是有限理性假設時,主要是比較獲取信息的成本和從信息中得到的收益:當信息收益大于信息成本時,繼續搜尋信息,逼近完全理性假設;當信息成本等于或大于信息收益時,停止信息搜索,按照有限理性假設采取決策。

    在大數據環境下,理性假設的前提遇到了挑戰,大數據技術極大地減少了受眾搜索信息的成本,受眾可以輕而易舉地獲取決策所需的各種信息,并利用數據處理技術對信息的收益進行計算,在此基礎上作出決策,這使得有限理性范式失去了解釋力。同時,信息成本和交易成本的大幅下降,使網絡空間出現了許多新的組織形態和交易形式,如以分享、合作為主題的維基百科、開放源代碼、網絡共享等,這些新的組織形式無法用理性范式進行解釋,如果從理性的角度計算成本收益關系,那么人們沒有動力進行網絡分享與合作。然而,這種“無組織的組織力量”在今天的互聯網世界越來越常見。這些大數據時代的新現象很難用理性范式進行解釋,我們需要用新的傳媒經濟學研究范式解釋這些行為和現象。

    2.研究理論

    在研究理論上,大數據時代的傳媒經濟研究不僅需要經濟學理論,也需要社會學理論、網絡科學理論等其他學科理論。傳統的經濟學理論中,個體脫離了所屬的社會結構和社會群體,研究者忽視了社會關系、人際傳播、社會結構因素對個體的影響,脫離個體所鑲嵌的社會情境因素來考察個體,犯了“低度社會化”的錯誤。在傳媒經濟理論中,無論是生產者還是消費者,他們的生產行為和消費行為都是黑箱,我們不知道生產者和消費者是如何做出生產和消費決策的,哪些因素產生影響、如何影響等一系列問題都處在黑箱中。

    在大數據的幫助下,研究者可以借助于社會學理論和社會網絡研究理論,把個體納入到一定的社會結構和社會情境中,考察個體鑲嵌其中的社會關系因素如何影響個體的媒介接觸和媒介消費行為,研究影響個體行為的各種因素及其影響機制,揭開人們媒介接觸和媒介消費行為的黑箱,從而發展出能夠揭示傳媒經濟行為一般規律的理論。

    3.研究工具和方法

    傳媒經濟學主要的研究方法包括抽樣調查、內容分析、假設檢驗、實驗研究等,盡管這些方法有其優點,但它們的缺點也是顯而易見的,這些傳統方法都無法對海量數據進行分析,在大數據面前,這些傳統方法基本是無能為力的。

    以抽樣調查方法來說,在大數據來臨之前,受制于研究條件和數據可得性,研究者只能對有限的數據進行抽樣,通過對有限樣本的分析推斷總體的狀況。抽樣分析的前提是所抽取的樣本能夠代表總體,但在研究中很難使樣本能夠完全代表總體,樣本與總體總會存在一定的誤差,抽樣調查的價值也因此打折扣。在大數據時代,可以直接對總體數據進行分析,而無需通過抽樣調查來估計總體狀況。同樣,內容分析法也是基于抽樣分析,通過抽取樣本對媒介內容進行研究。實驗法也是對少數受試者施加試驗刺激,通過與對照組進行比較研究,觀察實驗刺激產生的效果。這些傳統方法都是小數據時代處理信息所采用的方法,并不適用于大數據環境,大數據需要學者設計運用新的研究方法與研究工具。

    4.研究對象

    在微觀經濟學研究中,研究對象是個體的企業、家庭或個人,研究者通過對單個企業或個人的生產、消費等行為的分析,考察影響他們決策的各種因素。在傳媒經濟學研究中,媒體、受眾也是作為個體存在的。這種研究有兩方面缺陷,一是個體的消費行為始終處在黑箱中,我們不知道個體是如何做出消費行為決策的。二是研究只見樹木不見森林,無法從對個體的研究中獲知關于總體的狀況,而總體狀況具有極大的研究價值和應用價值。

    大數據可以在這兩方面做出改進,首先,借助于大數據技術,研究者可以對受眾的媒介接觸行為和媒介消費行為進行準確的追蹤分析,掌握受眾在每時每刻的媒介接觸和消費行為。另外,大數據可以使研究者獲知受眾整體的媒介接觸和消費情況,進而對受眾的媒介接觸和消費趨勢做出預測。

    5.研究主體

    大數據對傳媒經濟研究者也提出了挑戰,在大數據時代,研究者需要對大數據有深刻的理解和把握,充分認識大數據對傳媒經濟研究帶來的深遠影響,學會從大數據的研究范式出發思考問題。另外,研究者也需要掌握數據分析的方法和工具,學會利用大數據分析工具對傳媒經濟學的各類問題進行研究。同時,跨學科的學術合作與學術交流也變得更加重要,任何單一學科的視角和方法都難以對大數據環境下的傳媒經濟現象做出充分的解釋。只有從傳播學、經濟學、社會學等多種理論視角進行跨學科考察,才能對大數據環境下的傳媒經濟問題做出深入的研究。

    大數據時代傳媒經濟研究的創新

    大數據對傳媒經濟學研究提出了相當大的挑戰,在大數據環境下,傳媒經濟研究至少可以在以下四個方面進行創新:

    1.受眾行為分析

    受眾的媒介接觸和媒介消費行為,始終是傳媒經濟研究的核心問題。在小數據時代,很難準確全面地了解受眾的媒介接觸和媒介消費行為,無論是傳統的入戶調查,還是受眾的自我報告,都存在兩方面問題:一是樣本量太小,從樣本中得出的結論不具有推廣性;二是受眾在接受調查時經常會給出有偏向的答案,由于第三者效應的存在,受眾總會有美化自身行為的可能性。這使得對受眾媒介接觸和媒介消費行為的研究變得非常困難。

    大數據技術能夠對受眾的媒介接觸和媒介消費行為進行實時分析,比如受眾在網絡上點擊了哪些頁面、停留了多長時間、鏈接到哪些網站、購買了什么商品、發表了怎樣的評論等信息都可以被后臺服務器保留,通過分析受眾的個人接觸信息,可以準確把握受眾媒介接觸行為的特點和模式,進而對受眾進行有針對性的營銷。

    2.市場趨勢預測

    大數據技術可以對市場趨勢做出準確預測,舍恩伯格認為,大數據的核心就是預測,它是把數學算法運用到海量數據上來預測事情發生的可能性。一個著名的例子是Farecast票價預測工具,這個工具通過對近十萬億條機票價格數據進行分析,預測美國國內航班機票價格,其預測的精準程度達到75%,每位使用該系統的消費者每張機票可節約50美元。

    3.廣告及營銷精準度研究

    在小數據時代,廣告投放呈現出撒胡椒面式的粗放形態,廣告的投資回報率很低,商品的營銷手段也較為粗糙,難以對受眾進行一對一的精準營銷。大數據環境下,通過對每位消費者的消費習慣和消費模式數據進行統計分析,可以進行精準的廣告投放和商品營銷,提高廣告和營銷的精準度。

    比如,亞馬遜運用數據挖掘技術,通過分析用戶的瀏覽、收藏、購買、評論及其他用戶的反饋等數據,預測每位消費者可能感興趣的內容,將其推薦給消費者。亞馬遜提出,在最理想的情況下,亞馬遜只會推薦一本書,而這本書就是消費者將要購買的那本書。

    4.盈利模式創新研究

    大數據環境下,媒體的盈利模式也需要做出調整。在讀者量不斷下滑、廣告市場被新興媒體分流的現實背景下,傳統的二次售賣模式難以為繼。傳統媒體必須創新盈利模式,利用大數據技術帶來的機會,整合數據資源,尋找新的盈利增長點,實現自身的逆轉。傳媒盈利模式的創新也是傳媒經濟研究的重要問題之一。

    參考文獻:

    第9篇:大數據時代的缺點范文

    關鍵詞:非概率抽樣 社會網絡 大數據

    中圖分類號:F626.5

    文獻標識碼:A

    文章編號:1004-4914(2016)03-030-02

    一、研究意義

    傳統的社會網絡主要存在于人群中的血緣關系、地緣關系、政治關系、經濟關系、宗教關系以及其他社會性的聯系,這些或強或弱的人際關系形成了各種各樣的社會網絡。有些社會網絡是開放的,可以通過多種方法進行調查研究,比如對于親緣關系和同伴關系的研究,這些研究甚至可以通過直接的問卷調查進行;但有些網絡是封閉的,從外部很難進入,對這些網絡的調查研究和深入分析比較困難,比如一些特殊人群的圈子、宗教網絡或者政治性群體。

    隨著互聯網的蓬勃發展,社交型網絡帶來了社會網絡的極度膨脹和蔓延,大量虛擬的社會網絡呈現在人們面前,這個被稱為“網友”的社會群體逐漸成為新的社會網絡研究對象。人們的群體認知和社會交往都發生了極大的改變,社會群體的規模、結構、關聯和復雜性都大大加強。

    同時,2012年以來,人們對于大數據時代的探討和研究越來越多,其中一個重要的問題就是大數據時代是否還需要抽樣。有學者建議使用行政記錄或相關的基礎數據的完全統計分析來取代抽樣調查。就社會群體而言,群體大數據的記錄和分析同樣具有很大的困難,這是由于社會網絡的邊界屬性和區隔特征所決定的,大多數社會網絡的成員之間有著相似的群體特征,而與外部個體有著顯著的區隔。比如宗教團體成員之間的互信關系、艾滋病患者之間的“同病相憐”關系等,都無法通過簡單的大數據關系實現統計分析和推斷。因此,抽樣調查就顯得比較重要。

    由于社會網絡的現實性及其成員之間的特殊關聯,利用現有的隨機抽樣的方法幾乎無法完成調查和統計分析,一是因為無法得到一個社會網絡成員的抽樣框,其成員的花名冊通常是保密的或者不可知的;二是因為即使有抽樣框,對這些特殊群體的訪問也是無法實現的;三是一些社會網絡人群對面向社會現實的抽樣調查有著天然的抗拒和排斥心理。

    然而由于研究或實踐的需要,有時需要對網絡人群的相關情況進行估計,通過相關理論和實踐研究發現,一些非概率抽樣方法可以應用于上述情況中。

    本文回顧了可應用于網絡人群抽樣的非概率抽樣方法。

    二、利用非概率抽樣方法對社會網絡人群抽樣的研究現狀

    目前來看,國內學者對非概率抽樣方法對隱藏人群抽樣的研究還比較少,無論研究的程度和寬度均與國外學者有較大差距。

    國外學者對社交網絡人群的的抽樣研究做了許多細致而有效的工作,其成果大體可以分為以下四類:

    1.對抽樣方法的理論研究。Goodman(1961){1}詳細地介紹了S階段K推薦滾雪球抽樣的定義,并討論了如何通過抽樣樣本對總體的一些特征做出推斷,例如以S=K=1的情形為例,對如何表示總體中相互推薦的關系數目進行了詳細論證,他指出,在對隱藏人群進行抽樣時,滾雪球抽樣比簡單隨機抽樣更具效率。Salganik(2006){2}對同伴驅動抽樣的設計效應和抽樣規模進行了深入討論,并發現在使用同伴驅動抽樣時,所需要的樣本容量是簡單隨機抽樣下的2倍。Heckathorn(2007){3}提出在假設合理的情況下,同伴驅動抽樣能夠對總體作出漸進無偏估計。

    2.結合具體案例,對抽樣方法理論進行驗證性研究。Malekinejad等人(2008){4}通過實際調查發現,如果設計合理,同伴驅動抽樣在被應用到高危人群抽樣時,是一種有效的方法。Wejnert(2009){5}論證了在使用真實數據的情況下,利用同伴驅動抽樣是能夠給出有效的估計的。Sadler等(2010){6}討論了滾雪球抽樣在招募隱藏人群時的優缺點,認為在使用滾雪球抽樣時,應當十分慎重。Johnston等(2010){7}討論了在實際應用同伴驅動抽樣時所面對的優缺點。Perez等(2011){8}利用實際數據證明了,在恰當的使用滾雪球抽樣方法后,對少數人群的抽樣節省而高效。Korf(2012){9}利用數據再次驗證了同伴驅動抽樣比隨機抽樣在面對隱藏人群時更為有效。

    3.對不同抽樣方法的比較研究。Heckathorn(1997){10}比較了滾雪球抽樣和同伴推動抽樣的不同點,他指出,同伴推動抽樣利用二次激勵提高了抽樣者推動和控制的效率并減少了花費。Salganik和Heckathorn(2004){11}在比較了目標抽樣和時間空間抽樣在對隱藏人群的估計偏差方面的不足后,提出了同伴驅動抽樣通過充分利用社會網絡結構的信息,能夠更好的對總體作出相應估計,并給出了相應數學推導。Magnani等(2005){12}在研究如何對隱藏人群抽樣時,比較了滾雪球抽樣、目標抽樣、時間空間抽樣以及同伴驅動抽樣等抽樣方法的優劣。Semaan(2010){13}從目的、應用、調查過程以及優缺點等方面對時間空間抽樣和同伴推動抽樣做了對比。Kral等(2010){14}以招募美國舊金山的吸毒者為例,比較了同伴驅動抽樣和目標抽樣的效果。他發現,兩種方法各具優勢,綜合兩種方法也許是更好的抽樣方法。

    4.將抽樣方法應用于各種領域中的橫向研究。Baltar等(2011){15}在利用臉譜來研究移民時,借助了滾雪球抽樣。Illenberger(2013){16}利用滾雪球抽樣設計來從已有數據中估計拓普網絡的特性。

    三、應用到社交網絡平臺的思考

    從已有的研究看,由于隱藏人群的比例較小且常常難以接觸,常規的抽樣方法難以有效實施,學者們普遍認為滾雪球抽樣以及同伴驅動抽樣是較好的抽樣方法,這是因為上述方法借助了人際網絡,提高了調查效率。

    對網絡人群的抽樣方法研究集中在滾雪球抽樣和同伴驅動抽樣上,二者的區別在于同伴驅動抽樣加入了二次激勵機制。已有學者借助滾雪球抽樣在虛擬網絡中實現對目標群體的抽樣。結合上述兩種抽樣方法的特點,當需要在線上發起一項調查時,同伴驅動抽樣可能將是一種較好的調查方式,而如果想要對社交網絡中某一群體的特征做研究,考慮到網友之間的推薦關系可由已存在的“好友”關系所替代,借助網絡技術就能達到搜集數據的目的,滾雪球抽樣和同伴驅動抽樣的效果是基本相同的。

    四、小結

    處于大數據時代,大數據的一個重要特征就是體量巨大。在這個時代,人們能夠從幾乎任何數據中獲得可轉換為推動人們生活方式變化的有價值的知識。在大數據時代,信息會展現出其前所未有的能量,因此,獲取信息尤其是有價值的信息是很重要的。對于處于社會網絡結構的人們(尤其是特殊群體)而言,他們身上也蘊含著豐富的信息,如何有效的從他們身上獲取信息至關重要。

    對于處于社會網絡中的人們而言,由于無法獲取抽樣框等原因,在利用傳統的概率抽樣方法時,很難有效地獲取所需信息。解決這一問題的重要途徑就是利用滾雪球抽樣、同伴驅動抽樣等非概率抽樣方法,即在充分利用社會網絡結構的特點之上,完成對目標群體的抽樣,特別的,在面對社交網絡時,應當注意利用其已存在并可被識別的“網友”關系。

    本文詳細介紹了利用非概率抽樣方法對社會網絡人群抽樣的研究現狀,并在此基礎上給出了今后應用的思考,當然,就如何使用非概率抽樣方法在社會網絡上實現目標群體的抽樣還有待進一步的研究。

    [課題支持:1.2013年山西省普通高校特色重點學科項目《山西綜改實驗區建設統計調查與評價方法設計和應用》;2.2015年山西省研究生創新項目《轉型期社會網絡非概率抽樣研究》編號2015SY47]

    注釋:

    {1}Goodman Leo A. Snowball Sampling. Annals of Mathematical Statistics. 1961;32:148 170.

    {2}Salganik Matthew J. Variance Estimation, Design Effects, and Sample Size Calculations for Respondent-Driven sampling. Journal of Urban Health. 2006;83:i98 i112.

    {3}Heckathorn Douglas D. Extensions of Respondent-Driven Sampling: Analyzing Continuous Variables and Controlling for Differential Recruitment. In: Xie Yu., editor. Sociological Methodology. vol. 37. Boston, MA: Blackwell Publishing; 2007. pp. 151 207.

    {4}Malekinejad M, Johnston LG, Kendall C, Kerr LR, Rifkin MR, Rutherford GW. Using Respondent-Driven Sampling Methodology for HIV Biological and Behavioral Surveillance in International Settings: A Systematic Review. AIDS and Behavior. 2008;12:105 130.

    {5}Wejnert Cyprian. An Empirical Test of Respondent-Driven Sampling: Point Estimates, Variance, Degree Measures, and Out-of-Equilibrium Data. In: Xie Yu., editor. Sociological Methodology. vol. 39. Hoboken, NJ: Wiley-Blackwell; 2009. pp. 73 116.

    {6}Sadler, Hau-Chen Lee, Lim, Fullerton. Recruitment of hard-to-rearch population subgroups via adaptations of the snowball sampling strategy. Nursing and Health Sciences. 2010:12:369-374.

    {7}Lisa G. Johnston and Keith Sabin. Sampling hard-to-reach populations with respondent driven sampling. Methodological Innovations Oline. 2010.pp.38-48.

    {8}Daniel F.Perez, Jason X.Nie, Cheis I.Ardern, Natasha Radhu, Paul Ritvo. Impact of Participant Incentives and Direct and Snowball Sampling on Survey Response Rate in an Ethnically Diverse Community:Results from a Pilot Study of Physical Activity and the Built Environment. J Immigrant Minority Health. 2011.

    {9}Korf. Differential Profiles of Crack Users in Respondent-Driven and Institutional Samples:A Three-Site Comparison. European Addicition Research,2012:18,192.

    {10}Heckathorn Douglas D. Respondent-Driven Sampling: A New Approach to The Study of Hidden Populations. Social Problems. 1997;44:174 0199.

    {11}Salganik Matthew J, Heckathorn Douglas D. Sampling and Estimation in Hidden Populations Using Respondent-Driven Sampling. In: Stolzenberg Ross M., editor. Sociological Methodology. vol 34. Boston, MA: Blackwell Publishing; 2004. pp. 193 239.

    {12}Magnani Robert, Sabin Keith, Saidel Tobi, Heckathorn Douglas D. Review of Sampling Hard-to-Reach and Hidden Populations for HIV Surveillance. AIDS 2005. 2005;19 Suppl2:S67 S72.

    {13}Salaam Semaan. Time-Space Samping and Respondent-Driven Sampling with Hard-To-Reach Populations. Methodological Innovations Online. 2010:5:60-75.

    {14}Kral, Malekinejad, Vaudrey, Martinez, Lorvick, McFarland, Raymond. Comparing Respondent-Driven Sampling and Targeted Sampling Methods of Recruiting Injection Drug Users in San Francisco. Bulletin of the New York Academy of medicine. 2010.

    {15}Fabiola Baltar, Ignasi Brunet. Social research 2.0:virtual snowball samling method using Facebook. Internet Research. 2012:pp.57-74.

    {16}Johannes Illenberger, Gunnar Fl?tter?d. Estimating network properties from snowball sampled data Working Paper 11-01. Preprint submitted to Social Networks. 2013

    (作者單位:山西財經大學統計學院 山西太原 030006)

    相關熱門標簽
    主站蜘蛛池模板: 成人黄页网站免费观看大全| 欧美成人精品第一区二区三区| 国产成人一区二区三区 | 成人Av无码一区二区三区| 成人午夜一区二区三区视频| 成人免费v片在线观看| 成人欧美日韩一区二区三区| 成人免费视频观看无遮挡| 国产69久久精品成人看小说| 成人18在线观看| 欧洲国产成人精品91铁牛tv| 久久成人国产精品一区二区| 四虎成人精品在永久在线| 国产成人亚洲欧美电影| 亚洲av无码精品国产成人| 成人深夜福利视频| 午夜成人无码福利免费视频| 182tv成人午夜在线观看| 成人凹凸短视频在线观看| 成人凹凸短视频在线观看| 成人毛片免费播放| 四虎精品成人免费影视| 成人怡红院视频在线观看| 精品久久久久成人码免费动漫| 国产成人精品免费午夜app| 成人午夜性影院视频| 窝窝视频成人影院午夜在线| 亚洲国产成人va在线观看 | 亚洲成人免费网址| 国产成人无码av在线播放不卡| 日本成人免费在线| 最新69国产成人精品免费视频动漫| 五月天国产成人AV免费观看| 亚洲av成人综合网| 久久久久亚洲av成人网人人软件 | 成人合集大片bd高清在线观看| 亚洲成人高清在线观看| 亚洲国产成人久久综合一区| 六月丁香激情综合成人| 亚洲国产成人精品女人久久久 | 欧美成人看片黄a免费看|