公務員期刊網 精選范文 數據統計分析范文

    數據統計分析精選(九篇)

    前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數據統計分析主題范文,僅供參考,歡迎閱讀并收藏。

    數據統計分析

    第1篇:數據統計分析范文

    關鍵詞: SPSS軟件 考試數據 統計分析 操作步驟

    1. 引言

    一份好的試卷須有好的測量指標來表明它的優良程度,試題有難度和區分度指標,試卷有效度和信度指標,這些是評價考試最主要的測量指標,但是僅有這些指標不足以反映一份試卷的實際測量效果,考試研究人員希望從考生的試卷統計分析中獲取更多的信息來評價一份試卷。在計算機未普及的年代,考試成績統計主要依靠人工閱卷,考試數據無法電子化存儲,對考試數據分析統計難以實現。隨著計算機的普及和信息化的推廣,各種分析數據的軟件應運而生,這些軟件中匯集了統計學和測量學的分析工具,使得應用電子信息技術分析統計考試成績數據成為可能,這些統計信息可以為教研部門、考試行政部門進行行政決策等提供非常重要的幫助。在眾多的統計分析軟件當中,SPSS是應用最多、影響最廣泛的分析工具之一。在本文中,我們以SPSS軟件為工具,對教育招生考試成績的數據進行統計分析,分析主要著重于考試數據的相關性、假設檢驗等幾個方面。

    2. SPSS分析軟件簡介

    “SPSS統計分析軟件”的英文名稱為“Statistical Package for the Social Science”,中文名稱為“社會科學統計軟件包”,它是世界著名的統計分析軟件之一,在自然科學、社會科學的各個領域均有非常廣泛的應用。SPSS是一個組合式軟件包,它集數據整理、分析于一身,主要功能包括數據管理、統計分析、圖表分析、輸出管理等,該軟件的統計分析過程包括描述性統計、均值比較、一般線性模型、相關分析、回歸分析、對數線性模型、聚類分析、數據簡化、生存分析、時間序列分析、多重響應等幾大類。

    下面我們利用SPSS軟件對考試數據的相關性、檢驗假設進行統計分析,介紹使用SPSS進行統計分析的一般方法和步驟。

    3. 相關性分析

    教育考試中,考試結果的信度,試題的區分度,每個題目得分與試卷總分的關系,以及題目之間的關系,等等,都是考試研究的重要內容,最主要的研究方法就是數據的相關性分析。在眾多的教育考試數據的相關性分析方法中,Pearson相關系數法、Spearman相關系數法和Cronbach α信度系數法是比較常用的幾種方法。

    Pearson相關系數法計算公式:

    式中x為第i個考生第j題的得分,y為第i個考生第k題的得分,為第j題的平均分,為第k題的平均分,n為測試樣本量。該公式既可以計算兩個連續變量之間的相關性,又可以計算一個雙歧變量與一個連續變量之間的相關性。

    Spearman相關系數法計算公式:

    r=1-(2)

    式中D為兩個變量的秩序之差,n為樣本容量。

    Cronbach a信度系數法計算公式:

    α= 1-(3)

    式中n為試題數,s為第i題的標準差,s為總分的標準差。該公式實際上就是將考試中所有試題間相關系數的平均值(又稱內部一致性)作為α信度系數。

    對于給定的一組考生成績數據,利用SPSS統計分析軟件可以非常容易地定量分析考生某學科試卷總分和該學科某道題的相關性,以及各個題目之間的相關性。我們以Pearson相關系數分析為例,利用SPSS軟件進行統計分析。

    數據統計分析的對象是某省高考數學6道解答題的得分情況(不是整張試卷),數據源于該省的高考數據成績。研究的目的是測量6道解答題每兩個題目之間的相關性。

    我們以SPSS 13.0版本的軟件為例,介紹利用SPSS進行數據統計分析的步驟(以Pearson相關系數法為例):

    (1)將考試數據導入SPSS軟件,在SPSS數據窗口中,順序點擊【Analyze】【Correlate】【Bivariate...】,系統彈出變量相關系數設置對話框。

    (2)在該對話框中,將待計算的變量從左側的變量列表中導入到右側的“Variables”變量列表中,在本例中導入t1、t2、t3、t4、t5、t6共6個變量(t1―t6是6道解答題的變量名稱)。在“Correlation Coefficients”相關系數選項中,選取“Pearson”復選框。

    (3)在該對話框的“Test of Significance”設置區域,可以點選“Two-tailed”選項或者“One-tailed”,我們采用系統默認值。

    (4)對話框中的其它選項取軟件系統的默認值,點擊【OK】,開始相關系數計算,系統彈出新的窗體輸出運算的結果。本次輸出的情況如下:

    上表的統計結果可用于題目之間相關性的分析。表中的大部分題目的相關系數都比較適中,但題目T4和題目T5之間的相關程度遠高于其它幾個題目,我們可以確信這兩者之間一定存在著比其他題目之間更緊密的關系,這是我們通過分析獲取的重要信息,該信息表明這兩個題目之間的相關性高于其他幾個題目之間的相關性,這在大規模考試中是不應該出現的,需要在以后的命題考試中加以改進。

    Spearman相關系數分析方法和上述分析方法類似,只需要在上述SPSS操作的第二個驟中選取“Pearson”復選框,程序就會按Pearson相關系數法進行統計分析,如果同時選中“Spearman”和“Pearson”復選框,程序將會同時計算按兩種分析方法統計分析的數據,并會以不同的圖表進行顯示,而Cronbach a信度系數法計算方法與上述方法略有不同,其操作步驟如下:

    (1)在SPSS數據窗口中,順序點擊【Analyze】【Scale】【Reliability Analysis...】,系統彈出“Reliability Analysis”信度分析設置對話框。

    (2)將待計算的變量從左列的變量列表中導入到右側的“items”變量中,在左下列的“model”選擇項的下拉列表中確保選中“Alpha”(信度系數),點擊“Statistics”選擇項可以進行更為詳細的參數設置,我們采用系統的默認值即可。

    (3)參數設置完畢之后,點擊【OK】,軟件開始相關系數計算并輸出運算結果。

    4. 選擇題的選項分析

    在目前的教育招生考試中選擇題是一種較常見的題型,考試研究人員關注較多的是對選擇題基本特征、測量功能及其優缺點的理論探討[1][2],對選擇題干擾項的設計及其施測后的實際效果關注甚少,事實上施測后對題目各選項的有效性作出判斷可為評價試題質量提供重要參考依據。我們利用統計中χ檢驗假設,對試卷中常見的選擇題選擇項進行統計分析。

    教育考試的單項選擇項一般設置為4個,其中僅有1個選擇項是正確的。命題人員在設計選擇項時,應當也必然對每道題目所有的選擇項(正確選擇項和干擾選擇項)的考生作答情況作出預測,對考生作答的分布情況作出預估。考試結束后,研究人員應該對實測的情況與命題教師預測的情況進行對比分析,以檢驗考試效果是否達到了預測的目標。這和χ擬合度檢驗的思想具有一致性,因此可以嘗試使用χ檢驗假設進行分析。

    我們依據文獻[3][4]的方法來介紹χ檢驗假設在考試數據分析中應用的基本原理,設變量E是命題者對某道試題的期望值,E=nP,n為樣本容量,P為期望的相對頻率,引入以下統計量:∑(O-E)/E,其中O為觀察頻數。

    本文為全文原貌 未安裝PDF瀏覽器用戶請先下載安裝 原版全文

    我們需要進行的假設檢驗是:零假設H:選項的實測分布與期望分布相同;非零假設H:選項的實測分布與期望分布不同。

    檢驗假設的思想:擬合度檢驗的統計量在確定的某種顯著性水平下如果零假設是真,則檢驗統計量∑(O-E)/E呈近似χ分布,其自由度為研究變量的可能值減1;如果實測分布與期望的分布相當吻合,就不排除零假設,否則就排除零假設;最后對檢驗假設的結果進行解釋。

    數據分析的目的是判斷考生實際的應答結果(實測數據)與命題期望的選擇概率(期望數據)是否一致。我們隨機抽取某省5542個高考考生的數學有效數據構成分析樣本,利用SPSS進行統計分析。

    SPSS數據統計分析的步驟如下:

    (1)將考試數據導入SPSS軟件,依次點擊【Analyze】【Nonparametric Tests】【Chi-Square...】,彈出“Chi-Square Tests”對話框。

    (2)將變量列表中待分析的題目序號導入到“Test Variables List”(檢驗變量列表)中,本例中題目的序號為t7。

    (3)將對選擇試題的每個選項的期望值依次輸入到“Expected Values”所屬的方框,具體操作方法是選中單選框“Values”,輸入具體的期望數值,點擊“Add”按鈕,依次重復上述的步驟直至所有的選項的期望值輸入完畢。

    (4)點擊【OK】,輸出軟件運算結果。

    我們需要進行的假設檢驗,H:選項的實測分布與期望分布相同;H:選項的實測分布與期望分布不同。

    假設檢驗的顯著性水平為α=0.05,χ=∑(O-E)/E,自由度為df=4-1=3,查χ分布表或利用相關軟件可得P=0.0626,由于P>α,因此不能拒絕零假設,即選項的實測分布與期望分布相同。因此,檢驗結果在0.05顯著性水平時,沒有足夠的證據拒絕零假設,即可認為本題選項的實測分布與期望分布相同,也就是說本題的實際測試效果與命題教師預測的效果是一致的,命題教師準確地估計了考生的實際水平,這是分析獲得的很重要的結論。

    5. 結語

    SPSS軟件在考試數據統計分析中應用廣泛,但大部分是集中在試題難度、均值、方差統計、考試數據的圖表顯示等幾個方面,本文從一個新的角度利用SPSS軟件對考試數據的相關性、檢驗假設等幾個方面進行了嘗試性統計分析,介紹了使用SPSS進行統計分析的一般方法和步驟。從上述分析來看,軟件操作步驟和統計分析過程十分簡單、快捷,對于測量學和統計學基礎不太好的數據分析統計人員來說,只要遵循一定的操作步驟,就可以進行分析。

    參考文獻:

    [1]王孝玲.教育測量(修訂版)[M].上海:華東師范大學出版社,2006.

    [2]雷新勇.大規模教育考試:命題與評價[M].上海:華東師范大學出版社,2006.

    [3]李偉明,馮伯麟,余仁勝.考試的統計分析方法[M].北京:高等教育出版社,1990.

    第2篇:數據統計分析范文

    一、當前,在檔案信息資源開發和信息反饋工作中存在的主要問題

    (一)局限于檔案利用數據統計,不求檔案的實際效益。各地各級檔案行政管理部門,每到年終在要求基層檔案館(室,下同)編制年報,了解檔案利用情況時,只需統計幾個利用數據,如利用人數、利用檔案卷(冊)數、頁數及復印數據數等,而不了解通過檔案信息資源的開發與利用,而所獲得的社會效益和經濟效益。收集統計檔案利用數據,雖然亦能反映檔案的利用情況,但這是表面現象,說明不了檔案給社會和經濟建設帶來的價值和作用。也就是說,統計幾個數據只能揭示表現現象,而不能揭示檔案利用的實質,即實際效益。這是各地各級檔案部門普遍存在的一個問題。

    (二)在檔案館查(借)閱利用時,只要求填寫其利用目的,不求深層次了解,失去檔案利用信息反饋的機會。在通常情況下,利用單位和利用人來檔案館查(借)閱檔案時,均需填寫一份登記表。登記表除需填寫利用單位、利用人姓名和證件號碼外,就是還要說明利用目的。而利用者在填寫利用目的時都較簡單,如“工作參考”、“提權依據”等等。由于不作深層次了解,利用結束亦就了結,而失去了檔案利用信息反饋的機會。檔案信息資源的開發與利用,可分兩個階段。第一階段,又可稱初級階段,即利用者到檔案館查(借)閱檔案或檔案館主動為利用者提供檔案,這時只反映檔案利用情況;第二階段,又可稱為高級階段,即檔案通過利用者在工作、學習、生產等社會實踐中的利用,不同程度會產生一定的社會效益和經濟效益,也就是體現了利用檔案的作用和價值,通過信息反饋而求得。而要取得這種信息,事先必須有所了解和掌握,即在利用時有目的地作些深層次了解,并一一記錄在案,以利日后跟蹤調查。

    (三)有了利用實例,不求匯集編發重返社會。有些館雖也注重檔案利用信息反饋工作,收集有價值的檔案利用實例,但只是作為檔案目標管理認證和達標的材料,因此收集后就將實例束之高閣,不匯編發表,重返社會,影響檔案信息資源的開發與利用。如果將利用實例編發,不但會促進檔案的開發利用,使社會和全民更加認識檔案、了解檔案,使檔案的使用價值得到進一步發揮,而且可大大提高檔案館的社會地位和知名度。

    (四)編研工作滯后,遠遠跟不上檔案信息資源的開發利用需要。因為,利用單位不了解館藏情況,即你館藏中究竟有些什么資料可供社會利用。因此,檔案管理人員必須了解信息社會動向和需求,結合館藏實際,有目的、有計劃地編研一些參考性、指導性的資料,提供社會利用。然而,各地各級檔案館編研工作滯后,跟不上社會發展和經濟建設的需求,影響檔案信息資源的開發與利用。

    二、檔案館應在了解和掌握檔案利用實際效益上下功夫。

    綜觀各地各級檔案館都能夠把每年檔案資料查閱利用情況反映出來,即某某年查閱有多少人次、多少卷(冊)檔案,但該年數百人次、數百卷(冊)檔案,有什么社會效益和經濟效益呢?卻一無所知或知之不多。為此,筆者認為檔案館查閱利用情況需要了解和統計,但更重要的要從了解和掌握檔案利用實際效益上下功夫,即了解其查閱利用目的和所產生的社會效益和經濟效益。要想取得成果,除了要求利用者主動反饋信息外,檔案館亦可進行跟蹤調查。調查收集檔案利用實際效益,主要有以下六大作用:

    (一)有利于了解檔案的價值和作用。《檔案法》第二條稱:“本法所稱的檔案是……對國家和社會有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄。”但了解檔案是否具有保存價值,最重要的一點是要提供利用。如果檔案不再利用,最有價值的檔案也就失去保存的意義。而只有通過檔案的利用和開發,才能了解檔案的價值。過去不少單位和領導,為什么對檔案工作不夠重視和支持,主要一個原因是檔案部門長期處在“封閉”狀態,單位和領導也認為檔案不能給本單位出效益、出成果。其實無數事例證明,這完全是一種偏見和誤解。有保存價值的檔案,一般都具有利用價值,但其價值的大小,必須通過利用,一旦利用一定會產生一定的社會效益和經濟效益。

    (二)有利于檔案的鑒定工作。眾所周知,檔案的保管期限定為永久、長期、短期三種,檔案到了規定的保管期限,就要組織鑒定,確定其銷毀還是延長保管期限。而檔案的價值是鑒定時必須考慮的一個重要因素。檔案利用頻率高、周期長,即使已到規定的保管期限,也應繼續延長其保管期限;反之,檔案利用率較低,保存價值不大,即使未到規定的保管期限,亦應降低其保管期限。通過調查收集檔案利用的實際效益,大大有利檔案的鑒定工作。

    (三)有利于了解和掌握檔案利用信息,進一步拓寬檔案利用工作的渠道,最大限度地發揮檔案的價值和作用。通過實際效益的調查和收集,可以進一步了解社會和市場對檔案利用的需求和利用者的心理,從而改進我們的服務形式,拓寬利用渠道,使更多的利用者了解檔案,熟檔案,利用檔案,為社會主義現代化建設服務。如果我們不重視調查和收集檔案利用的實際效益,檔案利用渠道就無法拓寬,亦影響檔案價值作用的充分發揮。

    (四)有利于編發檔案利用實例,加大檔案宣傳工作力度。通過調查和了解收集檔案利用的實際效益,取得一個又一個的利用實例,充分體現檔案的保存和利用價值,并篩選、整理,編印成小冊子,下發至基層和領導,使他們了解檔案的作用,這要比空喊幾句檔案工作重要強得多。尤對不太了解檔案、不熟悉檔案價值的同志來說,更是一個實際的宣傳和教育,使他們通過例證,了解檔案,支持檔案工作。

    (五)有利于檔案館業務工作實績的體現。檔案業務工作的內容很多,而開發利用檔案信息資源應該是業務工作的“主體工程”,因為,收集和管理檔案的根本目的,是為了利用,否則就失去保存檔案的意義。而要衡量一個館的工作與實績,在業務工作上,開發利用檔案信息資源最能說明問題了。用戶通過利用你的檔案,獲取了社會效益和經濟效益,這就是你工作的實績。如果既統計利用數據,又注意了解檔案的實際效益,那你的實績就有血有肉。三、開發利用檔案信息資源,獲得檔案實際效益的基本做法

    (一)認真做好查(借)閱登記工作。查(借)閱登記是各館在檔案查(借)閱時必須做的一項工作。在登記時,一要認真負責,按項目一一填寫清楚,必須填寫的項目不要漏填;二要把查(借)閱檔案的利用目的,填寫清楚,不可填寫得太簡單,如“工作參考”等,而應填明作那一項工作參考,填明具體內容和將起到的作用和效益,這樣便于提供實際效益的線索和確定有否必要進行跟蹤調查等。

    (二)建立用戶聯系制度。檔案在查(借)閱時,一般不會產生效益,而要通過實踐,才能反映出檔案的實

    際價值,產生一定的社會效益和經濟效益。因此,為了及時取利用信息,可以建立用戶聯系制度,即把用戶的姓名、單位地址、聯系電話和郵編等一一登記在冊,以便與用戶聯系。檔案館亦可把自己的聯系人和聯系電話告訴用戶,以利用戶及時反饋信息。同時,也可定期召開用戶座談會,以利加強與用戶聯系,改進我們的工作和服務方法,更好地為社會和用戶服務。

    (三)分發檔案信息反饋表。即在用戶查(借)閱檔案后發給一張檔案利用信息反饋表,主要內容包括利用單位、利用人、時間、案卷名稱和獲取的社會效益、經濟效益。特別是效益要寫得具體一點,應有時間、地點、人物和具體事例。

    (四)及時編發檔案利用社會效益、經濟效益實例。反饋的信息仍要通過編輯再重返社會,這樣既可進一步宣傳檔案的作用和價值,又可使社會各界進一步了解檔案、熟悉檔案,來利用檔案。特別要將實例送給有關部門(單位)的領導,使他們認識檔案作用,支持做好檔案工作。如果把反饋的信息收藏起來,便失去了反饋工作的實際意義。

    第3篇:數據統計分析范文

    關鍵詞:海量數據 NoSQL數據庫 高并發處理

    中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2015)07-0000-00

    1 引言

    針對海量移動應用數據構建一套可行的統計分析系統,從基本的數據統計,到深入的數據分析、挖掘,可以為移動互聯網企業提供全方位的海量數據解決方案,幫助開發者更好的了解市場動向,了解用戶的使用習慣和需求,從而創造出更有價值的移動應用。

    2 系統分析設計

    本系統的用戶為移動應用開發者,系統的最終目的是為開發者們提供一個應用數據的統計分析平臺,為開發者提供實時的用戶統計數據和應用統計數據,開發者可以利用這些有價值的數據對應用進行調整,從而更好地適應不斷變化的市場需求。系統主要完成應用趨勢分析,版本分析,渠道分析,用戶參與度分析和終端屬性統計五部分。應用趨勢分析提供對新增用戶、活躍用戶、留存用戶和應用啟動次數的統計分析功能,開發者從這些數據中了解當前應用的用戶情況,判斷出未來趨勢。版本分析提供對當前應用所有版本的統計分析,開發者可以從中了解目前市場上的版本分布情況,從而可以對版本的更新迭代做出調整。渠道分析提供對當前應用各市場下載量的統計分析數據,開發者可以從中分析出各市場的推廣情況如何,從而有針對性的調整應用的推廣策略。

    系統分為數據服務器、移動終端和WEB展示端三部分來完成,其整體的功能結構圖如圖1所示。在實現的過程中充分考慮解決海量數據處理的問題。通過使用非關系數據庫NoSQL,Epoll技術及數據庫優化技術解決高并發請求,有效地緩解了海量數據對整個系統的壓力。系統整體在Linux系統下完成開發,綜合運用當前主流高效的開發工具和技術。

    數據服務器部分是整個系統的核心部分。數據接收模塊負責從移動終端獲取用戶數據和應用數據,數據緩存模塊用于緩存接收到的數據,數據存儲模塊負責向數據庫從存儲基礎數據,數據統計分析模塊負責對基礎用戶數據進行統計分析操作,處理后的數據用于網站端顯示。移動終端部分用于獲取數據。基于XML語言對Android界面進行設計,通過對系統函數和XML解析獲取用戶數據和應用數據,后將數據通過TCP/IP協議發送給服務器端,若網絡不允許則將數據臨時緩存,等待下一次發送請求。網站展示端向開發者展示最終的統計分析數據。頁面設計模塊使用CSS對整體風格進行控制,繪圖模塊使用highcharts,使用php和javascript向highcharts填充數據。

    3 系統總體設計與實現

    本系統分為數據處理服務器,移動終端,WEB展示端三部分來完成。其中移動終端負責采集用戶數據和應用數據,將采集到的數據通過網絡傳輸給數據處理服務器。數據處理服務器一遍負責存儲數據,一遍對數據進行統計和分析。統計和分析的結果通過相應WEB端網站的請求反饋給開發者。整體的開發都在Linux系統下完成,移動終端部分使用Android平臺,使用Java語言進行開發。數據服務器使用Python進行開發,數據接收部分使用Linux下GCC庫,使用C++編寫,數據庫使用MongoDB。WEB展示端使用PHP語言進行開發,整體風格使用Bootstrap框架。同時使用Git作為版本控制工具,用GitHub作為版本容器,方便團隊協作和代碼更迭。

    3.1 數據處理服務器架構

    數據處理服務器需要實現數據接收、數據緩存、數據存儲和數據處理四部分功能。

    數據處理服務器負責接收移動終端發送過來的用戶數據,通過高并發處理手段緩存到本地。數據庫處理程序負責從緩存文件中讀取數據插入到數據庫中。數據庫處理程序同時需要對基礎數據進行統計和分析處理,存儲到相應集合空間去。數據接收部分需要解決高并發請求。移動終端與服務器之間的通信使用TCP/IP協議,使用非阻塞的Socket連接來輪詢用戶請求。整體的底層架構使用Epoll庫,能夠很好的支持萬級別的并發量。數據緩存部分使用文件直接緩存。為了避免文件同時讀寫的鎖定問題,文件緩存按照一定的時間間隔寫入不同的文件中去。使用腳本文件拷貝寫入完成的數據文件到另外的文件夾用于向數據庫中寫入,寫入完成之后再將文件刪除。腳本使用python語言編寫。數據寫入部分也使用python進行編寫,數據采用非關系數據庫MongoDB。非關系數據庫在解決海量數據處理的問題上有著獨有的優勢,降低了程序與代碼的耦合度,同時還保證了數據存儲的可靠性。使用python處理數據寫入時需要用到MongoDB的python語言驅動,一般用pymongo即可。數據處理部分也使用python編寫。程序從MongoDB中讀取完數據之后,按照業務邏輯的要求對數據經行統計和分析。比如統計出某一應用一天的啟動次數。將這些統計數據存入到新的集合中去,留作網站展示端進行檢索。這樣可以大大減少網站端實時搜索對數據服務器造成的壓力。

    3.2 移動終端架構

    移動終端分為數據獲取、數據緩存、數據傳輸和界面設計四部分。移動終端整體架構使用MVC設計模式。前端界面設計使用XML進行配置,控制層將獲取到的數據一部分送至前端顯示,一部分送至數據服務器進行存儲。數據緩存使用SQLite保存未能發送至服務器的用戶數據。數據獲取指獲取用戶設備參數和用戶應用數據,設備參數包括設備的型號、分辨率、入網方式、內容服務商、系統版本號等,用戶應用數據包括應用的包名、版本號、啟動時間、使用時長、渠道信息、頁面訪問路徑等。數據緩存部分主要為了保證數據的完整性,因為用戶的設備并不能時刻保持網絡接入。當用戶處于離線狀態時,使用SQLite保存用戶信息。當用戶再次啟動時檢測是否有網絡接入,當發現網絡接入時將上一次的數據發送出去,同時清空SQLite數據庫。數據傳輸使用TCP/IP協議向數據庫服務器發送數據包。因為數據庫采用NoSQL數據庫,NoSQL數據庫的存儲格式為BSON(BSON是對JSON格式的二進制化),因此在數據發送之前需要將數據序列化為JSON格式。數據發送時需檢測數據是否正常發送,如果沒有正常發送則進行重發操作。界面設計采用Android標準開發模式,使用XML文件配置界面。頂部使用Google官方庫ActionBar,中間部分為ListView組件,ListView的每個Item都為一個數據,表示移動終端獲取到的某個變量。

    3.3 網站展示端

    網站展示端包括前端設計、數據處理和數據報表三部分。

    前端設計以美觀大方為目標,使用twitter前端開源框架Bootstrap。Bootstrap提供了優雅的HTML和CSS書寫規范,它由Less寫成,Less是一種優美的動態CSS語言。使用Ajax、jQuery、Javascript等前端技術,融入最新的HTML5、CSS3結構設計,優化UI的整體表現。數據處理使用PHP和 javascript。使用PHP語言的MongoDB驅動連接數據庫,獲取數據庫中相應的數據,格式化成json數據之后再送給前端的javascript層。Javascript與前臺界面經行交互,控制前臺界面的展示效果。數據報表部分是整個網站展示端的核心,主要用戶想用戶展示各種類型的統計分析數據。包括柱狀圖、折線圖、餅圖等。圖形的繪制使用開源項目Highcharts。Highcharts是一個使用純javascript編寫的圖標庫,可以便捷的在WEB網站顯示交互性的圖表。

    參考文獻

    [1] 譚磊.New Internet:大數據挖掘[M].北京:電子工業出版社,2013(2):13.

    [2] 艾榮榮.基于電信統計分析平臺的關鍵性指標分析系統設計與實現[D].西安:西安電子科技大學,2010.2-4.

    第4篇:數據統計分析范文

    【關鍵詞】統計數據;分析方法;市場調研;判別分析

    一、數據統計分析的內涵

    數據分析是指運用一定的分析方法對數據進行處理,從而獲得解決管理決策或營銷研究問題所需信息的過程。所謂的數據統計分析就是運用統計學的方法對數據進行處理。在實際的市場調研工作中,數據統計分析能使我們挖掘出數據中隱藏的信息,并以恰當的形式表現出來,并最終指導決策的制定。

    二、數據統計分析的原則

    (1)科學性。科學方法的顯著特征是數據的收集、分析和解釋的客觀性,數據統計分析作為市場調研的重要組成部分也要具有同其他科學方法一樣的客觀標準。(2)系統性。市場調研是一個周密策劃、精心組織、科學實施,并由一系列工作環節、步驟、活動和成果組成的過程,而不是單個資料的記錄、整理或分析活動。(3)針對性。就不同的數據統計分析方法而言,無論是基礎的分析方法還是高級的分析方法,都會有它的適用領域和局限性。(4)趨勢性。市場所處的環境是在不斷的變化過程中的,我們要以一種發展的眼光看待問題。(5)實用性。市場調研說到底是為企業決策服務的,而數據統計分析也同樣服務于此,在保證其專業性和科學性的同時也不能忽略其現實意義。

    三、推論性統計分析方法

    (1)方差分析。方差分析是檢驗多個總體均值是否相等的一種統計方法,它可以看作是t檢驗的一種擴展。它所研究的是分類型自變量對數值型因變量的影響,比如它們之間有沒有關聯性、關聯性的程度等,所采用的方法就是通過檢驗各個總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。(2)回歸分析。在數據統計分析中,存在著大量的一種變量隨著另一種變量的變化而變化的情況,這種對應的因果變化往往無法用精確的數學公式來描述,只有通過大量觀察數據的統計工作才能找到他們之間的關系和規律,解決這一問題的常用方法是回歸分析。回歸分析是從定量的角度對觀察數據進行分析、計算和歸納。

    四、多元統計分析方法

    (1)相關分析。相關分析是描述兩組變量間的相關程度和方向的一種常用的統計方法。值得注意的是,事物之間有相關關系,不一定是因果關系,也可能僅僅是伴隨關系;但如果事物之間有因果關系,則兩者必然存在相關關系。(2)主成分分析。在大部分數據統計分析中,變量之間是有一定的相關性的,人們自然希望找到較少的幾個彼此不相關的綜合指標盡可能多地反映原來眾多變量的信息。所謂的主成分分析就是利用降維的思想,把多指標轉化為幾個綜合指標的多元統計分析方法,很顯然在一個低維空間識別系統要比在一個高維空間容易的多。(3)因子分析。因子分析的目的是使數據簡單化,它是將具有錯綜復雜關系的變量綜合為數量較少的幾個因子,以再現原始變量與因子之間的相互關系,同時根據不同因子,對變量進行分類。這些因子是不可觀測的潛在變量,而原先的變量是可觀測的顯在變量。(4)聚類分析。在市場調研中,市場細分是最常見的營銷術語之一,它按照一定的標準將市場分割為不同的族群,并使族群之間具有某種特征的顯著差異,而族群內部在這種特征上具有相似性。聚類分析就是實現分類的一種多元統計分析方法,它根據聚類變量將樣本分成相對同質的族群。聚類分析的主要優點是,對所研究的對象進行了全面的綜合分析,歸類比較客觀,有利于分類指導。(5)判別分析。判別分析是判別樣品所屬類型的一種多元統計方法。若在已知的分類下,遇到新的樣本,則可利用此法選定一種判別標準,以判定將該新樣品放置于哪個類中。由定義我們可以知道判別分析區別于聚類分析的地方,而在判別分析中,至少要有一個已經明確知道類別的“訓練樣本”,從而利用這個數據建立判別準則,并通過預測變量來為未知類別的觀測值進行判別。與聚類分析相同的地方是,判別分析也是利用距離的遠近來把對象歸類的。

    參考文獻

    [1]溫美琴.統計分析方法在我國政府績效審計中的應用[J].統計與決策.2006(23)

    第5篇:數據統計分析范文

    關鍵詞:交通量;統計;分析;應用

    中圖分類號:F5文獻標志碼:A文章編號:1673-291X(2010)19-0167-02

    引言

    交通量數據是在有組織、有計劃地交通量調查的基礎上,通過統計整理和分析,所取得的交通量的統計資料;交通量數據統計與分析能夠充分反映本地區公路交通量的變化和發展趨勢,評價公路對現有交通車輛的適應程度及交通運輸服務質量水平,為公路交通行業的發展、公路建設的總體布局與規劃[1],公路建設項目的可行性研究等提供科學的數字和理論依據。

    通過對全市76個間隙式觀測點、3個連續式觀測點的觀測數據資料進行及時、準確、完整的數據統計匯總,并進行深入的數據分析,對管理線路等級、交通流量等提供第一手資料。

    一、交通量調查數據的整理和分析

    交通量調查經過觀測記錄、數據采集后,需要對取得的原始數據進行認真處理和分析,把它們轉換成有用的數據指標,才能讓這些花費了大量人力、物力、財力所獲得的資料發揮有效的作用[2]。

    1.交通量數據分類整理。交通量數據的整理首先要根據大量的原始數據來計算出混合交通量自然數和當量數。由于交通量時刻都在變動,一般常見的都是取某段時間的交通量平均值來衡量該段時間的交通量代表。一般在進行交通量的數據整理時,常分成三類[3]:(1)按交通組成的不同可分機動車交通量、非機動車交通量和行人交通量。機動車交通量包括各類汽車和拖拉機等。非機動車包括畜力車、電動車、人力車、自行車等。(2)按觀測時間的不同可分秒交通量(5 min、10 min、15 min)、小時交通量、白天12小時交通量、16小時交通量,日、周、月、年交通量。(3)根據用途不同平均交通量通常可分為平均日交通量、周平均日交通量、月平均日交通量、年平均日交通量、高峰小時交通量。

    2.交通量數據計算。通過以下公式計算各類公路的總交通量及在公路網中所占的比重。

    (1)線路交通量。線路交通量=■N■?L■。式中Ni――線路上各觀測站調查日交通量(輛/D);Li――線路上各觀測站對應的調查區間長度(km);n――線路上觀測站的個數。同類公路的路線交通量=轄區內每條同類公路的路線交通量之和;調查區域內線路交通量=轄區內幾類公路路線交通量之和。(2)日交通量。日交通量=路線交通量/路段全長;同類公路日交通量=同類公路路線交通量/同類公路里程總和;調查區域日交通量=調查區域內路線交通量/調查區域內幾類公路里程總計。(3)各類公路里程及路線交通量比重。各類公路里程比重=各類公路里程小計/幾類公路里程總計;各類公路路線交通量比重=各類公路路線交通量小計/幾類公路路線交通量總計。

    3.經過計算整理,可以得到本市、縣、區各類公路線路交通量比重調查表(以2009年為例)。

    二、交通量時空變化分析

    交通量的時間變化是指某一公路斷面交通量在不同時間的變化情況。交通量的空間變化是指同一時間交通量在道路網上不同地點的流量分布。在進行了24小時交通量的連續觀測后,就可以整理為以小時為單位的交通量統計表,繪制交通量的時變圖,以分析交通量的變化趨勢。了解上下高峰小時出現的時間、數值大小和夜間交通的情況等。

    通過對不同公路的交通量時變圖的分析可知(見圖1、圖2),地方公路交通量時空變化具有以下幾個特點:(1)交通量時變圖一般呈波浪形曲線分布,一般都有上下午高峰出現;(2)不同性質公路的空間分布規律有差異,市道和重要縣道交通流量較大,高峰期時間拉長,而次要的縣道和鄉道交通流量小,高峰期集中;(3)不同經濟發展規模的地區,所連接的公路的交通量時變規律有差異,相同性質的公路在經濟愈發達的地區交通量愈大。

    三、交通量數據的應用

    通過對交通量調查資料的整理和分析,可以了解各類公路的交通量及其各自在路網中的比重,同時也可以了解交通量的空間分布和時間分布特性、交通量的各種變化規律和影響因素、從而為道路網規劃、道路設計和建設、交通管理和控制、工程的經濟分析和效果對比、交通安全等各個方面提供了可靠的根據[4]。交通量調查資料在我市公路的應用和所起的作用主要體現在以下幾點。

    1.為道路養護管理提供依據。為提高公路養護的質量和經濟效益,道路的經常性維修經費及養路定員編制的額定,以交通量的大小及道路施工質量、線路性質及養護經費等情況綜合確定,并以交通量大小作為主要的決定因素,充分利用觀測數據為道路養護管理服務。如我們對在3 000輛/日以上的道班除按里程配備養護工人和增加臨時養護工加強養護外,還充分利用交通時變柱狀圖,合理安排道班工人在非車輛高峰小時進行路面養護作業,車輛高峰期則進行路肩、橋涵構造物及綠化帶等養護作業,從而提高了養護效率和安全系數。

    2.為遠景交通量預測提供根據。通過大量的交通量數據進行統計分析,找出交通量時間和空間上的變化規律,根據歷年的交通量數據來計算路線的交通量年遞增率,找出交通量增長規律,從而可以推算出遠景交通量,預測未來交通量的發展趨勢,為公路建設的宏觀決策提供依據。例如,衡陽市2005―2015年交通公路網規劃中的遠景交通量就是以歷年觀測取得的交通量數據和汽車起訖點調查(OD調查)等資料為基礎進行預測的。

    3.為交通控制與管理提供依據。交通控制的實施離不開交通量的現狀和需求,如果脫離了交通量流向和流量的實際,則交通控制的效果就會大大降低。例如,根據實測的交通量數據,對一些人口比較密集的鄉鎮除設置限速或村莊標志外,有些還加設交通信號燈或突起橫標線提醒駕駛員注意安全。并對交通量大的市、縣道設置齊全的交通標志和路面標線,加強路政管理力度,使公路經常保持良好的技術狀況,使道路的通行能力得到提高。

    4.為已有道路評定提供依據。運用交通量調查數據,可以計算出路線的交通擁擠度,判斷現有道路是否達到飽和程度,以評定道路的使用情況,評價現有公路對交通運輸通行要求的適應狀況和服務社會的水平。例如,以交通擁擠度低于2.0的,屬于暢通或擁擠路段,說明道路還能基本滿足運輸需要,車輛行駛較安全。擁擠度在2.0~3.0的,屬于堵塞路段,說明道路的通行能力已滿足不了運輸的需要,車輛行駛安全度較差。擁擠度大于3.0的,說明道路已遠遠不能滿通運輸的需要,屬于嚴重堵塞路段,車輛行駛極不安全,迫切需要對原有公路進行改造以提高其通行能力。

    5.為公路設計提供依據。根據現有道路的是否滿足運輸需要來進行總體布局,在確定了規劃項目后,在項目的前期工作要進行可行性研究,要新修或改建一條公路,都要利用大量的交通量數據來進行經濟論證和分析,論證公路建設項目的必要性、合理性與可行性。建設項目決定之后,在公路設計的過程中,公路的技術等級確定、道路交叉口類型確定、公路路面厚度的設計計算等也都要利用到交通量數據。

    結語

    交通量數據統計能準確、及時、全面、系統地提供各級公路上的各種交通工具的數量及構成比例,準確預測未來交通量的發展, 為公路建設總體布局與規劃、公路建設可行性研究、舊路改造、公路工程設計等提供首要資料,為公路基礎設施建設和投資規模提供確切可靠的依據。隨著社會的發展,對交通量調查統計也提出了新的要求和任務,需要我們加強交通量調查管理,進一步探討交通量調查的分析與應用,充分發揮交通量調查的作用,使交通量調查能更好地服務于社會。

    參考文獻:

    [1]交通部公路規劃設計院.公路交通調查指南[M].北京:人民交通出版社,1990.

    [2].淺談交通量調查數據的分析與應用[J].科技信息,2007,(25).

    第6篇:數據統計分析范文

    【關鍵詞】大數據;政府統計;統計分析;影響

    在這個大數據時代,隨著時間的推移,人們將越來越多的意識到數據對各個行業的重要性。其實,這對統計工作、政府統計也是一場模式革命。要擴大數據獲取來源,通過云計算對海量大數據進行比對、分析,理解附含的信息,篩選有用的信息,找到信息的聯系,針對經濟發展新常態進行深入分析,為五大發展理念的貫徹落實提供統計分析動力和決策依據。當前統計研究者更為關注,怎樣將企業、基層、部門的海量數據進行全面的無縫對接、匯總加工,怎樣通過大數據、云計算、物聯網為統計工作整合資源、匯聚合力,怎樣讓信息技術為統計流程改造和統計數據生產更好服務。

    一、大數據的概念和意義

    大數據(big data),指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。大數據技術的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理,通過“加工”實現數據的“增值”。所以大數據分析常和云計算聯系到一起。

    二、大數據對經濟發展和政府統計的影響

    (一)大數據對經濟統計的影響

    大數據實際上對經濟統計帶來了非常大的影響,極大地改變了統計數據收集方式、統計方法和統計生產過程,也是一種對傳統因果關系論證做法的革命和創新。

    第一,在數據收集方式方面,傳統方法更多是依靠全面報表、大型普查、抽樣調查、典型調查、重點調查等方法,但是僅僅依賴這些方法顯然無法跟上信息技術發展的步伐,有必要結合大數據應用進一步完善和改進統計方法。第二,在統計方法方面,考慮到成本、效率、精度等諸多因素,傳統方法中統計調查更多采用抽樣調查,但大數據時代輔以云計算,為獲取全數據提供了可能。第三,在統計生產過程方面,傳統統計方法講求數理關系、因果關系的嚴格邏輯性,定量分析更多,現在大數據時代,既要挖掘因果關系,更要關注事物聯系,能夠挖掘數據最大價值。

    (二)大數據對政府統計的影響

    大數據時代,各行各業都在適應、迎接這種深邃的變革,政府統計也要解放思想,順勢而為。這就要求加強和完善部門統計,促進綜合統計和部門統計協調發展,整合它們的數據信息,構筑新的接口吻合、共享方便的名錄庫和數據庫平臺,豐富數據獲取方式和分析方式,切實提高統計數據質量和政府統計公信力。新的統計方法相比以前,要在調查樣本范圍上有所擴大,要在記錄容量上有所加大,要在調查效率上有所提高,要在調查結果上更為精確。

    在消費價格方面,目前主要針對農貿市場、購物中心、超市百貨等場所開展統計調查,按月進行居民消費價格指數統計,信息滯后,周期過長。如果通過大數據進行調查,就能擴大調查范圍、增加調查樣本、提高調查速度、精確消費價格。在人口調查方面,作為世界第一人口大國,在2010年第六次全國人口普查時,主要通過問卷調查、入戶走訪、光電錄入、校驗匯總等方式積累和分析數據,可以說人力物力財力耗費巨大,信息固化無法及時更新。如果通過大數據進行普查,就可以建立一套完整的人口管理系統,整合公安、計生、民政等多個部門人口信息,大大提高調查時效,節約調查成本。在數據質量方面,傳統調查種類繁雜、數量龐大,各種非全面調查方法都有一些誤差,如果通過大數據建立完整的相關的政府管理數據庫,就能夠確保數據的準確性、提高的及時性。

    (三)大數據時代統計分析探究

    因為大數據時代信息爆炸式增長,必須對傳統統計方法進行改進,按需改造數據生產過程,運用大數據、云計算建立一個全新的全數據統計模式。其中,在一些領域,仍然要依靠傳統的抽樣調查等科學方法,方便快捷、低成本完成好統計調查,在另一些領域,就要運用大數據建立數據庫,適時提取所需數據,提煉有價值的決策咨詢信息。很多時候,針對經濟統計和政府統計,兩者需要有效交叉融合,這樣才能通過數據更加如實地反映經濟發展實情和社會發展本質,切實提高統計數據效用,助推經濟轉型升級和提質增效。

    三、結束語

    大數據將為這個時代插上騰飛的翅膀,政府統計工作一定要適應這種變革、引領這種變革,帶頭主動改造統計數據生產過程,進而讓數據樣本覆蓋更加全面,統計數據加工更加快捷,統計數據提供更加及時,統計數據質量更有保障。同時,這是一個體系,也需要全社會共同參與,這樣才能為經濟發展提供更加堅實的統計支撐。本文結合大數據概念和意義,針對經濟統計和政府統計,探討如何進行分析和研究。綜上可知,必須抓住大數據發展的契機,讓它和傳統統計調查方法有效結合、互相補充。另外,大數據還在發展之中,需要在全面深化統計改革實踐中,繼續加以深入研究和挖掘,讓大數據為經濟在新常態下更好發展發揮關鍵作用。

    參考文獻

    [1]趙彥云.宏觀經濟統計分析發展的基本問題[J].經濟理論與經濟管理,2013,(5):23-3..

    [2]李士猛,步倩.大數據背景下的統計探究[J].商場現代化,2014,(19):213.

    [3]程開明,莊燕杰.大數據背景下的統計――第十七次全國統計科學討論會綜述[J].統計研究,2014,(1):106-112.

    第7篇:數據統計分析范文

    關鍵詞 滑坡;數據庫;滑坡區劃;滑坡分析

    中圖分類號P642.22 文獻標識碼A 文章編號 1674-6708(2013)91-0129-02

    0 引言

    滑坡是指巖石、碎石或者土體沿坡面的運動。在美國,每年滑坡帶來約10~20億美元的經濟損失和25~50人死亡。意大利在1279~1999年期間840次滑坡中的死亡人數超過1萬人[1]。在中國,1949~2011年期間,由滑坡引起的死亡人數保守估計超過25000人,平均每年超過400人,而且平均每年的經濟損失大約為5000萬美元。

    本文的研究目的是通過構建一個系統的完整的中國近60年滑坡災害數據庫,利用統計學原理,并結合ArcGIS空間分析原理,分析滑坡災害在全中國空間尺度上的分布規律,同時評估全國不同區域滑坡災害情況。從時間和空間上研究滑坡災害變化的趨勢,引入滑坡區劃理論,分析我國不同區域滑坡報道次數與死亡人數的關系,對我國滑坡災害的預測和預防都具有重要的意義。

    1 滑坡區劃

    滑坡是危害程度僅次于地震的較大地質災害,與地震相似具有突發性的特點,主要發育在山區[2]。我國地域遼闊,山地占國土總面積的65%以上,因此滑坡在我國分布非常廣泛。據統計,據我國滑坡災害統計年鑒統計,自1949年以來,我國東起浙江、福建、遼寧、西至新疆、,北起內蒙古,南到海南、廣東,至少有22個省、市、自治區不同程度地遭受過滑坡的侵擾和危害。其中,以云貴高原的秦嶺-大巴山區域滑坡災害最為突出。

    為了在空間尺度上分析中國滑坡災害分布情況,參照《中國環境地質分區圖》,將我國國土按照地理位置和土質結構劃分為六大區域,分別為黃土高原、東北、華南、西北、西南和。

    2 滑坡災害數據分析

    2.1數據來源

    由于我國特殊的國情,在解放之前對滑坡災害缺乏歷史記錄,從1949年起,我國開始對滑坡災害做統計,但早期由于科技不發達,對滑坡的上報不及時,數據記錄依然很少。隨著科技的進步,滑坡的記錄越來越多,包含的信息量也越來越大,數據的準確性也越來越高。所以本文統計了從1949年到2011年近60多年來發生在我國境內的滑坡災害歷史記錄,目的是通過對歷史數據的分析,得出我國滑坡分布規律,對今后滑坡災害的預防起到一定的作用。

    數據的來源主要是國內的一些大型的數據庫網站,如中國地質環境信息網(http://)、中國風險網(http:///)、中國及鄰區地應力和地質災害數據庫查詢系統(http:///geo0503/),還有相關書籍中對中國各年份統計年鑒和中國重大山體滑坡事件表的記錄等。另外,國外大型網站對世界范圍內的大型滑坡也有記錄,如The EM-DAT International Disaster Database(http://)等,從中查找出發生在國內的滑坡災害信息,可以對數據進行準確性和完整性的檢驗,80%以上的滑坡災害可以再統計數據中找到,并且相關數據描述準確,具有一定的可信性。數據格式如下表1所示:

    編號 名稱 時間 地點 經度 緯度 滑坡等級 成因 受災人數 受傷人數 死亡人數 直接經濟損失 間接經濟損失 災害情況

    表1 滑坡災害數據統計表

    2.2數據分析

    根據60多年來發生在中國的滑坡災害歷史數據資料,結合我國縣級區劃圖,分析滑坡災害發生的區域特點,主要集中在四川、甘肅以及江浙一帶的南方地區,其中位于秦巴山一帶的點數最為密集,而黑龍江、內蒙古、等北方地區發生滑坡的次數非常少。統計我國滑坡分布規律主要集中在江、河、湖(水庫)、海、溝的岸坡地帶,地形高差大的峽谷地區,地質構造帶之中,如斷裂帶、地震帶等,易滑坡的巖、土分布區,如松散覆蓋層、黃土、泥巖、頁巖、煤系地層等,還有就是暴雨多發區或異常的強降雨地區。其中研究的重點區域是從太行山到秦嶺、經鄂西、四川、云南到藏東一帶的秦巴山地區。

    從統計結果中可以很明顯地看出,滑坡災害次數在整體上呈現上升趨勢,一方面可能由于早期我國在滑坡災害數據的整理方面不夠系統化,導致滑坡災害記錄不完整;另一方面也與近年來發生的眾多地質災害有關,如洪水、地震等都易導致滑坡的發生。從階段上來看,滑坡災害發生最多的是1998年,當時我國南方地區降雨導致洪澇災害頻發,與事實相符合,證明數據庫具有可靠性。

    我國平均每年發生滑坡和泥石流地質災害2萬余起、傷亡1千余人、受災人口90多萬,直接經濟損失20-60億元。對比1995-2010年中國統計年鑒中對每年因滑坡死亡人數的記錄,和國際緊急災難數據庫EM-DAT中對1982-2011年中國滑坡死亡人數的統計,可以看出,從整體走勢上來看大體相同,在2010年有一個最高點,在1996-1998年有一個比較明顯的波動變化,這與在發生在當時的洪水和地震地質災害有關。由于國外對我國滑坡災害的報道不全,從數據上存在差異是不可避免的,但總體上可以反映相同的規律。

    分析滑坡災害月份統計圖,滑坡災害基本是按正態分布規律,6月~9月這4個月滑坡災害發生的次數比較高,形成一個波峰,而其中7月發生滑坡的次數遠超于其他3個月,表明7月是滑坡災害研究的重點月份。同時分析死亡人數,滑坡 災害發生次數較多的幾個月,即6月~9月,造成的死亡人數也較多, 但最多的月份卻是5月,死亡人數 達到10882人,通過數據分析原因, 由于2003年5月11日,在汶川地區 發生地震,造成多處滑坡,死亡人 數嚴重,雖然滑坡發生次數不多,但規模較大。由此可見,滑坡分析造成的影響,除了要關注發生的次數,還要重視滑坡發生的規模等級。

    在1981~2011年這30年來,華南地區的滑坡災害報道次數要遠多于其他五個地區,分析其原因主要與該地區的降雨頻繁,而且土質比較松軟,易由于降雨或地震而引發滑坡災害。而另一方面,西南地區的死亡人數要遠多于其他區域,可能與該地區的經濟發展比較落后,對于滑坡災害的預警等方面嚴重不足有關,導致死亡人數相對來說比較高。由此可見,做好滑坡災害的預警,不僅要考慮降雨、土質等自然因素對其影響,人文經濟因素也是不可忽視的重要一項。如何綜合這些因素,對我國滑坡災害的發生做預測,也是當前研究的難點所在。

    3 結論

    通過對近60多年來發生在中國的滑坡災害歷史記錄的整理與分析,可以看出我國西南和華南地區,特別是秦巴山一帶是滑坡災害發生最為嚴重的地區,而通過統計這些滑坡災害中90%以上是由降雨導致的,所以如何防止降雨型滑坡的發生是今后研究的重點。本文構建滑坡災害數據庫,目的是通過滑坡歷史來反應滑坡的總體分布規律,對今后的滑坡防治研究以及風險評估,能夠起到指導性的作用。

    參考文獻

    第8篇:數據統計分析范文

    關鍵詞:統計數據質量;影響原因;對策分析

    一、企業統計數據質量的重要性

    在現實的企業經營運行中,談到企業管理,人們首先想到的是企業管理體制、經營方式、組織形式、運行機制等,而統計的重要性往往被企業管理者所忽視。企業管理體制、經營方式、組織形式、運行機制的有效與否,對企業適應市場經濟要求,提高經濟效益,具有重要的影響和意義。

    統計數據作為政府部門監督管理的依據,統計數據的真實可靠直接參與政府部門決策。同樣,企業的經營運轉離不開統計數據,統計數據反映了企業的實際經營情況,統計數據的不真實在一定程度上誤導決策者,影響企業生產經營及國家的經濟發展。俗話說:“失之毫厘,謬以千里。”在統計數據來源多樣化的情況下,統計數據的可靠性和有效性,直接影響到統計分析和預測能否得出正確的結論。因此,強化企業統計,無論是對企業的經營,還是對政府的宏觀調控同樣具有重要意義。

    二、影響企業統計數據質量的原因

    (1)對統計工作缺乏應有的重視,企業統計服務職能不能充分發揮。一是企業往往對統計工作缺乏正確的認識,認為統計工作只是為政府及上級部門服務的,使得統計工作沒有受到應有的重視。二是企業在統計方面的投入比較少,對統計數據的質量要求也不高,有些企業甚至沒有成立專門的數據統計部門,把統計工作簡單化。三是企業重會計輕統計的現象普遍存在,統計人員大多為會計兼職,沒有精力對統計數據進行必要的分析、整理,不能為領導決策提供橫向和縱向的對比數據資料,統計數據的質量和使用價值被削弱。

    (2)相關規章制度不健全,基礎工作較差,導致統計數據質量不高。有相當一部分企業沒有建立規范的企業統計制度,一些統計指標難以準確按照統計制度的具體要求來計算填報。一是部分企業統計臺賬和原始記錄不健全,企業統計數據數出無源,填報統計指標的隨意性較大,數據質量不高。二是一些單位雖建立了統計臺賬,但記錄不完整、不準確,經常出現一些低級錯誤。三是有些填報單位怕“露富”,害怕增加稅費,不說實話,不報實數,支持配合程度不高,所報送的報表經不起推敲,出入較大。

    (3)統計隊伍不穩定,業務素質有待提高。一是統計人員的頻繁變動影響統計數據質量。統計人員變動導致對業務不熟,對統計指標的含義以及統計口徑、統計范圍和計算方法一知半解,上報的報表往往容易出錯,數據質量很難得到保障。二是統計人員兼職較多,缺乏必要的業務培訓。尤其是基層統計人員缺乏統計知識的更新,對統計指標理解不清、不透,導致統計數據差錯現象時有發生,使統計的原始數據存在先天性的缺陷。三是部分統計人員積極性不高,責任心不高。這樣就影響了整個統計隊伍的素質,造成了統計工作的被動,從而對統計數據的質量也產生一定的影響。

    (4)企業治理層對企業統計職能不夠重視。企業主要是從事經營性工作,企業管理層對企業的內部管理工作的重視程度有所偏差,企業統計容易受到企業領導的忽視。企業管理層對與企業統計的缺乏關注,對企業統計無法提供有效的監督。企業管理層僅關注企業最終的統計資料,而忽視對企業統計工作的監督指導,企業統計部門及人員可能不正確地履行職責,在原則性問題上可能會放松警惕,不按照國家出臺的統計法律及制度編制統計報表,而僅僅是為了報表賬面“好看”,瞎編統計數據,這樣的現象在各行各業很常見。

    (5)企業統計方法及統計手段未能及時更新。企業利用科學的統計方法搜集、整理及分析并提供相關的資料構成統計工作的基礎。傳統的手工操作手段逐漸向計算機技術操作轉變。有些企業仍停留在傳統的手工計算,統計效率提不上去,統計數據的準確可靠性無法保證。計算機技術能夠使數據處理高速化、數據存儲資源化、數據傳輸網絡化,使數據信息得到共享,為信息使用者提供便利,還能夠減少因工作人員失誤造成的技術性誤差。計算機技術在企業統計方面的應用,大大降低了企業統計時間及人力成本,改善了企業統計效率,提升了企業統計數據質量。

    三、提高企業統計數據質量的對策

    (1)提高認識,加強機構建設。企業提高對統計工作的重視程度,建立健全企業統計的管理體制和運行方式。一是企業應設立統計部門明確職責,至少應設立相對獨立的統計崗位,將統計信息自下而上的單向運行變為上下左右之間的多向運行。二是理順各職能部門關系,明確職能部門職責,設立會計核算員兼職統計員崗位,將統計核算與會計核算有機結合,解決統計人員缺乏而且流動頻繁的矛盾。三是提高統計部門的地位,使統計部門和其他部門享有平等的地位和權力,增加統計部門的資金投入等,使統計工作能夠進入管理層、服務決策層。

    (2)強化基礎,推進統計工作制度規范化建設。企業在統計數據的采集到最終的報表的各個環節上規范操作,完善企業統計制度。制定企業統計監督管理辦法,從統計數據的采集整理、編制、審核及報批、分析、并保存統計數據及報表等環節,加強監督管理力度,從制度上防范統計作假行為。將統計工作責任落實到個人,統計人員對自身的統計工作負責。統計人員在統計數據時,保證統計數據的準確、真實。

    (3)加強企業統計人員培訓,提高整體素質水平。統計人員素質參差不齊,直接影響著統計數據質量。企業在招聘企業統計人員時,應注重統計人員的專業水平,盡量減少統計工作由其他崗位的人員兼職。定期對企業統計人員進行專業知識培訓及考核,鼓勵企業統計人員積極提升自身的專業素質,適應變化的統計環境。改變對統計工作的最初認識,加大對企業統計人員的福利待遇,激勵他們認真負責對待統計數據。同樣,統計人員自身也應注重統計知識的更新,提升自身的統計工作能力。除此之外,統計人員還需加強統計數據分析能力,為企業提供高質量的統計報表,對現有的統計資料做出準確的分析判斷,提出適合企業目前生產經營發展現狀的對策建議,改善企業生產經營狀況,提高企業效益。

    (4)企業應加強對企業統計部門的重視。企業除了應重點關注企業的經營情況外,還應重視企業統計。企業領導能夠通過企業的統計數據、統計資料及統計報表查看企業項目的進展情況,了解實際的生產經營狀況。加強對企業統計部門的重視,給予企業統計部門一定的權限,鼓勵統計部門在發現企業經營問題時及時反饋至領導層,使得問題得以盡快解決,保證企業的正常經營運作。

    (5)及時更新統計方法及手段。企業統計人員在進行統計時,不能僅限于傳統的統計手段,跟隨計算機技術的進步,及時更新企業統計方法。采取先進、科學的統計方法,提高統計數據的可靠性,統計工作人員不僅要利用計算機技術做一些基本的統計工作,還應該善于研究和開發,主動開展分析、參與管理、強化監督,為企業發展決策提供服務。

    參考文獻:

    [1] 王欣.關于統計數據質量的思考[J].天津經濟,2008(8).

    第9篇:數據統計分析范文

    關鍵詞 統計數據 失真 原因 應對措施

    中圖分類號:F222 文獻標識碼:A

    統計數據真實性作為統計工作的基礎與核心,其質量好壞將直接關系到各級各部門經濟決策的制定與執行程度,失真的統計數據會嚴重干預到經濟行為的全面性分析,進而給市場經濟運行本身帶來極為不利的影響。就我國現階段的統計工作而言,統計數據的失真問題已成為了相關工作人員普遍關注的問題之一,統計數據各種形式的弄虛作假問題屢禁不止,統計數據及統計信息的認同度與可靠度不高,最終嚴重影響到統計工作的順利開展。據此,找準統計數據失真問題的形成根源,采取各種具有針對性的措施與手段來合理控制并消除統計數據失真問題,已成為當前相關統計工作人員最亟待解決的問題之一。筆者現結合實踐工作經驗,就這一問題談談自己的看法與體會。

    一、統計數據失真的形成原因分析

    從理論上來說,現代經濟社會背景下的統計數據只是相關工作人員在統計工作活動過程中所獲取的那部分與國民經濟建設發展現狀以及經濟社會各類現象密切相關的直接性數字資料以及與其存在一定內在聯系間接性數字資料的統稱。無論是直接性數字資料還是間接性數字資料,其成為統計數據的最關鍵目的在于為各相關部門機構各項經濟預決策的制定與執行提供大量、可靠且及時的數據支持。受市場經濟發展健全程度不夠完善等客觀因素的影響與制約,當前經濟社會中的統計數據呈現出了一定的失真性問題,值得引起相關工作人員的重視。筆者認為,造成統計數據失真的原因多種多樣,具體來說可以劃分為以下幾個方面:

    (一)統計數據工作人員綜合素質存在問題。

    首先,統計數據工作人員在數據統計過程中的工作責任心比較淡薄。統計部門統計數據專員對于統計數據崗位的認識度還不夠充分,認為統計工作的中心在于統計分析及總結環節,統計數據的重要程度并非比較突出,這使得工作人員在統計數據工作過程中帶有比較明顯的敷衍色彩,對統計數據的來源及其真實程度的調查與復核不夠深入;其次,統計數據工作人員的專業技能水平不夠高。就我國現階段的統計機構部門來說,有關統計數據工作人員的知識講座與業務培訓比較少,統計數據工作人員的業務熟練程度還不夠,這使得大量的統計數據未經嚴格的審核與調查就進入下一環節,為統計數據的真實性埋下了安全隱患。

    (二)基層統計基礎工作規范性存在問題。

    基層統計部門作為整個統計行業的支柱與核心,應當在統計數據真實性方面做出表率。然而當前大部分基層統計單位對與統計數據工作的重視程度不夠,錯誤的將:“統計等于估計”這一思想應用在統計數據工作當中,在統計數據實踐工作過程中存在敷衍了事的怠倦思想,對于上報統計數據的真實性重視度不夠。再加上基層統計單位在統計數據賬面登記方面存在較為嚴重的問題,統計數據的計算方式與登記模式均存在較為嚴重的缺陷,最終使得基層統計單位在統計數據規范性方面存在缺失,統計數據真實性與質量程度無法得到可靠性保障。

    (三)現有統計管理體制在制定方面存在問題。

    在當前統計管理體制作用下,基層統計部門機構在人事任免工作方面將權利統一交由地方政府機構實施,有關基層統計部門工作人員的薪酬支付也交由地方財政部門執行。在這一管理體制規定下,基層部門的統計工作難免會深深地打上政府情感傾向的烙印,往往統計數據的上報會事先經過基層相關政府部門的通過。這也就意味著,基層政府部門極易在地方政效夸大化目的的作用下以行政方式參與到統計數據的實踐工作當中,進而致使基層統計部門統計數據存在嚴重的失真性問題。

    二、統計數據失真的應對措施分析

    針對上文有關統計數據失真的形成原因分析,筆者認為要想從根本上緩解并控制統計數據的失真問題,就需要圍繞統計數據工作人員綜合素質、基層統計基礎工作規劃以及統計管理體制這三大方面,有針對性的制定行之有效的應對措施,確保統計數據能夠為統計工作提供穩定且真實的數據支持。具體來說,可以概括為以下幾個方面:

    (一)統計數據工作人員需要加大日常業務培訓力度。

    現代經濟社會的建設發展使得統計工作面臨著前所未有的發展機遇與挑戰,統計數據工作人員作為統計數據工作的施動主體,其統計數據工作技能水平與業務熟練程度將直接關系到統計數據的真實性。針對當前統計部門統計數據工作人員業務培訓力度不夠的這一問題,筆者建議各級統計主管部門需要以統計工作需求的轉變為基礎,定期展開統計數據工作專員的業務培訓工作,以業務培訓挖掘統計部門內部綜合素質優秀的工作人員,發揮業務骨干的激勵職能。與此同時,統計部門的業務培訓工作還應當創新性的構建相應的培訓考核機制,以考核晉升為目的,激發統計數據工作人員參與業務培訓的積極性。在培訓過程中針對經濟社會發展實際向統計數據工作人員傳輸統計新知識與新技能,從統計數據工作人員綜合素質與業務水平的提升方面來實現并確保統計數據的真實性。

    (二)統計部門需要引入垂直式的管理模式。

    統計數據作為統計工作的數據基礎,其真實性是我們需要始終關注的問題之一。垂直式統計部門管理模式作為當前技術條件支持下,世界范圍內最為先進的統計部門管理模式之一,在我國現階段發展形勢下有著極為深刻的應用價值。簡單來說,垂直式的管理模式能夠實現統計部門在人力、物力以及財力方面的集中化管理,統計數據直接交由上級統計部門監督與管理,既有效避免了統計數據受政府政效意識影響,同時又賦予了統計部門較為獨立的統計數據報告權利。

    (三)統計數據真實性的實現需要加大統計數據失真行為的打擊與懲處力度。

    “無規矩不成方圓”。統計部門需要在統計數據的統計及管理過程中妥善應用包括行政、法律以及經濟等在內的多種手段,逐步加大對統計數據失真行為的打擊與懲處力度。將統計數據中的各種虛假作為打擊與懲處的關鍵對象。從法律角度來控制并消解統計工作中的統計數據失真問題。

    三、結語

    統計數據作為現代經濟社會建設與發展的根基,為相關機構部門各項經濟預測、經濟決策的制定及執行提供了可靠且及時的數據保障。可以說,統計數據的真實性將直接關系到國民經濟乃至整個經濟社會的發展與騰飛。在當前經濟社會背景下,統計數據的失真問題日益嚴重,各種統計數據的作假與虛報問題層出不窮,屢禁不止,需要引起相關工作人員的關注。本文針對統計數據失真的形成原因及應對措施作出了簡要分析與說明,希望能夠為今后相關研究與實踐工作的開展提供一定的參考與幫助。

    (作者單位:北京市農林科學院計財處)

    參考文獻:

    [1]楊志勇,林勇.統計數據失真蔓延的進化博弈論分析.內蒙古財經學院學報,2008.(03).

    [2]王雪靜.淺談建筑業產值統計數據失真問題.中國商界,2008.(02).

    [3]高強.四川省農村住戶收入統計數據失真原因分析與實證研究.四川農業大學,2005.

    主站蜘蛛池模板: 成人毛片一区二区| 欧美日韩亚洲成人| 亚洲av成人一区二区三区在线观看 | 成人试看120秒体验区| 日韩国产成人精品视频人| 成人免费网站视频www| 国产成人福利精品视频| a级成人免费毛片完整版| 成人影院久久久久久影院| 国产成人综合欧美精品久久| 成人免费视频网| 欧美成人天天综合在线视色| 国产成人亚洲综合色影视| 国产成人av乱码在线观看| 78成人精品电影在线播放日韩精品电影一区亚洲 | 亚洲国产精品成人久久久| 欧美成成人免费| 亚洲第一成人在线| 外国成人网在线观看免费视频| 亚洲成人福利在线| 成人影片一区免费观看| 五月天国产成人AV免费观看| 国产精品成人免费视频网站| 69成人免费视频无码专区| 俄罗斯一级成人毛片| 国产成人久久777777| 在线观看成人免费| 成人午夜精品视频在线观看| 四虎成人国产精品视频| 成人妇女免费播放久久久| 欧美成人观看视频在线| 69堂国产成人精品视频不卡| 四虎影视永久地址四虎影视永久地址www成人 | 免费成人福利视频| 国产成人久久av免费| 国产成人精品无码片区在线观看 | 四虎影院成人在线观看| 国产成人免费a在线视频app| 国产成人精品视频播放| 成人3d黄动漫无尽视频网站| 在线视频免费国产成人|