前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的大數(shù)據(jù)統(tǒng)計(jì)分析主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:國庫統(tǒng)計(jì) 大數(shù)據(jù) 分析與預(yù)測
一、大數(shù)據(jù)時(shí)代國庫統(tǒng)計(jì)分析轉(zhuǎn)變
(一)樹立大數(shù)據(jù)思維
“大數(shù)據(jù)時(shí)代預(yù)言家”維克托認(rèn)為:世界的本質(zhì)就是數(shù)據(jù),大數(shù)據(jù)將開啟一次重大的時(shí)代轉(zhuǎn)型,一直以來所延續(xù)的傳統(tǒng)統(tǒng)計(jì)分析思想已變得陳舊且落后。國庫統(tǒng)計(jì)分析思維應(yīng)當(dāng)在大數(shù)據(jù)背景下加以轉(zhuǎn)變。一是關(guān)于大數(shù)據(jù)抽樣調(diào)查工作的思想。抽樣調(diào)查是目前統(tǒng)計(jì)分析工作中的重要調(diào)查方式,但應(yīng)該清醒地認(rèn)識(shí)到,傳感器、網(wǎng)絡(luò)和數(shù)據(jù)處理技術(shù),為獲取全局?jǐn)?shù)據(jù)提供了可能,抽樣調(diào)查方式越來越多的被大數(shù)據(jù)取代成為必然。二是大數(shù)據(jù)統(tǒng)計(jì)思想:允許數(shù)據(jù)存在不精確性。縱觀目前的各類數(shù)據(jù),一方面,數(shù)據(jù)來源不斷擴(kuò)展,另一方面數(shù)據(jù)處理方法飛速發(fā)展,我們應(yīng)該把重心放在統(tǒng)計(jì)分析效率上,而不是一味地追求數(shù)據(jù)的精確性上。三是大數(shù)據(jù)相關(guān)關(guān)系的思想,由驗(yàn)證因果向?qū)で箨P(guān)聯(lián)轉(zhuǎn)變。統(tǒng)計(jì)分析報(bào)告是統(tǒng)計(jì)工作的下游產(chǎn)品,對(duì)決策的意義常常大于常規(guī)報(bào)表。大數(shù)據(jù)的應(yīng)用,統(tǒng)計(jì)分析也將發(fā)生轉(zhuǎn)變,在做好因果分析的基礎(chǔ)上向?qū)で箨P(guān)聯(lián)轉(zhuǎn)變,原因分析更加精準(zhǔn)和深刻,對(duì)策建議更具參考價(jià)值。
(二)被動(dòng)統(tǒng)計(jì)到主動(dòng)分析,從人工統(tǒng)計(jì)到智能統(tǒng)計(jì)
在這樣一個(gè)信息爆炸的大數(shù)據(jù)時(shí)代,無論政府機(jī)構(gòu)還是社會(huì)公眾都可以通過多種途徑獲取信息,國庫統(tǒng)計(jì)分析部門也不例外,更應(yīng)該變被動(dòng)為主動(dòng),對(duì)經(jīng)濟(jì)轉(zhuǎn)型期的一些重大問題尤其是關(guān)系到可持續(xù)發(fā)展的重要問題,做好數(shù)據(jù)統(tǒng)計(jì)分析,提高發(fā)展質(zhì)量,實(shí)現(xiàn)經(jīng)濟(jì)轉(zhuǎn)型。涂子沛指出人類使用數(shù)據(jù)的巔峰形式,是通過數(shù)據(jù)賦予機(jī)器“智能”。大數(shù)據(jù)在包括國庫統(tǒng)計(jì)分析中應(yīng)用的終極形式就是分析智能化。
(三)從事后統(tǒng)計(jì)向事前預(yù)測轉(zhuǎn)變
統(tǒng)計(jì)分析報(bào)告是統(tǒng)計(jì)工作的重要產(chǎn)品,完整的進(jìn)度性常規(guī)分析應(yīng)該包括對(duì)未來一定時(shí)期數(shù)據(jù)的預(yù)測。但由于小數(shù)據(jù)和信息量的局限,預(yù)測一般很少作為報(bào)告的重點(diǎn),多是在假定發(fā)展條件、相關(guān)政策不變的情況下對(duì)未來情況做出的粗略研判,影響了統(tǒng)計(jì)對(duì)決策的參考價(jià)值。而大數(shù)據(jù)的核心就是將數(shù)學(xué)算法與海量的數(shù)據(jù)有效結(jié)合,來預(yù)測事情發(fā)生的可能性。大數(shù)據(jù)的廣泛應(yīng)用,將有利于統(tǒng)計(jì)報(bào)告實(shí)現(xiàn)由單一的事后分析,向注重事前預(yù)測轉(zhuǎn)變。
二、大數(shù)據(jù)在國庫統(tǒng)計(jì)分析全流程應(yīng)用的探討
當(dāng)前,大數(shù)據(jù)浪潮帶來了一場新的革命,面對(duì)經(jīng)濟(jì)發(fā)展的新形勢新要求,國庫統(tǒng)計(jì)分析要學(xué)會(huì)積極的運(yùn)用大數(shù)據(jù)的思想和方法,來應(yīng)對(duì)各種新挑戰(zhàn)。國庫統(tǒng)計(jì)分析要積極主動(dòng)建立大數(shù)據(jù)分析應(yīng)用機(jī)制,破解新常態(tài)下面對(duì)的各種問題,實(shí)現(xiàn)工作的創(chuàng)新與發(fā)展。本文重點(diǎn)分析國庫統(tǒng)計(jì)分析全流程下大數(shù)據(jù)的應(yīng)用。
(一)數(shù)據(jù)源:建立國庫統(tǒng)計(jì)分析數(shù)據(jù)池
目前國庫統(tǒng)計(jì)分析所用數(shù)據(jù)主要通過“3T”系統(tǒng)產(chǎn)生基礎(chǔ)數(shù)據(jù)和監(jiān)管類數(shù)據(jù),通過收集各類型政策文件、影像資料、領(lǐng)導(dǎo)講話、內(nèi)網(wǎng)信息等形成綜合性數(shù)據(jù)。但這些數(shù)據(jù)遠(yuǎn)未達(dá)到支撐大數(shù)據(jù)統(tǒng)計(jì)分析的基礎(chǔ)。國庫統(tǒng)計(jì)分析應(yīng)當(dāng)建立“數(shù)據(jù)池”這一基礎(chǔ)工程,通過人行內(nèi)部數(shù)據(jù)整合、銀行和其它機(jī)構(gòu)數(shù)據(jù)接入、互聯(lián)網(wǎng)數(shù)據(jù)抓取和引入等多渠道擴(kuò)充基礎(chǔ)信息源和數(shù)據(jù)庫,為國庫統(tǒng)計(jì)分析的大數(shù)據(jù)應(yīng)用奠定數(shù)據(jù)基礎(chǔ)。
一是加速整合現(xiàn)有國庫數(shù)據(jù)。我國國庫匯集了各級(jí)政府財(cái)務(wù)數(shù)據(jù)和各級(jí)國庫管理數(shù)據(jù),包括從中央到縣鄉(xiāng)的各級(jí)機(jī)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),也包括稅務(wù)、海關(guān)、財(cái)政、銀行等部門處理的各類收支退存等國庫資金運(yùn)行數(shù)據(jù),涵蓋面極廣。但現(xiàn)有數(shù)據(jù)資源存在著部門隸屬、無法共享等問題,大數(shù)據(jù)要求建立統(tǒng)一、高效、共享的國庫業(yè)務(wù)大數(shù)據(jù)池,就必須打破現(xiàn)有藩籬,盡早實(shí)施“國家金庫工程”,完善內(nèi)部數(shù)據(jù)源。
二是擴(kuò)大國庫統(tǒng)計(jì)分析數(shù)據(jù)源。最重要的是打通各級(jí)政府及其下屬各部門之間的數(shù)據(jù)傳輸通道,實(shí)現(xiàn)政府辦公、工商行政、招商引資、外貿(mào)出口、仲裁訴訟等政府活動(dòng)所產(chǎn)生的數(shù)據(jù)接入共享。其次是實(shí)現(xiàn)一行三會(huì)、商業(yè)銀行、行業(yè)協(xié)會(huì)、企業(yè)實(shí)體等生產(chǎn)運(yùn)營數(shù)據(jù)的持續(xù)傳輸和報(bào)送。最后是互聯(lián)網(wǎng)數(shù)據(jù),互聯(lián)網(wǎng)是大數(shù)據(jù)的重要載體,也是數(shù)據(jù)收集的快捷途徑,通過各類互聯(lián)網(wǎng)平臺(tái),門戶以及行業(yè)網(wǎng)站,可以收集海量數(shù)據(jù)來增加國庫統(tǒng)計(jì)分析領(lǐng)域數(shù)據(jù)采集的前置性和時(shí)效性。
(二)數(shù)據(jù)采集與存儲(chǔ):軟件與硬件結(jié)合
大數(shù)據(jù)的應(yīng)用中,由于數(shù)據(jù)來源非常廣泛且類型多樣化,需要存儲(chǔ)和分析挖掘的數(shù)據(jù)量也是十分龐大的,因此數(shù)據(jù)展現(xiàn)和處理的高效性以及可用性十分重要。因而,大數(shù)據(jù)的收集和存儲(chǔ)應(yīng)當(dāng)通過先進(jìn)的計(jì)算機(jī)技術(shù)自動(dòng)實(shí)現(xiàn),并結(jié)合線下需求采取人工收集等傳統(tǒng)方法,以補(bǔ)足系統(tǒng)無法收集的數(shù)據(jù)的遺漏。國庫統(tǒng)計(jì)分析數(shù)據(jù)的采集應(yīng)當(dāng)在國庫大數(shù)據(jù)資源池基礎(chǔ)上,通過構(gòu)建云計(jì)算應(yīng)用平臺(tái),統(tǒng)籌整合各直屬國庫大量分散的數(shù)據(jù)和軟硬件資源,通過應(yīng)用云計(jì)算平臺(tái)的資源和功能,以提升和優(yōu)化整體效能,從而實(shí)現(xiàn)全國國庫統(tǒng)計(jì)分析的大集成、大整合以及大應(yīng)用。對(duì)于其他橫向聯(lián)網(wǎng)數(shù)據(jù),比如一些保密性較強(qiáng)的科學(xué)研究數(shù)據(jù)和企業(yè)生產(chǎn)經(jīng)營數(shù)據(jù),則可以與研究機(jī)構(gòu)和企業(yè)建立合作關(guān)系,使用特定系統(tǒng)接口等相關(guān)方式采集數(shù)據(jù)。
在數(shù)據(jù)存儲(chǔ)方面,在通過完善的物理存儲(chǔ)技術(shù)和云計(jì)算平臺(tái)等軟硬件設(shè)施的基礎(chǔ)上,按國庫統(tǒng)計(jì)層級(jí)建立分級(jí)倉儲(chǔ)式數(shù)據(jù)中心,以人行總行為總庫,各項(xiàng)業(yè)務(wù)與非業(yè)務(wù)數(shù)據(jù)達(dá)到匯總存儲(chǔ),各級(jí)行通過內(nèi)部接口或云計(jì)算平臺(tái)實(shí)現(xiàn)數(shù)據(jù)上傳下載,同時(shí)本級(jí)行建立分中心數(shù)據(jù)存儲(chǔ)倉,采集本級(jí)區(qū)域內(nèi)縱向和橫向數(shù)據(jù)并存儲(chǔ)。同時(shí)按照保密和信息安全等要求,實(shí)施分級(jí)授權(quán)和設(shè)置防火墻、實(shí)時(shí)加密存儲(chǔ)數(shù)據(jù)和卷標(biāo)存儲(chǔ)加密等技術(shù)。
(三)數(shù)據(jù)清洗與結(jié)構(gòu)化處理
國庫海量的、不規(guī)則的數(shù)據(jù)無法提供有效決策支持,只有通過數(shù)據(jù)清洗技術(shù)將大數(shù)據(jù)轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化和規(guī)則化的數(shù)據(jù),才能體現(xiàn)大數(shù)據(jù)價(jià)值。數(shù)據(jù)清洗包括檢查數(shù)據(jù)一致性,處理無效值和缺失值等,是發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識(shí)別的錯(cuò)誤的最后一道程序。經(jīng)過數(shù)據(jù)清洗技術(shù)處理殘缺數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)和重復(fù)數(shù)據(jù)后將有效數(shù)據(jù)寫入數(shù)據(jù)庫。
在國庫大數(shù)據(jù)統(tǒng)計(jì)分析上,通過數(shù)學(xué)知識(shí)(概率、統(tǒng)計(jì)、離散化等)建立合理模型,充分利用和挖掘數(shù)據(jù)內(nèi)容。綜合運(yùn)用開源類和非開源類數(shù)據(jù)分析工具包括R、Python、MATLAB、SPSS、EVIEWS等軟件進(jìn)行數(shù)據(jù)分析。具體實(shí)現(xiàn)統(tǒng)計(jì)分析、數(shù)據(jù)挖掘和模型預(yù)測等功能,并以可視化的結(jié)果予以呈現(xiàn)。統(tǒng)計(jì)分析包含假設(shè)檢驗(yàn)、差異分析、相關(guān)分析、方差分析、回歸分析、logistic回歸分析、因子分析、聚類分析、主成分分析、判別分析、bootstrap技術(shù)等。數(shù)據(jù)挖掘包含相關(guān)性分組或關(guān)聯(lián)規(guī)則、聚類、描述和可視化、復(fù)雜數(shù)據(jù)類型挖掘等。模型預(yù)測包含預(yù)測模型、機(jī)器學(xué)習(xí)、建模仿真等。
在統(tǒng)計(jì)分析過程中,國庫統(tǒng)計(jì)分析應(yīng)該重點(diǎn)實(shí)現(xiàn)云應(yīng)用的創(chuàng)新與共享。統(tǒng)計(jì)人員可以根據(jù)業(yè)務(wù)的新要求,在云平臺(tái)數(shù)據(jù)開放接口的基礎(chǔ)上,自由構(gòu)建合理的數(shù)學(xué)模型和算法,實(shí)現(xiàn)業(yè)務(wù)應(yīng)用的創(chuàng)新和擴(kuò)展。與此同時(shí),以算法的方式將統(tǒng)計(jì)人員的智力成果和業(yè)務(wù)知識(shí)固化,當(dāng)經(jīng)驗(yàn)證為可信任應(yīng)用時(shí),可自動(dòng)進(jìn)入云平臺(tái)的應(yīng)用共享庫,在得到授權(quán)的前提下,自由使用或補(bǔ)充完善,實(shí)現(xiàn)知識(shí)固化、資源共享。
(四)國庫運(yùn)行智能化統(tǒng)計(jì)分析
在云應(yīng)用平臺(tái)上,國庫統(tǒng)計(jì)分析首先要將日、旬、月和年作為數(shù)據(jù)的時(shí)間維度,將國庫收入、國庫支出以及國庫庫存等統(tǒng)計(jì)指標(biāo)作為數(shù)據(jù)的為空間維度,利用云計(jì)算的強(qiáng)大能力,并借助數(shù)據(jù)分析展示工具,預(yù)先計(jì)算處理數(shù)據(jù)。或者根據(jù)用戶事先提交的數(shù)據(jù)挖掘需求自動(dòng)完成相關(guān)數(shù)據(jù)預(yù)處理。統(tǒng)計(jì)分析人員隨時(shí)可以從兩個(gè)維度上深度挖掘數(shù)據(jù),并使用QLikView等數(shù)據(jù)分析工具,實(shí)現(xiàn)統(tǒng)計(jì)大數(shù)據(jù)的多維度、可視化展示。
二是實(shí)現(xiàn)常規(guī)統(tǒng)計(jì)分析的智能化生產(chǎn)。可以通過完善和豐富大數(shù)據(jù)應(yīng)用平臺(tái)的分析功能,實(shí)現(xiàn)機(jī)器式的學(xué)習(xí),輸入必要的參數(shù)后,系統(tǒng)將自動(dòng)計(jì)算數(shù)據(jù),并關(guān)聯(lián)提取大數(shù)據(jù)池中的相關(guān)數(shù)據(jù)和信息,進(jìn)而依據(jù)特定的模板輸出分析報(bào)告,最后由分析人員對(duì)輸出的分析報(bào)告進(jìn)行質(zhì)量把關(guān)和進(jìn)一步的補(bǔ)充完善。
三是構(gòu)建統(tǒng)計(jì)分析數(shù)據(jù)模型,提高預(yù)警預(yù)測水平。不斷進(jìn)行新的分析預(yù)測數(shù)學(xué)模型的探索和構(gòu)建,充分利用國庫統(tǒng)計(jì)大數(shù)據(jù)平臺(tái)上的海量數(shù)據(jù)和動(dòng)態(tài)實(shí)時(shí)數(shù)據(jù),不斷提高預(yù)測水平。
(五)數(shù)據(jù)展示與反饋
以智能化統(tǒng)計(jì)分析為主的大數(shù)據(jù)應(yīng)用技術(shù),為數(shù)據(jù)結(jié)構(gòu)化和可視化的展示提供了支持。簡要國庫運(yùn)行數(shù)據(jù)、系統(tǒng)化運(yùn)行指標(biāo)、國庫資金運(yùn)行報(bào)告、國情和輿情監(jiān)測報(bào)告、企業(yè)和金融服務(wù)報(bào)告、國庫運(yùn)行情況預(yù)測等為中央銀行、各級(jí)政府部門制定有關(guān)政策提供統(tǒng)計(jì)信息和參考依據(jù),充分發(fā)揮國庫在國家預(yù)算執(zhí)行中的促進(jìn)、反映和監(jiān)督作用。同時(shí)建立信息反饋機(jī)制,對(duì)現(xiàn)有統(tǒng)計(jì)分析結(jié)果予以反饋,還包括對(duì)未滿足需求提出反饋,豐富和完善大數(shù)據(jù)應(yīng)用成果,充分發(fā)揮國庫統(tǒng)計(jì)分析應(yīng)用大數(shù)據(jù)的社會(huì)價(jià)值。
綜上所述,從全流程看,大數(shù)據(jù)應(yīng)用自數(shù)據(jù)端建立“”數(shù)據(jù)池“”到處理端智能分析在到應(yīng)用端數(shù)據(jù)展示,大致可以通過下圖(圖1)形象展示:
三、有效提升大數(shù)據(jù)應(yīng)用的政策建議
(一)從制度層面保障大數(shù)據(jù)統(tǒng)計(jì)分析的有效開展
制定專門的大數(shù)據(jù)應(yīng)用法律法規(guī),在由總行統(tǒng)一部署、統(tǒng)一實(shí)施的基礎(chǔ)上,各地區(qū)分支機(jī)構(gòu)結(jié)合當(dāng)?shù)貙?shí)際制定特色大數(shù)據(jù)應(yīng)用和發(fā)展規(guī)章制度。從數(shù)據(jù)產(chǎn)生、采集、存儲(chǔ)、挖掘和應(yīng)用等大數(shù)據(jù)處理全流程做出明確安排。一是通過總行層面的發(fā)文、通知等鼓勵(lì)通過大數(shù)據(jù)方法加強(qiáng)國庫統(tǒng)計(jì)分析,建設(shè)大數(shù)據(jù)共享和應(yīng)用平臺(tái);二是強(qiáng)化大數(shù)據(jù)統(tǒng)計(jì)所需軟硬件采購、數(shù)據(jù)源互聯(lián)互通及模塊化分割等作出具體安排;三是要求大數(shù)據(jù)應(yīng)用所應(yīng)達(dá)到的在信息、統(tǒng)計(jì)報(bào)告、預(yù)測與預(yù)警等功能上的目標(biāo)和績效予以明確,充分利用大數(shù)據(jù)平臺(tái)提供統(tǒng)計(jì)分析支持;四是強(qiáng)化信息技術(shù)安全,防止信息泄露、網(wǎng)絡(luò)攻擊、系統(tǒng)失靈等問題,明確應(yīng)急處置方案。做到嚴(yán)格立法,有法可依,有章可循。
(二)加大基礎(chǔ)設(shè)施建設(shè)和人才投入,滿足大數(shù)據(jù)應(yīng)用的軟硬件要求
大數(shù)據(jù)基礎(chǔ)設(shè)施可分為硬件和軟件兩類。硬基礎(chǔ)設(shè)施主要包括用于收集、存儲(chǔ)、分析和應(yīng)用大數(shù)據(jù)的信息化系統(tǒng)架構(gòu);軟件基礎(chǔ)設(shè)施主要包括各類數(shù)據(jù)信息、數(shù)據(jù)挖掘和大數(shù)據(jù)應(yīng)用專業(yè)軟件以及金融企業(yè)的人力資源。人民銀行應(yīng)通過專項(xiàng)資金投入等方式構(gòu)建大數(shù)據(jù)應(yīng)用的軟硬件設(shè)施和和培養(yǎng)專業(yè)人才,并通過持續(xù)培訓(xùn)使全體員工了解并使用大數(shù)據(jù)進(jìn)行國庫統(tǒng)計(jì)分析。也可邀請(qǐng)專業(yè)的大數(shù)據(jù)解決方案服務(wù)商作為咨詢顧問,整合國庫不同生產(chǎn)系統(tǒng)數(shù)據(jù),優(yōu)化數(shù)據(jù)應(yīng)用行為,加快統(tǒng)計(jì)系統(tǒng)建設(shè)步伐。
(三)提高大數(shù)據(jù)管理和應(yīng)用能力
國庫統(tǒng)計(jì)分析應(yīng)不斷的加強(qiáng)國庫運(yùn)行數(shù)據(jù)的采集、儲(chǔ)存、保護(hù)和管理工作,不斷提升統(tǒng)計(jì)分析水平。加強(qiáng)對(duì)國庫統(tǒng)計(jì)分析中涉及的地方債、營改增、房地產(chǎn)、小微企業(yè)經(jīng)營、財(cái)政專戶、盤活庫存等熱點(diǎn)領(lǐng)域可以設(shè)計(jì)建立相應(yīng)跟蹤監(jiān)測指標(biāo)體系。與此同時(shí)加強(qiáng)改革數(shù)據(jù)的統(tǒng)計(jì)制度、方法以及程序,研究大數(shù)據(jù)共享制度,為宏觀經(jīng)濟(jì)分析提供便捷、堅(jiān)實(shí)的大數(shù)據(jù)基礎(chǔ)。
建立國庫大數(shù)據(jù)分析應(yīng)用機(jī)制是新形勢下的當(dāng)務(wù)之急。國庫統(tǒng)計(jì)分析需不斷改革創(chuàng)新,強(qiáng)化大數(shù)據(jù)的思維,提高大數(shù)據(jù)的意識(shí)和駕馭大數(shù)據(jù)的能力,積極探索新的大數(shù)據(jù)應(yīng)用方法和途徑,從而在國家宏觀決策、服務(wù)經(jīng)濟(jì)社會(huì)發(fā)展、服務(wù)國庫管理方面,進(jìn)一步提升國庫統(tǒng)計(jì)分析服務(wù)的能力和水平。
參考文獻(xiàn):
[1]沈昱池.大數(shù)據(jù)時(shí)代我國財(cái)政信息共享的思考[J].地方財(cái)政研究,2015(11):47-67
[2]陳健慧,趙昕.國庫統(tǒng)計(jì)分析數(shù)據(jù)集中系統(tǒng)建設(shè)[J].金融電子化,2010,03:89-90
【關(guān)鍵詞】SG-186;Hadoop;大數(shù)據(jù)分析
引言
在電網(wǎng)智能化、信息化飛速發(fā)展的今天,以SG-186為核心的數(shù)百個(gè)各類系統(tǒng)已經(jīng)滲入電力生產(chǎn)、經(jīng)營、管理等各個(gè)角落。系統(tǒng)運(yùn)行的可靠性直接影響電力可靠性及公司的社會(huì)形象,系統(tǒng)的各類數(shù)據(jù)也都直接反映了公司經(jīng)營業(yè)績及發(fā)展現(xiàn)狀。信息系統(tǒng)后臺(tái)日志數(shù)據(jù)規(guī)模急速增大,傳統(tǒng)的單機(jī)式數(shù)據(jù)庫模式在各類系統(tǒng)復(fù)雜的數(shù)據(jù)分析診斷中已經(jīng)越顯乏力,本文運(yùn)用Hadoop平臺(tái)及相關(guān)技術(shù),提供了一款基于Hadoop的大數(shù)據(jù)分析解決方案。通過在服務(wù)器上的運(yùn)作,可以對(duì)大規(guī)模日志進(jìn)行分析,并自動(dòng)生成圖表進(jìn)行展示,從而可以非常直觀的觀察各項(xiàng)用戶數(shù)據(jù)。
1.技術(shù)背景
Hadoop是一個(gè)高效的、非常可靠的并且可擴(kuò)展性很強(qiáng)的的分布式軟件開發(fā)框架,它的優(yōu)勢在于能在相對(duì)較短的時(shí)間內(nèi)接受并且完成大量的數(shù)據(jù)處理任務(wù)。運(yùn)用Hadoop框架進(jìn)行開發(fā),開發(fā)者可以通過自己開發(fā)編寫的Map/Reduce來進(jìn)行大數(shù)據(jù)分析處理。通過更改相應(yīng)的配置文件,數(shù)個(gè)甚至更多的副本數(shù)據(jù)可以通過Hadoop保存下來,這樣的設(shè)計(jì)可以使得Hadoop更加的可靠。因?yàn)榧词鼓骋粋€(gè)集群中的Hadoop節(jié)點(diǎn)出錯(cuò),其也可以通過HDFS,即數(shù)據(jù)塊副本來完成數(shù)據(jù)處理任務(wù)。因?yàn)镠adoop框架可以在非常寬泛的范圍內(nèi)進(jìn)行擴(kuò)展,所以其可以處理海量的數(shù)據(jù),其數(shù)據(jù)規(guī)模普遍可以達(dá)到TB的數(shù)量級(jí),在某些情況下還可以突破PB的數(shù)量級(jí)。Hadoop進(jìn)行數(shù)據(jù)處理的時(shí)候,其運(yùn)行速度是非常迅速的,并且在處理過程中,開發(fā)者可以不用了解或研究其系統(tǒng)底層的實(shí)現(xiàn)過程就可以完成發(fā)任務(wù)。
Hadoop的相關(guān)系統(tǒng):Hadoop分布式系統(tǒng)(HDFS)包含了許多元素,文件系統(tǒng)存儲(chǔ)在群集節(jié)點(diǎn)上的文件。HDFS上層的Map/Reduce程序框架引擎,包含了工作跟蹤和任務(wù)的跟蹤。
2.大數(shù)據(jù)分析解決方案
2.1 系統(tǒng)日志數(shù)據(jù)預(yù)處理
確定了系統(tǒng)對(duì)數(shù)據(jù)的需求之后,就可以對(duì)日志進(jìn)行預(yù)處理了。通過對(duì)用戶日志的UID訪問,獲取每個(gè)日志的基本數(shù)據(jù)。然后逐個(gè)讀取各項(xiàng)數(shù)據(jù),分別確認(rèn)是否屬于系統(tǒng)所需的日志數(shù)據(jù)類型。如果是,則保留在系統(tǒng)平臺(tái)內(nèi);如果不是,則刪除其數(shù)據(jù)。為了獲取用戶的各種信息,我們需要對(duì)用戶訪問系統(tǒng)所遺留下來的日志進(jìn)行嚴(yán)格的分析。其中,非常關(guān)鍵的問題在于,在運(yùn)用本文所設(shè)計(jì)的基于Hadoop的海量數(shù)據(jù)分析系統(tǒng)對(duì)日志進(jìn)行分析之前,盡可能的對(duì)日志進(jìn)行簡化,即去除一些無關(guān)緊要的數(shù)據(jù)部分,是對(duì)整個(gè)系統(tǒng)的運(yùn)行效率有著重大提升的意義的。
因此,在將日志導(dǎo)入系統(tǒng)進(jìn)行分析之前,我們需要對(duì)日志進(jìn)行預(yù)處理。預(yù)處理有兩個(gè)目的:一是去掉日志中部分系統(tǒng)不關(guān)心的數(shù)據(jù);二是統(tǒng)一日志格式,在用戶訪問的過程中,其生成的格式有可能會(huì)因?yàn)槠鋪碓辞赖纫蛩氐牟煌瑢?dǎo)致日志整體架構(gòu)不一致,如果不統(tǒng)一日志的格式,直接導(dǎo)入系統(tǒng)進(jìn)行處理,那么將會(huì)有大量的系統(tǒng)資源被浪費(fèi)在無用的處理過程中。
2.2 生成最小粒度數(shù)據(jù)的實(shí)現(xiàn)
根據(jù)從日志的預(yù)處理之后得到的新日志文件數(shù)據(jù),系統(tǒng)將對(duì)海量的數(shù)據(jù)進(jìn)行逐個(gè)肢解的過程,并將其按維度劃分最細(xì)分粒度及流轉(zhuǎn)最細(xì)粒度,生成最細(xì)分粒度數(shù)據(jù)。此步驟的難度在于,日志數(shù)據(jù)極為龐大,單個(gè)日志要?jiǎng)澐殖墒當(dāng)?shù)個(gè)乃至數(shù)十個(gè)的小數(shù)據(jù),其數(shù)量就更為龐大。如何存儲(chǔ)這些最細(xì)分粒度數(shù)據(jù),以便系統(tǒng)后用成了最重要也是最難的問題。
在這個(gè)步驟中,系統(tǒng)將用Hadoop平臺(tái)的Apache Pig來實(shí)現(xiàn)這一過程。Apache Pig是一個(gè)用于分析大型數(shù)據(jù)集的平臺(tái),包括一個(gè)高層次的語言表達(dá)數(shù)據(jù)分析程序來評(píng)估這些方案以及基礎(chǔ)數(shù)據(jù)處理。Pig的突出特性是它們的結(jié)構(gòu)是適合進(jìn)行大量的并行輪流處理,使他們能夠處理非常大的數(shù)據(jù)集。目前,Pig的基礎(chǔ)設(shè)施層由編譯器產(chǎn)生的Map-Reduce計(jì)劃,大規(guī)模并行實(shí)現(xiàn)已經(jīng)存在于序列中。
首先,將后臺(tái)用戶日志導(dǎo)入系統(tǒng)。系統(tǒng)將對(duì)海量數(shù)據(jù)進(jìn)行逐個(gè)肢解的過程,并將其按維度劃分最細(xì)分粒度及流轉(zhuǎn)最細(xì)粒度,形成最細(xì)分粒度數(shù)據(jù),然后存放在Hive中。
在這個(gè)過程中,難點(diǎn)在于日志的數(shù)量大,通常是數(shù)百GB。因此,在此部分,系統(tǒng)將運(yùn)用Apache Pig來實(shí)現(xiàn)對(duì)系統(tǒng)原始日志及特征表的肢解,使其生成最細(xì)分粒度數(shù)據(jù),并將其導(dǎo)入Hive中存放。
首先系統(tǒng)將注冊(cè)各種UDF,以便 展整個(gè)系統(tǒng)流程。然后導(dǎo)入系統(tǒng)后臺(tái)所存儲(chǔ)的用戶訪問電商網(wǎng)站服務(wù)器所留下來的日志數(shù)據(jù),主要是訪問日志,其次是訪問特征碼,特征碼對(duì)于頁面流轉(zhuǎn)的統(tǒng)計(jì)分析是非常重要的。
然后系統(tǒng)將要逐個(gè)地清理原始日志,主要是排除垃圾信息和不完整信息,因?yàn)樵谠恢敬鎯?chǔ)的過程中,不可避免的會(huì)收到一些或有意或無意的垃圾信息的攻擊,這一部分需要提前剔除,以免工作量太大。
2.3 數(shù)據(jù)分析及報(bào)表的實(shí)現(xiàn)
在得到各個(gè)數(shù)據(jù)類型的Hive表之后,系統(tǒng)需要通過Apache Hive來匯總所需細(xì)分粒度數(shù)據(jù)。匯總的方式可以由用戶自行設(shè)定,可以將任意兩種乃至數(shù)種上文中所提到的Hive表進(jìn)行組合匯總,形成新的Hive表。在此步驟中,被劃分成最細(xì)分粒度的數(shù)據(jù)己經(jīng)存放于Hive中。所以,系統(tǒng)將運(yùn)用Apache Hive來將所有最細(xì)分粒度數(shù)據(jù)匯總,使其成為各個(gè)項(xiàng)目單獨(dú)的匯總表文件。從最細(xì)粒度的數(shù)據(jù)統(tǒng)計(jì),現(xiàn)在就有了兩個(gè)乃至多個(gè)Hive表均包含其數(shù)據(jù)內(nèi)容。當(dāng)系統(tǒng)收到上一個(gè)步驟所分析統(tǒng)計(jì)得出的Hive表時(shí),其將通過調(diào)用Apache Hive的各個(gè)接口,使其接收到Hive表中的內(nèi)容,并且通過用戶事先設(shè)定好的數(shù)據(jù)類型匯總方式,將各個(gè)Hive表中的數(shù)據(jù)先逐個(gè)讀取,再將其輸入存放到新的Hive表中。
系統(tǒng)在此部分將通過Hadoop平臺(tái)所提供的接口建立到數(shù)據(jù)庫的鏈接,然后在對(duì)上一節(jié)中所生成的各項(xiàng)Hive表實(shí)施遍歷,逐行逐詞的讀出數(shù)據(jù)表中的每一項(xiàng)數(shù)據(jù),將其存入Mysql中,然后提供一個(gè)前端可用的接口,以方便各種前端客戶連接至Mysql,將數(shù)據(jù)資料讀出并做成可直觀閱讀和分析的系統(tǒng)報(bào)表。
在數(shù)據(jù)存入Mysql之后,系統(tǒng)可以根據(jù)銜接的前端程序的不同,生成各類不同樣式的圖表,可以包括系統(tǒng)到目前為止,儲(chǔ)存在數(shù)據(jù)庫中的全部或者部分?jǐn)?shù)據(jù),供網(wǎng)站分析人員觀察與分析。
3.結(jié)論
目前電力行業(yè)信息發(fā)展所面臨的問題是本論文的重點(diǎn)。首先介紹了選題的背景和意義,然后逐步引入Hadoop技術(shù),特別是在HDFS文件系統(tǒng)方面的,Map/Reduce框架,Hive數(shù)據(jù)倉庫框架介紹的原理和使用,以及作為如何使用Hadoop數(shù)據(jù)處理,來解決這個(gè)問題的。然后,本文介紹了如何充分利用Hadoop的配置設(shè)備,以及內(nèi)置的數(shù)據(jù)倉庫框架,以實(shí)現(xiàn)統(tǒng)計(jì)的需求,并生成直觀的圖表顯示。
因?yàn)镠adoop運(yùn)作過程并非自動(dòng)化的工作形式,可以研究關(guān)于這個(gè)項(xiàng)目的代碼固化下來的可能性,以達(dá)到完成自動(dòng)化功能的目的,僅需要用戶簡單地輸入特定需求的參數(shù),后臺(tái)任務(wù)運(yùn)行這些數(shù)據(jù)使用Hadoop來進(jìn)行數(shù)據(jù)處理,所以面對(duì)數(shù)據(jù)的處理需求,并不需要手動(dòng)啟動(dòng)腳本來運(yùn)行任務(wù)。
參考文獻(xiàn)
[1]MapReduce計(jì)算任務(wù)調(diào)度資源配置優(yōu)化研究.
作者簡介:
【關(guān)鍵詞】分析系統(tǒng);大數(shù)據(jù);時(shí)代;運(yùn)用
一、大數(shù)據(jù)時(shí)代背景
最早提出“大數(shù)據(jù)”時(shí)代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,并成為至關(guān)重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來”。進(jìn)入2014年,“big data”一詞越來越多地被提及,時(shí)代寡頭用它來描述和定義信息爆炸產(chǎn)生的海量數(shù)據(jù),命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。數(shù)據(jù)正在迅速膨脹并變大,它決定著一個(gè)企業(yè)、一個(gè)行業(yè)、一個(gè)領(lǐng)域甚至一個(gè)國家的發(fā)展和未來,雖然很多個(gè)體和部門并沒有意識(shí)到數(shù)據(jù)爆炸性增長所帶來挑戰(zhàn)和機(jī)遇,但隨著時(shí)間的推移,人們將越來越清晰的認(rèn)識(shí)到海量數(shù)據(jù)的重要性,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗(yàn)和直覺。
二、經(jīng)驗(yàn)審計(jì)之弊端
本課題以具有大數(shù)據(jù)特征的人民銀行國庫核算業(yè)務(wù)為切入點(diǎn),分別從審計(jì)抽樣、線索發(fā)現(xiàn)、問題定性等多方面、深層次加以分析,顯現(xiàn)經(jīng)驗(yàn)審計(jì)之特點(diǎn)。為保證分析數(shù)據(jù)的科學(xué)性、連續(xù)性和邏輯性,課題組抽取了人民銀行某地市中心支行2008至2013年期間,甲、乙、丙3名審計(jì)人員對(duì)國庫核算業(yè)務(wù)審計(jì)資料,對(duì)比如下:甲審計(jì)員分別于2008年、2009年、2011年和2012年參加了對(duì)4家縣支行國庫核算業(yè)務(wù)審計(jì),其中審計(jì)資料調(diào)閱重合度98.7%,線索追溯重合度95.4%,問題定性重合度98.4%,而審計(jì)方案覆蓋率只有63.2%。乙審計(jì)員于2009年、2010年和2012年參加了對(duì)3家縣支行國庫核算業(yè)務(wù)審計(jì),資料調(diào)閱重合度96.8%,線索追溯重合度95.3%,問題定性重合度97.9%,審計(jì)方案覆蓋率為67.1%。丙審計(jì)員于2008年、2012年和2013年參加了對(duì)3家縣支行國庫核算業(yè)務(wù)審計(jì),資料調(diào)閱重合度94.5%,線索追溯重合度96.4%,問題定性重合度97.2%,審計(jì)方案覆蓋率為72.3%。
三、分析審計(jì)系統(tǒng)的優(yōu)勢
隨著人民銀行業(yè)務(wù)信息化進(jìn)程的不斷加快和數(shù)據(jù)大集中趨勢的愈加明顯,經(jīng)驗(yàn)審計(jì)已無法滿足基于風(fēng)險(xiǎn)控制的管理要求。為順應(yīng)內(nèi)部審計(jì)工作發(fā)展,推動(dòng)內(nèi)審轉(zhuǎn)型成果的有效運(yùn)用,人行寶雞中支積極探索應(yīng)用計(jì)算機(jī)輔助審計(jì)系統(tǒng)(分析審計(jì)系統(tǒng))開展大數(shù)據(jù)環(huán)境下的審計(jì)工作。2014年,寶雞中支通過輔助審計(jì)系統(tǒng)對(duì)國庫核算業(yè)務(wù)數(shù)據(jù)進(jìn)行非現(xiàn)場查閱,重點(diǎn)運(yùn)行“重要空白憑證領(lǐng)用情況”、“重要空白憑證跳號(hào)使用”、“預(yù)算執(zhí)行情況分析”、“退庫原因分析”、“支付方式退庫原因明細(xì)查詢”、“查復(fù)不及時(shí)”、“通過暫收款重?fù)堋薄ⅰ案@髽I(yè)增值稅退稅”、“財(cái)政專戶分析”、“大額貸記退匯支付業(yè)務(wù)”、“大額實(shí)撥資金業(yè)務(wù)分析”、“國庫內(nèi)部往來”、“會(huì)計(jì)主管授權(quán)日志分析”、“集中支付支出情況分析”等32個(gè)固化審計(jì)模型,完成了對(duì)3家縣支行國庫核算業(yè)務(wù)的全面覆蓋,篩選提取重點(diǎn)關(guān)注數(shù)據(jù)1098條,現(xiàn)場審計(jì)核實(shí)風(fēng)險(xiǎn)隱患16類,共計(jì)37條,并實(shí)現(xiàn)了對(duì)審計(jì)方案的全面覆蓋。
計(jì)算機(jī)輔助審計(jì)系統(tǒng)的有效運(yùn)用一改傳統(tǒng)盲目、經(jīng)驗(yàn)的審計(jì)抽樣方式,實(shí)現(xiàn)了審計(jì)范圍的全面排查,最大限度的在海量數(shù)據(jù)中發(fā)現(xiàn)國庫業(yè)務(wù)存在的薄弱環(huán)節(jié),使審計(jì)工作方向明確、有備而來,審計(jì)疑點(diǎn)準(zhǔn)確鎖定、精確打擊,大大節(jié)約了現(xiàn)場檢查資源,降低了審計(jì)成本,提高了審計(jì)質(zhì)量,改善了審計(jì)效果。
四、成果展示
2014年8月,寶雞中支成立審計(jì)組進(jìn)駐轄區(qū)某縣支行,利用計(jì)算機(jī)輔助審計(jì)系統(tǒng)開展對(duì)縣級(jí)國庫核算系統(tǒng)專項(xiàng)審計(jì),取得較好效果。
1.全面數(shù)據(jù)分析,篩選疑點(diǎn)線索
審前準(zhǔn)備階段,審計(jì)人員利用輔助審計(jì)系統(tǒng)非現(xiàn)場抽調(diào)了支行2013年至審計(jì)日的國庫核算數(shù)據(jù),根據(jù)數(shù)據(jù)分析組件對(duì)數(shù)據(jù)進(jìn)行加工、篩選和比對(duì)。重點(diǎn)篩查了“重要空白憑證領(lǐng)用情況”、“重要空白憑證跳號(hào)使用”、“預(yù)算執(zhí)行情況分析”、“退庫原因分析”、“支付方式退庫原因明細(xì)查詢”、“查復(fù)不及時(shí)”等固化審計(jì)模型,初步篩選出需現(xiàn)場確認(rèn)的可疑記錄711條,按照風(fēng)險(xiǎn)類別整理導(dǎo)出文件32個(gè)。
2.強(qiáng)化疑點(diǎn)核實(shí),核對(duì)憑證記錄
現(xiàn)場審計(jì)階段,針對(duì)審前提取的疑點(diǎn)信息,審計(jì)組有的放矢,調(diào)取疑點(diǎn)信息發(fā)生日及相鄰日期的傳票及賬簿憑證,現(xiàn)場核對(duì)、深入挖掘、揭示風(fēng)險(xiǎn)。經(jīng)核實(shí)后確認(rèn)支行國庫核算存在“福利企業(yè)退稅監(jiān)督不嚴(yán)”、“財(cái)政專戶撥款審核不嚴(yán)”、“國庫直接支付預(yù)算支出科目審核不嚴(yán)”、“預(yù)算單位國庫集中支付覆蓋率較低”、“對(duì)賬制度執(zhí)行不到位”等重要風(fēng)險(xiǎn)13個(gè),涉及業(yè)務(wù)風(fēng)險(xiǎn)10類,迅速實(shí)現(xiàn)了對(duì)疑點(diǎn)問題的精確定性,起到了精確鎖定,凸顯風(fēng)險(xiǎn),抓手明確,改善管理的審計(jì)目的。
【關(guān)鍵詞】統(tǒng)計(jì)學(xué);管理現(xiàn)狀;優(yōu)化策略;模式創(chuàng)新
【中圖分類號(hào)】C81【文獻(xiàn)標(biāo)志碼】A【文章編號(hào)】1673-1069(2020)06-0071-02
1引言
統(tǒng)計(jì)學(xué)作為企業(yè)經(jīng)營管理的重要手段,在企業(yè)經(jīng)營過程中統(tǒng)計(jì)工作是否落實(shí)到位,對(duì)于企業(yè)可持續(xù)發(fā)展目標(biāo)的實(shí)現(xiàn)而言具有重要影響,尤其在當(dāng)前多元化市場競爭環(huán)境下,企業(yè)規(guī)模化發(fā)展雖然推動(dòng)了國民經(jīng)濟(jì)的進(jìn)一步發(fā)展,但與此同時(shí)企業(yè)市場競爭也愈演愈烈,實(shí)現(xiàn)持續(xù)性經(jīng)營,確保統(tǒng)計(jì)學(xué)應(yīng)用效益的最大化,是目前推動(dòng)產(chǎn)業(yè)可持續(xù)發(fā)展的重要戰(zhàn)略基礎(chǔ)。
2大數(shù)據(jù)時(shí)代內(nèi)容的基本概述
簡單來講,所謂的“大數(shù)據(jù)”是指在當(dāng)前信息化產(chǎn)業(yè)時(shí)代背景下,無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是互聯(lián)網(wǎng)公司在日常運(yùn)營中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù),是需要新處理模式才能有效處理的海量、高增長率和多樣化信息資產(chǎn)。隨著近年來信息技術(shù)的不斷發(fā)展和廣泛應(yīng)用,“大數(shù)據(jù)”時(shí)代是“互聯(lián)網(wǎng)+”技術(shù)應(yīng)用下時(shí)代未來發(fā)展的趨勢。就目前來看,與傳統(tǒng)信息數(shù)據(jù)相比,大數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)多元以及數(shù)據(jù)價(jià)值高的顯著特點(diǎn),伴隨城市化、工業(yè)化建設(shè)進(jìn)程的不斷加快,如何有效地對(duì)大數(shù)據(jù)進(jìn)行處理,成為現(xiàn)階段基層產(chǎn)業(yè)結(jié)構(gòu)和相關(guān)主管部門的核心發(fā)展方向,也是促進(jìn)企業(yè)進(jìn)一步發(fā)展的重要基礎(chǔ)。
數(shù)據(jù)實(shí)質(zhì)上是存儲(chǔ)于計(jì)算機(jī)內(nèi)的各種信息集合,在當(dāng)前全球化、市場化不斷發(fā)展的新產(chǎn)業(yè)時(shí)代背景下,商業(yè)模式的巨大轉(zhuǎn)變,在改變?nèi)藗冴P(guān)注度的同時(shí),也為企業(yè)的進(jìn)一步發(fā)展奠定了良好基礎(chǔ),最終為企業(yè)預(yù)期發(fā)展目標(biāo)的實(shí)現(xiàn)創(chuàng)造了良好條件。對(duì)于大數(shù)據(jù)的處理,倘若采取傳統(tǒng)的處理技術(shù),不僅難以達(dá)到預(yù)期的處理目標(biāo),更極易導(dǎo)致一系列其他問題的產(chǎn)生,最終對(duì)企業(yè)整體發(fā)展造成了極為不利的影響,為此在大數(shù)據(jù)發(fā)展的同時(shí),技術(shù)領(lǐng)域也取得了顯著突破,目前常見的管理技術(shù)主要有——數(shù)據(jù)倉庫技術(shù)、數(shù)據(jù)安全技術(shù)、數(shù)據(jù)分析、數(shù)據(jù)挖掘和模型預(yù)測,其中,數(shù)據(jù)分析、數(shù)據(jù)挖掘與大數(shù)據(jù)關(guān)系最為密切。
3新形勢下統(tǒng)計(jì)學(xué)存在的主要問題
3.1企業(yè)對(duì)于統(tǒng)計(jì)管理工作的重視度不足
在經(jīng)濟(jì)全球化和一體化建設(shè)進(jìn)程不斷加快的新市場經(jīng)濟(jì)常態(tài)下,企業(yè)規(guī)模和數(shù)量的不斷增加,在加劇企業(yè)市場競爭力的同時(shí),如何有效地提升企業(yè)工作質(zhì)量和工作效率是現(xiàn)階段企業(yè)的核心發(fā)展方向,但由于部分企業(yè)受傳統(tǒng)發(fā)展以及管理理念根深蒂固的影響,企業(yè)管理和發(fā)展重心始終集中于企業(yè)經(jīng)濟(jì)效益,忽視了對(duì)統(tǒng)計(jì)管理的關(guān)注度,致使單位在統(tǒng)計(jì)管理工作方面的人力和物力投入不足,各項(xiàng)管理工作受到一定影響的同時(shí),企業(yè)的整體發(fā)展也受到了一定影響。
3.2統(tǒng)計(jì)管理人員自身專業(yè)素養(yǎng)有待提高
統(tǒng)計(jì)管理人員作為統(tǒng)計(jì)管理工作的實(shí)踐者,其自身專業(yè)能力和綜合素養(yǎng)水平的高低,對(duì)于統(tǒng)計(jì)管理工作質(zhì)量和工作效率具有重要影響,但隨著當(dāng)下統(tǒng)計(jì)管理工作量的增加,部分企業(yè)為滿足人員配置需求,不斷地降低人員選拔標(biāo)準(zhǔn),導(dǎo)致聘用人員無論是專業(yè)能力還是綜合素養(yǎng)都有待完善。作為一項(xiàng)專業(yè)、系統(tǒng)的管理工作,統(tǒng)計(jì)管理不僅要求管理人員擁有細(xì)心、踏實(shí)、耐心等基本素質(zhì),還要具備一定的計(jì)算機(jī)操作能力,但隨著企業(yè)規(guī)模和數(shù)量的持續(xù)增加,統(tǒng)計(jì)管理人員身兼數(shù)職、待遇不高等問題的存在,導(dǎo)致管理人員自身專業(yè)能力有所欠缺,業(yè)務(wù)操作等方面也存在一定不足,最終對(duì)統(tǒng)計(jì)管理造成了極為不利的影響。
3.3數(shù)據(jù)庫硬件設(shè)施、設(shè)備不完善
信息化產(chǎn)業(yè)時(shí)代背景下,“互聯(lián)網(wǎng)+”技術(shù)的廣泛應(yīng)用,在便捷人們?nèi)粘I睿岣咂髽I(yè)生產(chǎn)效益的同時(shí),將其應(yīng)用到其他領(lǐng)域中,在一定程度上也為各單位的轉(zhuǎn)型升級(jí)注入了新的發(fā)展動(dòng)力。統(tǒng)計(jì)管理是企業(yè)管理作業(yè)的重要內(nèi)容,在很大程度上數(shù)據(jù)管理庫自身硬件設(shè)施、設(shè)備的完善度對(duì)于統(tǒng)計(jì)管理工作質(zhì)量和效率具有直接影響,但對(duì)于某些偏遠(yuǎn)地區(qū)亦或經(jīng)濟(jì)發(fā)展相對(duì)緩慢的區(qū)域,統(tǒng)計(jì)管理設(shè)備、設(shè)施的落后性在影響現(xiàn)代化科技管理手段應(yīng)用效益的同時(shí),統(tǒng)計(jì)管理作業(yè)也始終未能得到突破性進(jìn)展,企業(yè)發(fā)展也由此受到了一定影響。
4新形勢下統(tǒng)計(jì)管理工作的創(chuàng)新策略探析
4.1加強(qiáng)對(duì)統(tǒng)計(jì)管理重要性的宣傳力度,提高對(duì)統(tǒng)計(jì)管理工作的重視
統(tǒng)計(jì)管理作為企業(yè)管理的重要組成部分,其管理工作質(zhì)量和工作效率對(duì)企業(yè)發(fā)展而言也具有一定影響,而為實(shí)現(xiàn)企業(yè)可持續(xù)發(fā)展的目標(biāo),確保統(tǒng)計(jì)管理工作落實(shí)到實(shí)處是極為必要的。通過上述分析可知,管理人員對(duì)于統(tǒng)計(jì)管理工作的不重視是影響統(tǒng)計(jì)管理工作效益的重要因素,為有效地改善當(dāng)前管理現(xiàn)狀,一方面基層產(chǎn)業(yè)機(jī)構(gòu)需加大對(duì)統(tǒng)計(jì)管理重要性的宣傳力度,在不斷提高人們對(duì)于“統(tǒng)計(jì)學(xué)應(yīng)用效益”高度認(rèn)同的同時(shí),為統(tǒng)計(jì)管理工作的順利開展奠定良好基礎(chǔ)。而另一方面企業(yè)還需加強(qiáng)對(duì)統(tǒng)計(jì)管理工作人員的教育力度,在不斷增強(qiáng)統(tǒng)計(jì)管理人員工作責(zé)任感和使命感的基礎(chǔ)上,為預(yù)期管理目標(biāo)的實(shí)現(xiàn)創(chuàng)造良好條件。
4.2積極和有關(guān)大數(shù)據(jù)公司或機(jī)構(gòu)進(jìn)行合作
要想在大數(shù)據(jù)時(shí)代背景下進(jìn)一步優(yōu)化和提高統(tǒng)計(jì)管理工作,就必須將大數(shù)據(jù)有關(guān)技術(shù)和統(tǒng)計(jì)管理的實(shí)際工作緊密結(jié)合起來,因此必須解放思想,打破行業(yè)限制,積極尋求和有關(guān)大數(shù)據(jù)公司或者機(jī)構(gòu)進(jìn)行合作開發(fā),開發(fā)出真正適合統(tǒng)計(jì)管理工作的大數(shù)據(jù)技術(shù)和工具,大數(shù)據(jù)無法使用單臺(tái)計(jì)算機(jī)進(jìn)行操作和處理,必須采用分布式架構(gòu)技術(shù)等,其也必然和云計(jì)算的有關(guān)分布式處理、云存儲(chǔ)以及虛擬技術(shù)等密不可分,因此統(tǒng)計(jì)管理必須要積極尋求多方合作,積極將大數(shù)據(jù)的有關(guān)技術(shù)引入統(tǒng)計(jì)管理的實(shí)際工作中去。
4.3不斷優(yōu)化和完善統(tǒng)計(jì)管理模式
在當(dāng)前企業(yè)規(guī)模和數(shù)量持續(xù)增加的新產(chǎn)業(yè)時(shí)代背景下,數(shù)據(jù)的形成過程較為煩瑣,且數(shù)量也較為龐大,為從根本上有效提高管理的科學(xué)性、高效性和有效性,不斷地優(yōu)化統(tǒng)計(jì)管理模式和管理手段也是極為必要的。通過大量調(diào)研數(shù)據(jù)分析可知,在進(jìn)行統(tǒng)計(jì)管理過程中,信息技術(shù)的不斷發(fā)展和傳播渠道的日趨增多,在很大程度上為企業(yè)統(tǒng)計(jì)管理創(chuàng)造了良好條件,但由于部分企業(yè)在計(jì)算機(jī)信息技術(shù)應(yīng)用過程中,未將現(xiàn)代化技術(shù)應(yīng)用到電子統(tǒng)計(jì)管理中,導(dǎo)致管理信息化水平較低的同時(shí),預(yù)期管理目標(biāo)也難以實(shí)現(xiàn),為有效地解決上述問題,將數(shù)據(jù)信息化納入到工作日程中,為單位的數(shù)據(jù)管理部門配置專門的信息化設(shè)備,是現(xiàn)階段提高統(tǒng)計(jì)管理信息化水平,促進(jìn)企業(yè)進(jìn)一步發(fā)展的重要戰(zhàn)略手段。
4.4將各項(xiàng)統(tǒng)計(jì)管理工作細(xì)節(jié)落實(shí)到位
在統(tǒng)計(jì)管理作業(yè)過程中,從根本上有效地提高企業(yè)的經(jīng)濟(jì)效益、確保各項(xiàng)統(tǒng)計(jì)工作細(xì)節(jié)落實(shí)到位也是現(xiàn)階段基層產(chǎn)業(yè)機(jī)構(gòu)和相關(guān)主管部門的重要工作內(nèi)容,換言之,在當(dāng)前多元化市場競爭環(huán)境下,要想從根本上提升統(tǒng)計(jì)管理工作質(zhì)量,提高企業(yè)整體的經(jīng)濟(jì)效益,以會(huì)計(jì)管理工作為中心,確保各項(xiàng)細(xì)節(jié)管理工作落實(shí)到位是十分必要的。要想確保管理工作效益的最大化發(fā)揮,提升企業(yè)經(jīng)濟(jì)效益,企業(yè)需將會(huì)計(jì)的發(fā)展目標(biāo)與企業(yè)的發(fā)展方向相結(jié)合,在確保兩者“統(tǒng)一性”的基礎(chǔ)上,以會(huì)計(jì)管理工作為中心對(duì)企業(yè)經(jīng)營進(jìn)行系統(tǒng)化管理,最終為企業(yè)可持續(xù)發(fā)展目標(biāo)的實(shí)現(xiàn)奠定良好基礎(chǔ)。
4.5確保預(yù)算統(tǒng)計(jì)管理工作落實(shí)到位
在當(dāng)前企業(yè)經(jīng)濟(jì)收支管理過程中,預(yù)算統(tǒng)計(jì)管理工作流于形式是影響精細(xì)化管理效率的重要因素,而為從根本上有效地解決上述問題,確保全面預(yù)算統(tǒng)計(jì)管理工作落實(shí)到位,是現(xiàn)階段企業(yè)經(jīng)濟(jì)運(yùn)行精細(xì)化管理目標(biāo)實(shí)現(xiàn)的重要基礎(chǔ)和根本前提。作為企業(yè)經(jīng)濟(jì)運(yùn)行精細(xì)化管理的重要環(huán)節(jié),全面預(yù)算統(tǒng)計(jì)管理作業(yè)的開展不僅能確保企業(yè)達(dá)成預(yù)期的戰(zhàn)略目標(biāo),其在科學(xué)預(yù)測企業(yè)未來運(yùn)營狀況、協(xié)調(diào)內(nèi)部資源以及控制內(nèi)部預(yù)算編制等方面都發(fā)揮了重要作用。因此,在進(jìn)行預(yù)算統(tǒng)計(jì)管理過程中,企業(yè)統(tǒng)計(jì)管理部門工作人員需摒棄傳統(tǒng)管理理念,在做好日常收支管理的基礎(chǔ)上,還要確保內(nèi)部全范圍、全過程及所有資產(chǎn)的預(yù)算統(tǒng)計(jì)管理落實(shí)到位,由此在保障全面預(yù)算作業(yè)有序開展的同時(shí),提升企業(yè)在多元化市場中的競爭優(yōu)勢。
【 關(guān)鍵詞 】 大數(shù)據(jù);數(shù)據(jù)庫;安全;風(fēng)險(xiǎn)評(píng)估
Big Data Era Database Information System Security Risk Assessment Technical Analysis
Zeng Jian-guo
(Xinhua News Agency Beijing 100070)
【 Abstract 】 The rapid development of multimedia computer and Internet technology makes human society entered the era of big data, massive data resources for people's work, life and learning convenience. Era of big data database information system is the foundation to support the development of human information. Therefore, the security of database information system has an important role. The information work events based on the author's many years, detailed analysis the face database information system security risk, and discusses the risk evaluation technology, in order to be able to database information security defense system and lay a solid foundation.
【 Keywords 】 big data; database; security; risk assessment
1 引言
大數(shù)據(jù)給人們的工作、生活和學(xué)習(xí)帶來了極大的便利,提高了人們的生活質(zhì)量、工作效率和學(xué)習(xí)成效,具有重要的作用。數(shù)據(jù)庫是承載互聯(lián)網(wǎng)大數(shù)據(jù)的存儲(chǔ)器,是為人們提供數(shù)據(jù)信息的基礎(chǔ),因此數(shù)據(jù)庫在大數(shù)據(jù)時(shí)代具有重要的作用。面對(duì)日益增長的海量數(shù)據(jù)信息資源以及豐富的互聯(lián)網(wǎng)應(yīng)用軟件,大數(shù)據(jù)時(shí)代數(shù)據(jù)庫信息系統(tǒng)的安全風(fēng)險(xiǎn)呈現(xiàn)多樣化、智能化、傳播迅速化特點(diǎn)。許多計(jì)算機(jī)學(xué)者將數(shù)據(jù)庫安全風(fēng)險(xiǎn)評(píng)估、安全防御作為數(shù)據(jù)庫未來發(fā)展的重要方向之一。計(jì)算機(jī)學(xué)者經(jīng)過多年的研究,已經(jīng)提出了許多風(fēng)險(xiǎn)評(píng)估技術(shù),比如基于灰色理論、基于專家系統(tǒng)、基于神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)挖掘算法等,有效地提高了數(shù)據(jù)庫信息系統(tǒng)安全風(fēng)險(xiǎn)評(píng)估的準(zhǔn)確程度,快速地發(fā)現(xiàn)數(shù)據(jù)庫存在的安全漏洞,及時(shí)打補(bǔ)丁和構(gòu)建防御系統(tǒng),為大數(shù)據(jù)的應(yīng)用保駕護(hù)航。
2 大數(shù)據(jù)時(shí)代數(shù)據(jù)庫信息系統(tǒng)面臨的安全風(fēng)險(xiǎn)
大數(shù)據(jù)時(shí)代數(shù)據(jù)庫信息系統(tǒng)面臨的安全風(fēng)險(xiǎn)包括多種,比如木馬、病毒和黑客攻擊,并且存在安全攻擊形式和渠道多樣化、數(shù)據(jù)庫信息系統(tǒng)漏洞快速增長、安全威脅智能化等特點(diǎn)。
2.1 安全攻擊形式和渠道多樣化
數(shù)據(jù)庫信息系統(tǒng)為大數(shù)據(jù)應(yīng)用提供基礎(chǔ)支撐。云計(jì)算、分布式計(jì)算、移動(dòng)計(jì)算等技術(shù)的快速發(fā)展和進(jìn)步,為大數(shù)據(jù)應(yīng)用軟件接入數(shù)據(jù)庫信息系統(tǒng)提供了豐富的渠道,為人們應(yīng)用大數(shù)據(jù)資源的同時(shí)帶來了潛在的攻擊,并且使得攻擊形式和渠道呈現(xiàn)多樣化特點(diǎn)。安全攻擊可以采用應(yīng)用軟件接入端口、郵件傳輸端口、數(shù)據(jù)采集端口等攻入數(shù)據(jù)信息系統(tǒng),并且攻擊形式除了木馬、病毒和黑客之外,還采取了拒絕服務(wù)、斷網(wǎng)等形式。
2.2 數(shù)據(jù)庫信息系統(tǒng)漏洞快速增長
大數(shù)據(jù)為人們提供了豐富的數(shù)據(jù)資源,促進(jìn)許多軟件開發(fā)商設(shè)計(jì)與實(shí)現(xiàn)適于人們需求的應(yīng)用程序,以便存取數(shù)據(jù)資源,提供不同種類的應(yīng)用。應(yīng)用軟件開發(fā)過程中,采用的系統(tǒng)架構(gòu)、實(shí)現(xiàn)技術(shù)、接入數(shù)據(jù)庫端口不同,因此導(dǎo)致數(shù)據(jù)庫信息系統(tǒng)面臨著多種存取模式,比如離線存取、在線存取、斷點(diǎn)續(xù)傳等,使得數(shù)據(jù)庫信息系統(tǒng)漏洞在應(yīng)用中不斷的上升,為數(shù)據(jù)庫信息系統(tǒng)的防護(hù)帶來了潛在威脅。
2.3 數(shù)據(jù)庫信息系統(tǒng)安全威脅智能化
隨著計(jì)算機(jī)技術(shù)的快速提升,網(wǎng)絡(luò)中傳播的木馬、病毒和黑客攻擊也得到迅速提升,呈現(xiàn)出智能化的特點(diǎn),潛藏的時(shí)間更長,傳播速度更快,感染范圍也更加廣泛,更加難以被風(fēng)險(xiǎn)評(píng)估技術(shù)、安全防御技術(shù)掃描到,一旦爆發(fā)將會(huì)給數(shù)據(jù)庫信息系統(tǒng)帶來嚴(yán)重的影響。
3 大數(shù)據(jù)時(shí)代數(shù)據(jù)庫信息系統(tǒng)風(fēng)險(xiǎn)評(píng)估技術(shù)
數(shù)據(jù)庫信息系統(tǒng)可以為大數(shù)據(jù)時(shí)代提供數(shù)據(jù)來源,豐富應(yīng)用系統(tǒng)功能。數(shù)據(jù)庫信息系統(tǒng)需要為用戶提供強(qiáng)大的安全風(fēng)險(xiǎn)評(píng)估技術(shù),以便能夠確保數(shù)據(jù)庫信息系統(tǒng)的安全。目前,許多計(jì)算機(jī)學(xué)者經(jīng)過多年的研究,數(shù)據(jù)庫信息系統(tǒng)風(fēng)險(xiǎn)評(píng)估技術(shù)包括安全檢查表法、專家評(píng)價(jià)法、事故樹分析法、層次分析方法。
(1)安全檢查表法。安全檢查表法可以指定詳細(xì)的數(shù)據(jù)庫風(fēng)險(xiǎn)評(píng)估規(guī)范、評(píng)估內(nèi)容,邀請(qǐng)經(jīng)驗(yàn)較為豐富的安全風(fēng)險(xiǎn)評(píng)估專家根據(jù)安全檢查表逐項(xiàng)進(jìn)行評(píng)估,及時(shí)發(fā)現(xiàn)數(shù)據(jù)庫信息系統(tǒng)存在的風(fēng)險(xiǎn)。
(2)專家評(píng)估法。專家評(píng)估方法可以根據(jù)數(shù)據(jù)庫信息系統(tǒng)過去、現(xiàn)在運(yùn)行的情況,參考風(fēng)險(xiǎn)評(píng)估標(biāo)準(zhǔn)和準(zhǔn)則,預(yù)測數(shù)據(jù)庫信息系統(tǒng)未來的安全趨勢,專家評(píng)估過程中,主要采取專家審議法和專家質(zhì)疑法兩種措施,都可以有效的進(jìn)行風(fēng)險(xiǎn)分析和評(píng)估。
(3)事故樹分析方法。事故樹分析方法本質(zhì)是一種信息系統(tǒng)風(fēng)險(xiǎn)演繹分析方法,通過分析數(shù)據(jù)庫信息系統(tǒng)組成部分之間的邏輯關(guān)系,以便能夠明確安全事故發(fā)生的基本原因,事故樹分析方法能夠識(shí)別誘發(fā)安全事故的基本風(fēng)險(xiǎn)元素。
(4)層次分析方法。層次分析方法可以自頂向下將組成數(shù)據(jù)庫信息系統(tǒng)的軟硬件資源劃分不同的層次,形成一個(gè)層次模型,并且按照風(fēng)險(xiǎn)可能發(fā)生的概率進(jìn)行優(yōu)化和組織,最終識(shí)別風(fēng)險(xiǎn)發(fā)生可能較大的資源。
安全檢查表法、專家評(píng)估法、事故樹分析方法屬于定性風(fēng)險(xiǎn)評(píng)估,其需要依賴數(shù)據(jù)庫信息系統(tǒng)安全評(píng)估人員的風(fēng)險(xiǎn)分析經(jīng)驗(yàn),結(jié)合風(fēng)險(xiǎn)評(píng)估標(biāo)準(zhǔn)和類似案例等,評(píng)估數(shù)據(jù)庫信息系統(tǒng)的風(fēng)險(xiǎn)分級(jí),風(fēng)險(xiǎn)評(píng)估結(jié)果具有很強(qiáng)的個(gè)人主觀性。層次分析方法屬于定量分析方法,其可以確定威脅事件發(fā)生的概率,確定威脅發(fā)生后對(duì)系統(tǒng)引起的損失,定量分析可以更加準(zhǔn)確的、直觀的描述系統(tǒng)的風(fēng)險(xiǎn)級(jí)別,獲取更好的風(fēng)險(xiǎn)分析結(jié)果,更具有客觀性,因此逐漸成為風(fēng)險(xiǎn)分析和評(píng)估的主流方法。
4 結(jié)束語
數(shù)據(jù)庫信息系統(tǒng)安全風(fēng)險(xiǎn)評(píng)估可以有效地發(fā)現(xiàn)存儲(chǔ)系統(tǒng)存在的安全漏洞,并且定量計(jì)算風(fēng)險(xiǎn)發(fā)生的可能性和帶來的嚴(yán)重影響,以便制定完善的安全防御策略,保證數(shù)據(jù)庫信息系統(tǒng)正常運(yùn)行。
參考文獻(xiàn)
[1] 文偉平, 郭榮華, 孟正等.信息安全風(fēng)險(xiǎn)評(píng)估關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[J].信息網(wǎng)絡(luò)安全, 2015, 31(2):145-146.
[2] 李剛. Microsoft SQL Server數(shù)據(jù)庫風(fēng)險(xiǎn)分析與建議[J].信息安全與技術(shù), 2014, 32(8):55-57.
[3] 西米莎.基于大數(shù)據(jù)背景的數(shù)據(jù)庫安全問題與保障體系分析[J]. 數(shù)字化用戶, 2014, 34(18):89-90.
[4] 李靖.網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估關(guān)鍵技術(shù)研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用, 2014, 28(5):82-82.
【關(guān)鍵詞】大地控制測量數(shù)據(jù)庫數(shù)據(jù)處理系統(tǒng)分析
自我國成立至今,全國各地都開展了大地測量工作,累積了眾多觀測的信息及平差結(jié)果,這些都是十分重要的資源,科學(xué)整理、保存、應(yīng)用這些資源極為關(guān)鍵。隨著目前計(jì)算機(jī)技術(shù)的推陳出新,以往DOS系統(tǒng)創(chuàng)建的軟件及數(shù)據(jù)庫已經(jīng)無法滿足人們的需求,相關(guān)工作人員應(yīng)對(duì)其進(jìn)行改進(jìn)與創(chuàng)建,進(jìn)而生成更為完善的大地測量數(shù)據(jù)庫及處理系統(tǒng)。
一、大地控制測量數(shù)據(jù)庫
對(duì)于大地控制測量數(shù)據(jù)庫來講,其包含的內(nèi)容有:觀測值數(shù)據(jù)庫、控制網(wǎng)信息庫、GPS觀測數(shù)據(jù)資料管理庫、控制點(diǎn)成果數(shù)據(jù)庫等。在數(shù)據(jù)庫中,可以對(duì)信息的入庫、改正、查找等進(jìn)行操作。一般來講,入庫的形式大致分為兩類:第一類為利用光學(xué)經(jīng)緯設(shè)備、水平儀、測距儀等收集相關(guān)信息,之后通過處理,利用鍵盤輸入數(shù)據(jù)庫中;第二類是采用電子全站設(shè)備、水準(zhǔn)儀獲取數(shù)據(jù),將其下載以后,利用接口程序?qū)胛募小T趯⒁粋€(gè)控制網(wǎng)內(nèi)的信息傳遞完以后,利用數(shù)據(jù)接口程序把平差導(dǎo)入文件中,利用幾何封閉條件的合差對(duì)其可靠性及平差進(jìn)行檢驗(yàn),確保正確以后再導(dǎo)入數(shù)據(jù)庫內(nèi)。對(duì)于GPS觀測數(shù)據(jù)資料管理庫來講,其能夠自行記錄相應(yīng)的數(shù)據(jù)。目前,GPS接收設(shè)備形成的信息格式較不統(tǒng)一,想要形成統(tǒng)一的數(shù)據(jù)庫,應(yīng)編訂接口處的軟件,在讀取相應(yīng)資料以后,統(tǒng)一格式導(dǎo)入數(shù)據(jù)庫中。
二、控制網(wǎng)的平差及概算
在以往的控制網(wǎng)信息處理系統(tǒng)中,包含的內(nèi)容有:高程控制網(wǎng)、平面控制網(wǎng)、條件檢核、精確度評(píng)定等。這些內(nèi)容已經(jīng)運(yùn)用了很多年,當(dāng)前仍具一定應(yīng)用價(jià)值。尤其是導(dǎo)線網(wǎng)及水準(zhǔn)網(wǎng),具備相對(duì)較強(qiáng)的生命力。GPS定位技術(shù)目前已經(jīng)完全替代了以往的控制測量系統(tǒng),變成了創(chuàng)建控制網(wǎng)的主要方法。該處理技術(shù)包含兩方面內(nèi)容,即網(wǎng)平差及基線解算。其中,網(wǎng)平差包含基線網(wǎng)的數(shù)據(jù)檢驗(yàn)、二維平差、三維平差等內(nèi)容,基線解算指的是由初始觀測數(shù)據(jù)起,利用預(yù)處理、加工、解算等方法,獲取基線的方差陣及向量。
三、控制網(wǎng)的優(yōu)化設(shè)計(jì)
對(duì)于控制網(wǎng)的優(yōu)化設(shè)計(jì)來講,其包含的內(nèi)容有:GPS控制網(wǎng)優(yōu)化及經(jīng)典控制網(wǎng)優(yōu)化兩方面內(nèi)容。對(duì)GPS控制網(wǎng)優(yōu)化是基于測量任務(wù)書前提下,保證該網(wǎng)的密度、用途、準(zhǔn)確度等符合相應(yīng)標(biāo)準(zhǔn),同時(shí)在保證交通、地形等條件下,對(duì)該網(wǎng)坐標(biāo)基準(zhǔn)、外業(yè)觀測度等進(jìn)行優(yōu)化設(shè)計(jì),同時(shí)合理選取其接收設(shè)備的精度。一般來講,該控制網(wǎng)優(yōu)化系統(tǒng)具備的功能有以下幾方面:其一,能夠增加或者刪減基線邊與控制點(diǎn),可以實(shí)現(xiàn)控制網(wǎng)的移動(dòng)、擴(kuò)大、縮小、刷新等功能;其二,在選取好對(duì)應(yīng)的網(wǎng)形以后,依據(jù)相應(yīng)的接收設(shè)備精確度,能夠計(jì)算出控制網(wǎng)的可靠性與精確度;其三,基于控制網(wǎng)前提下查詢基線邊與控制點(diǎn)的信息。
四、大地控制測量數(shù)據(jù)庫的技術(shù)要點(diǎn)
(一)較為全面的自行監(jiān)測能力
在將信息導(dǎo)入數(shù)據(jù)庫中前,需要對(duì)平差、概算等進(jìn)行檢驗(yàn),從而消除記錄數(shù)據(jù)時(shí)的誤差,保證信息的精確性;同時(shí),傳統(tǒng)控制網(wǎng)在進(jìn)行概算操作期間,能夠自行對(duì)三角形的閉合差進(jìn)行檢驗(yàn),從而確保平差的準(zhǔn)確。一般,應(yīng)用迭代法對(duì)網(wǎng)平差進(jìn)行控制。
(二)存儲(chǔ)壓縮能力
雖然當(dāng)前計(jì)算機(jī)設(shè)備的內(nèi)存量相對(duì)較大,然而在進(jìn)行平差設(shè)計(jì)期間,依舊需要對(duì)內(nèi)存進(jìn)行考量。由于在平差狀態(tài)時(shí),誤差的方程矩陣等需要占據(jù)較大的內(nèi)存,所以,應(yīng)采用存儲(chǔ)壓縮的方法,從而更好的拓寬存儲(chǔ)的單元空間。
(三)處理圖形的能力
在控制網(wǎng)顯示圖形前,需要轉(zhuǎn)換相應(yīng)的坐標(biāo),例如:顯示GPS基線網(wǎng),需要先把空間的三維坐標(biāo)變成大地坐標(biāo),然后再把大地坐標(biāo)變成平面的笛卡爾坐標(biāo),最終變成屏幕坐標(biāo)。在顯示網(wǎng)圖以后,可以依據(jù)需求進(jìn)行放大、移動(dòng)、復(fù)原等控制,能夠在控制網(wǎng)界面編輯、查找相應(yīng)的數(shù)據(jù),利用鼠標(biāo)點(diǎn)擊控制點(diǎn),則會(huì)相應(yīng)彈出對(duì)話框,在對(duì)話框內(nèi)就可以顯現(xiàn)出該位置的坐標(biāo)、點(diǎn)名、精確度等,當(dāng)利用鼠標(biāo)點(diǎn)擊某一邊時(shí),則對(duì)話框內(nèi)就會(huì)顯現(xiàn)出該端點(diǎn)的邊長、精確度、方位角等。
總結(jié):
總而言之,對(duì)于大地控制測量數(shù)據(jù)庫來講,其具備較強(qiáng)的功能,能鞏固為各類測量單位提供相應(yīng)的數(shù)據(jù)管理機(jī)處理服務(wù)。該系統(tǒng)的操作較為簡單、應(yīng)用便捷。并且具備較強(qiáng)的開放性,能夠?qū)崿F(xiàn)信息的共享,并且合理處理生產(chǎn)期間碰到的實(shí)際問題。相關(guān)工作人員應(yīng)對(duì)該數(shù)據(jù)庫及處理系統(tǒng)進(jìn)行深入探究,從而更好的提高數(shù)據(jù)庫的功能,為人們提供便捷服務(wù)。
參考文獻(xiàn):
[1]董春來,劉彥芳,焦明連,周立."大地測量學(xué)基礎(chǔ)"教學(xué)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].測繪通報(bào),2010(09).
關(guān)鍵詞:第三方支付系統(tǒng) 大數(shù)據(jù)管理 分析系統(tǒng)
1.引言(Introduction)
基于保障國家信息安全、金融交易信息的安全需要,我國的金融大數(shù)據(jù)管理與分析勢在必行,建成后將在各個(gè)行業(yè)、商戶、消費(fèi)者、政府管理部門廣泛應(yīng)用,可實(shí)現(xiàn)我國整體經(jīng)濟(jì)環(huán)境向先進(jìn)化、集約化方向發(fā)展,有利于新產(chǎn)業(yè)的拓展和既有產(chǎn)業(yè)體系的轉(zhuǎn)型升級(jí),提升我國企業(yè)整體競爭實(shí)力,擴(kuò)大我國的經(jīng)濟(jì)規(guī)模,提升我國的世界經(jīng)濟(jì)地位。第三方支付企業(yè)作為金融業(yè)的新軍和重要組成部分,隨著數(shù)據(jù)價(jià)值的認(rèn)可及金融大數(shù)據(jù)在大數(shù)據(jù)中的重要性,尤其是在第三方支付公司極速發(fā)展的時(shí)期,基于數(shù)據(jù)業(yè)務(wù)及內(nèi)部管理優(yōu)化,使得第三方支付系統(tǒng)的大數(shù)據(jù)應(yīng)用市場規(guī)模在未來幾年將以高于整體大數(shù)據(jù)發(fā)展水平的速度增長。基于我國金融交易企業(yè)的總體交易規(guī)模遠(yuǎn)比大數(shù)據(jù)市場規(guī)模要高的現(xiàn)狀,若在金融交易數(shù)據(jù)領(lǐng)域?qū)崿F(xiàn)對(duì)大數(shù)據(jù)模型及應(yīng)用的深入應(yīng)用,必將實(shí)現(xiàn)二者的良性互動(dòng),促進(jìn)第三方支付系統(tǒng)大數(shù)據(jù)及金融市場的健康發(fā)展,同時(shí)更快速地推進(jìn)大數(shù)據(jù)市場規(guī)模的擴(kuò)大。
第三方支付系統(tǒng)大數(shù)據(jù)平臺(tái)的建設(shè),有助于實(shí)現(xiàn)商戶和消費(fèi)者的線上、線下業(yè)務(wù)的雙向引導(dǎo),并快速促成交易,為眾多生存狀態(tài)下的第三方支付系統(tǒng)及商戶提供盈利點(diǎn)。系統(tǒng)總體架構(gòu)如下。
2.系統(tǒng)架構(gòu)(System Architecture)
針對(duì)第三方支付系統(tǒng)大數(shù)據(jù)的安全性、實(shí)時(shí)性、穩(wěn)定性等特性,采用新型的大數(shù)據(jù)分析數(shù)據(jù)庫技術(shù),實(shí)現(xiàn)對(duì)數(shù)據(jù)庫的優(yōu)化升級(jí),保障數(shù)據(jù)分析的高可用性及高性能,以完全滿足針對(duì)第三方支付系統(tǒng)的大數(shù)據(jù)的存儲(chǔ)、管理、分析需求。
4.結(jié)語(Conclusion)
研發(fā)第三方支付系統(tǒng)大數(shù)據(jù)管理、分析系統(tǒng),并利用其通用接口與結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)對(duì)接,基于大數(shù)據(jù)管理建立了分析模型,以服務(wù)于企業(yè)、商戶、消費(fèi)者,從而提高企業(yè)和商戶的生產(chǎn)、經(jīng)營和管理智能化水平,提高管理水平、管理效率和提高競爭能力,幫助深入挖掘數(shù)據(jù)價(jià)值,提升決策水平,并在此過程中加強(qiáng)消費(fèi)者的消費(fèi)體驗(yàn)。
參考文獻(xiàn):
[1]楊莉國.基于MDA的數(shù)據(jù)挖掘模型研究[D].大連交通大學(xué),2010.
[2]李國杰.大數(shù)據(jù)研究的科學(xué)價(jià)值.中國計(jì)算機(jī)學(xué)會(huì)通訊,2012,8(9):8-15.
[3]Aguilera MK,Merchant A,Shah M,Veitch A,Karamanolis C.Sinfonia:A new paradigm for building scalable distributed systems.In:Proc.of the SOSP.New York:ACM Press,2007.[doi:10.1145/1294261.1294278]
[4]Liu HK,Jin H,Liao XF,Hu LT,Yu C.Live migration of virtual machine based on full system trace and replay.In:Proc.of the HPDC.2009.101-110.[doi:10.1145/1551609.1551630]
[5]Gilbert S,Lynch N.Brewer’s conjecture and the feasibility of consistent,available,partition-tolerant Web services.ACM SIGACT News,2002,33(2):51-59.[doi:10.1145/564585.564601]
[6]Vogels W.Eventually munications of the ACM,2009,52(1):40-44.[doi:10.1145/1435417.1435432]
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;現(xiàn)代百貨業(yè);顧客細(xì)分
隨著零售業(yè)信息技術(shù)的發(fā)展,如何有效地利用商場信息化帶來的數(shù)據(jù)成為企業(yè)生存與發(fā)展新的利潤增長點(diǎn),這是現(xiàn)代百貨業(yè)不得不考慮的問題。華地國際揚(yáng)州萬家福商城通過建立以客戶為中心的管理信息系統(tǒng),分析會(huì)員數(shù)據(jù)的同時(shí)可以指導(dǎo)營銷,幫助挖掘顧客消費(fèi)行為和規(guī)律, 設(shè)計(jì)出更加符合顧客需要的商品和服務(wù),在近二十年的系統(tǒng)使用過程中,智能客戶關(guān)系管理系統(tǒng)得到不斷完善,真正做到實(shí)現(xiàn)顧客細(xì)分,精準(zhǔn)營銷,極大地增強(qiáng)了企業(yè)自身的競爭力。
一、萬家福會(huì)員卡決策支持系統(tǒng)的設(shè)計(jì)思路
1.確定目標(biāo)(理解業(yè)務(wù)):這是系統(tǒng)模型構(gòu)建的關(guān)鍵一步,將現(xiàn)實(shí)問題轉(zhuǎn)化為數(shù)據(jù)挖掘的算法,以會(huì)員消費(fèi)數(shù)據(jù)為基礎(chǔ),最終實(shí)現(xiàn)顧客細(xì)分,從而達(dá)到有針對(duì)性對(duì)顧客一對(duì)一營銷的目的。
2.關(guān)于數(shù)據(jù):包括數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)理解。數(shù)據(jù)挖掘的前提是要求數(shù)據(jù)是真實(shí)的、大量的、有效的。在確定了目標(biāo)之后,選擇符合條件的大量數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)的選擇、整理、清理、異常值的處理、標(biāo)準(zhǔn)化處理過程等。
3.建立顧客細(xì)分模型:在研究零售業(yè)顧客細(xì)分模型及方法的基礎(chǔ)上,總結(jié)出適合萬家福商城比較理想的模式,主要功能是實(shí)現(xiàn)顧客細(xì)分,同時(shí)對(duì)顧客的細(xì)分結(jié)果進(jìn)行分析,并提出相應(yīng)的營銷策略。
4.擴(kuò)展功能:在實(shí)現(xiàn)顧客細(xì)分的基礎(chǔ)上,進(jìn)行深層次展望,有針對(duì)性地制定營銷策略,為決策提供支持。
二、萬家福會(huì)員卡決策支持系統(tǒng)的實(shí)踐研究
1.會(huì)員資料庫基礎(chǔ)架構(gòu)設(shè)計(jì)
⑴會(huì)員卡的靜態(tài)數(shù)據(jù), 如年齡、性別、職業(yè)、單位郵編、單位地址、手機(jī)號(hào)碼、興趣愛好、家庭成員等。
⑵會(huì)員卡的消費(fèi)信息,如購物時(shí)間、購買品類、金額、頻率等。
⑶會(huì)員卡的基礎(chǔ)信息定義,包括卡種、卡類型、保管地點(diǎn)、年齡段、地區(qū)、職業(yè)等。
2.會(huì)員決策支持系統(tǒng)及大數(shù)據(jù)分析
在會(huì)員決策系統(tǒng)的大力支持下,管理層可以根據(jù)需要對(duì)按照不同的屬性劃分的會(huì)員卡進(jìn)行分析,比如通過對(duì)卡的類型 ,持卡人的性別、年齡和居住地可以掌握顧客結(jié)構(gòu)及有關(guān)變化的趨勢數(shù)據(jù),分析顧客的消費(fèi)行為、尋找新的消費(fèi)模式等等。
3.根據(jù)決策分析支持系統(tǒng)實(shí)施會(huì)員營銷,發(fā)展、鎖定會(huì)員
要想實(shí)施精準(zhǔn)營銷,關(guān)鍵在于目標(biāo)顧客的篩選,品牌的顧客具備有哪些特征?顧客的購物行為特征是怎樣的?等等,會(huì)員決策支持系統(tǒng)有對(duì)會(huì)員數(shù)據(jù)強(qiáng)大的智能分析功能,管理者可以通過系統(tǒng)平臺(tái)進(jìn)行判斷、分類,從顧客購買的產(chǎn)品特征判定顧客的消費(fèi)意識(shí)、性別、年齡、購物偏好、行為習(xí)慣、家庭情況等,并通過對(duì)顧客連續(xù)的購買記錄進(jìn)行分析并修正原有的判斷。不同品類間的促銷組合也可以用來做精準(zhǔn)營銷,通過會(huì)員決策支持系統(tǒng)的會(huì)員深度分析模塊,可以對(duì)品類的關(guān)聯(lián)度分析,當(dāng)某個(gè)區(qū)域的商品出現(xiàn)滯銷,但又苦于找不到目標(biāo)群體時(shí),那么就可以通過商品組合做捆綁銷售,而這種商品組合經(jīng)過系統(tǒng)的分析為開展?fàn)I銷活動(dòng)提供了精準(zhǔn)的數(shù)據(jù),向顧客傳達(dá)準(zhǔn)確有效的營銷信息。
4.深度分析及挖掘會(huì)員消費(fèi)行為數(shù)據(jù),案例解析
通過決策分析支持系統(tǒng)的查詢和統(tǒng)計(jì)分析,我們的目標(biāo)客戶以白領(lǐng)和中產(chǎn)企業(yè)家為主,這部分群體具有明顯的營銷特點(diǎn):收入較高且穩(wěn)定、品牌粘性強(qiáng),對(duì)價(jià)格不會(huì)敏感。維持和提升這部分客戶的品牌忠誠度對(duì)上本的發(fā)展至關(guān)重要。
第一步,進(jìn)行消費(fèi)引導(dǎo)。借助短信功能平臺(tái)首先向會(huì)員進(jìn)行生日營銷,告知當(dāng)天購物享雙倍積分并有禮品贈(zèng)送。經(jīng)過一段時(shí)間的短信發(fā)送,生日來店的會(huì)員明顯增多,參與人數(shù)由開始的1、2個(gè)到后來的十多個(gè)至二十幾個(gè),逐漸增多。
第二步,開展有效的營銷活動(dòng)。比如,積分營銷,分分禮,禮紛紛。會(huì)員持卡消費(fèi)獲得積分獎(jiǎng)勵(lì),積分累計(jì)到一定分?jǐn)?shù)將可獲贈(zèng)禮品。
同時(shí),借助決策分析支持系統(tǒng)提供的強(qiáng)大會(huì)員篩選器,幫助客服部門多角度準(zhǔn)確篩選營銷群體,進(jìn)行時(shí)點(diǎn)會(huì)員營銷。系統(tǒng)提供刷卡贈(zèng)送、消費(fèi)實(shí)時(shí)贈(zèng)送、累積后贈(zèng)送等多種促銷方式,以電子優(yōu)惠券、短信的形式精準(zhǔn)發(fā)送到會(huì)員手中。
三、結(jié)語
總體而言,基于數(shù)據(jù)挖掘技術(shù)的會(huì)員卡決策分析支持系統(tǒng)可以對(duì)零售業(yè)顧客群進(jìn)行合理的細(xì)分,建立顧客細(xì)分模型,有針對(duì)性地對(duì)目標(biāo)顧客進(jìn)行一對(duì)一營銷,有助于提高營銷活動(dòng)的針對(duì)性和有效性,有助于客戶關(guān)系管理的良好實(shí)施。隨著信息化的繼續(xù)發(fā)展,必將在數(shù)據(jù)處理及資源整合,為企業(yè)提供決策支持等方面,發(fā)揮更大的作用。
參考文獻(xiàn):
[1](美)Michael J A Berry , Gordon SLinoff.數(shù)據(jù)挖掘技術(shù):市場營銷、銷售與客戶關(guān)系管理領(lǐng)域應(yīng)用[M].機(jī)械工業(yè)出版社,2011.
[2]利.數(shù)據(jù)挖掘與商業(yè)智能完全解決方案[M].北京:電子工業(yè)出版社,2011.
[3]趙濤.商場經(jīng)營管理:理論、案例、制度、實(shí)務(wù)――商業(yè)現(xiàn)代化與基礎(chǔ)管理叢書[M].北京工業(yè)大學(xué)出版社,2009.
隨著科學(xué)的進(jìn)步以及不斷發(fā)展,導(dǎo)致現(xiàn)代社會(huì)信息化水平日益提高,大數(shù)據(jù)時(shí)代應(yīng)運(yùn)而生。在信息化水平不斷提高的背景下,審計(jì)人員如何利用一些必要的計(jì)算機(jī)技術(shù)來分析被審計(jì)數(shù)據(jù),從中發(fā)現(xiàn)審計(jì)線索以確定審計(jì)重點(diǎn)、范圍,這將成為開展審計(jì)工作的前提條件。而當(dāng)前,審計(jì)人員采取的數(shù)據(jù)工具以Excel與SQL Server為主,本文就將針對(duì)這兩種工具與R語言之間進(jìn)行比較研究,并以此探究R在實(shí)際審計(jì)工作開展的可行性。
二、R語言簡介
R語言是S語言的一種實(shí)現(xiàn)。S語言同C語言一樣,只是一個(gè)標(biāo)準(zhǔn),而圍繞它有很多實(shí)現(xiàn)。S語言的最初實(shí)現(xiàn)版是S-PLUS,但S-PLUS作為一款商業(yè)軟件,價(jià)格十分昂貴,其受眾面較窄。后新西蘭奧克蘭大學(xué)的Ross Ihaka與Robert Gentleman共同開發(fā)出S語言的另一種實(shí)現(xiàn)-R語言。R是一個(gè)免費(fèi)開源、能夠自由有效地用于統(tǒng)計(jì)計(jì)算和繪圖的語言和環(huán)境,在UNIX、Windows以及Mac OS系統(tǒng)中均可以運(yùn)行,它提供了廣泛的統(tǒng)計(jì)分析和繪圖技術(shù),包括回歸分析、時(shí)間序列、分類和聚類等建模方法。
R是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng),擁有一套開源的數(shù)據(jù)分析解決方案,由一個(gè)龐大而活躍的全球性社區(qū)維護(hù)。與其說R是一種統(tǒng)計(jì)軟件,還不如說R是一統(tǒng)計(jì)分析與計(jì)算的環(huán)境,因?yàn)镽不僅提供若干統(tǒng)計(jì)程序,而且還可進(jìn)行統(tǒng)計(jì)分析,只需使用者指定數(shù)據(jù)庫和若干參數(shù)即可。R的思想是:它可以提供一些集成的統(tǒng)計(jì)工具,更重要的是,它還可以提供各種數(shù)學(xué)計(jì)算、統(tǒng)計(jì)計(jì)算的函數(shù),從而令使用者能夠靈活地進(jìn)行數(shù)據(jù)分析,甚至創(chuàng)造出符合需要的新的統(tǒng)計(jì)計(jì)算方法。
三、R與當(dāng)前審計(jì)方法比較分析
(一)利用Excel分析
Excel作為我們生活中常用的數(shù)據(jù)統(tǒng)計(jì)、分析工具,早在中學(xué)時(shí)期便為我們所接觸、熟知,Excel能被審計(jì)人員廣泛接受,一方面與其高被使用頻率以及在使用者心中根深蒂固的地位相關(guān),另一方面與其易操作的特點(diǎn)、能夠滿足大部分?jǐn)?shù)據(jù)分析要求的功能密不可分。Excel在審計(jì)人員進(jìn)行非大數(shù)據(jù)分析工作時(shí),不失為首選工具,能夠幫助審計(jì)人員高效快速地分析數(shù)據(jù)并以此發(fā)現(xiàn)審計(jì)線索,但日前,伴隨著大數(shù)據(jù)時(shí)代的進(jìn)入,數(shù)據(jù)量大且結(jié)構(gòu)復(fù)雜,Excel可能并不能很好地協(xié)助進(jìn)行審計(jì)工作,將其與R進(jìn)行比較,可發(fā)現(xiàn)存在以下兩方面的不同,同時(shí),這也直接反映了R的優(yōu)勢。
1.Excel所能處理的數(shù)據(jù)數(shù)量受限。Excel滿足于非大量數(shù)據(jù)分析要求,對(duì)于海量數(shù)據(jù)的處理、計(jì)算、統(tǒng)計(jì)等分析過程可能并不能應(yīng)用自如。本部分僅針對(duì)該公立醫(yī)院2015年的部分?jǐn)?shù)據(jù)進(jìn)行分析,尚可滿足數(shù)據(jù)分析需求,在針對(duì)該公立醫(yī)院多年的藥品數(shù)據(jù)進(jìn)行分析時(shí),運(yùn)算速度較慢,同時(shí)會(huì)出現(xiàn)軟件閃退及程序停滯無法運(yùn)轉(zhuǎn)的情況,而現(xiàn)今已進(jìn)入大數(shù)據(jù)時(shí)代,數(shù)據(jù)數(shù)量不斷增加及其繁復(fù)程度不斷提高,這必將為分析數(shù)據(jù)的工具提出更高要求。而R作為大數(shù)據(jù)統(tǒng)計(jì)軟件,能夠?qū)崿F(xiàn)大量數(shù)據(jù)分析,同時(shí),只要下載安裝合適的程序包(關(guān)于R中的包將在本文第3部分詳細(xì)介紹),便能讀取包括Excel、SPSS、SAS、Stata等甚至從網(wǎng)頁中抓取的數(shù)據(jù),基本沒有R不能讀取的數(shù)據(jù)形式,完全滿足國家審計(jì)人員實(shí)際大數(shù)據(jù)審計(jì)工作開展的需要。
2.Excel可視化功能有限。Excel中對(duì)分析結(jié)果進(jìn)行圖表展示的能力有限,以常規(guī)的折線圖、柱狀圖、餅圖等圖形形式居多;此外,難以將大量分析結(jié)果在一張圖形中進(jìn)行展示,同時(shí)對(duì)于大量數(shù)據(jù)展現(xiàn)的觀賞性不強(qiáng),難以為審計(jì)人員分析決策提供幫助。而R是現(xiàn)今最受歡迎的數(shù)據(jù)分析和可視化平臺(tái)之一,基于R語言可制作多種精美的圖形,允許眾多分析結(jié)果以代表各自的圖形形態(tài)在一張圖中進(jìn)行展示,可方便審計(jì)人員對(duì)分析結(jié)果進(jìn)行宏觀觀察、分析。
(二)通過SQL語句查詢分析
SQL查詢是SQL最常用的功能,被廣泛應(yīng)用于目前審計(jì)機(jī)關(guān)針對(duì)特定條件、事項(xiàng)進(jìn)行的查詢分析,通過編寫簡單的SQL查詢語句來詢問特定的問題,之后數(shù)據(jù)庫通過執(zhí)行這個(gè)查詢便可提供回答這個(gè)問題的數(shù)據(jù)信息。SQL的易理解、易操作、易上手等特點(diǎn)成為目前國家審計(jì)機(jī)關(guān)人員重點(diǎn)培訓(xùn)的使用工具之一。但將應(yīng)用SQL語句進(jìn)行查詢分析與基于R語言進(jìn)行統(tǒng)計(jì)分析過程進(jìn)行比較,R語言仍具備兩點(diǎn)優(yōu)勢:
1.R語言分析數(shù)據(jù)的功能更為強(qiáng)大。眾所周知,SQL語句作為結(jié)構(gòu)化查詢語言,在數(shù)據(jù)查詢方面具備強(qiáng)大的功能,優(yōu)勢明顯,但在數(shù)據(jù)挖掘?qū)用妫热邕M(jìn)行聚類、回歸建模分析等應(yīng)用時(shí),SQL可能并不如R語言使用得心應(yīng)手;同時(shí),面對(duì)一些高級(jí)查詢,可能需要通過編寫連串的、大量的SQL語句,而R自帶多種函數(shù)及功能強(qiáng)大的程序包,涵蓋統(tǒng)計(jì)學(xué)、生物學(xué)、數(shù)學(xué)等多個(gè)領(lǐng)域,而R又作為免費(fèi)開源軟件,使用者還在不斷創(chuàng)建新的包來更新豐富R的使用功能,通過簡單的幾步函數(shù)運(yùn)行便可實(shí)現(xiàn)多種統(tǒng)計(jì)需求;除此之外,R語言是用來進(jìn)行統(tǒng)計(jì)分析和繪圖的一種語言,除了自身包括強(qiáng)大功能的函數(shù)及多種程序包能夠滿足審計(jì)人員進(jìn)行多種統(tǒng)計(jì)分析的要求之外,還可以作為一種可視化語言,能夠?qū)⒎治鼋Y(jié)果以各種精美的圖形展現(xiàn)以幫助分析決策。而進(jìn)入大數(shù)據(jù)時(shí)代,軟件的數(shù)據(jù)可視化能力至關(guān)重要。
2.R語言的應(yīng)用范圍更廣。SQL側(cè)重應(yīng)用于數(shù)據(jù)庫軟件,能夠方便使用者作相關(guān)查詢分析,而R作為大數(shù)據(jù)統(tǒng)計(jì)工具,廣泛應(yīng)用于數(shù)據(jù)分析、數(shù)據(jù)挖掘等諸多方面,是目前最受歡迎的數(shù)據(jù)分析和可視化平臺(tái)之一,其包含的眾多具備不同功能的函數(shù)、程序包,可滿足數(shù)據(jù)分析人員眾多需求。
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級(jí)別:省級(jí)期刊
榮譽(yù):中國期刊全文數(shù)據(jù)庫(CJFD)
級(jí)別:省級(jí)期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級(jí)別:省級(jí)期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫