前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的大數據庫建設方案主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:NoSQL 3.20工程 研判分析
一、前言
當今世界是一個信息高速發展的時代,隨著網民參與互聯網產品和應用的程度越來越深,互聯網將更加智能,互聯網的數據量也將呈爆炸式增長。可以預見公安行業信息化發展在未來幾年里,數據將以每年 30%到50%的速度爆炸式增長。
在大數據時代下對系統又提出了新的需求:1、高并發讀寫的需求,高并發、實時動態獲取和更新數據。2、海量數據的高效率存儲和訪問的需求,類似SNS網站,海量用戶信息的高效率實時存儲和查詢。3、高可擴展性和高可用性的需求,需要擁有快速橫向擴展能力、提供7*24小時不間斷服務。
物聯網發展和互聯網應用帶來了多源海量數據的存貯、管理、處理、融合、整合和挖掘分析問題,傳統的關系數據庫管理系統(SQL數據庫管理系統)已不能完全適應這些海量數據的管理與計算要求,NoSQL數據庫管理系統應運而生。NoSQL數據庫主要有鍵-值存貯(key-value stores)、 BigTable、文件存貯數據庫(document store databases)和圖形數據庫(graph databases)等類型,相關的數據庫軟件主要memcached, Redis, MongoDB, CouchDB, Apache Cassandra和HBase等等,都是開源的。
NoSQL數據庫與傳統的關系數據庫管理系統相結合,為智慧城市數據管理提供整體解決方案,應用NoSQL并不是全盤否定SQL數據庫,而應該是NoJustSQL依賴于SQL。
二、傳統數據庫在大數據處理中存在的問題
傳統數據庫,主要指關系型數據庫,在長期的實踐中體現出性能好、穩定性高等特點,在使用上也比較簡單,功能強大,在實際的數據庫工作和研究發揮了很好的作用。但關系數據庫在應對大數據存在明顯的問題:
1、分庫分表缺點:
(1)受業務規則影響,需求變動導致分庫分表的維護復雜。
(2)系統數據訪問層代碼需要修改。
2、Master-Slave缺點:
(1)Slave的實時性保障,在實時性要求很高的應用中,可能需要進行相關處理。
(2)在高可用性方面的問題,Master存在容易產生單點故障的致命弱點。
3、 MMM缺點: 本身擴展性差,一次只能一個Master可以寫入,只能解決有限數據量下的可用性。
三、NoSQL概念
1、什么是NoSQL NoSQL是Not Only SQL的縮寫,而不是Not SQL,它不一定遵循傳統數據庫的一些基本要求,比如說遵循SQL標準、ACID屬性、表結構等等。相比傳統數據庫,叫它分布式數據管理系統更貼切,數據存儲被簡化更靈活,重點被放在了分布式數據管理上。
2、主流NoSQL數據庫--HBase簡介 HBase是Hadoop Database的簡稱,它是一個高可靠性、高性能、面向列、可伸縮的分布式存儲系統,利用HBase技術,可在廉價的PC Server上搭建起大規模、結構化的存儲集群。
HBase是由Google Bigtable的開源實現,類似于Google Bigtable利用GFS作為其文件的存儲系統,HBase利用Hadoop HDFS作為其文件的存儲系統;Google是通過運行MapReduce來處理Bigtable中的海量數據,HBase同樣是通過利用Hadoop MapReduce來處理HBase中的海量數據的;Google Bigtable利用 Chubby來作為協同服務,HBase是利用Zookeeper來作為對應的。
四、NoSQL的特點分析
1、NoSQL是易擴展的
NoSQL數據庫的種類繁多,但是他們有一個共同的特點,就是去掉了傳統關系數據庫的“關系型”這一特性,所以NoSQL數據庫的數據之間是無“關系”的,這樣的數據庫就非常容易擴展,同時,在架構的層面上也具有可擴展性,有多種NoSQL數據庫之間的整合能力。
2、NoSQL是靈活的數據模型
NoSQL數據庫不需要事先為要存儲的數據建立對應的字段,隨時可以存儲自定義的數據格式。而在傳統的關系數據庫里,增刪字段是非常麻煩的,如果是大數據量的數據庫表,增加一個字段簡直是很麻煩的。
3、NoSQL是高可用的
NoSQL數據庫可以方便的實現高可用的架構,而且不太影響性能。比如Cassandra,HBase模型,就可以通過復制模型實現高可用。
4、NoSQL是具有大數據量的處理能力,具有高性能的特點
NoSQL數據庫都具有非常高的讀寫性能,尤其在大數據量下,這種讀寫能力體現更加突出,這得益于它的“無關系性”,數據庫的結構簡單,NoSQL的 Cache是記錄級的,是一種細粒度的Cache,所以NoSQL在這個層面上來說就要性能高很多了。
五、“3.20”工程海量數據分析應用
“3.20”工程是在江蘇省公安廳統一部署下開展的路面監控建設工程,要求在市區主要道路每3公里記錄一次車輛軌跡,國道等城市道路每20公里記錄一次。
由于“3.20”工程每天產生海量過車信息,數據總量大、日均增量大、占用存儲空間多,僅僅依靠Oracle關系數據庫技術的存儲建庫模式,已不能完全滿足實戰應用的需求。對于傳統的關系數據庫來說,在一張幾百億條數據記錄的表里面進行SQL查詢,效率極其低下,用戶不可忍受。在傳統的關系數據庫系統中往往采用分庫、分表的策略進行數據存儲,這種方式使得單表的查詢效率得到提高。然而在能耗監測系統中往往需要對全局數據進行綜合統計查詢,往往涉及到幾十上百個表,查詢效率無法保證。
這就需要在“大平臺”總體數據庫體系下,深入研究“大數據”應用處理問題,引進HDFS分布式文件系統,采用Hadoop架構的NoSQL數據庫技術,科學規劃設計數據存儲、傳輸、建庫的模式,滿足“3.20”工程車輛數據應用需要。NoSQL數據庫采用“鍵-值”對的方式對數據進行存儲,該存儲方式是不需要固定的表結構的,也就不存在連接操作,具體操作時效率就比較高。在大數據存取上具備關系型數據庫無法比擬的性能優勢。
Hadoop應用場景
基于Hadoop HDFS等分布式文件系統存儲結構,能夠有效解決海量數據快速讀寫的性能瓶頸問題,是開展“大數據”應用訪問、統計分析很好的解決方案。
對于需要分析的大數據,特別是對于日均增量達4000萬的過車信息數據等,采用NoSQL數據庫技術,運用Hadoop的HDMS結構方式進行存儲建庫,搭建多個“3.20”工程大數據專題庫,并利用MapReduce功能來進行數據分析,多臺機器組成集群進行并行計算,以此提升全省“3.20”工程大數據的處理和分析能力。
在匯集整合全省道路監控網“3.20”工程相關信息資源的基礎上,結合各警種業務部門實戰需求,充分利用“大數據”技術,以人車案關聯分析為建設重點,實現全省一體化查詢服務、人車案關聯分析、重點車輛電子檔案、重點車輛積分預警、警務地理信息系統對接應用、指揮調度系統對接應用等功能,面向全省基層單位、專業部門、各級公安機關領導提供系統服務,為開展深度研判應用奠定基礎。
參考文獻
[1]黃富潔.公安決策支持系統的研究與設計[D].濟南:山東山東大學,2004
[2]張嵐.淺析數據庫技術的發展趨勢[J].信息與電腦(理論版).2012
顛覆性改變
由于醫院數據具有數據量總體偏小,并以結構化數據為主,以及管理工具以ORACLE、SQLserver等數據庫管理系統為主等特點,使得醫院信息系統仍然以提高工作效率、提升精細管理和優化診療流程為主,醫療質量主要體現在對醫療過程的環節控制上,真正以提高診斷水平和診療技術為目的的信息系統還屈指可數。另外由于醫院管理總體上還比較粗放,對于這些有限的數據利用率也還不夠高,因此有人得出醫院沒有大數據的結論。
但作者認為盡管大數據目前在醫院還沒有得到充分應用,卻已越來越表現出大數據的特征。首先區域醫療的發展使得一個地區的醫療數據完全達到PB級,即使是在醫院內部,10多年的數據也接近乃至達到PB級。其次醫療數據越來越多樣化,臨床的深入應用必然要采集包括數值、文字、影像、文本、語音等各種類型的診療數據。另外,云計算、移動互聯網、可穿戴設備、基因治療、大型影像設備的發展讓醫療領域快速積累了大量蘊含極大價值的診療數據。這些海量數據依靠原有的數據庫或數據倉庫技術已經難以得到充分的利用,必須引入新的技術才能解決。
利用這些“大數據”將對醫療服務模式產生巨大影響。首先在臨床決策支持上,通過全面分析同類型患者的體征數據和療效數據,比較多種干預措施的有效性,找到最佳治療途徑。精確分析包括患者體征數據、費用數據和療效數據在內的大型數據集,幫助醫生確定臨床上最有效和最具有成本效益的治療方法。
利用規則和數據進行實時分析,給出藥物過敏重點人群、慢病患者等各類警示信息以及重復檢查檢驗提示,提醒醫生防止潛在的錯誤,降低醫療事故率。對數據的深入分析和挖掘,能給醫生提供診療建議,從而提高工作效率和診療質量。
其次,基于海量的臨床和分子生物學數據、信息與知識的整合與分析,個性化醫療逐漸進入臨床實踐。通過高級算法和分布式計算加快基因測序計算效率,加速基因序列分析,讓疾病的發現過程變得更快、更容易和更便宜。根據基因信息,制定專門的疾病治療方案。考察遺傳變異對特定疾病的易感性和對特殊藥物的反應的關系,針對不同患者采取不同的診療方案,提供個性化治療服務。
另外,大數據分析技術對非結構化數據的分析能力更加強大,以此可以發展智能化診療技術。比如可以使用圖像分析和識別技術識別醫療影像(X線、CT、MRI)數據,或者挖掘醫療文獻數據建立醫療專家數據庫,從而通過操作計算機就基本可以對大部分常見病和多發病做出診斷。另外大數據分析、海量醫學影像檢查、三維重建技術和機器人手術等將顛覆手術模式,未來醫院的手術也許將按如下路徑展開:智能診斷->海量影像檢查->三維重建->手術導航->機器人手術。
同時,大數據采集管理結合可視化技術,可以有效提升醫療效率和質量。如西雅圖兒童醫院的醫護人員通過使用iPad上的數據可視化和分析工具Tableau來分析遍布醫院各處的服務器和數據庫里的數億TB數據,并以數據可視化方式展現數據之間的關系和趨勢。可視化數據分析不但幫助醫護人員減少醫療事故,制定臨床試驗計劃,而且還幫醫院節省了供應鏈成本。
此外,在健康管理和流行病檢測以及疾病預防方面,大數據也將大有作為。通過對健康傳感器采集的如睡眠質量數據、日常活動數據,以及大量公共衛生和健康行為數據,還有來自社交網絡上的各種相關數據進行關聯分析,提供一個可針對個人的健康行為分析平臺,協助將健康傳感器和移動數據轉換為個人健康建議和指導。
另一方面,公共衛生部門可以通過覆蓋全國的患者電子病歷數據庫,快速檢測傳染病,進行全面的疫情監測,并通過集成疾病監測和響應程序,快速進行響應。大數據幫助確定哪些人是某類疾病的易感人群,如應用高級分析可以幫助識別哪些患者有患糖尿病的高風險,使他們盡早接受預防性保健方案。這些方法也可以幫患者從已經存在的疾病管理方案中找到最好的治療方案。
總而言之,通過對大數據的深度挖掘利用,不僅能夠改變診療模式,還會使患者服務、決策方式和精細化管理等方面都發生質的改變。
積極應對
面對大數據帶來的機遇和挑戰,作者認為首先要轉變對大數據的態度。現在業內對新技術往往存在不正確的認識,一種是盲目追隨,不管是否符合實際,不管是否能夠產生效益,盲目引進新技術,導致不必要的浪費;另一種是盲目拒絕,覺得大數據還很遙遠,高掛免戰牌。
對待像大數據這類新技術,一定要樹立大數據意識。首先要熱情擁抱,不要排斥,要跟進、學習和體驗,并思考大數據與行業的結合點,努力應用創新。其次是要科學對待,思考并創新應用新技術解決現實問題。
之后,還要有效組織大數據。大數據不是憑空而來的,醫療大數據完全是在互聯網、物聯網、云計算和可穿戴設備等深入應用到醫療行業各個領域后聚集而來的,應用大數據還必須學會有效組織大數據。醫療領域的信息系統不少還是離散的、垂直的業務和單一的應用。通過云計算可以搭建一個扁平化的信息云平臺,在此之上可以把原來離散的信息系統整合起來,進而促進業務的有效協同。可以把離散在各個系統、各個機構甚至各個醫療器械中的健康信息提取出來,形成完整的診療信息,從而形成完整的臨床診療數據中心。
關鍵詞:大數據;BIM系統;基礎數據;施工企業
大數據時代,建筑行業無可回避。那么,大數據對建筑行業到底會帶來哪些影響呢?“大數據”的標簽已經開始引領建筑業。但“大數據”的真正含義是什么[1],它如何影響建筑行業?在最簡單的形式中,大數據是一個龐大而復雜的數據集的集合。管理數據的能力成為關鍵。許多建筑公司開始為業務和技術進行大數據定義,將大數據與BIM結合,管理與BIM相關的數據和其他協作流程[2]。
大數據技術的戰略意義在于借助于專業軟件,對這些含有意義的數據進行專業化處理。提高對數據的“加工能力”,通過“加工”實現數據的“增值”。建筑行業是數據最多的行業,但也是數據最不透明的行業。建筑行業中,掌握數據能力強的企業,必然產生極大的競爭優勢,并形成核心的競爭能力。那么,大數據時代,施工企業該如何構建企業的基礎數據庫?企業基礎數據又該如何利用呢?
1 建筑施工企業基礎數據定義
施工企業在施工全過程中產生的資料,將其電子信息化后產生的數據,就可以成為基礎數據;基礎數據包括:預算數據,建筑施工模型,企業定額,企業指標庫、企業知識經驗庫;其中,企業定額庫是企業所獨特的,通過設計階段的建筑實物模型得到的計劃量,根據各個企業的管理水平和技術力量不同,資源實際的消耗量也不一樣。施工過程中發生的人、材、機、稅、費、技術、消耗量、價格等,都屬于施工企業的基礎數據中的預算數據。對于施工企業來講,最核心的基礎數據就是企業定額。通過搜集、分析、歸納、反饋、再收集這一循環來制定一個企業的基礎數據庫;施工企業的基礎數據有很多種類:工程數據、企業消耗量指標、價格庫、構件庫等,只有工程項目本身的數據來源于設計,其它的數據另有解決方案來收集、處理、共享、應用。
2 基礎數據構建基本條件
2.1 共同平臺,相同規范
上下層級協同歸集,創建一個共同開發的平臺;最好能有一個和清單計價規范一樣的整體分類;建筑企業基礎數據要在BIM平臺發揮使用價值,首先要歸集成大家認可的企業定額庫、指標庫等。平臺的構建是關鍵,一定要由懂得施工流程與控制相關的專業人員和系統軟件建立數據庫。
2.2 需求出發,部門配合
首先要從需求出發,再分析自己的需求應該來源于哪些數據;由對應的各部門提供,專門部門管理;基礎數據庫要開發對應的應用,讓數據流動起來。
2.3 做好規劃,管理先行
做好大數據規劃,信息細度的劃分等數據管理規范是基礎數據庫的基石。在管理手段上提出符合專業數據的要求;在技術手段上和云、BIM等先進系統軟件結合;在理念上基礎數據是需要的;在制度上規定必須用;在技術保障上推廣BIM等手段[3]。
不同的建筑數據來源,必定對應不同的管理出處和管理目標,整合是關鍵,但還要進行必要的區分和歸類;基礎數據協同、共享的基礎是數據的結構化;建筑企業的目標是將項目流程化,模塊化,規范化。這樣整理出的大數據,才能為行業所用;建筑過程中發生的所有數據,都要能自動化、低成本、高效率收集起來,并能將數據盡可能結構化,并與行業業務系統對接,可隨時再利用,并可分享給全行業。
3 目前存在的數據構建難點
3.1 數據難以收集
建筑企業長期處于手工時代,基礎數據都存放于業務人員的大腦中。
3.2 數據無法實現共享
尤其是中小施工企業,各職能部門的數據,都是為自己部門服務,沒有統一口徑的數據;企業編碼不統一,建筑企業信息化數據難以共享,缺乏一個大的數據平臺。
3.3 基礎數據庫對專業要求太高
數據庫的專業化程度太高,非數據專家不能應用;建立數據庫考驗企業人員的業務能力;基礎數據庫的創建與運維,考驗信息化部門的信息管理能力。最關鍵的問題是,建筑行業管理層次的困難,就是對這海量數據的掌控能力不夠,因此必須要借助BIM這樣的工具。同時基礎數據庫需要一個緩慢積累過程。
4 BIM系統在基礎數據構建方面的作用
4.1 基礎數據提升管控力度,改善管理效率
基于BIM的基礎數據庫,數據被處理后的信息,是支持決策的關鍵,可以派生管理所需的信息;數據的歸集主要是將數據結構化,管控就是通過對結構化數據的應用,完成特定的任務與工作;基礎數據庫的建立實際是可以認為是我們施工企業管理理念的更新,提升管理的效率。
4.2 借助基礎數據,提升經濟價值
基于BIM的基礎數據庫,為我們規范管理,帶來經濟利潤的提高;基礎數據可以歸納、分析、提煉出一些KPI指標,應用于企業內部的考核和外部溝通;還能促進建筑工廠化建設,減少耗材和浪費,控制人工支出等。
4.3 實現數據共享,提升項目和企業協同能力
輕松管理軟件資產,過程數據留在企業數據服務器,不再擔心數據流失;工程問題照片實時收集和監管處理;知識積累和共享、建立企業標準:企業指標庫、企業自動套、企業定額庫、企業構件庫,讓企業中的每位員工都能成為行業專家,企業專家建設,全公司員工共享,大幅提升團隊專業水平;共享、協同、應用:輕松建立基于BIM的企業級項目基礎數據庫,實現BIM圖形數據、報表數據共享,實現產值統計、生產計劃、材料用量分析、成本分析等多項企業應用。
5 結束語
大數據時代,BIM技術不僅在處理項目級的基礎數據方面發揮了作用,在支撐企業級海量數據方面,同樣具備強大的能力。建筑業項目管理主流模式至今還是以承包制為主,集約化運營難以做到。其根源就在于企業級數據集約化還無法實現,但基于大數據時代的需求,借助于BIM的企業級項目管理系統的發展,解決這一問題將不再是難事。
參考文獻
[1]孟小峰,慈祥.大數據管理:概念,技術與挑戰[J].計算機研究與發展,2013,50(1):146-169.
[2]侍干霞.建筑企業信息化建設[J].城市建設理論研究(電子版),2014(7).
Gartner報告預計,2013年全球各大企業用于大數據業務的投資總額將增至340億美元,同比增長8倍;2013年年初IDC預測,大數據技術與服務市場將從2010年的32億美元攀升至2015年的169億美元,實現高達40%的年增長率,并將是整個IT與通信產業增長率的7倍。大數據的發展趨勢毋庸置疑。
數據越發龐大,積累的商業信息越多,價值也就越大。以海量、多樣、快速為顯著特征的大數據,不像傳統數據庫的數據那么易于管理和分析,在為整個IT及通信行業帶來機會的同時,也提出了更高的要求。大數據時代的戰略意義已超越如何掌握龐大的數據信息,而是實現對這些數據的深層挖掘,進而讓其“增值”。
驅動大數據發展的重要因素主要來自兩個方面:一是消費領域,如網購及社交媒體應用產生的大量數據;另一方面來自城市基礎設施建設,安防便是其中之一。建設平安城市的過程伴隨大量數據的產生,尤其是以視頻監控為主要特征的數字安全監控(Digital Security Surveillance, DSS)。我們所居住的城市中有無數的高清攝像頭,涉及治安監控、指揮通信、偵查破案、規范執法、社會服務等,視頻接入規模從幾千到幾十萬,隨著安防監控對高清、智能、聯網的要求越來越高,每天產生的數據規模正以驚人的速度不斷增長。
安防大數據
從全省、市視頻監控,交通卡口監控,到運營商機房和基站的環境量監控,原有的系統數據查詢越來越慢,寫入的數據越來越多,需要配置的存儲也越來越大,原先使用的關系型數據庫性能壓力激增,IO陷入瓶頸,不得不承認安防領域的大數據時代已經來臨。然而,一直以來,由于安防行業的自身業務特點以及國內廠商受研發方向所限,大數據技術在安防領域并不如在IT、互聯網行業那樣得以深入應用。隨著科技巨頭的入駐,這一市場格局正在發生巨變。
基于安防的大數據同樣引起了計算機和服務巨頭IBM的注意。2012年10月,IBM了專為大數據處理打造的專家集成系統PureData,并和南京有關部門達成建設“智慧南京”的戰略合作,綜合應用智慧交通、智慧醫療、智慧數據系統,提高南京市民的生活水平。
云計算解決方案供應商浪潮緊隨其后,于同年年底宣布推出用于大規模部署的公共云數據中心——“模塊化數據中心”。 “數字安全監控遠非安裝幾個攝像頭那么簡單。除了捕獲數據,還要從中充分挖掘新知,在此基礎上開發更多應用。傳統安防廠商和IT廠商合作是未來的發展趨勢。安防廠商對業務的熟悉度與IT公司的大數據檢索和分析能力是絕佳的互補。”英特爾公司全球數字安全監控市場總監Todd Matsler如此評價。
智能計算至關重要
隨著政府部門大力推動“平安城市”、“和諧社會”建設,各行各業對安防產品的需求全面爆發。金融、交通、政府等傳統領域的安防應用更加深入,新生領域如教育、衛生、體育、能源飛速發展,社區、居民相關應用也在不斷升溫。根據《安防產業“十二五”規劃》所提到的目標,到“十二五”末期,安防產業規模將翻一倍,年均增長率達到20%左右,2015年總產值達到5000億元。從高端市場如軍隊、政府、司法、金融、交通、核電站、機場與港口,到中端市場如工業設施、教育、醫療,再到居民小區、零售店鋪、倉庫管理、物流等民用市場,安防需求將全面爆發。
與此同時,安防行業在國內的發展表現出一個重要特點,即由政府主導的大型項目推動,如智能交通系統。以視頻監控為主要特征的數字安全監控扮演著無可替代的重要角色,在城際間、城市中的各類設施及行業中不斷部署、滲透。隨著視頻監控與IT、電信行業的聯系日益緊密,數字化、高清化、網絡化和智能化成為其發展方向。
如何從前端攝像頭獲得的數據中挖掘出有用的信息,最終服務于智慧城市、智能交通?我們需要構建一個復雜而精致的系統,并考慮互聯性、安全性和可管理性。英特爾在構建這個系統時,利用主動管理技術實現了設備之間的互聯,并提出了分布式智能計算的構想。后者包含三個重要概念,一是如何從瀚如煙海的數據中挖掘出對各行業有用的知識,二是保證基礎架構及設備與設備間的數據流動,三是降低數據對來自于不同用戶或者不同系統的訪問障礙。”
這套系統化解決方案,從數據獲取、存儲到分析及應用各個層面均有覆蓋,包括軟件。這些基于IA架構的技術,不僅廣泛應用于后端運算系統以及開發系統,也在前端和邊緣設備中發揮著巨大作用,可以幫助設備開發商大幅縮短產品上市周期,降低開發成本,同時,其強大的計算能力以及基于互聯網應用的開放平臺也將進一步促進安防行業的多樣化發展。
而博康智能副總裁田廣表示,安防行業的數字化、高清化、網絡化和智能化轉變,也契合了國家的物聯網政策。數字安防監控行業的現狀是缺乏標準卻要謀求大發展,這對企業產品兼容性、未來的可擴展性、產品性能、安全性以及穩定性是個很大的挑戰,需要企業在軟件、上層平臺等方面都有很強的規劃和實施能力。
安防的可期未來
全國政協委員、南京政協主席沈健就大數據時代政府的公共基礎建設需求這一主題曾說過:在大數據時代,政府要做的事情,第一應該高度重視數據的采集和生成;第二做好數據的公開工作;第三,數據的整合;第四,建立我們的數據文化;第五,數據安全。這意味著在智慧城市的基礎建設中,大數據將承擔更多信息的挖掘和整合工作。
當數據全面實現聯網、共享,得到有效存儲,并予以充分分析和挖掘,安防領域的大數據時代將真正深化。那時警察可以輕松地搜索某一時段某一顏色或某一品牌汽車的所有視頻并快速識別違章行為;在沒有人為干擾的情況下,視頻監控設備通過自動分析對動態場景中的目標進行定位、識別和跟蹤,在異常情況發生時做出反應,進行自動報警;現在每年社會走失的老人、小孩成千上萬,開發“人員走失查詢系統”,聯網共享這些視頻資源,將為更多的老百姓服務……
大數據究竟可以帶給安防一個怎樣的未來,我們拭目以待!
-李育新
LSI SAS力挺新型服務器
LSI 公司日前宣布,其12Gb/s SAS存儲解決方案將用于100多款新型服務器,這些服務器均采用日前宣布的IntelXeon處理器E5-2600 v2產品系列。包括Asustek、Fujitsu、Gigabyte、Huawei、Intel、Supermicro等在內的領先服務器制造商,均已選用LSI12Gb/s SAS和MegaRAID解決方案,為其新一代服務器平臺提供存儲性能加速和企業數據保護功能。
LSI 12Gb/s SAS技術能將存儲I/O性能提升50%。Intel Xeon 處理器E5-2600 v2產品系列采用22nm工藝技術,大幅降低了功耗,同時提升了性能。這樣的組合解決方案將為新一代服務器提供強大的平臺。
今年,針對服務器和外部存儲OEM廠商,LSI宣布推出業界首批12Gb/s SAS 片上RAID(RAID-on-Chip)和I/O控制器。7月,LSI率先宣布向市場推出12Gb/s SAS主機總線適配器系列產品。
自SAS誕生以來,LSI推出了眾多領先的產品。LSI SAS解決方案能提供同類最佳的SAS技術,確保互操作性和統一的廠商支持,現已應用于業界最廣泛的服務器平臺之上。
昆騰改變數據存儲、共享和保護方式
昆騰公司近日宣布正在與CommVault一同擴展其對象存儲產品,以便為數據中心融合備份與歸檔提供獨一無二的解決方案。這個經過驗證的解決方案基于昆騰Lattus對象存儲技術以及CommVaultSimpana 10 軟件,能夠實現全面數據保護和歸檔戰略,從而降低了主存儲成本并優化了備份性能,同時在多 PT 級環境中最大程度降低了管理復雜性、管理成本和資本支出。
在一個高度可擴展、高成本效益,并且不需要“叉車式”升級的一種永久性磁盤歸檔的磁盤解決方案中,Quantum Lattus可近線訪問全球各地的歸檔數據。Lattus提供比傳統 RAID 產品更優異的耐用性,其中包括真正的自我修復和自我保護功能,并且無需復制就能自動進行多站點保護。最終實現一個無需備份的高彈性、容災、可擴展的歸檔庫。CommVaultSimpana將備份、歸檔、報告和災難恢復(DR)統一到一個軟件平臺上,提供一個融合數據管理解決方案來控制成本和風險。通過昆騰Lattus-D 與CommVaultSimpana的整合,企業現在可以放心地在Lattus上存儲單一歸檔數據實例。這種方式超出了傳統冗余副本數據保護計劃所提供的保護措施。客戶還能得益于全球規模所實現的低延遲訪問。
Emulex光纖通道助力HP StoreFabric
關鍵詞:大數據;管理會計信息系統;項目管理
引言:大數據時代,能否從海量信息中獲取關鍵或相關信息,進而獲得客戶,成為企業盈利的重要環節。對大數據的分析和應用是管理會計的職能之一。傳統管理會計重視財務信息的分析和應用,忽略了海量非結構化的業務數據,與業務脫節嚴重,管理會計報告質量不高。2016年,財政部《會計改革與發展“十三五”規劃綱要(2016-2020)》,提出“提高企業會計信息化水平”,“推動基層單位會計信息系統與業務系統的有機融合,推動會計工作從傳統核算型向現代管理型轉變”,并“密切關注大數據、“互聯網+”發展對會計工作的影響”。這表明管理會計信息化已上升成為國家戰略層面的高度。管理會計信息化成為企業的基本要求,數字化、信息化、智能化轉型勢在必行。如何構建大數據管理會計信息系統并應用,是本文研究的重點。
一、大數據對管理會計的要求
1.大數據和大數據技術
自媒體和多渠道電商平臺的興起,產生了海量大數據。大數據是指與目標群體相關的存儲類型多樣化的海量數據,具有短時間體量巨大、類型多樣化、價值密度低、時效性高等特征。大數據分為結構化和非結構化數據兩種。結構化數據是指能夠以一定的邏輯結構進行呈現的數據,通常指以文字、數字和表格形式存儲的財務數據、人事數據、供應商和客戶數據等,這些數據便于使用者運用傳統技術方法進行計算和分析。非結構化數據是指不能以一定的結構呈現,以圖片、動畫、音頻、視頻等多樣化存儲形式存在的數據,這些數據難以使用傳統技術方法提取有效信息,且產生時效短,數量巨大,因此,需要大數據技術及時對數據進行挖掘、清洗和分析,才能提取經營決策有效信息。
大數據技術包括大數據信息平臺構建、數據挖掘和清洗、數據分析和處理等技術。大數據挖掘是對數據的全覆蓋式搜索,通過關鍵詞的精準和模糊搜索,全面搜索含關鍵詞的字段、圖片、動畫、網頁、音頻、視頻等數據,按一定規則對數據進行描述、分類,歸入數據倉庫。數據清洗是依據一定規則對分類數據提取關鍵信息,清洗無用數據和信息,歸集至相應的數據庫。數據分析和處理是指運用聚類分析、回歸分析、決策樹分析等大數據分析方法對數據進行分析,發現數據的變化趨勢,為經營決策提供數據佐證。
2.大數據與管理會計信息系統的關系
大數據的發展為管理會計信息系統提供了共享云平臺,提高了會計信息化處理效率,降低了會計信息化成本。應用大數據技術數據,能夠做好市場預測幫助企業抓住先機,提高財務決策的科學性,提升了管理會計分析預測的精準度和效率。同時,大數據對管理會計提出了大數據思維、分析能力、工具應用能力等更高的要求。
管理會計信息系統是助力管理會計實現增值目標的應用工具,其構建的原則和框架,不僅應基于項目單位的建設需求,還應符合大數據時代的要求。管理會計信息系統基于大數據技術進行搭建,對結構化數據和非結構化數據進行全面搜索,歸集到基礎數據庫中,采用信息技術對數據進行挖掘和清洗、分析處理形成可視化數據庫,提供專業化、可視化的數據處理報告、專項報告、項目決策報告。
二、大數據時代管理會計信息系統構建原則和框架
1.構建原則
(1)安全性原則
管理會計信息系統,是多部門協同建設和使用的數據系統,應從用戶級別和使用權限、信息搜集和處理、跨庫數據提取等方面保證數據庫的安全性。首先,建設單位應依據管理層級和權限設置用戶級別和權限,確保在用戶登陸和使用范圍的安全性;應設置信息的重要性等級標準,便于數據讀取部門能夠依據數據等級標準判斷數據來源的重要性。其次,管理會計為了做出戰略決策、財務決策、項目決策,需要從內外部搜索、接收大量數據。信息搜索過程面臨較大風險,應建立高標準的防御措施,抵抗病毒和黑客的入侵。最后,管理會計信息系統內部跨庫數據的訪問和提取環節,是安全保障的重要環節,應在確保安全性的前提下提升跨庫訪問和提取的速度。
(2)開放性原則
管理會計信息系統應按照開放性原則,建立開源云平臺,架設開放性結構,滿足大數據處理的需求。未來的稅務征管系統、銀行系統、工商系統等平臺都將實現數據開放查詢。架設開放性結構的管理會計信息系統,能夠滿足外部環境和信息復雜多變的管理需求,多端口設計可以為企業后續擴容提供便利。
(3)統一性原則
管理會計信息系統包括人力資源系統、財務信息系統、供應鏈系統、銷售信息系統等多個數據庫。各個數據庫相互獨立,具有不同的數據代碼和標準。要建設管理會計信息系統,需要整合各獨立數據庫的序號、代碼、標準和轉換規則,按照統一性的原則,實施整體統一代碼規則。只有依據統一性原則建設,各獨立數據庫才能實現跨庫搜索和查詢,形成統一的數據庫資產,才能為實現管理會計目標提供數據支持。
2.構建框架
管理會計信息系統是由多個數據系統組成的復雜系統。依據系統論的理論,多個要素組成的復雜系統,具有開放性、自組織性、整體性、關聯性、等級結構性、動態平衡性等共同特征。根據系統論的觀點和方法,管理會計信息系統可按照基礎設施層、基礎數據層、分析應用層和綜合報告層進行構建。管理會計信息系統構建框架見下圖。
(1)基礎設施層
基礎設施層是系統的平臺,是數據存儲的媒介,由互聯網、服務器、云服務器、計算機軟硬件等組成。企業應根據戰略發展的需要和實際財務狀況,系統化設計管理會計信息系統,明確項目建設預算,制定合理的實施方案。基礎設施層的構建不僅要滿足現有的系統管理需求,還應保留足夠的可拓展空間,便于未來的開放性結構擴容。
(2)基礎數據層
基礎數據層是管理會計信息系統的數據輸入層,分為結構性數據和非結構性數據。其中,結構性數據由人力資源部門、財務部門、業務部門、研發部門等分別在相應系統端口輸入源數據;非結構性數據則由系統采用大數據挖掘技術從外部獲取,包括從政府網站、工商、稅務、銀行、電商平臺、論壇等多渠道獲得實時數據。基礎數據層存儲各種類型的源數據,為分析應用提供數據依據。
(3)分析應用層
分析應用層包括兩部分,第一部分是預算管理、戰略管理、資金管理、成本管理、投融資管理、風險管理、績效管理等管理會計工作任務;第二部分是大數據技術工具和管理會計工具。分析應用層的職能是通過大數據挖掘、分析技術、管理會計工具,對基礎數據進行分析和應用,完成管理會計工作任務。系統運用大數據挖掘、清洗技術,對非結構化數據的圖片、音頻、視頻、動畫、網站信息進行描述、歸類,挖掘有效信息;并通過聚類分析、決策樹分析、回歸分析等技術對有效信息進行分析,為管理會計的預算管理、資金管理、投融資管理、成本管理、風險管理、績效管理等職能管理提供清洗后有效信息。管理會計應對結構化和轉化后的非結構化數據進行綜合處理,才能做出精準的決策。
(4)綜合報告層
綜合報告層是管理會計經過分析處理后提供的可視化報告,包括預算報告、戰略報告、經營管理報告和績效報告等。綜合報告層是管理會計信息系統的核心,其機密程度、訪問權限和修改權限應為最高級。綜合報告可以不設置固定匯報格式,依據管理層的需求,提供有針對性的管理報告。
三、管理會計信息系統在項目管理中的應用
在阿米巴經營理念下,每個業務部門都是一個獨立經營、自負盈虧的主體。各獨立核算主體按業務類別劃分項目制進行運營。每個業務部門或每個項目配備一名業務伙伴(以下簡稱BP)。企業設置BP崗位,是對業務的支持。BP是將財務職能提升到業務前端,與業務同步,為業務提供預算編制和調整、風險識別和防控、資金結算與費用控制、財務分析和評價等管理會計服務和支持。BP的職能,一是輔助業務部門跟進全流程,為業務提供專業的財務建議和服務,二是為管理會計提供全過程鏈的分析數據。BP崗位能力,除了具備管理會計能力和信息系統使用能力,還需要掌握宏觀經濟基礎、行業生命周期、產業鏈、企業的經營戰略和策略、采購模式、生產工藝流程、營銷模式等信息。本文以項目管理中BP的工作流程來介紹管理會計信息系統在項目管理中的應用。
項目管理中,BP的工作主要分為事前預測和服務、事中控制和支持、事后評價和反饋三部分。BP進入項目組,需要掌握項目實施區域環境和風險評估、項目業務流程、主要競爭對手、項目預算等情況,才能為項目提供全流程專業預測和支持。管理會計信息系統是BP快速掌握項目情況的優質工具。項目階段BP和業務的工作成果表如下。
1.事前預測和服務
事前,BP的職責是對項目區域宏觀環境、法律規章、行業生命周期、項目競爭程度進行風險評估,完成項目預算計劃。BP可以運用大數據挖掘技術,搜集項目實施區域最新的政策文件、稅收優惠條件、項目實施最新規定、同類項目案例文書等資料,錄入管理會計信息系統的基礎數據層;通過對比分析,生成該區域項目實施的外部環境可視化報告;結合企業過去存儲的同類或相同區域的區域環境風險評估報告,生成本項目的可視化風險評估報告。風險評估報告應包括項目流程圖和風險識別點標識,有利于項目業務執行的風險防控。BP編制項目預算,應在公司年度總預算內控制項目預算額度。BP編制項目預算計劃,應依據項目執行方案,按照時間序列和項目進度,填制預算資金支付計劃表,并按預算調整因素確定預算調整金額幅度。經項目負責人調整和確定后,確定項目預算計劃。
2.事中控制和支持
事中,BP的職責是對項目執行的風險識別和控制,提供財務支持和服務。BP的風險識別和控制主要體現在對項目合同的成果交付和支付等條款議定,以及財務結算風險控制。項目按產品和服務類型可分為常規項目和新增項目。對于常規項目,BP可以通過管理會計信息系統獲得以往期間同類項目的風險評估報告和項目風險控制表,可對同產品項目的風險點識別和控制有清晰認知。對于新增項目的風險識別,BP可以運用大數據挖掘技術搜索項目風險評估因素,并通過與項目負責人的溝通,明確項目風險識別和控制環節,提升項目風險防控水平。BP對項目的財務支持主要體現在對結算票據的核算處理環節。BP將票據掃描錄入后,系統調用合同庫數據,自動比對開票人、票據金額、產品名稱、發票號碼、發票專用章等信息要素。通過比對審核后,項目的業務流、資金流、信息流進入相應分析應用層的專項管理系統。資金流信息進入資金管理系統,完成資金收付和會計記賬等核算工作。業務流信息進入項目管理系統,動態顯示項目進度。供應商、客戶、產品工藝、產品流程、采購費用等信息流信息進入信息管理系統,豐富項目信息數據。
3.事后評價和反饋
事后,BP的職責是對項目績效、人員績效和往來單位進行評價,并完成項目績效報告、員工績效報告、往來單位評價報告和項目總結報告。項目績效報告不再是過去對項目的經驗總結,而是依據管理會計信息系統的預算計劃、執行、調整、項目盈利等情況進行針對性的科學評價。員工績效報告,依據項目方案,按進度和時間節點,對員工完成項目任務的質量和進度進行評價,既利于項目員工成長,也利于項目管理。往來單位評價報告,從信息管理系統導出基礎數據,按照項目評價標準對供應商和客戶進行級別評價,并列出評價依據。評價依據應按照往來單位規模、管理制度、人員能力、預算執行、合同議價等因素進行客觀列示。項目總結報告是從財務角度對項目方案、預算執行、盈利能力、發展能力等進行總結。
綜上,可以看出,大數據時代,管理會計信息系統運用大數據信息技術和管理會計技術進行大數據信息處理、財務支持和風險防控,在事前、事中、事后三個環節能夠有效降低項目的風險水平,提高項目執行效率,提升項目盈利能力。
四、管理會計信息系統的安全保障
關鍵詞:大數據 SAP HANA 電力大數據 電力系統
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2016)11-0150-01
近年來,國內許多電力企業的業務不斷發展,除了傳統的火電發電,還涉及風力發電、光伏發電、電站檢修和運營服務等方面業務。為了加快兩化融合,促進企業管理及信息化雙提升要求是建設企業運營管理系統的大數據平臺的關鍵驅動因素,大數據平臺的建成將成為企業管理及信息化運轉的驅動引擎,是加快電力信息化規劃實現步伐。
通過大數據平臺建設,形成全公司范圍的運營管理解決方案,保障企業管理工作標準化、規范化、精細化、高效化,真正為決策服務。電力企業大數據平臺具有業務數據量大,分析模式復雜,數據讀取頻繁,等諸多特點,如何利用最前沿的軟硬一體的大數據庫應用支撐是擺在電力企業運營管理系統建設面前的重要難題。
1 大數據定義與特征
大數據又稱海量數據,指的是所涉及的數據規模巨大,以至于目前已有的軟件工具無法在合理時間內,處理、管理、挖掘這些數據,并將其整理成為幫助企業經營決策更積極目的的信息。大數據的4V特征:數量(Volume),即數據巨大;多樣性(Variety),即數據類型繁多;速度(Velocity),即處理速度快;價值性(Veracity),即追求高質量的數據。
2 SAP HANA技術
SAP HANA提供多用途的內存應用設備,企業可以利用它即時掌握業務運營情況,從而對所有可用的數據進行分析,并對快速變化的業務環境做出迅速響應。
通過SAP HANA,企業可以在業務運作期間基于海量實時詳細信息分析業務運營情況。企業可以探索和分析來源于所有數據源的全部交易數據和分析數據。運營數據在產生時由內存獲取,并通過靈活的視圖迅速將分析信息呈現給用戶。外部數據可輕松的被添加至分析模型,與整個企業的數據進行整合。
3 電力大數據平臺的架構設計
電力大數據平臺系統具有業務數據量大,分析模式復雜,數據讀取頻繁,等諸多特點,如何利用最前沿的軟硬一體的大數據庫應用支撐是擺在電力企業運營管理系統建設面前的重要難題。
3.1 電力大數據平臺架構
將數據平臺總體架構劃分為三大層:采集層,存儲層以及分析/展現層。這種架構,是對傳統標準企業級數據倉庫架構的擴展,既能滿足一個數據中心平臺層面的所有需求,又具備充分的前瞻性,為未來EOM提供實時、兼具廣度和深度的大數據應用提供支撐。
3.2 數據采集層設計
數據抽取、轉換、加載的任務將在此處完成。整個平臺的數據整合能力將由SAP HANA Smart Data Integrator來提供,通過開放的數據接口連接各種類型的底層數據源,并且在數據加載的同時進行第一輪的數據清洗任務,提高保證數據的規范性。
3.3 數據存儲層設計
數據存儲管理是本方案的核心部分。在整個方案設計中,SAP建議把數據按照數據的時效性分層管理,即歷史數據和活動數據。歷史數據部分包含所有的分析數據,存放電力企業歷年來的數據。活動數據(熱點數據)部分包含日常分析中最常使用的數據,所有的前端分析數據都將在活動數據中命中,在活動數據中將進行保證最大的數據分析并提高和數據檢索效率。
3.4 數據分析/展現層
SAP建議使用SAP BusinessObject作為整體的數據展現平臺。BO中的語義層工具Information Designer Tool(IDT)將負責業務數據模型的整體管理,通過IDT中的數據調用,把需要展現的數據輸送給前端工具進行報表展示。
4 關鍵技術及方案優勢
高性能內存計算技術:數據分析應用,對實效性往往要求極高,對數據存儲平臺提出了更高的要求:高速的數據裝載的同時,提供毫秒級的查詢響應。全面的數據集成能力:本方案ETL工具將利用SAP數據采集系統SAP Data Integrator,這是一個專門面向企業信息管理的應用平臺,幫助企業遷移、轉變和提升數據。實時數據流分析能力:SAP在信息集成過程,增加了獨一無二的架構――基于內存的實時數據流處理機制,把需要處理的數據在內存中流動起來,高效地輸送到各個處理環節,實現高頻次、小批量的數據處理調度,到達高吞吐量、低延時的理想效果。
5 結語
本文提出了一套針對電力系統的解決方案和基于SAP HANA的大數據平臺架構,大數據平臺架構包括對電力數據采集層,數據存儲層和數據分析/展現層,該平臺在高性能,數據集成,實時數據流分析和可靠性上具有很大的提高。對電力大數據平臺的研究還存在很多不足之處,還有待在今后的學習和工作中進一步研究。
參考文獻
[1]Liu Qingyun, Gao Shu, Cao Xiufeng, Chen Liangchen.Research Of The Security Situation Visual Analysis For Multidimensional Inland Navigation Based On Parallel Coordinates. The Third International Conference on Cyberspace Technology[C].EI: 20161802313580.
百尺竿頭
推動基礎軟件平臺建設
中國信息化周報:您如何看待南大通用2014年的發展?
崔維力:2014是公司成立十年來發展最快的一年。首先員工人數從年初的300人發展到年末的近500人,并建立了一套有效的技術人員任職資格評價體系;其次,我們自主研發的支撐大數據應用的新型數據庫GBase 8a集群規模突破120節點,在電信、金融等領域應用不斷突破,市場營收增長40%以上,特別是中國農業銀行基于GBase 8a構建的總行數據倉庫正式上線,可以說是國產基礎軟件在金融領域應用的一個里程碑。我們還專門搭建了PB級的結構化大數據測試平臺,來驗證GBase 8a產品,這應該也是國內數據庫廠家獨有的。另外,今年我們還通過和IBM戰略合作獲得了Informix數據庫技術授權,我們將基于Informix最新源代碼自主構造一款面向高端行業復雜事務處理的數據庫產品GBase 8t,這樣通過引進、消化吸收、再創新,GBase 8t將與GBase 8a一起構成公司“雙子星”產品,分別在OLTP和OLAP領域為南大通用的更高速發展提供有力支撐。2014年的這些發展,使公司上下樹立了打造國產數據庫龍頭的信心。
中國信息化周報:中國擁有數據庫龍頭企業也是用戶、產業、政府所期望的。
崔維力:是的。數據庫具備平臺屬性,平臺需要龍頭。國際上無論軟硬件平臺,都是圍繞龍頭構建產業鏈,龍頭需要一定規模的用戶、配套工具、人才來支撐。我們國家硬件平臺的龍頭效應好一些,比如服務器、PC機,甚至手機等,但CPU、OS、數據庫尚缺乏真正龍頭,很難形成良性格局。
中國信息化周報:在當前環境下,推動基礎軟件平臺的龍頭打造,需要政府哪方面的引導?
崔維力:南大通用2014年的高速發展離不開政府部門的支持。今年,工信部電子發展基金、發改委云專項都支持了南大通用打造面向關鍵行業的大數據處理平臺,我們將基于GBase 8a集群與Hadoop的“混搭架構”構建支撐我國電信、金融、安全等領域的大數據處理平臺解決方案。另外,今年天津市也把南大通用列為重點支持企業,何樹山副市長及各委辦局領導都專程到公司調研指導,濱海新區領導更是多次到南大通用指導工作。
中國信息化周報:但是,龍頭可能帶來壟斷的問題。
崔維力:這個問題需要辯證的看。追求商業目標,龍頭往往會帶來壟斷。打破壟斷則往往靠創新,然后新的一代龍頭形成。正是在這個不斷打破的過程中,技術、社會在進步和發展。當前環境下,培育龍頭是支撐國產化及自主可控戰略的抓手。這個龍頭首先是催生類似CPU、OS、數據庫等基礎平臺產品的龍頭。參照IBM、MS等從軟硬一體化上打造全鏈條也許是可行的,鏈條上產品選擇不開放,也許會帶來整個鏈條的“木桶效應”。
布局OLTP市場
實現數據庫國產化替代
中國信息化周報:前面您提到農行數據倉庫案例,您說它是國產基礎軟件在金融領域應用的一個里程碑?
崔維力:南大通用今年在行業營銷上取得持續增長態勢,這得感謝我們中興、榮之聯、浪潮、東軟等合作伙伴,不斷拓展我們GBase 8a產品在電信、金融、安全等領域的應用,更把它帶出國門。農行數據倉庫項目是一個十分典型的案例。農行數據倉庫建設選用的是我們GBase 8a集群產品,目前已經上線的數據存儲與管理平臺,數據量達到500TB、每日新增數據800G,支撐包括貸記卡、信用卡、網絡銀行、資金轉移定價等多個業務需求。
此項目成功實施,使農行成為國內首家在核心系統中進行數據庫國產化部署的銀行,破除了對國外昂貴產品的依賴心理,而且節約建設成本70%以上。該項目能成功實施與農行領導重視國產化及安全可控信息技術應用,保障金融數據安全可控,并從響應國家戰略角度,以一種使命感、頂著巨大壓力支持國產化應用分不開。正是這種敢“吃螃蟹”的勇氣,不僅幫助了國產數據庫產品的成熟,堅定了金融領域實現數據庫國產化替代的信心,而且也成就了國產基礎軟件在金融領域應用的一個里程碑。
中國信息化周報:GBase 8a在金融、電信領域的主要競爭對手是國外產品嗎?
崔維力:GBase 8a定位數據分析類應用,也就是OLAP應用,它的價值點在高速。我們在國內市場上直面競爭的是EMC、HP、Teradata等國際一線產品。經過我們5年多的產品打造,GBase 8a在技術上與國際同類產品保持同步,這兩年我們與國際上競爭對手同臺竟測,一直名列前三甲。GBase 8a集群定位于支撐行業大數據或結構化大數據,我們很多應用實踐表明它與Hadoop的混搭架構是復雜大數據應用場景下的理性選擇,Hadoop的非結構化大數據處理能力強大,而GBase 8a集群使用SQL進行結構化大數據處理和分析,并具有高并發、支持多表聯合復雜查詢、高安全等優勢。
當前我們的研發團隊正在進一步完善在大數據存儲管理平臺中GBase 8a計算引擎和Hadoop計算引擎的深度融合,并實現相互間的數據透明交換。構建全數據統一存儲、統一計算、統一分析、統一服務接口、統一監控管理的大數據應用平臺。明年我們將創新突破200節點以上更大規模的集群部署,以及跨數據中心的數據同步與統一管理等很有挑戰性的問題,從而保持市場競爭力。
中國信息化周報:國內基礎軟件領域,包括操作系統和數據庫,大多采用基于開源軟件的發展模式。GBase 8a這種引進商業源代碼授權的模式,其差異化何在?
崔維力:首先一個不同之處在于我們基于Informix源代碼進一步開發的功能,包括對國產CPU的支持、安全功能模塊、集群功能模塊等源代碼的知識產權完全屬于南大通用,我們是可以不反饋給IBM的。當然,和IBM協同發展Iinformix源代碼體系是另外一個問題。開源軟件已成為一種主流的軟件開發模式,軟件服務化也已成為一種趨勢,我們也在計劃在適當時間把我們GBase 8a的源代碼以及我們基于Informix的增值開發模塊的源代碼開源到社區里。南大通用希望推動國產數據庫領域軟件開發上的參與分享模式。
中國信息化周報:南大通用今年發展很快,您目前的感受是什么?
1檔案數據采集安全
檔案數據采集包括電子文檔的收集和紙質檔案的數字化處理兩個部分。檔案數據采集安全在強調數據收集的齊全完整的同時,也要考慮由于重復收集產生的數據冗余問題。
1.1檔案數據收集范圍擴展
從某種意義上來說,“大數據”的一個重要理念就是掌握的數據量越大、內容越豐富,從中推斷出的信息就越多、結論就越有參考價值。具體到檔案工作,無論是從檔案的憑證價值和情報價值,還是檔案的現實價值和長遠價值,抑或檔案的第一價值和第二價值來考慮,就檔案數據收集而言,可能需要重新思考收集的范圍和形式。大數據往往是唯一的樣本數據集。舉例而言,那些測量交通、土壤酸堿、雨量、風力等物理信號的監控設備,或視頻監控以及其他類型的器材所連續積累的時段性或實時性數據,都單獨記錄著一個唯一的活動片段,一旦數據丟失,這個片段就隨之永遠消失。[6]從檔案收集的齊全、完整、真實、有效和數據安全考慮,這些數據文檔都應該實時在線歸檔,并同時保存離線副本。具體操作規范和標準可參考《電子文件管理暫行辦法》(中辦、國辦廳字〔2009〕39號)和《電子文件歸檔與管理規范》(標準號:GB/T18894-2002)。另一個比較典型的案例是美國政府的《聯邦政府Web2.0使用情況和檔案價值報告》,該報告中提到,在社交平臺上產生的信息,只要具有業務價值、證據價值和背景價值,就可以認定為歸檔的文件。我國迄今為止雖對這類內容無具體的歸檔規定,但根據大趨勢判斷,各級各類檔案館的收集范圍需要主動擴展。檔案大數據也可以說是檔案的“全數據”。相對于其他領域的數據收集,檔案大數據更強調的是數據的“全”:收集業務范圍內的所有檔案數據。一個基層檔案部門,只要收集了本機關、團體、企事業單位的全部檔案數據,即使數據總量不大,也可以稱之為大數據。因為在其后對這些數據進行的分析,將采取“樣本=總體”的方法;凡采用這種分析方式的數據分析方法,就稱為大數據分析。當一個機構擁有全部或者幾乎全部的檔案數據,就能從不同的“相關”關系而非“因果”關系中更細致地統計和研究數據的方方面面。因此,檔案大數據中的“大”不是絕對意義上的,而是相對意義上的“大”。與此同時,在具體工作中我們也發現,在大數據環境下,原來按“單位”進行的檔案收集會有相當程度的冗余信息產生。例如,各級部門下發的紅頭文件,如果每個收文單位都作了歸檔,在今后可能建立的某種級別的云檔案數據庫中就存在相當的數據冗余。[7]這時就可能需要在歸檔的源頭與具體規定這類文件的歸檔單位,其它收到此類文件的單位不需要歸檔,但在需要時有查詢和利用的權限。
1.2紙質檔案數字化過程和結果安全
紙質檔案數字化的過程安全是指在檔案數字化過程中沒有發生危害檔案實體和信息安全的事件或行為。因此,一系列的規章制度和規范的操作流程是必要的。首先,要考察數字化服務提供單位的資質和信譽。其次,要建立完善的管理制度。例如,案卷不準擅自帶離加工現場;當日數字化的案卷必須當日歸庫;案卷進出庫有嚴格的交接、檢查手續等等。最后,在數字化的過程中嚴格遵守《紙質檔案數字化技術規范》(標準號:DA/T31-2005),檔案的拆卷要以不破壞檔案裝訂原貌為基礎,在掃描過程中保證案卷整潔并確保掃描圖像與原件一致。紙質檔案數字化的結果安全是指數字化后的檔案數據有效、可用。因此,檔案數字化后必須經過電子檔案質量檢查這一環節。這也是對檔案數字化結果安全監控的重要一步。主要包括三個過程或環節:一是質量抽查,對于不合格的數據要及時返工重掃。二是數據檢測,主要內容包括病毒檢測、運行檢測和數據核對等三個方面。三是數據利用檢測,主要是將全部數據直接掛接到檔案管理系統后,對外提供利用時,是否出現錯誤或者使用者發現的一系列問題。[8]為了保證數字化后檔案信息的長期有效可用,異地的多種載體備份存儲和數字信息定期可讀性抽查、復制備份等制度的建立也是必要的。
2檔案信息管理系統安全
從上世紀90年代國內最早的檔案管理軟件產生至今,已經經歷了近20年的發展。隨著計算機及網絡技術的發展,數字化檔案管理方式在分布形式上從最初的單機版(C/S架構)、到網絡版(B/S架構)、直至發展到最新的面向服務的數據平臺(SOA架構);在功能上則從單一的僅實現簡單檔案管理的軟件、到檔案管理軟件與OA系統整合的數據庫、再到現今的將數字化檔案管理方式滲透到整個工作流(workflow)的數據庫平臺。檔案大數據是在檔案方面涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理并整理成為幫助企業經營決策更積極目的的信息。[9]因此,檔案信息管理系統的安全在很大程度上決定了檔案信息的安全。
2.1數據支持平臺安全
美國政府大數據計劃中的國家檔案和文件署(NARA)計劃為十億電子記錄(CI-BER)建設網絡基礎設施,這是一個聯合機構主辦的測試平臺。這個多機構主辦的網絡基礎設施,對國家檔案館87萬多樣化的數字記錄文件和信息的收集,可稱為計算研究所的“文藝復興”。這個試驗臺將評估技術和方法,進行超大規模數據收集,以支持可持續的訪問。[10]縱覽國內外各行業大數據建設實踐,構建檔案大數據平臺至少要實現四個層次的部署:一、云服務商提供全面、可視化的服務,尤其是檔案大數據服務委托方有權隨時監管、分析基礎設施中發生的所有事項;二、收集海量檔案數據,并解決各個數據庫的兼容問題;三、數據庫有更快識別目標、鎖定威脅來源和敵對事件的能力和相關設置;四、基礎設施具有可擴展性,可以執行短期和長期的分析。監控管理、風險控制、規則遵從是檔案云數據支持平臺確保安全的最基本要求。
2.2數據計算環境安全
傳統的數據庫系統不能有效地處理大數據的原因在于,這些系統的設計無法應對現如今結構化數據所占比例越來越低,數據類型日益復雜的狀況,以及傳統的數據庫無法既迅速又比較經濟地對系統進行拓展。不僅是硬件程序的設計環節,從數據管理的角度來看,少量的數據樣本容易進行單獨的測試和監控,而檔案大數據計算平臺上存儲的數據首先要有詳細的類別劃分,其次才是存儲和計算。檔案數據庫的數據分析完成后,是要將結果呈現給不同的人群使用的。針對同一條查詢指令,應該讓不同角色的人群看到不同的結果信息,即查詢所反饋的結果應該是不一樣的:技術人員讀取有關系統和設置管理的數據;檔案工作人員查看、操作與自身業務范圍相關的內容;普通利用者可以得到經審核公開的電子文本或目錄。大數據時代的檔案安全解決方案應該包括足夠強大的、能夠針對不同層次的人群提供不同的展現界面和工具。同時,檔案大數據系統必須具有目錄整理、檔案采集、檔案審核、系統維護等功能,并利用現化代網絡技術,實現多人多客戶端操作。
3檔案數據提供利用安全
正如1893年立式文件柜的出現最終解決了紙質文件的存儲和檢索的困難,檔案大數據必將對檔案信息的查找利用帶來顛覆性的變革:檔案收集保管的最終目的是為了方便利用;檔案大數據的核心不是擁有數據,而是拿這些檔案數據去做什么。
3.1檔案數據比對分析
檔案大數據最直觀的應用在于數據的比對分析。例如,在經適房的申購過程中,如何才能快速有效地鑒別申購者的資格?用申購者提供的姓名、身份證號等相關信息比對在房地產交易、車輛管理、金融機構等數據庫的相關信息,可以準確掌握申購者的資產狀況,剔除不夠格的申請者。還有一個典型例子就是我國醫療檔案大數據建設的“3521工程”。該項目融合了我國絕大部分三甲醫院和部分二甲醫院的數據庫和影像文件的數字化信息系統以及電子健康檔案系統,旨在通過數據自動匯總、統計分析,進行慢性病、流行病的自動篩查、趨勢分析和爆發預警;同時系統還可以為新藥研發、新治療方案的設計等工作提供數據支持。檔案大數據提供利用在一定程度上來說只需要知道檔案大數據“是什么”,而不需要知道“為什么”。這種變化已經遠遠突破了技術層面,將對人類認知世界的方式方法產生重大影響。從檔案大數據進行的對比分析,就是用檔案數據說話的最簡單直接證明。檔案工作的核心在“用”。利用者在檔案數據比對分析時,通過軌跡研判、信息關聯等方式,由已存的較全面的檔案信息,才能得出正確、合理的結論。在這種狀況下,可提供利用的數據資源的豐富,就代表了一定程度上的利用環境安全。
3.2檔案咨詢服務
(1.中南大學 信息科學與工程學院,湖南 長沙410083;2.中南大學 地球科學與信息物理學院,湖南 長沙 410083)
摘要:計算思維能力是當前國內外大學課程建設和教學改革的重要內容和方向。文章以非計算機專業數據庫系列課程為例,探討如何在教學過程中培養計算思維能力,同時對改革的重要內容即數據庫課程群建設進行分析,闡述如何在數據庫系列課程教學過程和課程群建設中引入計算思維的思路和方法,為高等學校教育教學方法和課程改革提供思路。
關鍵詞 :計算思維;教學方法;教學質量;課程群建設;課程改革
基金項目:湖南省普通高等學校教學改革研究項目(湘教通[2014]247號);教育部高等學校文科大學計算機教學改革項目(教高文計函[2014]05號2014-A128);全國高等院校計算機基礎教育研究會2014年課題(201445)。
第一作者簡介:奎曉燕,女,副教授,研究方向為計算機網絡和數據庫技術,xykui@csu.edu.cn。
0 引言
計算思維是由美國卡內基·梅隆大學周以真教授在Computational Thinking中提出來的。周教授認為計算思維是運用計算機科學的基礎概念求解問題、設計系統和理解人類的行為,其根本內容是本質、抽象和自動化。計算思維涵蓋了反映計算機科學之廣泛性的一系列思維活動,是與讀寫能力一樣的人類基本思維方式[1]。目前,國內外計算機界學者對計算思維這一課題進行了大量的研究。研究結果表明,計算思維不僅反映了計算機及計算機科學在當前社會中重要的新認識,也反映了計算機學科最本質的特征和最核心的方法,這在計算機技術飛速發展的今天尤為重要[2]。
1 計算思維在數據庫系列課程改革中的作用
數據庫技術是信息系統的核心技術。近年來,數據庫技術和計算機網絡技術相互滲透、相互促進,已成為當今計算機領域發展迅速、應用廣泛的兩大技術。在數據庫系列課程中,教學方法革新和課程群建設是課程改革的兩個重要方面。在數據庫課程改革中引入計算思維有助于正確理解計算和計算機,可以更好地揭示表象背后的核心問題,揭示不同現象之間的共同本質,從而有效提高教學質量,培養出時展所需要的高素質人才。
在數據庫系列課程的教學過程中引入計算思維的理念,應當使計算思維的本質始終貫穿整個數據庫課程教學過程,根據講授的具體知識點適時引入計算思維的思想,培養學生的創新能力和計算思維能力,久而久之,教師形成新的教學思路和行之有效的教學方法。具體來說,計算的想法是把復雜問題分解,把問題簡單化;計算的方法是選擇一個合適的模型反映這個問題的相關方面;計算的思維是考慮當出現問題時如何恢復等。總的來說,計算思維是采取適當的方法解決問題并理解人類行為,這是計算機科學中非常重要的一些想法[3]。
在數據庫系列課程的課程群建設中引入計算思維,必須先研究課程群各門課程的關聯性,通過課程整合刪除重復過時的內容,增加可增強學生應用和創新能力的新內容,一方面提高教學效率,使學生在有限的學時內能吸收更多的知識;另一方面,針對課程群理論與實踐并重的特點,通過引入計算思維更好地訓練學生的思維能力,提高學生的綜合技能。
2 在數據庫教學過程中引入計算思維的方法和步驟
在數據庫系列課程的教學過程中,一方面是理論知識講授,通過教學幫助學生正確理解和掌握數據庫的基本原理,熟練掌握數據庫的設計方法和應用技能;另一方面是通過實踐環節激發學生對數據庫相關知識的興趣,培養獨立探求新方法、新技術的技能,使之成為適應能力強、有創新精神和創造才能的專門人才。在數據庫系列課程的教學過程中引入計算思維,需要結合課堂教學和實踐環節這兩個方面。教師應當始終將計算思維的本質貫穿在課堂教學中,根據講授的具體知識點適時引入計算思維中涉及的關注點、嵌入、保護、轉化、糾錯和恢復、啟發式等基本概念和思維方法,引導學生領會計算思維的新方法;在實踐環節,教師提出問題、給出實驗任務,學生通過獨立完成或者小組協作的方式運用計算思維的系列方法解決實際問題,從中探索解決問題的新方法,發現問題的本質,達到更好吸收和鞏固知識、學會運用計算思維方法的目的,最終培養學生的創新思維和計算思維,提高其獨立思考、解決問題的技能[4]。具體實現方法主要包括以下幾方面。
1) 整合并精煉教學內容。
由于課程教學內容較多,教師應在課堂教學和實踐環節中將教學內容根據章節進行歸類、重新整合,選取重點和難點知識中的典型問題以提問的方式入手,用討論的形式加強互動,啟發學生同步思考,調動學生的學習積極性和參與熱情,形成師生積極互動的良好氛圍,使學生從被動接受知識變為主動探討問題,達到良好的教學效果。此外,教師應通過對整合性教學內容的分析,建立各相關知識點與計算思維核心概念之間的關系和聯系,在教學中表述出各知識點對應的應強化和滲透的計算思維具體核心概念。通過教師整合、分析和精煉教學內容,學生在有限的學時內可以更高效、主動地掌握更多知識和技能,同時這也有效促進教師不斷地自我學習和提高。
2) 采用生動具體的實例教學法。
在教學過程中,教師以當前點擊率頗高的淘寶網、當當網、京東網等多個購物平臺和銀行數據庫管理系統為切入點,引入數據庫的相關概念以及數據存儲、數據模型、數據組織等相關知識;通過在購物平臺上進行
關鍵詞 搜索查找特定信息的過程,引入關系、數據表、查詢、索引、視圖、存儲過程、觸發器等相關知識;通過購物者選中物品、點擊支付平臺進行網上提交訂單和在線付費購買的過程,引入數據庫的安全機制、身份驗證、登錄和權限管理、數據備份等方面的知識,這樣用學生熟悉的生活實例引出相關的數據庫知識點,幫助學生從更簡易、更直觀、更清晰、更生動、更透徹的角度學習相關知識,始終將計算思維的思想貫穿其中,擺脫傳統教學方法的單一性和枯燥性,激發學生的學習興趣,提高學習效果,一方面鍛煉學生的思維,另一方面激發學生的創造力和學習能力,讓學生掌握用計算思維思考和解決問題的本領。
3) 將計算思維融入實踐教學。
數據庫課程實踐環節重點鍛煉學生對計算思維方法的運用能力,引導學生探索解決實際問題的方法,是對課堂教學內容的補充,促進學生更好地認識和鞏固計算思維的方法。實踐環節可以采用課堂練習、綜合設計等多種形式;對于單一知識點練習題可以要求學生獨立運用計算思維方法完成;對于綜合設計題,學生可劃分小組進行探討,各自闡述對問題的認識和對知識點的理解,提出解決思路與方法,確定方案,然后上機實踐,讓計算機檢驗思路和方法的正確性。實踐過程將知識作為載體,實現思想和方法的傳授,通過有效使用工具,可以達到事半功倍的教學效果,使得學生不僅可以掌握數據庫相關的軟硬件工具、數據庫系統及各類語言,而且通過抽象表示設計有效的算法,通過程序的實現高效地解決實際問題,真正掌握數據庫的相關知識和技能。
3 在數據庫課程群建設中引入計算思維的方法和步驟
數據庫課程群建設中的系列課程均是高校非計算機專業必修或選修的與數據庫相關的公共基礎課程(數據庫應用基礎、數據庫技術與應用、數據庫系統原理、數據庫應用系統開發等),這些課程涉及全校非計算機專業的所有學生。課程群建設是近年來課程建設改革的一個發展趨勢,是針對某一受教育對象將相關的課程組合在一起,進行整合更新,使課程內容更貼近現實需求,提高學生應用和創新能力以及教學效率和質量。
數據庫課程群的教學內容是根據教育部對計算機基礎教學基本要求設計的,教學目標是通過課程學習幫助學生了解數據庫應用領域,掌握基本的數據庫技術,提高數據庫管理系統分析、數據庫應用程序設計和開發、數據庫使用和維護的能力。課程群建設以教指委提出的“普及計算機文化、訓練計算思維、培養信息應用能力”為總體目標,從培養學生信息素養、計算機應用能力等方面著手,以數據庫技術為基礎,以計算思維為切入點,以應用能力為目標,構造并設計數據庫課程群知識體系及教學方案,旨在新形勢下進一步提高高校計算機基礎教育的質量[5]。具體實現方法主要包括以下幾方面。
1) 以計算思維為切入點。
數據庫課程群建設的實施可采用課程知識體系及教學內容重組與教學方法推動相結合的方式,在宏觀上,以計算思維為切入點重組課程知識體系框架;微觀上,參照教學指導委員會編制的《高等學校計算機基礎教學發展戰略研究報告暨計算機基礎課程教學基本要求》和《高等學校計算機基礎核心課程教學實施方案》提出的課程基本知識體系和實驗體系,融入最新數據庫技術、通信技術、網絡技術等相關概念、方法和應用,形成數據庫課程群建設的方案。
一個高效的教學團隊對于強化質量意識、深化教學改革、促進課程群建設、提高教學質量發揮著極其重要的作用。基于師資隊伍的現狀,教學團隊建設應以教學研究為切入點,以提高隊伍的教學水平和改善隊伍職稱結構為目的,最終形成穩定的、高水平的師資隊伍。團隊中的教師應該認真學習并掌握計算思維的精髓,能夠在教學過程中引入計算思維,啟發學生訓練思維能力,用計算思維的方法思考和分析問題,提高學生對知識的綜合運用能力。
2) 采用層次化教學方法。
教學方法的研究與實踐在數據庫課程群建設中占據相當重要的地位。教師要改革傳統的以單純的操作、技術為重點的教學方式,轉變為以思維能力養成訓練、問題求解能力培養、工作實踐能力培養為目標的新型教學方式,采用層次化教學方法進行數據庫課程群建設,針對不同層次的課程和不同專業的學生采用不同的教學方法(如圖1所示)。第1層課程采用啟發式教學方法,教師用多媒體課件等教具向學生形象、生動地演示課程重點和難點,通過靈活設計教學過程讓學生積極參與教學活動,更好地掌握知識;第2層課程采用案例教學法、講授教學法、實驗教學法相結合的方式;第3層課程采用課題研究教學法、討論教學法、指導自學法相結合的方式。除此之外,無論是哪一個層次的教學,都應該在整個教學過程中研究計算思維要素的概念、案例、課題的教授方法,研究如何將隱式計算思維要素與課程內容有機結合并呈現出來,使學生感受計算思維的科學性與普適性,從而提高學生的計算思維能力和科學素養。
3) 科學制訂課程知識體系。
在數據庫課程群建設中,建立科學的課程知識體系能大大提高課程群建設的質量和效果。具體來說,一方面要準確分析計算機公共課的培養目標及知識結構要求,在正確認識數據庫技術系列課程知識體系特點的基礎上科學提煉計算機學科內涵;另一方面要及時跟蹤國內外計算機技術和數據庫技術的發展和趨勢,不斷根據大數據[6]、透明計算、云計算、物聯網[7]時代的技術發展特點修正、更新和調整教學內容,讓課程知識體系能始終適應時展的需求。同時,要以培養計算機應用開發能力為目標,以計算思維為切入點,對教學內容進行科學組織和優化;在充分調研、認真分析的基礎上,確定學生應具備的知識結構,明確改革目標,提出具體方案并投入課程改革實踐,分析改革效果,進行總結和推廣研究。這個過程可以反復交叉進行。改革是無止境的,改革的效果也是相對的,沒有最好,只有更好。教師應在實踐中不斷調整和修正教學改革方案,建立科學的課程知識體系。
4 結語
數據庫系列課程是高等學校非計算機專業中非常重要的公共基礎課[8],如何在計算機技術飛速發展的背景下更加深入地理解計算機學科的內涵和性質,根據不同專業、不同年級學生的特點開展有針對性的教學,在數據庫系列課程教學和數據庫課程群建設中引入計算思維以有效促進課程改革,是高校計算機基礎課教師應重點關注和思考的問題。筆者闡釋了計算思維在數據庫系列課程改革中的作用,介紹了在數據庫系列課程教學過程和在課程群建設中融入計算思維的方法和步驟,期望通過大膽的探索為培養和提高教師和學生的計算思維能力打下基礎。
參考文獻:
[1] 周以真. 計算思維[J]. 中國計算機學會通訊, 2007(11): 11-14.
[2] 李廉. 計算思維: 概念與挑戰[J]. 中國大學教學, 2012(1): 7-12.
[3] 龔沛森, 楊志強. 大學計算機基礎教學中的計算思維培養[J]. 中國大學教學, 2012(5): 51-54.
[4] 李曉明, 蔣宗禮, 王志英, 等. 積極研究和推進計算思維能力的培養[J]. 計算機教育, 2012(5): 1.
[5] 教育部高等學校計算機基礎課程教學指導委員會. 高等學校計算機基礎核心課程教學實施方案[M].北京: 高等教育出版社, 2011: 4-5.
[6] 大數據時代來臨[N]. 北京晚報, 2012-06-15(40).
[7] 嚴大虎, 陳明選. 物聯網在智慧校園中的應用[J]. 現代教育技術, 2011, 21(6): 123-125.