前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的化學(xué)數(shù)據(jù)分析方法主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:高職教育;個(gè)性化學(xué)習(xí);數(shù)據(jù)挖掘;商業(yè)智能
中圖分類(lèi)號(hào):TP311.13
作為我國(guó)高等教育一支重要生力軍――高等職業(yè)教育近幾年來(lái)的發(fā)展可謂迅猛,無(wú)論是學(xué)校數(shù)還是學(xué)生人數(shù),高職專(zhuān)科的規(guī)模已是我國(guó)高等教育的半壁江山。高職教育對(duì)人才的培養(yǎng)目標(biāo)是為國(guó)家和地方經(jīng)濟(jì)的發(fā)展輸送適應(yīng)生產(chǎn)、建設(shè)服務(wù)等一線急需的應(yīng)用型高素質(zhì)人才,《國(guó)務(wù)院關(guān)于大力發(fā)展職業(yè)教育的決定》中就提出了“堅(jiān)持以就業(yè)為導(dǎo)向,深化職業(yè)教育教學(xué)改革”,要求加強(qiáng)職業(yè)院校對(duì)學(xué)生實(shí)踐能力和職業(yè)技能的培養(yǎng)。
1 現(xiàn)狀
目前,高職學(xué)生在學(xué)校完成系統(tǒng)的課程學(xué)習(xí)依然是高職教育教學(xué)的主要方式,在此過(guò)程中,由于學(xué)生個(gè)體特性、就業(yè)意向、專(zhuān)業(yè)方向等各種因素的影響,獲取的知識(shí)無(wú)論從方式方法、內(nèi)容結(jié)構(gòu),還是真正掌握的程度來(lái)說(shuō)都因人而異,而這其中有相當(dāng)大的部分是學(xué)生主動(dòng)性選擇的結(jié)果;此外,在高職教育教學(xué)改革的嘗試中,大類(lèi)招生、拓展專(zhuān)業(yè)等多項(xiàng)措施在很多職業(yè)院校中已然試行,這就給予學(xué)生更多的自和選擇的機(jī)會(huì)。
然而,在自主選擇的過(guò)程中,由于沒(méi)有一個(gè)可參照的、適合自己的挑選標(biāo)準(zhǔn),高職學(xué)生進(jìn)行各項(xiàng)選擇時(shí)在很大程度上有著“扎堆隨大流”、“哪個(gè)課能混好過(guò)”的心理,這就導(dǎo)致主動(dòng)選擇的課程,其學(xué)習(xí)過(guò)程并不順暢、學(xué)習(xí)效果也不理想,沒(méi)有提升自身知識(shí)結(jié)構(gòu)的質(zhì)量。這種高職教育中教與學(xué)環(huán)節(jié)的脫節(jié)會(huì)對(duì)高職學(xué)生的能力培養(yǎng)產(chǎn)生有著不可忽視的影響。
2 研究思路
隨著教育信息化的深入發(fā)展,先進(jìn)的信息技術(shù)手段在教育教學(xué)的方方面面都得以有效利用,這也為學(xué)生綜合能力培養(yǎng)的探索與嘗試提供了新的途徑,數(shù)據(jù)挖掘技術(shù)就是其中很重要的一種。數(shù)據(jù)挖掘指的是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。在此過(guò)程中,數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的,而從中發(fā)現(xiàn)的是用戶(hù)所感興趣的知識(shí)內(nèi)容,這些知識(shí)應(yīng)該是可以接受和理解、并且能加以進(jìn)一步運(yùn)用的。
數(shù)據(jù)挖掘技術(shù)之所以在教育行業(yè)有更為廣泛、實(shí)際的應(yīng)用,這是由于各個(gè)學(xué)校都會(huì)有自己的一整套數(shù)據(jù)庫(kù)系統(tǒng),用于記錄學(xué)生的學(xué)籍信息、課程教學(xué)過(guò)程等歷史數(shù)據(jù),這樣,就可以嘗試運(yùn)用先進(jìn)的數(shù)據(jù)挖掘技術(shù)和智能分析工具,通過(guò)對(duì)高職教育研究和教學(xué)過(guò)程中積累的海量數(shù)據(jù)進(jìn)行采集分類(lèi)、挖掘和分析,從多角度、多層次出發(fā),構(gòu)建識(shí)別個(gè)體特點(diǎn)、知識(shí)構(gòu)成和獲取方式等要素之間關(guān)聯(lián)模式的數(shù)據(jù)模型。數(shù)據(jù)挖掘是一門(mén)交叉學(xué)科,其理論和方法有很多,包括K-最近鄰分類(lèi)器、判別分析、人工神經(jīng)網(wǎng)絡(luò)和分類(lèi)樹(shù)等,它把人們對(duì)數(shù)據(jù)的應(yīng)用從低層次的簡(jiǎn)單查詢(xún),提升到從數(shù)據(jù)中挖掘知識(shí),提供決策支持。在這里就是要將數(shù)據(jù)挖掘方法與高職教育教學(xué)研究相結(jié)合,設(shè)計(jì)實(shí)際的分析應(yīng)用系統(tǒng),具體來(lái)說(shuō):
(1)數(shù)據(jù)挖掘技術(shù)面向高職教育這一特定領(lǐng)域中的主體――高職學(xué)生,針對(duì)專(zhuān)門(mén)的指標(biāo),包括個(gè)體特性、專(zhuān)業(yè)要求、就業(yè)意向等,著眼于課程這個(gè)知識(shí)載體,對(duì)它們之間的關(guān)系進(jìn)行深層次、智能化的挖掘、分析;
(2)數(shù)據(jù)挖掘的應(yīng)用會(huì)具體到建模、變量篩選和導(dǎo)入等方面,而不只是一些抽象的挖掘算法的研究;
(3)數(shù)據(jù)分析采用先進(jìn)的商業(yè)智能工具,同樣,數(shù)據(jù)的展現(xiàn)手段基于平臺(tái),具有開(kāi)放化、模塊化、網(wǎng)絡(luò)化特點(diǎn)。
3 系統(tǒng)框架
系統(tǒng)定位于個(gè)性化學(xué)習(xí)分析,其框架結(jié)構(gòu)參見(jiàn)圖1,主要由數(shù)據(jù)集成、數(shù)據(jù)建模、數(shù)據(jù)分析及展現(xiàn)等部分構(gòu)成。具體來(lái)說(shuō),數(shù)據(jù)集成模塊完成定義數(shù)據(jù)結(jié)構(gòu)、裝載、清洗、合并數(shù)據(jù)的功能;數(shù)據(jù)建模是指建立數(shù)據(jù)分析OLAP及數(shù)據(jù)挖掘模型;數(shù)據(jù)分析旨在分析和比較各種不同算法得出的結(jié)果,尋找最為匹配的算法,而數(shù)據(jù)展現(xiàn)的作用是根據(jù)分析結(jié)構(gòu)靈活創(chuàng)建數(shù)據(jù)報(bào)告。
圖1 系統(tǒng)框架結(jié)構(gòu)
在此架構(gòu)下,各個(gè)子系統(tǒng)的功能如下所述:
(1)數(shù)據(jù)集成。分析和歸納課程教學(xué)過(guò)程中產(chǎn)生的系列數(shù)據(jù),根據(jù)其特征和行為設(shè)計(jì)及定義便于分析和挖掘的數(shù)據(jù)結(jié)構(gòu),然后并進(jìn)行數(shù)據(jù)集成。數(shù)據(jù)集成的工作包括從異構(gòu)數(shù)據(jù)源獲取數(shù)據(jù),將其進(jìn)行清洗、轉(zhuǎn)換、合并,然后加載到數(shù)據(jù)倉(cāng)儲(chǔ)中。數(shù)據(jù)集成執(zhí)行的時(shí)間、相互的順序、成敗對(duì)將來(lái)的分析結(jié)果的有效性則至關(guān)重要。
(2)數(shù)據(jù)建模。典型的數(shù)據(jù)挖掘工具將在構(gòu)建了數(shù)據(jù)倉(cāng)庫(kù)后進(jìn)行分析并生成結(jié)果,一些工具也可以使用關(guān)系型數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)分析的結(jié)果獨(dú)立于數(shù)據(jù)倉(cāng)庫(kù)中使用的數(shù)據(jù)。數(shù)據(jù)挖掘核心的部分就是選擇挖掘算法并建立數(shù)據(jù)模型,這樣就可以根據(jù)學(xué)生個(gè)體信息、學(xué)生成績(jī)等數(shù)據(jù)之間的關(guān)系將這些學(xué)生劃分成分析有意義的組群并預(yù)測(cè)他們的行為;當(dāng)把這些組發(fā)送回分析過(guò)程時(shí),數(shù)據(jù)挖掘引擎允許分析人員和用戶(hù)根據(jù)這些簇進(jìn)行劃分和細(xì)化。
(3)數(shù)據(jù)分析與展示。以學(xué)生個(gè)體信息和課程數(shù)據(jù)為輸入,利用所篩選出的最佳建模方法,逐步提出一個(gè)可實(shí)現(xiàn)個(gè)性化學(xué)習(xí)分析的數(shù)據(jù)模型,以衡量及提高模型預(yù)測(cè)的準(zhǔn)確度。將分析結(jié)果以特定的客戶(hù)端或Web方式進(jìn)行展現(xiàn),以建立的分析結(jié)果展示平臺(tái),具有高度的開(kāi)放性、通用性和可擴(kuò)展性。通過(guò)建模創(chuàng)建了正確的模型,數(shù)據(jù)挖掘的重點(diǎn)就從分析轉(zhuǎn)到結(jié)果上,數(shù)據(jù)報(bào)告的展現(xiàn)方式有多種,可通過(guò)專(zhuān)業(yè)的報(bào)告工具,也可自行編寫(xiě)Web網(wǎng)站進(jìn)行。
4 結(jié)束語(yǔ)
在高職教育教學(xué)研究中運(yùn)用先進(jìn)的數(shù)據(jù)挖掘技術(shù)手段,針對(duì)各項(xiàng)課程教學(xué)、學(xué)生管理數(shù)據(jù)進(jìn)行深度挖掘、分析,研究個(gè)性化學(xué)習(xí)模式,為學(xué)生的自我學(xué)習(xí)規(guī)劃提供具體化、智能化分析結(jié)果以供參照,在此情況下,先進(jìn)技術(shù)手段的支持,對(duì)教與學(xué)都有著不可忽視的影響。同時(shí),也為人才培養(yǎng)的探索與嘗試提供新途徑。
參考文獻(xiàn):
[1]趙云鵬,石麗,劉瑩.基于數(shù)據(jù)挖掘的高校規(guī)模分析及應(yīng)用研究.第九屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C].2011.
[2].數(shù)據(jù)挖掘在高職院校教學(xué)管理中的應(yīng)用[J].清遠(yuǎn)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2010(12).
[3]干娟.基于決策樹(shù)算法的學(xué)生綜合測(cè)評(píng)系統(tǒng)的設(shè)計(jì)[J].安徽電子信息職業(yè)技術(shù)學(xué)院學(xué)報(bào),2011(04).
關(guān)鍵詞:統(tǒng)計(jì)測(cè)度;統(tǒng)計(jì)學(xué);大數(shù)據(jù);數(shù)據(jù)科學(xué);
作者簡(jiǎn)介:李金昌,男,50歲,浙江義烏人。浙江財(cái)經(jīng)大學(xué)校長(zhǎng),統(tǒng)計(jì)學(xué)教授,博士生導(dǎo)師。研究方向?yàn)榻?jīng)濟(jì)統(tǒng)計(jì)學(xué),統(tǒng)計(jì)理論與方法,抽樣技術(shù),政府統(tǒng)計(jì)等。
最近兩年,統(tǒng)計(jì)學(xué)界對(duì)大數(shù)據(jù)問(wèn)題所進(jìn)行的理論探討逐漸增多,視角也各有千秋,引起了一些共鳴。圍繞大數(shù)據(jù)問(wèn)題,由統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)等學(xué)科共同支撐的數(shù)據(jù)科學(xué)開(kāi)始形成。但大數(shù)據(jù)畢竟是一個(gè)新課題,因此遠(yuǎn)未達(dá)到對(duì)其有一個(gè)系統(tǒng)完整的認(rèn)識(shí),仍然需要從不同的方面加以研究,其中有一個(gè)重要但又容易被忽視的問(wèn)題,即統(tǒng)計(jì)測(cè)度問(wèn)題,值得去探討。
一、什么是統(tǒng)計(jì)測(cè)度
漢語(yǔ)上,測(cè)度是指猜測(cè)、揣度、估計(jì)。數(shù)學(xué)上,測(cè)度是一個(gè)函數(shù),它對(duì)一個(gè)給定集合的某些子集指定一個(gè)數(shù),這個(gè)數(shù)可以比作大小、體積、概率等等。通俗地說(shuō),測(cè)度把每個(gè)集合映射到非負(fù)實(shí)數(shù)來(lái)規(guī)定這個(gè)集合的大小:空集的測(cè)度是0;集合變大時(shí)測(cè)度至少不會(huì)減小(因?yàn)橐由献兇蟮牟糠值臏y(cè)度,而它是非負(fù)的)。
除了數(shù)學(xué)角度的測(cè)度論,查閱國(guó)內(nèi)文獻(xiàn)資料,帶有測(cè)度這個(gè)詞匯的文獻(xiàn)不少,但專(zhuān)門(mén)針對(duì)統(tǒng)計(jì)測(cè)度(或測(cè)度)內(nèi)涵的討論幾乎沒(méi)有。一些對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析測(cè)度的文獻(xiàn),例如新型工業(yè)化進(jìn)程測(cè)度、貨幣流動(dòng)性測(cè)度、全面小康社會(huì)發(fā)展進(jìn)程測(cè)度、收入分配公平性測(cè)度、技術(shù)效率測(cè)度、人力資本測(cè)度、金融風(fēng)險(xiǎn)測(cè)度、產(chǎn)業(yè)關(guān)聯(lián)測(cè)度等等,所做的測(cè)度都是再測(cè)度,均不對(duì)測(cè)度本身進(jìn)行討論。查閱國(guó)外文獻(xiàn)資料(關(guān)鍵詞:measurement),也同樣存在這樣的問(wèn)題,只能收集到一些比較零散的表述。LudwikFinkelstein(1975)[1]認(rèn)為,在我們對(duì)事物或現(xiàn)象進(jìn)行描述時(shí),測(cè)度可以被定義為對(duì)現(xiàn)實(shí)世界中某一現(xiàn)象的個(gè)體屬性或特征進(jìn)行量化的過(guò)程。JamesT.Townsend和F.GregoryAshby(1984)[2]認(rèn)為,如果按照極端的觀點(diǎn),那么統(tǒng)計(jì)分析中的基本測(cè)度理論的含義仍然是存在爭(zhēng)議的。LudwikFinkelstein(2003)[3]指出,測(cè)度在那些原來(lái)尚未得到卓有成效或廣泛應(yīng)用的領(lǐng)域,也已取得了明顯的進(jìn)步,社會(huì)、政治、經(jīng)濟(jì)和行為科學(xué)正在更大程度地利用定量技術(shù);測(cè)度是現(xiàn)代思維的一種實(shí)際有效的工具,是我們借以描述世界的一種方法。GiovanniBattistaRossi(2007)[4]認(rèn)為,用以表示測(cè)度結(jié)果的,是數(shù)字或者數(shù)字符號(hào)。LucaMari(2013)[5]認(rèn)為,測(cè)度的基礎(chǔ)特征是被公認(rèn)為世界上獲取并正式表達(dá)信息的基本方法,這讓它成為一種跨學(xué)科的工具。LudwikFinkelstein(2014)[6]指出,在自然科學(xué)技術(shù)中,測(cè)度的重要性不可否認(rèn),它是科學(xué)調(diào)查和發(fā)現(xiàn)必不可少的工具,它可將宇宙中的復(fù)雜現(xiàn)象用精確、簡(jiǎn)潔和普遍的數(shù)學(xué)語(yǔ)言來(lái)描述。
那么,到底什么是統(tǒng)計(jì)測(cè)度呢?目前沒(méi)有一個(gè)統(tǒng)一的定義。本文認(rèn)為,統(tǒng)計(jì)測(cè)度具有不同于測(cè)度的意義,并且大大超越數(shù)學(xué)上的界定,即它具有數(shù)學(xué)定義的一般屬性,但又不受制于函數(shù)表現(xiàn)形式,因?yàn)榻y(tǒng)計(jì)測(cè)度所要面對(duì)的是現(xiàn)實(shí)世界,實(shí)際問(wèn)題要比理論上可以定義的問(wèn)題復(fù)雜得多。按照我們的理解,統(tǒng)計(jì)測(cè)度就是用一定的符號(hào)和數(shù)字,用一定的形式和載體,對(duì)所研究的現(xiàn)象或事物的特征進(jìn)行量化反映,表現(xiàn)為可用于統(tǒng)計(jì)分析的數(shù)據(jù)的過(guò)程。它應(yīng)該具有這樣一些屬性:以實(shí)際現(xiàn)象為測(cè)度對(duì)象,測(cè)度結(jié)果具有實(shí)際意義;以量化為目的,把信息轉(zhuǎn)化為數(shù)量,提供人們?nèi)菀桌斫獾亩拷Y(jié)論;個(gè)體特征的測(cè)度符合形成總體定量結(jié)論的要求,同時(shí)能夠體現(xiàn)個(gè)體差異。可以發(fā)現(xiàn),統(tǒng)計(jì)測(cè)度需要借用數(shù)學(xué)工具,但更重要的是對(duì)具體測(cè)度現(xiàn)象本質(zhì)特征的認(rèn)識(shí)和掌握。
統(tǒng)計(jì)測(cè)度可以從若干不同角度進(jìn)行分類(lèi)。邱東教授(2012)[7]曾在“宏觀測(cè)度的邊界悖律及其意義”一文中,從邊界的角度對(duì)宏觀測(cè)度進(jìn)行了分類(lèi):一是因事物本身可測(cè)度性而形成的邊界,即本體論意義上的測(cè)度邊界;再一是由人的認(rèn)知能力而形成的邊界,即認(rèn)識(shí)論意義上的測(cè)度邊界;第三則是由統(tǒng)計(jì)相關(guān)性偏好和投入約束而形成的邊界,即操作意義上的測(cè)度邊界。這三條測(cè)度邊界,應(yīng)該以本體論意義的測(cè)度邊界最大,認(rèn)識(shí)論意義的測(cè)度邊界次之,而操作意義的測(cè)度邊界最小。這樣的分類(lèi),對(duì)于我們正確理解統(tǒng)計(jì)測(cè)度的內(nèi)涵很有幫助。受此啟發(fā),筆者認(rèn)為統(tǒng)計(jì)測(cè)度還可以有如下分類(lèi):
1.從測(cè)度的實(shí)現(xiàn)形式看,可以分為原始測(cè)度和再測(cè)度。原始測(cè)度也可以稱(chēng)為直接測(cè)度,它通過(guò)對(duì)測(cè)度對(duì)象進(jìn)行直接測(cè)度來(lái)獲取數(shù)據(jù),例如清點(diǎn)庫(kù)存物品數(shù)量、丈量作物播種面積、觀察培育細(xì)菌數(shù)目、檢測(cè)藥物成分等獲得的數(shù)據(jù),以及各種登記、記錄的原始數(shù)據(jù)等等。再測(cè)度也稱(chēng)為間接測(cè)度,它以其他已知的測(cè)度數(shù)據(jù)為基礎(chǔ)去計(jì)算、推算或預(yù)測(cè)所需的未知數(shù)據(jù),例如根據(jù)GDP和人口數(shù)測(cè)度人均GDP、根據(jù)人口普查分年齡人口數(shù)據(jù)測(cè)度老齡化系數(shù)和社會(huì)負(fù)擔(dān)系數(shù)、根據(jù)相關(guān)指標(biāo)數(shù)據(jù)測(cè)度CPI的變化等等。復(fù)雜的再測(cè)度則需要借助相應(yīng)的統(tǒng)計(jì)模型作為工具,因?yàn)樗鼘?shí)際上是對(duì)相關(guān)變量之間的關(guān)系進(jìn)行定量反映。從兩者關(guān)系上看,原始測(cè)度是基礎(chǔ),是根本,沒(méi)有科學(xué)的原始測(cè)度就不會(huì)有可靠的再測(cè)度;再測(cè)度則是測(cè)度功能提升的必然要求,以解決原始測(cè)度不能解決的問(wèn)題。
2.從測(cè)度的計(jì)量方式看,可以分為自然測(cè)度、物理測(cè)度、化學(xué)測(cè)度、時(shí)間測(cè)度和價(jià)值測(cè)度。自然測(cè)度是利用現(xiàn)象的自然屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如人口規(guī)模、企業(yè)數(shù)量等的測(cè)度,采用自然計(jì)量單位;物理測(cè)度是利用現(xiàn)象的物理屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如公路長(zhǎng)度、作物播種面積、天然氣產(chǎn)量等的測(cè)度,采用物理計(jì)量單位;化學(xué)測(cè)度是利用現(xiàn)象的化學(xué)屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如醫(yī)學(xué)、生物學(xué)中化學(xué)合成物的成分結(jié)構(gòu)測(cè)度,采用百分?jǐn)?shù)、千分?jǐn)?shù)或特定標(biāo)識(shí)為計(jì)量單位;時(shí)間測(cè)度是利用現(xiàn)象的時(shí)間屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如勞動(dòng)用工、閑暇時(shí)間等測(cè)度,采用時(shí)間計(jì)量單位;價(jià)值測(cè)度是利用現(xiàn)象的價(jià)值屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如勞動(dòng)報(bào)酬、經(jīng)濟(jì)活動(dòng)成果等測(cè)度,采用貨幣計(jì)量單位。在這些測(cè)度計(jì)量方式中,價(jià)值測(cè)度因最具有綜合功能而應(yīng)用最為廣泛。
3.從測(cè)度的方法看,可以分為計(jì)數(shù)測(cè)度、測(cè)量測(cè)度、實(shí)驗(yàn)測(cè)度、定義測(cè)度和模型測(cè)度。計(jì)數(shù)測(cè)度是一種通過(guò)觀測(cè)計(jì)數(shù)來(lái)獲得數(shù)據(jù)的方法,最為簡(jiǎn)單,一般用于自然測(cè)度或時(shí)間測(cè)度;測(cè)量測(cè)度是一種根據(jù)物理或化學(xué)規(guī)制對(duì)現(xiàn)象進(jìn)行測(cè)量、測(cè)算來(lái)獲得數(shù)據(jù)的方法,一般用于物理測(cè)度或化學(xué)測(cè)度;實(shí)驗(yàn)測(cè)度是一種按照科學(xué)實(shí)驗(yàn)原理、通過(guò)觀察實(shí)驗(yàn)對(duì)象在既定條件下的反應(yīng)來(lái)獲得數(shù)據(jù)的方法,一般與測(cè)量測(cè)度相結(jié)合,用于獲取科學(xué)研究數(shù)據(jù);定義測(cè)度也可以稱(chēng)之為指標(biāo)測(cè)度,是一種通過(guò)探究現(xiàn)象的本質(zhì)特征和活動(dòng)規(guī)律、歸納出表現(xiàn)其數(shù)量特征的范疇、給出統(tǒng)計(jì)指標(biāo)定義(包括內(nèi)容、口徑、計(jì)算方法和表現(xiàn)形式等)來(lái)獲取數(shù)據(jù)的方法,最常用于價(jià)值測(cè)度,也用于其他形式的測(cè)度。可以說(shuō),定義測(cè)度方法應(yīng)用最為廣泛,但也最為困難。模型測(cè)度是一種根據(jù)現(xiàn)象與現(xiàn)象之間的內(nèi)在聯(lián)系關(guān)系、或者現(xiàn)象自身的發(fā)展變化規(guī)律,通過(guò)建立一定的方程模型來(lái)獲取數(shù)據(jù)的方法。前面三種統(tǒng)計(jì)測(cè)度方法基本上都屬于直接測(cè)度,定義測(cè)度既可能是直接測(cè)度、也可能是間接測(cè)度,而模型測(cè)度都屬于間接測(cè)度方法。
4.從測(cè)度的維度看,可以分為單一測(cè)度與多維測(cè)度。單一測(cè)度是指采用單一的方式方法對(duì)所研究現(xiàn)象或事物進(jìn)行單一角度的測(cè)度,獲得單一的數(shù)據(jù)。多維測(cè)度是指對(duì)所研究現(xiàn)象或事物進(jìn)行多角度的測(cè)度,測(cè)度過(guò)程中可能需要采用多種測(cè)度方法和計(jì)量方式,例如多指標(biāo)綜合評(píng)價(jià)就需要借助統(tǒng)計(jì)指標(biāo)體系對(duì)評(píng)價(jià)對(duì)象進(jìn)行多角度的測(cè)度。顯然,單一測(cè)度是多維測(cè)度的基礎(chǔ)。
二、統(tǒng)計(jì)測(cè)度是統(tǒng)計(jì)學(xué)的立足之本
首先,從統(tǒng)計(jì)學(xué)的發(fā)展歷史看,是統(tǒng)計(jì)測(cè)度使統(tǒng)計(jì)學(xué)破繭而出。為什么主流觀點(diǎn)認(rèn)為政治算術(shù)是統(tǒng)計(jì)學(xué)的起源而不是國(guó)勢(shì)學(xué)?正是因?yàn)橥づ涞谑状尾捎媒y(tǒng)計(jì)測(cè)度的方式進(jìn)行了國(guó)家實(shí)力的統(tǒng)計(jì)分析和有關(guān)推算,得出了令人信服的結(jié)論。威廉·配第在1693年出版的《政治算術(shù)》[8]中寫(xiě)道“因?yàn)楹椭皇褂帽容^級(jí)或最高級(jí)的詞匯以及單純作思維的論證相反,我卻采用了這樣的方法(作為我很久以來(lái)就想建立的政治算術(shù)的一個(gè)范例),即用數(shù)字、重量和尺度的詞匯來(lái)表達(dá)我自己想說(shuō)的問(wèn)題,只進(jìn)行能訴諸人們的感官的論證和考察在性質(zhì)上有可見(jiàn)的根據(jù)的原因”,這一觀點(diǎn)在統(tǒng)計(jì)學(xué)的發(fā)展過(guò)程中產(chǎn)生了非常重要的影響。他的這段話雖然沒(méi)有出現(xiàn)測(cè)度一詞,但卻道出了測(cè)度的本質(zhì),即讓事物變得明白、變得有根據(jù),因?yàn)椤皵?shù)字、重量和尺度”就是測(cè)度、就是根據(jù),用“數(shù)字、重量和尺度的詞匯來(lái)表達(dá)想說(shuō)的問(wèn)題”就是一種測(cè)度的思想,盡管測(cè)度的方式方法還很簡(jiǎn)單。相反,國(guó)勢(shì)學(xué)雖然提出了歸納法這一統(tǒng)計(jì)學(xué)的基本方法并首創(chuàng)了統(tǒng)計(jì)學(xué)一詞,但由于沒(méi)有采用統(tǒng)計(jì)測(cè)度的方式進(jìn)行國(guó)勢(shì)問(wèn)題的研究而難以修成正果。正如邱東教授[7]所說(shuō):“在配第之前,統(tǒng)計(jì)學(xué)的研究對(duì)象雖然是國(guó)家的態(tài)勢(shì),但它在方法論上只是定性言說(shuō)。一個(gè)國(guó)家的財(cái)富總量在本體論意義上是可以測(cè)度的。然而只是到了配第時(shí)期,人類(lèi)才想到了要測(cè)度它,并發(fā)明了如何測(cè)度的基本方法。政治算術(shù),即開(kāi)創(chuàng)期的經(jīng)濟(jì)統(tǒng)計(jì)學(xué),實(shí)現(xiàn)了從無(wú)到有的轉(zhuǎn)變,大大擴(kuò)展了宏觀測(cè)度的認(rèn)識(shí)論邊界,因而才具有了統(tǒng)計(jì)學(xué)范式創(chuàng)新的革命性意義。”同樣,格朗特的《關(guān)于死亡表的自然觀察和政治觀察》也是人口統(tǒng)計(jì)測(cè)度方面的經(jīng)典之作,無(wú)論是原始測(cè)度還是再測(cè)度,都給后人留下了寶貴的財(cái)富。之后,統(tǒng)計(jì)學(xué)就是沿著如何更加科學(xué)、準(zhǔn)確測(cè)度世界這一主線而發(fā)展的。筆者曾在“從政治算術(shù)到大數(shù)據(jù)分析”一文[9],對(duì)數(shù)據(jù)的變化與統(tǒng)計(jì)分析方法的發(fā)展進(jìn)行了粗淺的歸納,其主題實(shí)際上就是統(tǒng)計(jì)測(cè)度問(wèn)題。
其次,從統(tǒng)計(jì)學(xué)的研究對(duì)象上看,統(tǒng)計(jì)測(cè)度是體現(xiàn)統(tǒng)計(jì)學(xué)數(shù)量性特征的前提條件。統(tǒng)計(jì)學(xué)的研究對(duì)象是現(xiàn)象的數(shù)量方面,或者說(shuō)統(tǒng)計(jì)學(xué)是關(guān)于如何收集和分析數(shù)據(jù)的科學(xué)。統(tǒng)計(jì)數(shù)據(jù)從何而來(lái)?從統(tǒng)計(jì)測(cè)度中來(lái)。數(shù)據(jù)不同于數(shù)字,數(shù)字是統(tǒng)計(jì)測(cè)度的符號(hào),數(shù)據(jù)是統(tǒng)計(jì)測(cè)度的結(jié)果,這也正是統(tǒng)計(jì)學(xué)區(qū)別于數(shù)學(xué)之處。所以說(shuō),數(shù)據(jù)的本質(zhì)問(wèn)題就是統(tǒng)計(jì)測(cè)度問(wèn)題,故此統(tǒng)計(jì)測(cè)度是統(tǒng)計(jì)學(xué)的基本問(wèn)題。這里重點(diǎn)討論兩個(gè)問(wèn)題:一是統(tǒng)計(jì)測(cè)度與統(tǒng)計(jì)指標(biāo)的關(guān)系,二是統(tǒng)計(jì)測(cè)度面臨的新問(wèn)題。關(guān)于第一個(gè)問(wèn)題,本文認(rèn)為統(tǒng)計(jì)測(cè)度與統(tǒng)計(jì)指標(biāo)是一個(gè)事物的兩個(gè)方面,這個(gè)事物就是數(shù)據(jù)。統(tǒng)計(jì)指標(biāo)法是統(tǒng)計(jì)學(xué)的基本方法之一,盡管前面對(duì)統(tǒng)計(jì)測(cè)度從方式方法上進(jìn)行了分類(lèi),但從廣義上說(shuō)所有統(tǒng)計(jì)測(cè)度都是定義測(cè)度,都表現(xiàn)為指標(biāo)。也就是說(shuō),任何統(tǒng)計(jì)測(cè)度———不論是直接測(cè)度還是間接測(cè)度,最終目的是獲得能夠讓人明白的數(shù)據(jù),而表現(xiàn)數(shù)據(jù)的最主要形式就是統(tǒng)計(jì)指標(biāo),其他表現(xiàn)數(shù)據(jù)的形式都是派生出來(lái)的。所以,統(tǒng)計(jì)測(cè)度就是根據(jù)所設(shè)定的統(tǒng)計(jì)指標(biāo)去獲得所需的數(shù)據(jù)。關(guān)于第二個(gè)問(wèn)題,與后文所要論及的大數(shù)據(jù)有關(guān),就是定性測(cè)度問(wèn)題。在統(tǒng)計(jì)學(xué)中,數(shù)據(jù)可以分為兩類(lèi)———定性數(shù)據(jù)與定量數(shù)據(jù),其中定性數(shù)據(jù)又包括定類(lèi)數(shù)據(jù)與定序數(shù)據(jù)兩種,它們屬于非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)。相應(yīng)地,統(tǒng)計(jì)測(cè)度也可分為定性測(cè)度與定量測(cè)度。很顯然,只有定性測(cè)度與定量測(cè)度方法得到同步發(fā)展,統(tǒng)計(jì)學(xué)才能更加完善。總體上看,定量數(shù)據(jù)的統(tǒng)計(jì)測(cè)度已經(jīng)比較完善,但定性數(shù)據(jù)的統(tǒng)計(jì)測(cè)度還有很多問(wèn)題尚待解決,難點(diǎn)就在于測(cè)度的切入點(diǎn)———如何提取有效的信息、如何最終轉(zhuǎn)化為統(tǒng)計(jì)指標(biāo)。盡管關(guān)于定性數(shù)據(jù)分析的論著已經(jīng)不少,但還沒(méi)有從理論方法上建立起定性數(shù)據(jù)統(tǒng)計(jì)測(cè)度的體系,因此統(tǒng)計(jì)學(xué)在這方面的任務(wù)依然很重。
第三,從統(tǒng)計(jì)學(xué)的永恒主題看,通過(guò)科學(xué)的數(shù)據(jù)分析、得出有效的結(jié)論是其不變的追求,而數(shù)據(jù)分析過(guò)程就是綜合的統(tǒng)計(jì)測(cè)度過(guò)程。獲得數(shù)據(jù)的目的是為了發(fā)現(xiàn)隱含其中的有價(jià)值的信息,即發(fā)現(xiàn)數(shù)據(jù)背后的數(shù)據(jù),讓數(shù)據(jù)再生數(shù)據(jù),從而滿足人們認(rèn)識(shí)事物、掌握規(guī)律、科學(xué)決策的需要。除了總量、結(jié)構(gòu)等基本信息外,更重要的是通過(guò)數(shù)據(jù)分析來(lái)呈現(xiàn)現(xiàn)象的變化規(guī)律與相互關(guān)系。不難發(fā)現(xiàn),這種數(shù)據(jù)分析的過(guò)程,就是不斷進(jìn)行各種統(tǒng)計(jì)測(cè)度的過(guò)程,所以最終的統(tǒng)計(jì)分析結(jié)果實(shí)際上就是各環(huán)節(jié)、各方面的各種類(lèi)型的統(tǒng)計(jì)測(cè)度的疊加結(jié)果,或者說(shuō)是統(tǒng)計(jì)測(cè)度不斷放大的過(guò)程。大量針對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析研究的文獻(xiàn)(不論是否冠以“測(cè)度”兩字),只要有數(shù)據(jù)分析,都是如此。可以說(shuō),統(tǒng)計(jì)測(cè)度貫穿于統(tǒng)計(jì)數(shù)據(jù)分析的全過(guò)程。但是,為什么很多統(tǒng)計(jì)數(shù)據(jù)分析并沒(méi)有得出有效的結(jié)論呢?本文認(rèn)為原因就出在統(tǒng)計(jì)測(cè)度上,尤其是沒(méi)有首先解決好原始統(tǒng)計(jì)測(cè)度問(wèn)題。應(yīng)該說(shuō),圍繞數(shù)據(jù)分析已經(jīng)建立起一整套比較完整的統(tǒng)計(jì)方法體系,很多方法也都身經(jīng)百戰(zhàn)、行之有效,但一旦原始統(tǒng)計(jì)測(cè)度有問(wèn)題、數(shù)據(jù)不準(zhǔn)確或不真實(shí),那么任何方法都只是擺設(shè)。仔細(xì)研讀很多所謂的實(shí)證分析文獻(xiàn),其重點(diǎn)均在于構(gòu)建什么樣的模型或運(yùn)用什么樣的方法,雖然有的文獻(xiàn)也必須要討論選擇什么樣的變量(指標(biāo))這個(gè)問(wèn)題,但并不是系統(tǒng)地從測(cè)度的角度進(jìn)行闡述,因此所用的模型越來(lái)越復(fù)雜,但所得的結(jié)論卻離實(shí)際情況越來(lái)越遠(yuǎn)。學(xué)界總是有這樣一種觀念:變量越多、符號(hào)越新奇、模型越復(fù)雜的文章才越有水平,似乎這樣分析所得的結(jié)論才越可靠。殊不知,不以科學(xué)可靠的原始統(tǒng)計(jì)測(cè)度為基礎(chǔ),任何數(shù)據(jù)分析都會(huì)成為無(wú)源之水、無(wú)本之木,所得的結(jié)論也只是更精確的錯(cuò)誤而已。本文認(rèn)為,任何脫離科學(xué)統(tǒng)計(jì)測(cè)度的統(tǒng)計(jì)分析都是毫無(wú)意義的,充其量是一種數(shù)字游戲而已。應(yīng)該樹(shù)立這樣一種觀念:科學(xué)的統(tǒng)計(jì)數(shù)據(jù)分析首先取決于科學(xué)的統(tǒng)計(jì)測(cè)度,而不是首先取決于什么樣的分析模型,雖然模型也很重要。這也再一次證明,統(tǒng)計(jì)測(cè)度問(wèn)題是統(tǒng)計(jì)學(xué)的根本問(wèn)題。其實(shí),歸根結(jié)底看,在統(tǒng)計(jì)數(shù)據(jù)分析過(guò)程中,每一步分析都以前一步的測(cè)度為原始測(cè)度,每一步所用的方法都是統(tǒng)計(jì)測(cè)度方法,因此所有的統(tǒng)計(jì)分析方法都是統(tǒng)計(jì)測(cè)度方法。甚至可以說(shuō),統(tǒng)計(jì)學(xué)方法體系就是統(tǒng)計(jì)測(cè)度方法體系。
當(dāng)然,在實(shí)際的統(tǒng)計(jì)分析中,統(tǒng)計(jì)測(cè)度往往遇到一些困難,即有些指標(biāo)數(shù)據(jù)由于各種原因無(wú)法獲得,這就不得不采用替代這種途徑。例如,綠色GDP核算的概念已經(jīng)提出很多年,但為什么還沒(méi)有哪個(gè)國(guó)家真正公布綠色GDP數(shù)據(jù),原因就是自然資源價(jià)值、生態(tài)環(huán)境價(jià)值等的統(tǒng)計(jì)測(cè)度目前還面臨著很大的困難,其背后存在著一系列有待進(jìn)一步研究和解決的理論與實(shí)踐問(wèn)題,因此不少學(xué)者進(jìn)行了替代測(cè)度的探討。這一方面說(shuō)明統(tǒng)計(jì)測(cè)度的重要性,另一方面說(shuō)明統(tǒng)計(jì)測(cè)度替代的無(wú)奈性。但是,替代測(cè)度必須遵守相應(yīng)的規(guī)則與邏輯,要經(jīng)得起推敲。有的文獻(xiàn)明明知道有關(guān)變量無(wú)法測(cè)度、有關(guān)數(shù)據(jù)無(wú)法獲得,卻隨意地、不符合邏輯地進(jìn)行所謂的替代,結(jié)果是最后的結(jié)論不知替代成什么樣了,很難理解它的意義。關(guān)于替代測(cè)度的有效性問(wèn)題,邱東教授[7]已有精辟的論述,在此不再展開(kāi)討論。
三、統(tǒng)計(jì)測(cè)度是數(shù)據(jù)科學(xué)的基礎(chǔ)
籠統(tǒng)地講,數(shù)據(jù)科學(xué)就是以大數(shù)據(jù)為研究對(duì)象的科學(xué),需要多學(xué)科交叉融合、共同支撐。由于大數(shù)據(jù)是快速增長(zhǎng)的復(fù)雜數(shù)據(jù),因此大數(shù)據(jù)分析僅有統(tǒng)計(jì)思維與統(tǒng)計(jì)分析方法是不夠的,還需要強(qiáng)大的數(shù)據(jù)處理能力與計(jì)算能力。只有把統(tǒng)計(jì)思維、統(tǒng)計(jì)方法與計(jì)算技術(shù)結(jié)合起來(lái),才有可能真正挖掘出大數(shù)據(jù)中的有價(jià)值信息。本文認(rèn)為統(tǒng)計(jì)思維、統(tǒng)計(jì)方法與計(jì)算技術(shù)相結(jié)合的基礎(chǔ)就是科學(xué)的統(tǒng)計(jì)測(cè)度。
首先,大數(shù)據(jù)技術(shù)不能自行解決其計(jì)算和分析應(yīng)從何處著手的問(wèn)題。現(xiàn)代信息技術(shù)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,使人類(lèi)進(jìn)入大數(shù)據(jù)時(shí)代,也有人說(shuō)進(jìn)入到數(shù)聯(lián)網(wǎng)時(shí)代,這意味著我們一方面被各種越來(lái)越多、越來(lái)越復(fù)雜的數(shù)據(jù)所包圍,另一方面又被數(shù)據(jù)中巨大的信息價(jià)值所吸引,想從中挖掘出可供決策之用的信息。如何挖掘大數(shù)據(jù)?人們已經(jīng)進(jìn)行了艱苦的探索,發(fā)展了很多專(zhuān)門(mén)的方法技術(shù),并已嘗到了不少甜頭,但遠(yuǎn)未達(dá)到充分利用大數(shù)據(jù)中有效信息的目的,因?yàn)橐延械拇髷?shù)據(jù)分析研究主要集中于計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程、計(jì)算數(shù)學(xué)等領(lǐng)域,重點(diǎn)是計(jì)算能力與算法研究,而很少?gòu)慕y(tǒng)計(jì)學(xué)的角度進(jìn)行有針對(duì)的探討,還沒(méi)有真正進(jìn)入數(shù)據(jù)分析的深層。這里面實(shí)際上忽略了最基礎(chǔ)的統(tǒng)計(jì)測(cè)度問(wèn)題。如果說(shuō),計(jì)算技術(shù)的發(fā)展能夠解決數(shù)據(jù)儲(chǔ)存與計(jì)算的能力問(wèn)題,算法模型的改進(jìn)能夠解決大數(shù)據(jù)分析的綜合能力問(wèn)題,那么它們?nèi)匀徊荒芙鉀Q對(duì)誰(shuí)進(jìn)行計(jì)算與分析的問(wèn)題,也即從何處著手的問(wèn)題。無(wú)論是傳統(tǒng)的結(jié)構(gòu)型數(shù)據(jù),還是現(xiàn)在的包含大量非結(jié)構(gòu)型數(shù)據(jù)的大數(shù)據(jù),要對(duì)它們進(jìn)行分析都必須找到正確的切入口,即分析的基本元素是什么,或者說(shuō)需要測(cè)度什么。當(dāng)然,還有如何測(cè)度的問(wèn)題。然后,才能進(jìn)行分組、綜合和構(gòu)建模型,否則大數(shù)據(jù)分析不會(huì)達(dá)到人們的預(yù)期。
其次,大數(shù)據(jù)之所以催生數(shù)據(jù)科學(xué),就是為了通過(guò)多學(xué)科交叉融合來(lái)共同解決大數(shù)據(jù)分析中存在的問(wèn)題,其中包括統(tǒng)計(jì)測(cè)度問(wèn)題,這一點(diǎn)對(duì)于非結(jié)構(gòu)化數(shù)據(jù)尤為突出。實(shí)際上,大數(shù)據(jù)的本質(zhì)就是非結(jié)構(gòu)化數(shù)據(jù),一是體量大、比重高(超過(guò)95%),二是變化快、形式多,三是內(nèi)容雜、不確定。通過(guò)各種社交網(wǎng)絡(luò)、自媒體、富媒體,以及人機(jī)對(duì)話和機(jī)器感應(yīng)記錄等產(chǎn)生的各種非結(jié)構(gòu)化數(shù)據(jù),例如各種文字、各種表情符號(hào)、各種聲音、各種圖像,到底表示什么?綜合在一起能體現(xiàn)什么規(guī)律?如何綜合各種信息?存在著大量有待研究的問(wèn)題。其實(shí),文字的長(zhǎng)短、用詞、表達(dá)形式(敘述式、議論式、散文式、詩(shī)歌式,等)甚至字體大小與顏色,表情類(lèi)型與偏好,聲音高低、頻率與情緒,圖像顏色等等,都是有特定意義的,即在特定環(huán)境條件下的反應(yīng)。所以,一句話或一段聲音的意義并非文字本身的意思,一個(gè)表情符號(hào)的意義并非符號(hào)表征的意思,一個(gè)圖像的意義并非圖像內(nèi)容與色彩本身的意思,因?yàn)楸澈笥刑嗟奈粗H藗優(yōu)g覽檢索各種信息的習(xí)慣、收看與回復(fù)郵件等信息的習(xí)慣、參與信息網(wǎng)絡(luò)的習(xí)慣、購(gòu)物習(xí)慣與支付習(xí)慣等等,也是如此。更何況,同樣的網(wǎng)絡(luò)詞匯在不同的時(shí)間代表著不同的語(yǔ)義。這背后隱藏著的是人們的行為與社會(huì)關(guān)系,既具有個(gè)性又具有共性,極其復(fù)雜。所以對(duì)這樣的數(shù)據(jù)進(jìn)行分析,首先絕非是計(jì)算問(wèn)題,也不是用什么模型問(wèn)題,而首先是從何處著手、如何選取關(guān)鍵詞、如何選定關(guān)聯(lián)詞、可以用什么樣的指標(biāo)來(lái)綜合、可以用什么樣的表式來(lái)表現(xiàn)等問(wèn)題,一句話就是統(tǒng)計(jì)測(cè)度問(wèn)題。非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計(jì)測(cè)度將主要是定義測(cè)度,這些問(wèn)題不解決,分析模型也是難以構(gòu)建的,或者難以得出令人信服的結(jié)論。
例如,關(guān)于《紅樓夢(mèng)》前80回與后40回是否同一作者的爭(zhēng)論,韋博成[10]進(jìn)行了綜合性的比較研究并提出了自己的觀點(diǎn),他指出已有美國(guó)威斯康辛大學(xué)華裔學(xué)者陳炳藻教授(1980)[11]、我國(guó)華東師范大學(xué)陳大康教授(1987年)[12]和復(fù)旦大學(xué)李賢平教授(1987年)[13]等學(xué)者從統(tǒng)計(jì)學(xué)的角度進(jìn)行過(guò)專(zhuān)門(mén)的研究,但卻得出了不同的結(jié)論:陳炳藻教授認(rèn)為前80回與后40回均是曹雪芹所著;陳大康教授認(rèn)為前80回與后40回為不同人所著;李賢平教授認(rèn)為前80回是曹雪芹根據(jù)《石頭記》增刪而成,后40回是曹雪芹親友搜集整理原稿加工補(bǔ)寫(xiě)而成。此外,還有其他一些學(xué)者進(jìn)行過(guò)類(lèi)似的研究,也有一些不同的結(jié)論。為什么都通過(guò)提取關(guān)聯(lián)詞和統(tǒng)計(jì)的方法卻得出不同的結(jié)論?原因就在于用以分析的關(guān)聯(lián)詞不同,即統(tǒng)計(jì)測(cè)度的切入點(diǎn)不同,當(dāng)然也有統(tǒng)計(jì)方法上的差異,但前者是根本。至少存在幾個(gè)統(tǒng)計(jì)測(cè)度上的問(wèn)題:提取單一維度的關(guān)聯(lián)詞還是多維度的關(guān)聯(lián)詞?提取什么類(lèi)型的關(guān)聯(lián)詞(例如:關(guān)聯(lián)詞是名詞、形容詞還是動(dòng)詞;是花卉、樹(shù)木、飲食、醫(yī)藥還是詩(shī)詞)?這些關(guān)聯(lián)詞可以綜合為什么樣的指標(biāo)?等等。由此可見(jiàn),原始統(tǒng)計(jì)測(cè)度代表著數(shù)據(jù)分析的方向。
相比《紅樓夢(mèng)》,大數(shù)據(jù)分析要復(fù)雜得多、困難得多。所以,數(shù)據(jù)科學(xué)除了需要數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)、人工智能等學(xué)科的交叉融合外,還需要與行為科學(xué)、語(yǔ)言學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科相結(jié)合,以便能很好地解決作為數(shù)據(jù)分析之前提的統(tǒng)計(jì)測(cè)度問(wèn)題。
第三,數(shù)據(jù)科學(xué)將進(jìn)一步拓展統(tǒng)計(jì)測(cè)度的邊界,并提出更高的要求。伴隨著人類(lèi)認(rèn)識(shí)世界的范圍的不斷拓展,統(tǒng)計(jì)測(cè)度的范圍也不斷擴(kuò)大,從自然現(xiàn)象統(tǒng)計(jì)測(cè)度到人口現(xiàn)象、經(jīng)濟(jì)現(xiàn)象統(tǒng)計(jì)測(cè)度,再到社會(huì)現(xiàn)象、環(huán)境現(xiàn)象、政治現(xiàn)象等統(tǒng)計(jì)測(cè)度,幾乎已經(jīng)滲透到了所有可以想象到的領(lǐng)域。相應(yīng)地,統(tǒng)計(jì)數(shù)據(jù)分析也從少量數(shù)據(jù)的分析進(jìn)入到了大數(shù)據(jù)分析。大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性(王元卓等,2013)[14],意味著統(tǒng)計(jì)測(cè)度的內(nèi)容大大增加,原來(lái)一些不能測(cè)度的數(shù)據(jù)被納入到了統(tǒng)計(jì)測(cè)度的范圍,按照邱東教授的說(shuō)法就是統(tǒng)計(jì)測(cè)度的邊界大大擴(kuò)展了。統(tǒng)計(jì)測(cè)度邊界的擴(kuò)大,必須以統(tǒng)計(jì)測(cè)度能力的提升為前提,即要求統(tǒng)計(jì)學(xué)借助現(xiàn)代信息技術(shù)進(jìn)一步提升處理和分析數(shù)據(jù)的能力———對(duì)大數(shù)據(jù)“化繁為簡(jiǎn)”、“變厚為薄”的能力,這就必須以科學(xué)準(zhǔn)確的大數(shù)據(jù)統(tǒng)計(jì)測(cè)度為前提,既改變統(tǒng)計(jì)思維,又創(chuàng)新統(tǒng)計(jì)分析方法,其中就包括統(tǒng)計(jì)測(cè)度思維、統(tǒng)計(jì)測(cè)度方法與統(tǒng)計(jì)測(cè)度標(biāo)準(zhǔn)。面對(duì)大量繁雜的數(shù)據(jù),如果沒(méi)有更好的統(tǒng)計(jì)測(cè)度思路與方法,包括個(gè)體標(biāo)志定義方法、最小數(shù)據(jù)細(xì)胞分組與聚類(lèi)方法、關(guān)聯(lián)詞含義的時(shí)間影響計(jì)量方法、定性測(cè)度指標(biāo)篩選方法、再測(cè)度路徑與方法、大數(shù)據(jù)統(tǒng)計(jì)測(cè)度評(píng)價(jià)標(biāo)準(zhǔn)等,那么統(tǒng)計(jì)學(xué)在數(shù)據(jù)科學(xué)發(fā)展過(guò)程中就難以發(fā)揮應(yīng)有的作用,數(shù)據(jù)科學(xué)也將裹足不前。這就是統(tǒng)計(jì)學(xué)邁向數(shù)據(jù)科學(xué)的重要挑戰(zhàn)之一。
綜上所述,統(tǒng)計(jì)測(cè)度的基礎(chǔ)性問(wèn)題從統(tǒng)計(jì)學(xué)延伸到了數(shù)據(jù)科學(xué),是兩者的共同基礎(chǔ),并且對(duì)于數(shù)據(jù)科學(xué)而言顯得更為重要。大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性導(dǎo)致了統(tǒng)計(jì)測(cè)度的難度猛增,亟需建立面向大數(shù)據(jù)分析的統(tǒng)計(jì)測(cè)度理論與方法。要通過(guò)研究大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性特征的基本因素,以及這些因素之間的內(nèi)在聯(lián)系、外在指標(biāo)和測(cè)度方法,進(jìn)而研究基于先進(jìn)計(jì)算技術(shù)的大數(shù)據(jù)度量模型,構(gòu)建尋找面向計(jì)算的數(shù)據(jù)內(nèi)核或者數(shù)據(jù)邊界的基本方法。總之,建立有效易行的數(shù)據(jù)表示方法,即科學(xué)的統(tǒng)計(jì)測(cè)度方法,是數(shù)據(jù)科學(xué)必須解決的基礎(chǔ)問(wèn)題之一。
四、創(chuàng)新與完善大數(shù)據(jù)統(tǒng)計(jì)測(cè)度方法
如前所述,統(tǒng)計(jì)學(xué)研究對(duì)象已經(jīng)從結(jié)構(gòu)化數(shù)據(jù)延伸到了包括非結(jié)構(gòu)化數(shù)據(jù)在內(nèi)的一切數(shù)據(jù),統(tǒng)計(jì)測(cè)度邊界得到了大大的擴(kuò)展。按照邱東教授[7]曾經(jīng)引用過(guò)的海德格爾的話:“界限并不表示某一事物的發(fā)展到此為止,而是像希臘人所認(rèn)知的那樣,界限是某種事物開(kāi)始展現(xiàn)的地方”,預(yù)示著統(tǒng)計(jì)學(xué)在數(shù)據(jù)科學(xué)發(fā)展階段的新起點(diǎn)已經(jīng)展現(xiàn)在我們面前。新的統(tǒng)計(jì)測(cè)度邊界催生統(tǒng)計(jì)測(cè)度方法的創(chuàng)新,統(tǒng)計(jì)測(cè)度方法的創(chuàng)新促進(jìn)統(tǒng)計(jì)測(cè)度邊界的拓展,兩者相輔相成,共同推動(dòng)統(tǒng)計(jì)學(xué)與數(shù)據(jù)科學(xué)的發(fā)展。為此,我們要系統(tǒng)梳理統(tǒng)計(jì)測(cè)度方法的發(fā)展歷程,面對(duì)大數(shù)據(jù)提出的新挑戰(zhàn),大膽探索統(tǒng)計(jì)測(cè)度的新思路、新理論和新方法,為數(shù)據(jù)科學(xué)奠定堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ)。為此提出如下幾點(diǎn)建議:
首先,要緊密結(jié)合現(xiàn)象的本質(zhì)去探求更科學(xué)的統(tǒng)計(jì)測(cè)度方法。本質(zhì)決定一切,既然統(tǒng)計(jì)測(cè)度的目的是獲得客觀反映現(xiàn)象本質(zhì)的數(shù)據(jù),那么深入到現(xiàn)象本質(zhì)、認(rèn)識(shí)和掌握現(xiàn)象的本質(zhì),是科學(xué)統(tǒng)計(jì)測(cè)度的關(guān)鍵,也是探求新的統(tǒng)計(jì)方法的出發(fā)點(diǎn)。換句話說(shuō),科學(xué)的統(tǒng)計(jì)測(cè)度方法能夠體現(xiàn)出數(shù)據(jù)的真正意義。例如,要探求社交網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)計(jì)分析和測(cè)度方法,就必須了解社交網(wǎng)絡(luò)的產(chǎn)生背景、構(gòu)成要素、表現(xiàn)形式與基本特征,既要研究它的共性問(wèn)題,又要研究它的個(gè)性問(wèn)題與差異性,同時(shí)還要研究它的變化趨勢(shì)。只有這樣,才能掌握社交網(wǎng)絡(luò)數(shù)據(jù)的構(gòu)成要件或元素,才能建立起科學(xué)的、能有效體現(xiàn)社交網(wǎng)絡(luò)數(shù)據(jù)意義的統(tǒng)計(jì)測(cè)度方法。再如,要分析研究電子商務(wù)數(shù)據(jù),也必須先弄清楚什么是電子商務(wù),尤其是弄清楚它與傳統(tǒng)的商業(yè)模式有什么不同(包括物流、資金流與信息流)、有哪些新生事物(包括時(shí)空特征、法律監(jiān)管)等等,否則統(tǒng)計(jì)測(cè)度無(wú)從下手或者抓不住要害。同時(shí),作為一個(gè)新的研究領(lǐng)域,數(shù)據(jù)科學(xué)的理論基礎(chǔ)將與計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、人工智能、數(shù)學(xué)、社會(huì)科學(xué)等有關(guān),離不開(kāi)對(duì)相關(guān)學(xué)科領(lǐng)域知識(shí)與研究方法的借鑒,因此對(duì)相關(guān)領(lǐng)域的知識(shí)與研究方法的學(xué)習(xí)十分重要。否則,就會(huì)嚴(yán)重扭曲統(tǒng)計(jì)測(cè)度方法,胡亂設(shè)置測(cè)度標(biāo)志,這需要引起高度關(guān)注。
其次,要緊密結(jié)合大數(shù)據(jù)的特點(diǎn)去創(chuàng)新統(tǒng)計(jì)測(cè)度方法。大數(shù)據(jù)的特點(diǎn)是復(fù)雜性、不確定性和涌現(xiàn)性并存,構(gòu)成了多維的數(shù)據(jù)空間,里面蘊(yùn)藏著豐富的信息資源,這是傳統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)不可比擬的。那么該從何處進(jìn)入這樣的數(shù)據(jù)空間?怎么進(jìn)去?又怎么出來(lái)?這歸根結(jié)底還是統(tǒng)計(jì)測(cè)度方法問(wèn)題。因此,在開(kāi)展大數(shù)據(jù)分析之前,首先要研究大數(shù)據(jù)的基礎(chǔ)性問(wèn)題,包括大數(shù)據(jù)的內(nèi)在機(jī)理(包括大數(shù)據(jù)的演化與傳播機(jī)制、生命周期),數(shù)據(jù)科學(xué)與社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、行為科學(xué)等之間的互動(dòng)機(jī)制,以及大數(shù)據(jù)的結(jié)構(gòu)與效能的規(guī)律性等等,為創(chuàng)新統(tǒng)計(jì)測(cè)度方法提供導(dǎo)向。本文認(rèn)為,再?gòu)?fù)雜的數(shù)據(jù)也有共性,再不確定的數(shù)據(jù)也有規(guī)律,再涌現(xiàn)的數(shù)據(jù)也有軌跡。網(wǎng)絡(luò)大數(shù)據(jù)背后的網(wǎng)絡(luò)平均路徑長(zhǎng)度、度分布、聚集系數(shù)、核數(shù)、介數(shù)等具有共性的特征與參數(shù),是開(kāi)展復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)分析的基礎(chǔ)(李國(guó)杰、程學(xué)旗,2012)[15];大數(shù)據(jù)在時(shí)空維度上的分布形式、內(nèi)在結(jié)構(gòu)、動(dòng)態(tài)變化和相關(guān)聯(lián)的規(guī)律,是找到大數(shù)據(jù)分析切入口、進(jìn)而簡(jiǎn)化大數(shù)據(jù)表征的前提;大數(shù)據(jù)的涌現(xiàn)性軌跡(包括模式涌現(xiàn)性、行為涌現(xiàn)性和智慧涌現(xiàn)性),是研究更多的社會(huì)網(wǎng)絡(luò)模型和理解網(wǎng)絡(luò)瓦解失效原因,理解人們網(wǎng)絡(luò)行為涌現(xiàn)特征(例如人們發(fā)郵件數(shù)量的時(shí)間分布特征),以及探求大量自發(fā)個(gè)體語(yǔ)義融合連接形成有特定意義的通用語(yǔ)義之過(guò)程的路徑(靳小龍等,2013)[16]。也就是說(shuō),這些共性、規(guī)律和軌跡就是統(tǒng)計(jì)測(cè)度的主要依據(jù),也是重點(diǎn)內(nèi)容。發(fā)展和創(chuàng)新能夠準(zhǔn)確發(fā)現(xiàn)大數(shù)據(jù)的共性、規(guī)律和軌跡的定量方法,其實(shí)就是發(fā)展和創(chuàng)新大數(shù)據(jù)統(tǒng)計(jì)測(cè)度方法。
第三,要緊密結(jié)合現(xiàn)代信息技術(shù)以完善統(tǒng)計(jì)測(cè)度方法。復(fù)雜、多變和不斷涌現(xiàn)的大數(shù)據(jù),不僅需要借助現(xiàn)代信息技術(shù)(包括硬件與軟件)來(lái)解決極其復(fù)雜的分析計(jì)算問(wèn)題,也需要利用現(xiàn)代信息技術(shù)來(lái)解決其繁雜多樣的統(tǒng)計(jì)測(cè)度問(wèn)題。對(duì)于大數(shù)據(jù),不論是原始統(tǒng)計(jì)測(cè)度還是再測(cè)度,其復(fù)雜性或難度都不是傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)所能相提并論的,哪怕是基本的關(guān)聯(lián)詞計(jì)數(shù)、分類(lèi)與匯總,其工作量之大也超乎想象,不借用現(xiàn)代信息技術(shù)幾乎是不可能完成的。而事實(shí)上,有些統(tǒng)計(jì)測(cè)度的內(nèi)容與方法本身也是以數(shù)據(jù)處理能力的提升為前提的。可以說(shuō),脫離現(xiàn)代信息技術(shù),人們難以承受大數(shù)據(jù)的統(tǒng)計(jì)測(cè)度與分析任務(wù);要把統(tǒng)計(jì)測(cè)度思想變?yōu)榭蓪?shí)現(xiàn)的統(tǒng)計(jì)測(cè)度方法,必須借助現(xiàn)代信息技術(shù)。為此,要充分利用各種信息技術(shù)和手段,把統(tǒng)計(jì)測(cè)度與數(shù)據(jù)清洗相結(jié)合、與數(shù)據(jù)分析模型相結(jié)合、與計(jì)算方法相結(jié)合,努力建立融自動(dòng)搜索統(tǒng)計(jì)測(cè)度、動(dòng)態(tài)演化統(tǒng)計(jì)測(cè)度和自主優(yōu)選統(tǒng)計(jì)測(cè)度為一體的大數(shù)據(jù)統(tǒng)計(jì)測(cè)度方法體系。
【關(guān)鍵詞】數(shù)據(jù)分析 籃球運(yùn)動(dòng) 籃球技術(shù)
【中圖分類(lèi)號(hào)】G841 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1674-4810(2015)08-0188-02
在一場(chǎng)籃球比賽中進(jìn)行數(shù)據(jù)挖掘,并提取相關(guān)籃球技術(shù)動(dòng)作中可用信息是推進(jìn)籃球運(yùn)動(dòng)與事業(yè)發(fā)展的一個(gè)有效方法。將數(shù)據(jù)分析應(yīng)用到籃球運(yùn)動(dòng)中,通過(guò)對(duì)統(tǒng)計(jì)數(shù)據(jù)的分析,對(duì)籃球的各項(xiàng)數(shù)據(jù)進(jìn)行分類(lèi),并分析查找這些數(shù)據(jù)之間的相關(guān)性。
一 籃球數(shù)據(jù)分析方式
籃球數(shù)據(jù)分析是現(xiàn)代籃球很重要的一部分,通過(guò)數(shù)據(jù)的分析可以發(fā)現(xiàn)很多平時(shí)難于發(fā)現(xiàn)的問(wèn)題。在實(shí)際的運(yùn)用中,數(shù)據(jù)分析的方式就顯得尤為重要。
1.橫向的數(shù)據(jù)分析
橫向分析是對(duì)同一時(shí)期數(shù)據(jù)資料進(jìn)行橫剖研究,拋開(kāi)其他各種條件,對(duì)待一事物的具體特征,以具體數(shù)據(jù)的方式研究其變化的趨勢(shì)與規(guī)律。這種分析方式在籃球運(yùn)動(dòng)中可以用來(lái)分析球員的籃板、得分、助攻、搶斷、失誤五項(xiàng)數(shù)據(jù)。例如可以橫向地分析助攻失誤比是多少,這個(gè)比率越大說(shuō)明助攻的成功率就越高,助攻的效率也就越高,反之說(shuō)明助攻的同時(shí)付出了過(guò)大的失誤損失,助攻的效率就低。這個(gè)比率可以提示球員需要在哪些方面提高,比率大了就要增大助攻的次數(shù),比率小了就要適當(dāng)減少助攻的次數(shù)、提高傳球的把握性。數(shù)據(jù)橫向分析在籃球運(yùn)動(dòng)中使用是理論與實(shí)際相結(jié)合的過(guò)程,它提高了籃球技術(shù)的科學(xué)性,加快了籃球技術(shù)的發(fā)展。
2.縱向的數(shù)據(jù)分析
縱向分析也可以叫作垂直分析,主要用分析發(fā)展進(jìn)步的程度和速度。它可以清晰地分析出某個(gè)球員在職業(yè)生涯中的籃板、得分、助攻、搶斷、失誤的發(fā)展方向,也可以分析出一個(gè)球隊(duì)一年中基本數(shù)據(jù)的發(fā)展趨勢(shì)。例如某個(gè)球員的得分每個(gè)月的平均得分都在變大,這說(shuō)明這個(gè)球員在上升期,就可以判斷這個(gè)球員還有很大的潛力空間;一個(gè)球隊(duì)每個(gè)月的平均籃板數(shù)都在下降,這說(shuō)明球隊(duì)的球員積極性在減弱,教練就可以多進(jìn)行搶籃板方面的訓(xùn)練,多提醒球員拼搶籃板球,進(jìn)而調(diào)動(dòng)球員的積極性,提升球隊(duì)的籃板球數(shù)。
二 籃球數(shù)據(jù)分析的主體
籃球數(shù)據(jù)主要由單個(gè)球員的數(shù)據(jù)和球隊(duì)數(shù)據(jù)構(gòu)成,在分析籃球數(shù)據(jù)時(shí)就要將這兩個(gè)主體分門(mén)別類(lèi)匯總對(duì)比分析。
1.球員的數(shù)據(jù)分析
球員是籃球運(yùn)動(dòng)的基本要素,球員數(shù)據(jù)的分析是數(shù)據(jù)分析的第一步,也是最基礎(chǔ)的一步。球員在各個(gè)方面的貢獻(xiàn)才能換來(lái)球隊(duì)的良性發(fā)展,球員對(duì)球隊(duì)的發(fā)展起到很大的推動(dòng)作用,這樣就要求在對(duì)球員進(jìn)行數(shù)據(jù)分析時(shí)要對(duì)單個(gè)球員和多個(gè)球員組合進(jìn)行數(shù)據(jù)分析。
第一,單個(gè)球員各項(xiàng)數(shù)據(jù)分析。(1)單個(gè)球員某場(chǎng)比賽中在籃板、得分、助攻、搶斷、失誤等數(shù)據(jù)分析。(2)單個(gè)球員特定時(shí)間段在籃板、得分、助攻、搶斷、失誤等數(shù)據(jù)方面增大或者減少。(3)相同位置的球員數(shù)據(jù)分析,數(shù)據(jù)分析對(duì)比就可以看出能力、效率和態(tài)度。(4)單個(gè)球員歷史數(shù)據(jù)分析。現(xiàn)實(shí)數(shù)據(jù)與歷史數(shù)據(jù)進(jìn)行分析,清楚地顯示該球員得分的增減、防守的變化、拼搶積極性的變化等。(5)單個(gè)球員特定比賽的數(shù)據(jù)分析。例如一球員主場(chǎng)時(shí)平均得分20分,客場(chǎng)時(shí)平均得分10分,就可以清楚地判斷該球員在客場(chǎng)狀態(tài)沒(méi)有在主場(chǎng)狀態(tài)好,這樣就可以適當(dāng)增加該球員的主場(chǎng)上場(chǎng)時(shí)間,減少客場(chǎng)上場(chǎng)時(shí)間。
第二,多個(gè)球員組合數(shù)據(jù)分析。在籃球比賽中,對(duì)比賽數(shù)據(jù)進(jìn)行實(shí)時(shí)錄入分析,并輔以以往的比賽數(shù)據(jù)作為教練員的參考是極為重要的,這不但可以幫助教練員判斷球員的參賽狀況,還可以幫助分析哪些球員組合后能發(fā)揮出更大的優(yōu)勢(shì)。
球員組合數(shù)據(jù)分析是為了更好地產(chǎn)生球隊(duì)化學(xué)反應(yīng)。例如球員甲、乙、丙一塊上場(chǎng)時(shí)球隊(duì)凈勝10分,球員乙、丙、丁一塊上場(chǎng)時(shí)球隊(duì)負(fù)5分。通過(guò)這個(gè)球員組合數(shù)據(jù)分析可以表明甲、乙、丙組合效率更高,效果更好,在安排技戰(zhàn)術(shù)時(shí)應(yīng)增加此組合的上場(chǎng)時(shí)間。同理則要適當(dāng)減少乙丙丁組合的上場(chǎng)時(shí)間。
組合數(shù)據(jù)分析在實(shí)際運(yùn)用中越來(lái)越被重視,很多的球隊(duì)都出現(xiàn)了“三巨頭”“后場(chǎng)雙槍”等。例如NBA達(dá)拉斯小牛隊(duì)當(dāng)年的“三駕馬車(chē)”、底特律活塞隊(duì)的“藍(lán)領(lǐng)五人組”和湖人王朝時(shí)期的“OK”組合,還有我們都比較熟悉的火箭麥蒂與姚明“MM”組合。這些組合都是在組合數(shù)據(jù)分析的基礎(chǔ)上建立的,最終也都在籃球運(yùn)動(dòng)的歷史里留下了濃重的一筆。
2.球隊(duì)的數(shù)據(jù)分析
籃球這項(xiàng)運(yùn)動(dòng)是一個(gè)團(tuán)隊(duì)運(yùn)動(dòng),只分析球員的數(shù)據(jù)就違背了團(tuán)隊(duì)運(yùn)動(dòng)的精髓。因此,球隊(duì)數(shù)據(jù)分析要建立在球員數(shù)據(jù)分析的基礎(chǔ)上,既要注重個(gè)人的發(fā)揮,又要考慮球隊(duì)的整體。對(duì)球隊(duì)的數(shù)據(jù)分析主要有以下四個(gè)方面。
第一,球隊(duì)勝利時(shí)的數(shù)據(jù)分析。數(shù)據(jù)分析的目的是為了提高球隊(duì)的戰(zhàn)斗力和競(jìng)爭(zhēng)力,這就要求了在進(jìn)行數(shù)據(jù)分析時(shí)要重視球隊(duì)獲得勝利時(shí)的各項(xiàng)數(shù)據(jù)。例如勝利的比賽要分析命中率比對(duì)手高幾個(gè)百分點(diǎn)和凈勝對(duì)手多少分,這兩個(gè)數(shù)據(jù)可以體現(xiàn)球隊(duì)的狀態(tài)和進(jìn)攻能力。在分析進(jìn)攻的同時(shí)也不能忽視防守,防守情況就要分析凈勝對(duì)手多少個(gè)籃板球、逼迫對(duì)手出現(xiàn)多少次失誤、將對(duì)手的得分限制在多少分等。
第二,球隊(duì)失敗時(shí)的數(shù)據(jù)分析。有勝就有敗,勝利時(shí)的數(shù)據(jù)分析會(huì)鼓舞人心,失敗時(shí)的數(shù)據(jù)分析可能會(huì)使人心灰意冷,但是失敗時(shí)的數(shù)據(jù)分析是尋找差距并迎頭趕上的必經(jīng)之路。只有進(jìn)行準(zhǔn)確到位的分析,才能將進(jìn)攻端和防守端的問(wèn)題暴露出來(lái),才能更好地從根本上解決問(wèn)題。
第三,球隊(duì)歷史的數(shù)據(jù)分析。把歷史當(dāng)作一面鏡子,要經(jīng)常地去照鏡子,只有知道距離歷史最好水平還有多少差距,才可以明確球隊(duì)的發(fā)展方向。球隊(duì)歷史數(shù)據(jù)分析主要體現(xiàn)在以下三個(gè)方面:(1)發(fā)生重大人員變化。引進(jìn)的重要球員偏重進(jìn)攻,在戰(zhàn)術(shù)體系中就要加大進(jìn)攻的風(fēng)格。(2)球隊(duì)?wèi)?zhàn)術(shù)發(fā)生重大變化。球隊(duì)由進(jìn)攻型風(fēng)格向防守型風(fēng)格變化,就要分析改變風(fēng)格后防守?cái)?shù)據(jù)是否大于之前的效率。(3)與球隊(duì)鼎盛時(shí)期的數(shù)據(jù)對(duì)比。球隊(duì)鼎盛時(shí)期的數(shù)據(jù)是球隊(duì)建設(shè)的目標(biāo),如果球隊(duì)在上升期就要對(duì)各項(xiàng)數(shù)據(jù)進(jìn)行分析,以便能盡快地達(dá)到巔峰。如果球隊(duì)在下降期,如果只分析一些諸如防守的部分?jǐn)?shù)據(jù),就會(huì)使球隊(duì)陷入一種困惑,反倒會(huì)起到負(fù)面作用。
對(duì)球隊(duì)歷史數(shù)據(jù)分析時(shí)最重要,也是最需要注意的一點(diǎn)是對(duì)比的時(shí)期一定要選擇準(zhǔn)確,否則會(huì)讓數(shù)據(jù)分析不能客觀、科學(xué)地指導(dǎo)球隊(duì)的發(fā)展。
第四,與其他球隊(duì)的數(shù)據(jù)分析。俗話說(shuō):“知己知彼,百戰(zhàn)不殆”“三人行必有我?guī)煛保v的就是要熟悉對(duì)手、學(xué)習(xí)對(duì)手的優(yōu)勢(shì)才能打敗對(duì)手。與其他球隊(duì)數(shù)據(jù)分析主要有以下四個(gè)方面的內(nèi)容:(1)與即將比賽的球隊(duì)進(jìn)行之前交手?jǐn)?shù)據(jù)的分析。這些分析就可以清晰地反映球隊(duì)的優(yōu)勢(shì)或弱點(diǎn),對(duì)手在某個(gè)環(huán)節(jié)的優(yōu)勢(shì)或弱點(diǎn)。從而在安排技戰(zhàn)術(shù)時(shí)就可以最大化自己的優(yōu)勢(shì),猛攻對(duì)手的弱點(diǎn)。(2)與戰(zhàn)術(shù)體系相同的球隊(duì)進(jìn)行數(shù)據(jù)分析。進(jìn)攻型的球隊(duì)分析進(jìn)攻數(shù)據(jù),找到球隊(duì)在進(jìn)攻端的差距和不足;分析防守型球隊(duì)的數(shù)據(jù),這樣可以使球隊(duì)的戰(zhàn)術(shù)體系更加的均衡化,以便提高和長(zhǎng)足發(fā)展。(3)與戰(zhàn)術(shù)體系不相同的球隊(duì)進(jìn)行數(shù)據(jù)分析,發(fā)現(xiàn)其他球隊(duì)的優(yōu)勢(shì),進(jìn)而學(xué)習(xí),變?yōu)樽约旱膬?yōu)勢(shì)。(4)與戰(zhàn)績(jī)好的球隊(duì)進(jìn)行數(shù)據(jù)分析,尋找需要提高的要素。
三 結(jié)束語(yǔ)
隨著數(shù)據(jù)分析在籃球運(yùn)動(dòng)中的運(yùn)用越來(lái)越廣泛,有些球隊(duì)專(zhuān)門(mén)成立數(shù)據(jù)分析團(tuán)隊(duì),聘請(qǐng)數(shù)據(jù)分析專(zhuān)家,籃球運(yùn)動(dòng)中的數(shù)據(jù)分析越來(lái)越精細(xì)化、專(zhuān)業(yè)化,數(shù)據(jù)分析已經(jīng)成為籃球運(yùn)動(dòng)不可或缺的一部分。
參考文獻(xiàn)
【關(guān)鍵詞】英語(yǔ)教學(xué) 可視化分析 學(xué)習(xí)成效
我國(guó)英語(yǔ)教學(xué)在網(wǎng)絡(luò)課程、移動(dòng)學(xué)習(xí)、智能測(cè)評(píng)等方面近年來(lái)發(fā)展迅猛。結(jié)合我國(guó)實(shí)際的教學(xué)環(huán)境以及新近發(fā)展起來(lái)的大數(shù)據(jù)可視化分析模型,探索更有針對(duì)性更加有效的英語(yǔ)教學(xué)模式,以更大限度的提高學(xué)生學(xué)習(xí)熱情,改善學(xué)習(xí)成績(jī),培養(yǎng)全面發(fā)展的英語(yǔ)人才。
一、中國(guó)英語(yǔ)教育的規(guī)模與社會(huì)需求
全球化進(jìn)程和頻繁的國(guó)際交流推動(dòng)著我國(guó)的英語(yǔ)教育發(fā)展,同時(shí)也導(dǎo)致外語(yǔ)類(lèi)教學(xué)消費(fèi)的泡沫現(xiàn)象。針對(duì)高校英語(yǔ)專(zhuān)業(yè)和英語(yǔ)增長(zhǎng)和英語(yǔ)類(lèi)考試泛濫的現(xiàn)狀,導(dǎo)致了學(xué)生數(shù)量與教學(xué)質(zhì)量之間的矛盾。我國(guó)高校英語(yǔ)教育規(guī)模和社會(huì)需求的快速發(fā)展,但也隨之帶來(lái)了師資不足、教材陳舊、教學(xué)手段落后、理論和實(shí)際脫離等一系列問(wèn)題。在飛速發(fā)展的大數(shù)據(jù)時(shí)代,如何在保障英語(yǔ)教育規(guī)模的同時(shí),建設(shè)英語(yǔ)專(zhuān)業(yè)教材、深化英語(yǔ)專(zhuān)業(yè)教學(xué)改革、確保英語(yǔ)專(zhuān)業(yè)教學(xué)質(zhì)量已經(jīng)成為當(dāng)前迫切需要解決的問(wèn)題。
二、大數(shù)據(jù)分析模型在學(xué)生英語(yǔ)學(xué)習(xí)過(guò)程中的應(yīng)用
大數(shù)據(jù)概念在教育領(lǐng)域的發(fā)展體現(xiàn)在:開(kāi)創(chuàng)教育理念的新思維新視角的同時(shí),也給教育實(shí)踐探索帶來(lái)了新技術(shù)、新方法。通過(guò)數(shù)據(jù)記錄學(xué)生學(xué)習(xí)的能力、效果、時(shí)間、水平、成績(jī)、思維流程等,能夠直接、具象的掌握學(xué)生的學(xué)習(xí)進(jìn)度。通過(guò)大數(shù)據(jù)系統(tǒng),對(duì)這些信息和數(shù)據(jù)進(jìn)行記錄、整理、統(tǒng)計(jì)、分析,使得教師能更科學(xué)全面地掌握學(xué)生的學(xué)習(xí)動(dòng)向,也使得學(xué)生和家長(zhǎng)能及時(shí)客觀地了解個(gè)體發(fā)展情況。
通過(guò)大數(shù)據(jù)分析模型著重闡述了如何對(duì)學(xué)生英語(yǔ)水平進(jìn)行切面橫向的評(píng)價(jià),同時(shí)進(jìn)行分析研究,查缺補(bǔ)漏,制定個(gè)性化學(xué)習(xí)方案,教師實(shí)行定制化的施教方案,有針對(duì)性地對(duì)學(xué)生的英語(yǔ)學(xué)習(xí)進(jìn)行指導(dǎo)和教授知識(shí)點(diǎn),有效提高學(xué)生英語(yǔ)水平。
從縱向的時(shí)間維度來(lái)講,以學(xué)生個(gè)體在學(xué)習(xí)過(guò)程中積累的變動(dòng)數(shù)據(jù)為根據(jù),橫向細(xì)分考察點(diǎn)(聽(tīng)說(shuō)讀寫(xiě)譯的子考察點(diǎn))為依托,這樣可以繪制出學(xué)生個(gè)體在學(xué)習(xí)過(guò)程中的數(shù)據(jù)變化模型,制作出來(lái)評(píng)分圖,對(duì)比以前的評(píng)分圖,可以實(shí)現(xiàn)對(duì)該學(xué)生整個(gè)學(xué)習(xí)過(guò)程進(jìn)行可視化研究,并隨時(shí)調(diào)整學(xué)習(xí)方法和施教方案,有針對(duì)性地加強(qiáng)薄弱點(diǎn)的學(xué)習(xí),掌控學(xué)生的學(xué)習(xí)效果。
同前面所述一樣可以繪制出學(xué)生的學(xué)習(xí)水平評(píng)價(jià)表,可以清晰地記錄學(xué)生的學(xué)習(xí)軌跡,如果條件允許還可以制定學(xué)習(xí)記錄檔案,這不僅能成為學(xué)生學(xué)習(xí)成長(zhǎng)的指引工具,也有助于鍛煉學(xué)生的分析解決問(wèn)題能力和邏輯思維。
三、大數(shù)據(jù)分析法在英語(yǔ)教學(xué)當(dāng)中的應(yīng)用
1.大數(shù)據(jù)分析模型在學(xué)習(xí)群體中的分類(lèi)應(yīng)用。對(duì)一個(gè)學(xué)習(xí)群體來(lái)講,主要從以下四個(gè)方面進(jìn)行分類(lèi)研究,考查點(diǎn)分別是基礎(chǔ)綜合水平、學(xué)生學(xué)習(xí)目標(biāo)要求、英語(yǔ)學(xué)習(xí)薄弱點(diǎn)和學(xué)生的性格特點(diǎn)等。該四個(gè)考查點(diǎn)每個(gè)以滿分100分計(jì),基礎(chǔ)綜合水平時(shí)根據(jù)學(xué)生目前的學(xué)習(xí)狀況做個(gè)全面客觀的測(cè)試,可以從聽(tīng)說(shuō)讀寫(xiě)譯等五個(gè)基礎(chǔ)點(diǎn)進(jìn)行測(cè)試,為考慮英語(yǔ)教學(xué)是為學(xué)生英語(yǔ)學(xué)習(xí)的全面發(fā)展,故每個(gè)基礎(chǔ)點(diǎn)滿分為20分,進(jìn)行考察統(tǒng)計(jì);學(xué)生學(xué)習(xí)目標(biāo)要求是指根據(jù)學(xué)生當(dāng)前狀況,同時(shí)結(jié)合學(xué)生家長(zhǎng)、學(xué)生本人以及學(xué)校的期望和要求,制定合理的學(xué)習(xí)目標(biāo);英語(yǔ)學(xué)習(xí)薄弱點(diǎn)主要通過(guò)綜合水平的考查就可得出學(xué)生學(xué)習(xí)的評(píng)估結(jié)論;性格特點(diǎn)是指在英語(yǔ)學(xué)習(xí)過(guò)程當(dāng)中該學(xué)生適合的一種學(xué)習(xí)方法,以上四個(gè)方面具體參考下面表格進(jìn)行分類(lèi):
通過(guò)基礎(chǔ)綜合水平(從聽(tīng)說(shuō)讀寫(xiě)譯等五個(gè)方面進(jìn)行考核)、學(xué)習(xí)薄弱點(diǎn)、性格特點(diǎn)、學(xué)習(xí)目標(biāo)要求(學(xué)生自己的學(xué)習(xí)水平,學(xué)生家長(zhǎng)、學(xué)生本人以及學(xué)校的期望和要求)這四個(gè)方面,將學(xué)生群體分成幾類(lèi),清楚了解他們?cè)谟⒄Z(yǔ)學(xué)習(xí)過(guò)程中存在的問(wèn)題,可針對(duì)性地進(jìn)行施教,同時(shí)對(duì)學(xué)習(xí)過(guò)程進(jìn)行圖表追蹤,可以直觀反映學(xué)生在學(xué)習(xí)過(guò)程中的進(jìn)步情況。傳統(tǒng)的教育教學(xué)評(píng)價(jià)模式和大數(shù)據(jù)的評(píng)價(jià)模式有較大的差別,大數(shù)據(jù)時(shí)代的教育,更加注重ρ生多方面的考核,對(duì)學(xué)生的了解更具有針對(duì)性,施教方法和教材的選用都能體現(xiàn)個(gè)性化,會(huì)更客觀和全面地對(duì)學(xué)生進(jìn)行考核、評(píng)價(jià)、分析和研究。
通過(guò)對(duì)學(xué)生群體從以上四個(gè)大方向的了解分析,進(jìn)行有針對(duì)性的施教,前三個(gè)方面是從學(xué)生當(dāng)前自身的了解,后一項(xiàng)是對(duì)其學(xué)習(xí)目標(biāo)的確認(rèn),首先,在了解以上各方面的狀態(tài)下,結(jié)合學(xué)生的基礎(chǔ)綜合水平高低將其目標(biāo)分段實(shí)現(xiàn),同時(shí),結(jié)合其學(xué)習(xí)薄弱點(diǎn),進(jìn)行重點(diǎn)練習(xí)和學(xué)習(xí),鞏固以前基礎(chǔ),提升重點(diǎn)知識(shí)水平,針對(duì)不同性格的學(xué)生,采用不同的學(xué)習(xí)和練習(xí)方法,比如性格開(kāi)朗具有語(yǔ)言天賦的學(xué)生更能在聽(tīng)說(shuō)應(yīng)用中提高知識(shí)水平,性格內(nèi)向的學(xué)生在讀寫(xiě)和記憶知識(shí)方面更能發(fā)揮他們的優(yōu)勢(shì)。
2.大數(shù)據(jù)分析模型在學(xué)生個(gè)性化英語(yǔ)學(xué)習(xí)中應(yīng)用。
(1)英語(yǔ)教學(xué)評(píng)價(jià)指標(biāo)體系介紹。以單個(gè)學(xué)生為例,由評(píng)價(jià)老師組成評(píng)價(jià)小組,取平均值對(duì)學(xué)生進(jìn)行橫向切面的英語(yǔ)水平數(shù)據(jù)分析,評(píng)價(jià)表設(shè)計(jì)為:聽(tīng)(詞0.2、句0.2、文0.2、邏輯關(guān)系0.3、習(xí)語(yǔ)0.1)說(shuō)(發(fā)音0.5、斷句0.3、語(yǔ)氣語(yǔ)調(diào)0.2)、讀(詞匯0.3、句型0.3、語(yǔ)法0.4)寫(xiě)(詞匯0.5、格式行文0.2、組織結(jié)構(gòu)0.3)譯(口譯0.4、筆譯0.4、速記0.2)。
通過(guò)以上表格對(duì)學(xué)生的英語(yǔ)水平進(jìn)行全方位的數(shù)據(jù)分析,需要說(shuō)明的是評(píng)分等級(jí)可以是上面模糊指標(biāo),也可以是精確的得分,通過(guò)建立科學(xué)準(zhǔn)確的數(shù)學(xué)模型,可以輕而易舉的展現(xiàn)出某一學(xué)生的優(yōu)勢(shì)和不足,同時(shí)上表還可以結(jié)合學(xué)生的目標(biāo)要求拆開(kāi)來(lái)用,針對(duì)某一或幾個(gè)大類(lèi)進(jìn)行評(píng)價(jià)分析,最終可視化地得出學(xué)生英語(yǔ)水平表,之后針對(duì)學(xué)生的不足制定出個(gè)性化的學(xué)習(xí)和施教方案。按照英語(yǔ)水平數(shù)據(jù)分析評(píng)價(jià)模型表,就某一學(xué)生實(shí)際英語(yǔ)水平考查得分用柱狀圖進(jìn)行可視化分析。
從圖1可以看出該學(xué)生的能力水平中等偏上,但是翻譯水平很差,讀寫(xiě)水平良好,聽(tīng)說(shuō)能力一般,總體水平都有待提高,特別是翻譯水平需要特別注意。經(jīng)過(guò)分析,針對(duì)該學(xué)生教師首先著重從鍛煉其翻譯能力為重,制定專(zhuān)門(mén)能夠提高翻譯水平的施教方案和策略,同時(shí)注意對(duì)聽(tīng)說(shuō)讀寫(xiě)等方面能力的學(xué)習(xí)和提高。
下面再聽(tīng)力水平為例進(jìn)行分析,研究哪些細(xì)分方面能力水低而導(dǎo)致該生的聽(tīng)力水平一般。以聽(tīng)力水平考查得分為例,
由上圖可以輕松看出來(lái)該生的英語(yǔ)聽(tīng)力水平一般,具體原因除在詞匯方面表現(xiàn)良好以外,其他細(xì)分能力點(diǎn)的水平都很普通,在全文聽(tīng)力理解表現(xiàn)較差,對(duì)語(yǔ)句理解一般,全文邏輯關(guān)系掌握較差,英語(yǔ)習(xí)語(yǔ)的了解水平低,說(shuō)明該生需要著重訓(xùn)練語(yǔ)句及全文的聽(tīng)力理解邏輯關(guān)系和英語(yǔ)習(xí)語(yǔ)的學(xué)習(xí),結(jié)合英語(yǔ)聽(tīng)力能力的不足點(diǎn),制定個(gè)性化學(xué)習(xí)和施教方案,有針對(duì)性地彌補(bǔ)不足;同時(shí)從時(shí)間維度來(lái)看,可以隔一段時(shí)間對(duì)該學(xué)生的水平進(jìn)行評(píng)價(jià),做出評(píng)分圖,對(duì)比以前的評(píng)分圖可以看出該學(xué)生的提升幅度和當(dāng)前的能力水平,適時(shí)調(diào)整學(xué)習(xí)方法和側(cè)重點(diǎn),優(yōu)化調(diào)整施教方案。
四、結(jié)束語(yǔ)
“數(shù)據(jù)驅(qū)動(dòng)社會(huì),分析變革教育”的大數(shù)據(jù)時(shí)代已經(jīng)到來(lái),改變和優(yōu)化傳統(tǒng)的教育教學(xué)方法是時(shí)代所趨,更是學(xué)生學(xué)習(xí)的內(nèi)在所需。教育數(shù)據(jù)資源共享,利用大數(shù)據(jù)分析模型開(kāi)展教育和教學(xué)工作,提高學(xué)生英語(yǔ)學(xué)習(xí)水平,降低學(xué)習(xí)成本,實(shí)現(xiàn)大數(shù)據(jù)分析方法的最大的價(jià)值。
參考文獻(xiàn):
[1]徐鵬.大數(shù)據(jù)視角分析學(xué)習(xí)變革[J].遠(yuǎn)程教育雜志,2013,(6): 11-17.
[2]焦欣然.大數(shù)據(jù)時(shí)代下的因材施教[J].觀察視角,2015,(6):72.
Abstract: Construction idea for risk database of processed food was proposed under present food safety, test data of processed food was the object of study in this database. Information sources management and data screening analysis were realized by OLAP analysis tool. Expert judging, considering some factors such as data analysis and result, risk priority number of food hazard, and production process was studied, so as to realize the early warning analysis for risk data of processed food.
關(guān)鍵詞: 加工食品;風(fēng)險(xiǎn)數(shù)據(jù)庫(kù);構(gòu)建
Key words: processed food;risk database;construction
中圖分類(lèi)號(hào):G250.74 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2013)30-0174-02
0 引言
隨著食品加工技術(shù)的快速發(fā)展和新食品的開(kāi)發(fā),農(nóng)藥、獸藥、激素、添加劑、非食品原料帶入的食品安全問(wèn)題引起的社會(huì)的廣泛關(guān)注。加強(qiáng)對(duì)食品生產(chǎn)加工環(huán)節(jié)的管控是降低食品安全風(fēng)險(xiǎn)的重要舉措。近年來(lái),食品監(jiān)管部門(mén)持續(xù)加大風(fēng)險(xiǎn)監(jiān)測(cè)的工作力度,組織實(shí)施有針對(duì)性的風(fēng)險(xiǎn)監(jiān)測(cè)計(jì)劃,積累了大量的食品風(fēng)險(xiǎn)監(jiān)測(cè)數(shù)據(jù)資源,為發(fā)現(xiàn)食品中可能存在的潛在風(fēng)險(xiǎn)源提供有力的數(shù)據(jù)支撐。在此基礎(chǔ)上,構(gòu)建風(fēng)險(xiǎn)數(shù)據(jù)庫(kù),有效整合加工食品的企業(yè)、產(chǎn)品及監(jiān)測(cè)數(shù)據(jù)等信息資源,可實(shí)現(xiàn)資源的統(tǒng)籌管理和風(fēng)險(xiǎn)預(yù)警分析。
1 加工食品風(fēng)險(xiǎn)數(shù)據(jù)庫(kù)組成部分
數(shù)據(jù)庫(kù)的加工食品風(fēng)險(xiǎn)數(shù)據(jù)庫(kù)的構(gòu)建主要包括信息管理、預(yù)警分析、系統(tǒng)管理三大部分,通過(guò)各模塊功能作用有效實(shí)現(xiàn)數(shù)據(jù)錄入或?qū)搿⒉樵?xún)統(tǒng)計(jì)、數(shù)據(jù)分析及研判功能,滿足日常食品監(jiān)管工作中不同目的的查詢(xún)、統(tǒng)計(jì)、分析需求。①信息管理部分包括對(duì)企業(yè)信息、產(chǎn)品信息、檢測(cè)數(shù)據(jù)信息的錄入管理、綜合查詢(xún)兩個(gè)模塊,這兩個(gè)模塊作為操作性部分,實(shí)現(xiàn)對(duì)企業(yè)信息、產(chǎn)品信息、食品檢測(cè)數(shù)據(jù)的錄入、統(tǒng)計(jì)和管理。②預(yù)警分析部分包括數(shù)據(jù)篩查、統(tǒng)計(jì)分析、專(zhuān)家研判3個(gè)模塊。這三個(gè)模塊作為系統(tǒng)分析處理生成部分。③系統(tǒng)管理部分包括組織機(jī)構(gòu)信息、用戶(hù)權(quán)限管理等2個(gè)模塊。這兩個(gè)模塊作為數(shù)據(jù)系統(tǒng)的輔助部分,實(shí)現(xiàn)對(duì)組織機(jī)構(gòu)和用戶(hù)的管理。
2 加工食品數(shù)據(jù)庫(kù)設(shè)計(jì)思路
2.1 信息資源庫(kù)的建立 借鑒識(shí)別安全風(fēng)險(xiǎn)的整體風(fēng)險(xiǎn)分析方法,考慮與某一加工食品相關(guān)的各種因素,針對(duì)企業(yè)、產(chǎn)品、檢測(cè)數(shù)據(jù)建立三大信息源庫(kù),作為數(shù)據(jù)庫(kù)的基礎(chǔ)資源儲(chǔ)備。建立某一區(qū)域食品企業(yè)信息源庫(kù),內(nèi)容包括:企業(yè)名稱(chēng)、生產(chǎn)許可證號(hào)、企業(yè)所在地、生產(chǎn)地址、聯(lián)系方式。建立不同種類(lèi)產(chǎn)品信息源庫(kù),內(nèi)容包括:QS產(chǎn)品類(lèi)別、生產(chǎn)工藝及關(guān)鍵控制點(diǎn)。建立檢測(cè)數(shù)據(jù)源庫(kù),內(nèi)容包括:產(chǎn)品名稱(chēng)、生產(chǎn)日期、產(chǎn)品包裝/規(guī)格/型號(hào)、商標(biāo)、執(zhí)行標(biāo)準(zhǔn)號(hào)、監(jiān)測(cè)類(lèi)型、監(jiān)測(cè)時(shí)間、檢測(cè)項(xiàng)目、檢出值、檢測(cè)單位、標(biāo)準(zhǔn)規(guī)定值、檢出限、檢驗(yàn)結(jié)論、檢測(cè)標(biāo)準(zhǔn)、判定標(biāo)準(zhǔn)。
2.2 信息資源庫(kù)的管理 信息資源庫(kù)的管理必須消除源數(shù)據(jù)中的不一致,保證數(shù)據(jù)庫(kù)的高度集成性。將數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù)前,工作人員需從數(shù)據(jù)整理、對(duì)象管理、數(shù)據(jù)關(guān)系等方面建立數(shù)據(jù)維護(hù)。在將數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù)前,需進(jìn)行源數(shù)據(jù)的抽取、清理和轉(zhuǎn)換,要注意數(shù)據(jù)的規(guī)范化,規(guī)范化數(shù)據(jù)才能進(jìn)行有效的數(shù)據(jù)挖掘和數(shù)據(jù)分析。
2.3 分析工具 數(shù)據(jù)分析工具用于幫助用戶(hù)對(duì)源數(shù)據(jù)進(jìn)行獲取和分析,是數(shù)據(jù)系統(tǒng)的重要組成部分,也是數(shù)據(jù)挖掘的基礎(chǔ)。目前應(yīng)用于食品數(shù)據(jù)分析的工具包括聯(lián)機(jī)分析處理(OLAP)和數(shù)據(jù)挖掘(DM)。運(yùn)用OLAP技術(shù),可以進(jìn)行相關(guān)數(shù)據(jù)的交互查詢(xún)、匯總分析、多維分析,趨勢(shì)分析等多項(xiàng)分析功能[1]。DM是從超大型數(shù)據(jù)庫(kù)中發(fā)現(xiàn)并提取隱藏在內(nèi)部的信息的一種新技術(shù),可以通過(guò)發(fā)現(xiàn)變化趨勢(shì),幫助決策者尋找數(shù)據(jù)間潛在的關(guān)聯(lián),開(kāi)展有針對(duì)性的食品風(fēng)險(xiǎn)監(jiān)測(cè),為制定食品安全預(yù)警措施提供科學(xué)依據(jù)。
3 加工食品數(shù)據(jù)分析及預(yù)警系統(tǒng)的建立
3.1 食品危害物標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)的建立 食品危害物標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)包含食品安全預(yù)警關(guān)鍵因子,即涉及食品安全的有關(guān)檢測(cè)項(xiàng)目,本文將預(yù)警關(guān)鍵因子分為三大類(lèi):禁用或禁存類(lèi)食品危害物、限用或限存類(lèi)食品危害物、一般類(lèi)食品危害物。
禁用或禁存類(lèi)食品危害物,即在食品加工中不允許使用或在檢測(cè)中不得檢出的物質(zhì),主要是指非食用物質(zhì)、病源性微生物、禁用的農(nóng)藥殘留與獸藥殘留、生物毒素及化學(xué)污染物,一旦檢出,即為不合格食品。
限用或限存類(lèi)食品危害物,是食品中主要的危害物,即在食品中可以存在的物質(zhì),但是具有最大限量值(MRL)。食品中的含量超過(guò)最大限量值(MRL),可能對(duì)人體健康造成危害。主要有農(nóng)藥殘留、獸藥殘留、食品添加劑、有害元素、化學(xué)污染物等。此類(lèi)危害物在食品中的含量若不在最大限量值范圍內(nèi),即為不合格食品。
一般類(lèi)食品危害物,主要指與食品的質(zhì)量品質(zhì)相關(guān)的指標(biāo),如酸價(jià)、過(guò)氧化值、氨基酸態(tài)氮等。此類(lèi)危害物對(duì)人體的危害性較小,其在食品中的含量若不在標(biāo)準(zhǔn)規(guī)定范圍內(nèi),即為不合格食品。
3.2 食品安全預(yù)警關(guān)鍵因子風(fēng)險(xiǎn)系數(shù)R的確立 通過(guò)建立模型對(duì)某一食品的風(fēng)險(xiǎn)程度進(jìn)行研判,本文參照文獻(xiàn)[2],修正后建立風(fēng)險(xiǎn)系數(shù)R的計(jì)算模型:R=S+a。
①S值的確定:為危害物的敏感因子,可根據(jù)危害物在國(guó)內(nèi)外食品安全上關(guān)注的敏感度和重要性進(jìn)行適時(shí)的調(diào)整。在本次模型建立中,參照國(guó)質(zhì)檢監(jiān)[2010]575號(hào)《關(guān)于印發(fā)的通知》中關(guān)于風(fēng)險(xiǎn)信息分級(jí)規(guī)范確定各檢測(cè)項(xiàng)目的S值。參照文件規(guī)定的風(fēng)險(xiǎn)信息分級(jí)分為一級(jí)風(fēng)險(xiǎn)信息、二級(jí)風(fēng)險(xiǎn)信息、三級(jí)風(fēng)險(xiǎn)信息,并結(jié)合文獻(xiàn)資料對(duì)敏感因子的分類(lèi)依據(jù),S(危害物敏感因子)分別設(shè)為5(社會(huì)敏感度高,或危害特別嚴(yán)重,或影響區(qū)域廣泛,或受到境內(nèi)外廣泛關(guān)注的,如塑化劑、致病菌及毒素),3(對(duì)產(chǎn)品質(zhì)量安全和發(fā)展有一定影響,屬于較為嚴(yán)重的違法添加行為,可能?chē)?yán)重危害公眾健康,如農(nóng)獸藥殘留、非法添加物、化學(xué)及金屬污染物),1(屬于常規(guī)性風(fēng)險(xiǎn)項(xiàng)目,或尚未構(gòu)成對(duì)人體的嚴(yán)重健康危害,但需引起一定關(guān)注,或是已較少使用的物質(zhì),關(guān)注度有所下降,如品質(zhì)指標(biāo)等)。
②a值設(shè)定:在本次模型建立工作中,a暫定為0;在數(shù)據(jù)分析運(yùn)行一定時(shí)間后,可依據(jù)年平均問(wèn)題檢出率情況對(duì)風(fēng)險(xiǎn)系數(shù)R進(jìn)行修正,a為修正值可直接取一定時(shí)間內(nèi)該風(fēng)險(xiǎn)項(xiàng)目的平均問(wèn)題檢出率;若均無(wú)問(wèn)題情況檢出,該危害物的敏感因子以每年1/2遞減。
3.3 數(shù)據(jù)篩查及分析 基于OLAP開(kāi)展食品安全風(fēng)險(xiǎn)分析[3],首先分析食品監(jiān)測(cè)結(jié)果涉及因素:產(chǎn)品、企業(yè)、檢測(cè)機(jī)構(gòu)、監(jiān)管部門(mén),并形成關(guān)系圖,見(jiàn)圖1。采用維度分析方法,以監(jiān)測(cè)產(chǎn)品、監(jiān)測(cè)時(shí)間、監(jiān)測(cè)區(qū)域、監(jiān)測(cè)企業(yè)、檢測(cè)項(xiàng)目為維度進(jìn)行問(wèn)題檢出率統(tǒng)計(jì)分析,見(jiàn)表1。
3.4 專(zhuān)家研判分析
采用德?tīng)柗品ㄔ瓌t,充分發(fā)揮各領(lǐng)域?qū)<业摹爸悄覉F(tuán)”力量,將其在技術(shù)研究、產(chǎn)品研發(fā)、檢測(cè)、生產(chǎn)等方面具有的技術(shù)和經(jīng)驗(yàn)優(yōu)勢(shì)應(yīng)用到食品風(fēng)險(xiǎn)研判分析中。專(zhuān)家們?cè)诩庸な称凤L(fēng)險(xiǎn)數(shù)據(jù)庫(kù)中,綜合考慮產(chǎn)品檢測(cè)數(shù)據(jù)分析結(jié)果、風(fēng)險(xiǎn)系數(shù)R值、生產(chǎn)工藝等諸多因素,對(duì)食品的風(fēng)險(xiǎn)等級(jí)進(jìn)行評(píng)價(jià)。
4 小結(jié)
本文初步提出了加工食品風(fēng)險(xiǎn)數(shù)據(jù)庫(kù)的構(gòu)建思路,并就數(shù)據(jù)庫(kù)的組成部分、設(shè)計(jì)思路、數(shù)據(jù)分析及預(yù)警系統(tǒng)三個(gè)部分進(jìn)行闡述。建立加工食品風(fēng)險(xiǎn)數(shù)據(jù)庫(kù)系統(tǒng),是一項(xiàng)涉及食品工程、風(fēng)險(xiǎn)分析、數(shù)據(jù)庫(kù)信息管理系統(tǒng)、計(jì)算機(jī)網(wǎng)絡(luò)等多專(zhuān)業(yè)領(lǐng)域的綜合性研究課題。目前,該系統(tǒng)的研究還處于不斷完善和發(fā)展階段,未來(lái)在數(shù)據(jù)庫(kù)的共享、數(shù)據(jù)源的多維綜合預(yù)測(cè)分析方面還需進(jìn)行更加深入的研究,以開(kāi)拓系統(tǒng)的應(yīng)用領(lǐng)域,從而實(shí)現(xiàn)系統(tǒng)的有效推廣。
參考文獻(xiàn):
[1]許建軍,高勝普.食品安全預(yù)警數(shù)據(jù)分析體系構(gòu)建研究[J].中國(guó)食品學(xué)報(bào),2011,11(2):169-172.
大數(shù)據(jù)一詞是由英文單詞“Big Data”翻譯而來(lái)。大數(shù)據(jù)時(shí)代的到來(lái)既是信息技術(shù)領(lǐng)域的一場(chǎng)持久而深刻的變革,更在全世界范圍內(nèi)開(kāi)啟了思想的劇變,從而成為引領(lǐng)社會(huì)實(shí)現(xiàn)新興技術(shù)不斷向前發(fā)展與變革的利器,深刻地影響著人們的生產(chǎn)與生活。“當(dāng)今社會(huì)已經(jīng)邁入了大數(shù)據(jù)時(shí)代,大數(shù)據(jù)已經(jīng)滲透到當(dāng)今所有的行業(yè)和業(yè)務(wù)領(lǐng)域,成為重要的生產(chǎn)因素。”[1]在這個(gè)宏觀背景下,大數(shù)據(jù)的社會(huì)價(jià)值和科學(xué)價(jià)值的不斷得到彰顯與利用,給高校的教育與管理也帶來(lái)了新的機(jī)遇。教育領(lǐng)域的大數(shù)據(jù)運(yùn)用有其自身的特點(diǎn),在高校的實(shí)現(xiàn)應(yīng)當(dāng)側(cè)重從學(xué)生的學(xué)習(xí)過(guò)程、日常生活的微觀表現(xiàn)進(jìn)行測(cè)量,開(kāi)展精準(zhǔn)的“學(xué)生畫(huà)像”,有效分析與預(yù)測(cè)研究對(duì)象的學(xué)業(yè)完成進(jìn)度與趨勢(shì),從而為學(xué)校教育教學(xué)質(zhì)量提升和學(xué)生教育管理服務(wù)提供保障。
目前,國(guó)內(nèi)不少高校通過(guò)利用大數(shù)據(jù)技術(shù),深度挖掘在校大學(xué)生的行為數(shù)據(jù),但每個(gè)學(xué)校都因有自身不同的辦學(xué)特色和現(xiàn)實(shí)情況,如何結(jié)合學(xué)校信息化校園建設(shè),開(kāi)展針對(duì)在校學(xué)生的行為數(shù)據(jù)分析與研究,幫助教學(xué)、學(xué)工等相關(guān)部門(mén)提供可視化圖表的方式呈現(xiàn)數(shù)據(jù)分析結(jié)果和學(xué)業(yè)預(yù)警等相關(guān)意見(jiàn),從而為學(xué)校教育與管理服務(wù),提供決策建議與意見(jiàn),具有強(qiáng)烈的現(xiàn)實(shí)意義和廣闊的應(yīng)用前景。
2 一卡通數(shù)據(jù)系統(tǒng)分析云平臺(tái)
本文以圍繞學(xué)院校園一卡通系統(tǒng)建設(shè),開(kāi)展智慧校園和智慧管理研究,通過(guò)對(duì)學(xué)生教室考勤、宿舍門(mén)禁,校園消費(fèi)、上網(wǎng)記錄、獎(jiǎng)勵(lì)資助及購(gòu)水購(gòu)電等信息,關(guān)聯(lián)學(xué)生教務(wù)、圖書(shū)及其他物聯(lián)網(wǎng)等應(yīng)用系統(tǒng)后臺(tái)數(shù)據(jù)庫(kù),結(jié)合系統(tǒng)基礎(chǔ)數(shù)據(jù)庫(kù)的表結(jié)構(gòu)特征和關(guān)鍵字段,設(shè)置相應(yīng)的邏輯關(guān)系和判斷條件,通過(guò)校園一卡通大數(shù)據(jù)分析云平臺(tái),從學(xué)生學(xué)業(yè)警示預(yù)警、個(gè)性化學(xué)習(xí)、上網(wǎng)行為、消費(fèi)行為、獎(jiǎng)懲資助和就業(yè)幫扶等六個(gè)維度,使用聚類(lèi)、關(guān)系規(guī)則和序列模式挖掘等技術(shù)指標(biāo)與手段,開(kāi)展深度數(shù)據(jù)分析與數(shù)據(jù)挖掘,形成可視化圖表的方式呈現(xiàn)出數(shù)據(jù)分析的描述結(jié)果,給出相關(guān)的建議結(jié)論或預(yù)警意見(jiàn),供班導(dǎo)師、輔導(dǎo)員、相關(guān)職能部門(mén)查看與使用,從而為學(xué)校教育、管理與服務(wù)提供決策支持和智慧服務(wù)。[2]
3 學(xué)生行為大數(shù)據(jù)分析
3.1 學(xué)業(yè)警示預(yù)警分析
基于一卡通數(shù)據(jù)系統(tǒng)分析云平臺(tái)關(guān)聯(lián)學(xué)生教務(wù)系統(tǒng),系統(tǒng)管理員根據(jù)權(quán)限可以實(shí)現(xiàn)實(shí)時(shí)查看學(xué)生個(gè)人學(xué)業(yè)完成及積欠課程的情況,各班導(dǎo)師或輔導(dǎo)員可以統(tǒng)計(jì)與分析相關(guān)專(zhuān)業(yè)學(xué)生的學(xué)業(yè)完成度統(tǒng)計(jì)數(shù)據(jù),結(jié)合學(xué)生的課堂考勤、心理測(cè)評(píng)、圖書(shū)借閱、重修課程、上網(wǎng)數(shù)據(jù)等對(duì)學(xué)生的失聯(lián)、留級(jí)及預(yù)判延長(zhǎng)學(xué)制、不能畢業(yè)等情況予以預(yù)警。根據(jù)動(dòng)態(tài)分析數(shù)據(jù),班導(dǎo)師和輔導(dǎo)員可以及時(shí)與學(xué)生本人、任課教師和學(xué)生家長(zhǎng)取得聯(lián)系,幫助學(xué)生分析和查找問(wèn)題,指明努力方向。
3.2 個(gè)性化學(xué)習(xí)分析
基于一卡通數(shù)據(jù)系統(tǒng)分析云平臺(tái)結(jié)合學(xué)生選修課程、個(gè)人興趣與綜合評(píng)估,分析學(xué)生個(gè)人現(xiàn)狀及特點(diǎn),通過(guò)大數(shù)據(jù)分析,給予相關(guān)培養(yǎng)建議,從而圍繞校園數(shù)據(jù)資源,指導(dǎo)學(xué)校相關(guān)職能部門(mén)定期向?qū)W生推送個(gè)性化的網(wǎng)絡(luò)教學(xué)資源、網(wǎng)絡(luò)書(shū)籍與紙質(zhì)圖書(shū)資源、兼職與就業(yè)招聘信息等,提高課外閱讀量和專(zhuān)業(yè)學(xué)習(xí)水平,從而實(shí)現(xiàn)個(gè)性化教學(xué)指導(dǎo)與幫助。
3.3 上網(wǎng)行為分析
基于一卡通數(shù)據(jù)系統(tǒng)分析云平臺(tái)對(duì)學(xué)生的上網(wǎng)行為統(tǒng)計(jì)分析,通過(guò)對(duì)學(xué)生上網(wǎng)時(shí)間、上網(wǎng)地點(diǎn)、上網(wǎng)時(shí)長(zhǎng)、上網(wǎng)內(nèi)容、流量下載等數(shù)據(jù)建模,挖掘與分析學(xué)生上網(wǎng)行為習(xí)慣。通過(guò)統(tǒng)計(jì)分析日均上網(wǎng)或游戲時(shí)長(zhǎng)較長(zhǎng)的學(xué)生情況,結(jié)合學(xué)生學(xué)業(yè)完成度等,定期開(kāi)展預(yù)警警示工作,班導(dǎo)師和各學(xué)院學(xué)團(tuán)也可以有針對(duì)性的開(kāi)展學(xué)風(fēng)檢查、建設(shè)與整頓工作,從而更好地培育優(yōu)良的校風(fēng)、班風(fēng)與學(xué)風(fēng)。
3.4 消費(fèi)行為分析
基于一卡通數(shù)據(jù)系統(tǒng)分析云平臺(tái)對(duì)校園的消費(fèi)數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)和診斷群體消費(fèi)的偏好以及潛在的問(wèn)題,有效分析與預(yù)測(cè)未來(lái)消費(fèi)新趨勢(shì),加強(qiáng)后勤服務(wù)場(chǎng)所的管理與引導(dǎo)。學(xué)校可以針對(duì)貧困生等不同身份特征人群開(kāi)展分類(lèi)型的數(shù)據(jù)分析,通過(guò)消費(fèi)數(shù)據(jù)的挖掘,在貧困生認(rèn)定和精準(zhǔn)幫扶等方面提供可靠的數(shù)據(jù)支持,從而有效地為學(xué)工、教務(wù)后勤等部門(mén)的管理與服務(wù)提供信息數(shù)據(jù)支持。
3.5 獎(jiǎng)懲資助行為分析
基于一卡通數(shù)據(jù)系統(tǒng)分析云平臺(tái)對(duì)學(xué)生在校期間的獎(jiǎng)懲資助行為分析,完善學(xué)生獎(jiǎng)懲助困的動(dòng)態(tài)分析與監(jiān)控。通過(guò)及時(shí)完善相關(guān)信息,便于后期的數(shù)據(jù)統(tǒng)計(jì)及篩查工作,同時(shí)有利于完善貧困生的資助體系,開(kāi)展貧困生精準(zhǔn)幫扶工作,引導(dǎo)與管理好校園義工和勤工儉學(xué)崗位。通過(guò)全面梳理學(xué)生獎(jiǎng)勵(lì)及資助數(shù)據(jù),能有效加強(qiáng)對(duì)受處分學(xué)生的動(dòng)態(tài)的監(jiān)控,及時(shí)受理學(xué)生處分的撤銷(xiāo)與評(píng)議,提高受處分學(xué)生主動(dòng)承擔(dān)社區(qū)及義工服務(wù)的意識(shí)。
3.6 就業(yè)行為分析
基于一卡通數(shù)據(jù)系統(tǒng)分析云平臺(tái)對(duì)全校或者部分專(zhuān)業(yè)提供市場(chǎng)就業(yè)細(xì)分,結(jié)合學(xué)生生源地區(qū)、專(zhuān)業(yè)特長(zhǎng)、性格特征、個(gè)人愛(ài)好、學(xué)業(yè)完成度、能力模型及求職意向,設(shè)計(jì)就業(yè)工作模型,匹配相關(guān)用人單位及招聘信息,通過(guò)大數(shù)據(jù)實(shí)施雙向精準(zhǔn)推薦,從而更好地服務(wù)學(xué)生和用人單位。針對(duì)就業(yè)市場(chǎng)的大數(shù)據(jù)分析和結(jié)論,還可以為學(xué)校現(xiàn)有專(zhuān)業(yè)建設(shè)及人才培養(yǎng)方案的重構(gòu),提供數(shù)據(jù)支撐,從而進(jìn)一步服務(wù)教學(xué)與管理工作。
4 數(shù)據(jù)分析結(jié)果評(píng)價(jià)
基于一卡通數(shù)據(jù)系統(tǒng)分析云平臺(tái)的運(yùn)用,針對(duì)應(yīng)用系統(tǒng)后臺(tái)數(shù)據(jù)庫(kù)開(kāi)展數(shù)據(jù)分析,通過(guò)大數(shù)據(jù)挖掘方法,開(kāi)展系統(tǒng)總體構(gòu)建設(shè)計(jì),利用從原數(shù)據(jù)層到數(shù)據(jù)處理層,再到數(shù)據(jù)庫(kù)倉(cāng)層,最終到終端用戶(hù)層的框架模型,維度分析因果和映射關(guān)系,輔助以靈活可視化的查詢(xún)界面、圖形與圖表等形式,呈現(xiàn)出研究對(duì)象的學(xué)習(xí)、上網(wǎng)、消費(fèi)、獎(jiǎng)懲、資助、閱讀、就業(yè)等日常行為特征,分析其行為特征與學(xué)校智慧化校園管理與監(jiān)督之間的關(guān)系,為學(xué)校的教育、教學(xué)與管理工作提供決策建議和意見(jiàn)。
4.1 有助于學(xué)校精細(xì)化管理
通過(guò)平臺(tái),理清管理職責(zé)與權(quán)限,加強(qiáng)工作的細(xì)化與內(nèi)化,逐步實(shí)現(xiàn)學(xué)生的精準(zhǔn)化管理,既提高了工作的效率,又提升了工作的水平。通過(guò)信息系統(tǒng),改變?cè)邢鄬?duì)粗放的管理模式,量化分析學(xué)生的學(xué)習(xí)行為和日常表現(xiàn),洞察學(xué)習(xí)規(guī)律,促進(jìn)管理工作橫向到底、縱向到邊。[3]
4.2 有助于學(xué)校精準(zhǔn)化服務(wù)
通過(guò)平臺(tái),運(yùn)用數(shù)據(jù)監(jiān)測(cè),分析與定位重點(diǎn)幫扶的班級(jí)及學(xué)生,積極關(guān)注情況特別學(xué)生群體,幫助學(xué)業(yè)預(yù)警、心理異常、經(jīng)濟(jì)特困、就業(yè)困難、違紀(jì)處分等類(lèi)型的學(xué)生分析困難與問(wèn)題,找到走出困境的途徑與方法,從而將幫扶工作做到精準(zhǔn)到位,幫助每個(gè)學(xué)生充分發(fā)展。
4.3 有助于學(xué)校精心化育人
通過(guò)平臺(tái),透視教育數(shù)據(jù),優(yōu)化管理與評(píng)價(jià)機(jī)制,建立全方位育人體系,為學(xué)校及學(xué)生個(gè)性化教育和教學(xué)干預(yù)行為進(jìn)行準(zhǔn)確預(yù)測(cè)與服務(wù),加強(qiáng)部門(mén)間的聯(lián)動(dòng)與溝通,從而推進(jìn)學(xué)校決策的系統(tǒng)化與科學(xué)化,打造全員、全過(guò)程的育人格局,打造精心育人工程。
Excel單元是信息處理的重要組成部分,內(nèi)容具有一定的衍生性,在信息科技課程體系中有著承前啟后的作用。筆者以Excel單元學(xué)習(xí)為例,從概念的深度理解、學(xué)科思維的培養(yǎng)、知識(shí)的遷移應(yīng)用三個(gè)方面展開(kāi)教學(xué)實(shí)踐研究。
概念深度理解:從技術(shù)操作到技術(shù)原理
“知道不等于理解”“會(huì)操作不等于理解”,學(xué)生雖然依靠模仿和訓(xùn)練掌握了Excel的操作技能,但由于對(duì)概念沒(méi)有深度理解,往往在后期遷移和應(yīng)用時(shí)束手無(wú)措。Excel單元中的重要概念,教師可以結(jié)合生活情境,調(diào)動(dòng)、激活學(xué)生的已有知識(shí)經(jīng)驗(yàn),使他們對(duì)學(xué)習(xí)內(nèi)容加以解釋?zhuān)匦陆?gòu)知識(shí)的意義,促進(jìn)知識(shí)從“表層符號(hào)學(xué)習(xí)”進(jìn)入“知識(shí)內(nèi)在的邏輯形式”,使學(xué)生以融會(huì)貫通的方式對(duì)學(xué)習(xí)內(nèi)容進(jìn)行組織,建構(gòu)他們的知識(shí)結(jié)構(gòu)。
例1:在《數(shù)據(jù)的分類(lèi)匯總》教學(xué)中往往存在這樣的現(xiàn)象:學(xué)生進(jìn)行分類(lèi)匯總時(shí)經(jīng)常忘記或者不能準(zhǔn)確對(duì)“分類(lèi)字段”進(jìn)行排序分類(lèi),著重于技術(shù)操作,卻無(wú)法根據(jù)實(shí)際需求運(yùn)用技術(shù)解決問(wèn)題。可見(jiàn)學(xué)生對(duì)“分類(lèi)匯總”這個(gè)概念的技術(shù)原理和實(shí)際應(yīng)用意義并沒(méi)有理解,僅是模仿和套用教師的操作,并通過(guò)大量的操作訓(xùn)練實(shí)現(xiàn)知識(shí)與技能的學(xué)習(xí)。
【分析】Excel中分類(lèi)匯總的概念比較抽象,如何深入理解“分類(lèi)”“匯總”的概念,并將它們聯(lián)系起來(lái)尤為重要。從技術(shù)思想方面,“分類(lèi)匯總”分為兩步,第一步是利用數(shù)據(jù)排序功能進(jìn)行數(shù)據(jù)分類(lèi),使數(shù)據(jù)條理化和明確化。第二步是利用Excel數(shù)據(jù)處理中的函數(shù)功能,完成數(shù)據(jù)匯總。“分類(lèi)匯總”概念的深度學(xué)習(xí)可以結(jié)合生活中的事例,通過(guò)情境類(lèi)比和多元化學(xué)習(xí)的方法幫助學(xué)生理解技術(shù)操作背后的技術(shù)原理。
【實(shí)踐】教學(xué)設(shè)計(jì)――《數(shù)據(jù)的分類(lèi)匯總》。
1.創(chuàng)設(shè)生活化情境,將抽象的概念形象化
問(wèn)題情境是啟學(xué)引思、導(dǎo)學(xué)引教的有效載體。筆者結(jié)合生活中的情境,在導(dǎo)入環(huán)節(jié)中向?qū)W生展示某快遞公司某天即將發(fā)往松江各地區(qū)的快遞,并告知此快遞公司共有松江新城、松江老城、松江九亭、松江佘山、松江泗涇五個(gè)網(wǎng)點(diǎn)(如下頁(yè)圖1),以問(wèn)題為引導(dǎo)促進(jìn)學(xué)生對(duì)概念的深度理解。
師:面對(duì)堆積如山的快遞物品,工作人員要做什么?
生:分類(lèi)。
師:分類(lèi)完成后,快遞公司需要做統(tǒng)計(jì),明確發(fā)往各區(qū)域的快遞物品的數(shù)目是多少,這時(shí)候要怎么辦?
生:求和(求和是匯總的方式之一)。
上述情境創(chuàng)設(shè)和設(shè)計(jì)問(wèn)題看似簡(jiǎn)單,卻激發(fā)了學(xué)生的生活經(jīng)驗(yàn)和思考,實(shí)現(xiàn)了對(duì)“分類(lèi)匯總”中“分類(lèi)”和“匯總”的真實(shí)理解。
2.運(yùn)用技術(shù)開(kāi)展多元化學(xué)習(xí),實(shí)現(xiàn)可持續(xù)性理解
在《數(shù)據(jù)的分類(lèi)匯總》一課教學(xué)中,筆者采用了微視頻技術(shù),以便學(xué)生能有選擇地學(xué)習(xí),進(jìn)而促進(jìn)他們個(gè)性化的互助學(xué)習(xí)。整節(jié)課的教學(xué)流程如下:
環(huán)節(jié)一:教師通過(guò)上述情境類(lèi)比的方式講解分類(lèi)匯總的定義和方法,利用Excel分類(lèi)匯總的方式求出各地區(qū)快遞物品的數(shù)量是多少。
環(huán)節(jié)二:自主學(xué)習(xí)。學(xué)生利用微視頻進(jìn)行自主學(xué)習(xí)。
環(huán)節(jié)三:互助。由于每位學(xué)生的信息技術(shù)基礎(chǔ)和操作熟練度不一樣,導(dǎo)致他們的完成時(shí)間不同,這時(shí)候可以讓優(yōu)生當(dāng)小老師,學(xué)困生在同伴的幫助下及時(shí)跟上學(xué)習(xí)進(jìn)度。
環(huán)節(jié)四:整體反饋。反饋共性問(wèn)題,師生共同總結(jié)鞏固新知識(shí)。
學(xué)生通過(guò)自學(xué)、互助、交流等進(jìn)行深度學(xué)習(xí),教師也有了更多的時(shí)間關(guān)注每位學(xué)生的動(dòng)態(tài),及時(shí)發(fā)現(xiàn)并解決問(wèn)題,幫助他們深入理解“分類(lèi)字段”“匯總方式”“匯總項(xiàng)”等概念。
挖掘思維深度,培養(yǎng)學(xué)科思想
知識(shí)、能力與思想方法是學(xué)科學(xué)習(xí)的三大要素。學(xué)科知識(shí)是魚(yú),學(xué)科思想是漁,真正對(duì)學(xué)生以后的學(xué)習(xí)、生活和工作長(zhǎng)期起作用并使其終身受益的是學(xué)科思想。Excel單元的深度學(xué)習(xí)是要把握學(xué)科知識(shí)的本質(zhì)聯(lián)系,特別是注重學(xué)科思想的培養(yǎng),幫助學(xué)生形成解決相似問(wèn)題的思維方法。
例2:在《Excel數(shù)據(jù)計(jì)算》的教學(xué)中,教師經(jīng)常會(huì)遇到這樣的問(wèn)題:使用單元格地址進(jìn)行公式編輯,卻總有學(xué)生直接使用數(shù)值計(jì)算,混淆了不同情況下填充柄的使用功能。尤其是在學(xué)業(yè)考試數(shù)據(jù)計(jì)算量不大的情況下,只要結(jié)果正確,這個(gè)問(wèn)題往往就被忽略了。
【分析】在Excel數(shù)據(jù)計(jì)算中,學(xué)生要掌握填充柄和相對(duì)引用的技術(shù)方法,其中“引用”“相對(duì)地址”的概念屬于新知識(shí),對(duì)學(xué)生而言難度較大。其實(shí)“引用”這種高效解決問(wèn)題的思想在初中信息科技課程不同的章節(jié)中屢見(jiàn)不鮮,但是學(xué)生卻總是會(huì)出錯(cuò)。究其原因,主要是學(xué)生對(duì)其沒(méi)有真正地理解,因此必須對(duì)這類(lèi)問(wèn)題進(jìn)行深度挖掘、透徹分析。
【實(shí)踐】教學(xué)設(shè)計(jì)――《Excel數(shù)據(jù)計(jì)算》。
1.以學(xué)科思想為主線,揭示技術(shù)規(guī)律
“引用”不是對(duì)對(duì)象本身的操作,而是對(duì)存儲(chǔ)對(duì)象的引用。學(xué)生理解和類(lèi)比幾種“引用”思想的運(yùn)用,深度挖掘“引用”的技術(shù)思維,能夠培養(yǎng)學(xué)科思想,實(shí)現(xiàn)信息的高效管理。以下筆者將結(jié)合具體教學(xué)內(nèi)容進(jìn)行闡述。
(1)“引用”思想在信息搜索方面的表現(xiàn):優(yōu)化存儲(chǔ),提高閱讀效率。在《信息搜索》的教學(xué)設(shè)計(jì)中,教師提出相關(guān)問(wèn)題,請(qǐng)學(xué)生觀察搜索引擎中的搜索結(jié)果。學(xué)生通過(guò)觀察和討論發(fā)現(xiàn)搜索結(jié)果的呈現(xiàn)方式是相關(guān)的地址鏈接,并沒(méi)有加載具體的內(nèi)容,通過(guò)引用“超鏈接”這種常見(jiàn)的技術(shù)呈現(xiàn)出來(lái),目的是快速提供多樣化的內(nèi)容供搜索者進(jìn)一步篩選。
(2)“引用”思想在信息管理方面的表現(xiàn):使用簡(jiǎn)單,提高打開(kāi)效率。計(jì)算機(jī)中不僅可以存儲(chǔ)具體內(nèi)容,還可以存儲(chǔ)內(nèi)容存放的地址。在《文件與文件夾的管理》教學(xué)中,筆者設(shè)計(jì)了討論“‘快捷方式’高效管理程序的意義”的活動(dòng),加深了學(xué)生對(duì)快捷圖標(biāo)也即“引用”思想體現(xiàn)的認(rèn)識(shí)。
(3)“引用”思想在單元格地址引用中的表現(xiàn):靈活智能,提高了使用效率。在《Excel數(shù)據(jù)計(jì)算》教學(xué)中,學(xué)生通過(guò)遷移和類(lèi)比的方法,可以很好地理解“相對(duì)引用”的思想和意義,即單元格地址引用實(shí)際上是引用了單元格內(nèi)容。“引用”方法是高效解決問(wèn)題的思維方式,是學(xué)科思想的一種體現(xiàn)。
2.設(shè)置技術(shù)過(guò)渡區(qū),深度理解學(xué)科思想
為了更好地理解“引用”思想在Excel單元的應(yīng)用,在《家庭用水情況數(shù)據(jù)統(tǒng)計(jì)》教學(xué)中(上海市居民用水每立方米自來(lái)水價(jià)格為1.63元,排水費(fèi)為1.30元,水費(fèi)=自來(lái)水費(fèi)+排水費(fèi)×90%),筆者做了如下教學(xué)設(shè)計(jì)。
活動(dòng)一:在C3單元格中輸入公式,計(jì)算該用戶(hù)本月家庭用水情況(B列表示本月用水量)。
在計(jì)算過(guò)程中,筆者發(fā)現(xiàn)有兩種不同的計(jì)算方法,有的學(xué)生輸入的是數(shù)值,有的學(xué)生輸入了引用單元格地址,如下所示:
①在C3單元格中輸入公式:=1.63*18+1.30*18*0.9(B3中的值為18)。
②在C3單元格中輸入公式:=1.63*B3+1.30*B3*0.9。
師:因B3單元格中的數(shù)據(jù)錄入有誤,現(xiàn)在重新輸入數(shù)據(jù),觀察并討論上述兩種方法C3單元格中的數(shù)據(jù)有哪些變化?為什么?
生:第一種方法C3單元格不變,第二種方法C3單元格跟隨B3單元格值的變化而變化。
師:當(dāng)在公式中引用某單元格數(shù)據(jù)時(shí),你認(rèn)為應(yīng)該引用數(shù)值還是引用單元格的地址?為什么?
生:引用單元格地址,便于數(shù)據(jù)的后續(xù)管理。
活動(dòng)二:設(shè)置技術(shù)過(guò)渡環(huán)節(jié),使用相對(duì)引用的方法,計(jì)算出數(shù)據(jù)表內(nèi)C3單元格后兩個(gè)用戶(hù)的水費(fèi)。
在C4單元格中輸入公式:=1.63*B4+1.30*B4*0.9。
在C5單元格中輸入公式:=1.63*B5+1.30*B5*0.9。
設(shè)計(jì)意圖:鞏固地址和引用的概念,并讓學(xué)生意識(shí)到重復(fù)輸入公式很低效、繁瑣,思考是否有更加便捷的方法,為后面“填充柄”和“相對(duì)地址”學(xué)習(xí)做鋪墊。
活動(dòng)三:以上三個(gè)用戶(hù)水費(fèi)計(jì)算公式有什么不同?變化的區(qū)域有什么規(guī)律?能否推斷出Cn單元格中的公式是什么?
推測(cè)得出Cn單元格中的公式:=1.63*Cn+1.30*Cn*0.9。
設(shè)計(jì)意圖:借助層次遞進(jìn)的問(wèn)題,引導(dǎo)學(xué)生從現(xiàn)象入手探究規(guī)律。
活動(dòng)四:學(xué)習(xí)新技術(shù)――填充柄。
學(xué)生通過(guò)上述實(shí)驗(yàn)推測(cè)的方法,在了解技術(shù)原理的基礎(chǔ)上學(xué)習(xí)使用填充柄,鞏固了用“引用”來(lái)高效解決問(wèn)題的學(xué)科思想,將學(xué)習(xí)從淺表的知識(shí)學(xué)習(xí)和技巧訓(xùn)練提升到深層思想方法的學(xué)習(xí)。
從理解到實(shí)踐:實(shí)現(xiàn)知識(shí)的遷移應(yīng)用
葉圣陶先生曾說(shuō)過(guò),“教是為了不教”。這句話既道出了教學(xué)的目的,又道出了學(xué)生掌握知識(shí)和方法后,應(yīng)能遷移和應(yīng)用原有知識(shí),用以分析問(wèn)題和解決問(wèn)題。Excel單元深度學(xué)習(xí)的一個(gè)重要特點(diǎn)就是實(shí)現(xiàn)數(shù)據(jù)統(tǒng)計(jì)知識(shí)與技能的靈活應(yīng)用。
例3:在初中信息科技課堂上,學(xué)生跟隨教師的講解,不斷地演練著Excel中數(shù)據(jù)統(tǒng)計(jì)等基本操作。教師講學(xué)生練,經(jīng)歷了大量的訓(xùn)練,但學(xué)生卻不知道計(jì)算這些數(shù)據(jù)有什么實(shí)際作用,無(wú)法很好地讀數(shù)據(jù)、找不到規(guī)律或無(wú)法發(fā)現(xiàn)有用信息的現(xiàn)象層出不窮。任務(wù)中缺乏問(wèn)題產(chǎn)生的土壤,容易導(dǎo)致學(xué)生的知識(shí)只是在某種情境下應(yīng)用,而不能學(xué)以致用。
【分析】例3呈現(xiàn)的是初中信息科技課程教學(xué)現(xiàn)場(chǎng)經(jīng)常出現(xiàn)的現(xiàn)象。機(jī)械技能僵化訓(xùn)練看似方便學(xué)生操作,但課堂變得機(jī)械、枯燥、乏味,學(xué)生不知道為什么學(xué),簡(jiǎn)單的技能訓(xùn)練并沒(méi)有提升學(xué)生綜合應(yīng)用技術(shù)的能力。信息科技學(xué)習(xí)的本質(zhì)是如何利用它分析和解決問(wèn)題,為了把理論教學(xué)與實(shí)踐活動(dòng)有機(jī)地結(jié)合起來(lái),項(xiàng)目活動(dòng)成為達(dá)成信息科技課程目標(biāo)的有效途徑。
1.挖掘數(shù)據(jù)規(guī)律,深度理解技術(shù)意義
【實(shí)踐】教學(xué)設(shè)計(jì)――《慧眼讀數(shù)據(jù)――數(shù)據(jù)分析》。
在大數(shù)據(jù)時(shí)代,對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和深入分析,發(fā)現(xiàn)其背后蘊(yùn)含的規(guī)律,并加以開(kāi)發(fā)利用是一項(xiàng)非常有價(jià)值的工作,這也是學(xué)習(xí)Excel的意義所在。數(shù)據(jù)統(tǒng)計(jì)是一種技術(shù),也是解決問(wèn)題的方法。理解數(shù)據(jù)統(tǒng)計(jì)的意義,是學(xué)生實(shí)現(xiàn)深度學(xué)習(xí)的動(dòng)力之一。為提升學(xué)生“讀”數(shù)據(jù)的意識(shí)和能力,總結(jié)分析方法,并對(duì)實(shí)際生活產(chǎn)生指導(dǎo)作用,筆者本節(jié)課的教學(xué)設(shè)計(jì)如下:
環(huán)節(jié)一:故事激趣,概念導(dǎo)入。引入“數(shù)據(jù)挖掘技術(shù)在沃爾瑪?shù)倪\(yùn)用”的趣味故事,學(xué)生在故事中體會(huì)數(shù)據(jù)分析是有用的,激發(fā)學(xué)習(xí)興趣。
環(huán)節(jié)二:數(shù)據(jù)分析。學(xué)生觀看視頻《足球場(chǎng)上的神秘紙條》,思考數(shù)據(jù)分析的意義。說(shuō)一說(shuō),數(shù)據(jù)分析在家庭生活中的應(yīng)用。
環(huán)節(jié)三:熱身活動(dòng)。筆者出示某旅游景點(diǎn)歷年接待游客的情況:2010年迎接游客約100萬(wàn)人次,2011年迎接游客約200萬(wàn)人次,2012年迎接游客約300萬(wàn)人次,2013年迎接游客約350萬(wàn)人次,2014年迎接游客約380萬(wàn)人次,2015年迎接游客約400萬(wàn)人次。
師:請(qǐng)同學(xué)們預(yù)測(cè)一下2016年的游覽人數(shù)是多少?得到的數(shù)據(jù)對(duì)人們有什么幫助?
生:可能是410萬(wàn)人。經(jīng)過(guò)數(shù)據(jù)分析,作為游客,可以判斷景區(qū)的游覽舒適度;作為景區(qū)的工作人員,可以做好迎接游客的準(zhǔn)備。
以問(wèn)題為引導(dǎo)培養(yǎng)學(xué)生“讀”數(shù)據(jù)的能力,體會(huì)數(shù)據(jù)分析的過(guò)程,嘗試總結(jié)數(shù)據(jù)分析的方法(如圖2):
①整理數(shù)據(jù)――從各種數(shù)據(jù)源中選取和集成用于數(shù)據(jù)分析的數(shù)據(jù);
②分析數(shù)據(jù)――用某種技術(shù)方法將數(shù)據(jù)中的規(guī)律找出來(lái);
③推測(cè)結(jié)論――分析原因,給出建議或推測(cè)。
環(huán)節(jié)四:任務(wù)驅(qū)動(dòng),步步為營(yíng)。筆者提供網(wǎng)購(gòu)書(shū)籍的真實(shí)情境,根據(jù)各大電商的銷(xiāo)售數(shù)據(jù)選購(gòu)本月熱門(mén)圖書(shū),并整理和分析歷年的書(shū)籍銷(xiāo)售數(shù)據(jù),用數(shù)據(jù)說(shuō)話,結(jié)合物流等綜合因素,驗(yàn)證“雙十一”購(gòu)買(mǎi)書(shū)籍是否劃算。
教學(xué)以數(shù)據(jù)分析為切入點(diǎn),學(xué)生鞏固了電子表格中數(shù)據(jù)統(tǒng)計(jì)的方法,學(xué)習(xí)從熟練操作技能逐漸轉(zhuǎn)向?qū)?shù)據(jù)的整理和分析,理解技術(shù)的意義。
2.開(kāi)展項(xiàng)目活動(dòng),提升綜合應(yīng)用能力
【實(shí)踐】項(xiàng)目活動(dòng)――霧霾知多少。
美國(guó)國(guó)家研究理事會(huì)(NRC)研究概括出深度學(xué)習(xí)的本質(zhì),即個(gè)體能夠?qū)⑵湓谝粋€(gè)情境中所學(xué)的知識(shí)運(yùn)用于新情境的過(guò)程。為了讓學(xué)生能夠靈活運(yùn)用知識(shí),加強(qiáng)他們?cè)趯?shí)際生活中解決問(wèn)題的能力,筆者在教學(xué)實(shí)踐中,設(shè)計(jì)并開(kāi)展了主題為“霧霾知多少”的項(xiàng)目活動(dòng)。
“霧霾”與學(xué)生生活息息相關(guān),圍繞主題,學(xué)生通過(guò)自主探究、互相交流、選擇問(wèn)題、解決問(wèn)題等途徑展開(kāi)深度學(xué)習(xí)。
在項(xiàng)目活動(dòng)的初始階段,學(xué)生通過(guò)網(wǎng)絡(luò)搜索了解了霧霾的基本定義、危害物及主要成分、起因、危害物種類(lèi)的等級(jí)等,形成對(duì)霧霾的基本認(rèn)識(shí)。
為了更清晰地了解霧霾到底對(duì)我們生活有多大影響,還需要用數(shù)據(jù)來(lái)說(shuō)話,這就需要學(xué)生遷移已有的數(shù)據(jù)統(tǒng)計(jì)知識(shí)和技能,運(yùn)用數(shù)據(jù)計(jì)算、多角度分析數(shù)據(jù)表、制作圖表的方法,對(duì)數(shù)據(jù)進(jìn)行分析,取得想要的結(jié)果并展開(kāi)交流,總結(jié)活動(dòng)經(jīng)驗(yàn),提出切實(shí)可行的對(duì)策。
關(guān)鍵詞:大數(shù)據(jù);科技情報(bào)工作;挑戰(zhàn);對(duì)策建議
中圖分類(lèi)號(hào): G250.2 文獻(xiàn)標(biāo)識(shí)碼: A DOI: 10.11968/tsyqb.1003-6938.2015123
Challenges and Rethinking of S&T Information Service in Big Data Era
Abstract Data processing improvement is one of the main driven forces of S&T information service innovation. It becomes more and more difficult for S&T information institutes to face the challenges of scattered data resources, deepened and widened users' demands, and the complexity of big data analysis technologies. Meanwhile, these challenges make it possible for the innovation and sharp turn to new information service models. This paper analyzed the technical environment of big data, deconstructed the main challenges of intelligence work, and gave several suggestions as countermeasures.
Key words big data; S&T information service; challenges; suggestions
科技情報(bào)服務(wù)領(lǐng)域普遍將當(dāng)前面臨的海量數(shù)據(jù)處理和服務(wù)能力的矛盾,視為泛在信息環(huán)境所涌現(xiàn)出的、特有的“大數(shù)據(jù)”問(wèn)題,并產(chǎn)生了隱隱的“大數(shù)據(jù)憂慮”。隨著國(guó)家大數(shù)據(jù)戰(zhàn)略的提出,各界對(duì)數(shù)據(jù)問(wèn)題的關(guān)注和對(duì)數(shù)據(jù)服務(wù)的需求激增,學(xué)術(shù)界和科技情報(bào)服務(wù)實(shí)踐中對(duì)“大數(shù)據(jù)”應(yīng)用也呈現(xiàn)出多樣化的解讀,比如王飛躍提出的“基于ACP方法的開(kāi)源情報(bào)解析理論框架”和“四熵服務(wù)”理念[1],李廣建等提出的情報(bào)研究五個(gè)轉(zhuǎn)變[2],賀德方、喬曉東、曾建勛等提出的“事實(shí)型數(shù)據(jù)+專(zhuān)用工具+專(zhuān)家智慧”的FAST4Wisdom服務(wù)理念[3-4]和情報(bào)學(xué)四維度拓展變革[5],以及楊善林等提出的情報(bào)內(nèi)涵轉(zhuǎn)變[6]等。因此,消解科技情報(bào)機(jī)構(gòu)的大數(shù)據(jù)憂慮,洞察科技情報(bào)大數(shù)據(jù)發(fā)展特征與發(fā)展趨勢(shì),是當(dāng)前科技情報(bào)實(shí)踐領(lǐng)域的當(dāng)務(wù)之急。
1 科技數(shù)據(jù)挑戰(zhàn)與科技情報(bào)服務(wù)的發(fā)展
科技情報(bào)服務(wù)領(lǐng)域大數(shù)據(jù)問(wèn)題,實(shí)質(zhì)是全球數(shù)據(jù)自發(fā)式、爆發(fā)式增長(zhǎng)以及數(shù)據(jù)處理高效率要求的不對(duì)稱(chēng)體現(xiàn)[7]。而科技情報(bào)工作很早就關(guān)注到知識(shí)增長(zhǎng)趨勢(shì)及其在管理和服務(wù)領(lǐng)域帶來(lái)的信息爆炸與信息過(guò)載問(wèn)題[8]。科技情報(bào)工作從誕生之初起就一直面臨數(shù)據(jù)或信息資源的加工處理和分析利用的挑戰(zhàn),并在不同發(fā)展階段呈現(xiàn)出不同的問(wèn)題表征。在某種意義上,科技情報(bào)機(jī)構(gòu)就是為解決“大數(shù)據(jù)”問(wèn)題而誕生的專(zhuān)門(mén)機(jī)構(gòu),而數(shù)據(jù)挑戰(zhàn)也成為科技情報(bào)服務(wù)創(chuàng)新的內(nèi)在動(dòng)力。
1.1 科技情報(bào)初創(chuàng)時(shí)期的數(shù)據(jù)挑戰(zhàn)與服務(wù)創(chuàng)新
1944年,美國(guó)圖書(shū)館學(xué)家F.Rider關(guān)注到圖書(shū)館館藏大約每16年增長(zhǎng)1倍,并以此估計(jì)耶魯大學(xué)圖書(shū)館將在2040年擁有超過(guò)2億冊(cè)圖書(shū),大約2PB的信息存儲(chǔ),而這些圖書(shū)將占據(jù)6000英里長(zhǎng)的書(shū)架,至少需要6000名圖書(shū)館員完成編目和維護(hù)工作[9]。以當(dāng)時(shí)的數(shù)據(jù)處理?xiàng)l件而言,2億冊(cè)圖書(shū)的存儲(chǔ)空間和集中管理維護(hù)就是可能的“大數(shù)據(jù)”問(wèn)題。與之類(lèi)似,戰(zhàn)后美國(guó)政府收繳的40噸德國(guó)和日本技術(shù)資料的處理,也超出了當(dāng)時(shí)的文獻(xiàn)處理能力。科技情報(bào)界提出了“信息爆炸”的理念,并主張信息分析和處理工作的專(zhuān)門(mén)化和體系化,也視之為科技情報(bào)工作的開(kāi)端。依托業(yè)務(wù)部門(mén)進(jìn)行體系化的樹(shù)狀業(yè)務(wù)分解和專(zhuān)門(mén)信息的保存、交流和利用,構(gòu)建跨部門(mén)協(xié)作保障體系,極大紓解了信息總量增長(zhǎng)困難,并通過(guò)在1950年代引入縮微技術(shù)和數(shù)字存儲(chǔ)技術(shù)進(jìn)一步緩解了信息存儲(chǔ)空間問(wèn)題。
1.2 數(shù)字資源建設(shè)時(shí)期的數(shù)據(jù)挑戰(zhàn)與服務(wù)創(chuàng)新
20世紀(jì)60年代數(shù)據(jù)存儲(chǔ)技術(shù)的引入有效緩解了數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)集中管理問(wèn)題,但對(duì)原始數(shù)據(jù)的加工處理和分析技術(shù)短板卻再次成為“大數(shù)據(jù)”問(wèn)題。例如20世紀(jì)50年代美國(guó)國(guó)家安全局雇傭了超過(guò)12000名安全技術(shù)人員來(lái)處理每年偵聽(tīng)或加密的17000卷磁帶[10];1965年,美國(guó)國(guó)家數(shù)據(jù)中心的600個(gè)數(shù)據(jù)集存儲(chǔ)了1億張打孔卡片和3萬(wàn)份存儲(chǔ)磁帶,但對(duì)其擁有的1.75億枚指紋記錄、每年7.42億份納稅記錄的分析束手無(wú)策[11]。因此,1965年Dunn報(bào)告認(rèn)為,“面臨的最大問(wèn)題就是不知如何發(fā)現(xiàn)不同機(jī)構(gòu)、不同數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián)”[11],即數(shù)據(jù)分析的“大數(shù)據(jù)問(wèn)題”。Kaysen委員會(huì)提出的集中存儲(chǔ)和數(shù)據(jù)共享方案,推動(dòng)數(shù)據(jù)庫(kù)技術(shù)、信息檢索技術(shù)和數(shù)據(jù)科學(xué)的產(chǎn)生。這一時(shí)期,科技情報(bào)服務(wù)機(jī)構(gòu)也引入了數(shù)字存儲(chǔ)和數(shù)據(jù)庫(kù)管理體系,并引入了信息檢索技術(shù),比如1966年《化學(xué)文摘(CA)》引入的自動(dòng)處理系統(tǒng)和計(jì)算機(jī)可讀數(shù)據(jù)庫(kù)、1967年Roger Summit 主持開(kāi)發(fā)的Dialog在線數(shù)據(jù)訪問(wèn)。科技情報(bào)領(lǐng)域產(chǎn)生了以數(shù)據(jù)加工和信息系統(tǒng)管理為特征的海量科技情報(bào)服務(wù),出現(xiàn)了從文獻(xiàn)保障服務(wù)向以數(shù)據(jù)庫(kù)、信息檢索為代表的技術(shù)服務(wù)的融合,提升了科技情報(bào)處理的數(shù)據(jù)數(shù)量和處理速度。
1.3 數(shù)據(jù)分析和處理時(shí)期的數(shù)據(jù)挑戰(zhàn)與服務(wù)創(chuàng)新
20世紀(jì)80年代數(shù)據(jù)庫(kù)技術(shù)日益成熟,以數(shù)據(jù)挖掘和高階數(shù)據(jù)分析為代表的數(shù)據(jù)分析和處理技術(shù)得到廣泛應(yīng)用,數(shù)據(jù)分析進(jìn)入智能化階段。但這一時(shí)期的數(shù)據(jù)分析主要局限于封閉計(jì)算環(huán)境的中央數(shù)據(jù)存儲(chǔ)、局限于結(jié)構(gòu)化數(shù)據(jù)的分析和處理。因而,在20世紀(jì)80年代面臨的新的“大數(shù)據(jù)”問(wèn)題是海量外部數(shù)據(jù)的采集、加工和分析,以及如何降低數(shù)據(jù)分析成本和重復(fù)建設(shè)的“數(shù)據(jù)黑洞”,因而以競(jìng)爭(zhēng)情報(bào)、趨勢(shì)跟蹤等定向或定題的專(zhuān)項(xiàng)信息分析為代表的創(chuàng)新服務(wù)得以引入。科技情報(bào)服務(wù)機(jī)構(gòu)完成了從信息數(shù)據(jù)產(chǎn)品向情報(bào)產(chǎn)品的升級(jí),具備了情報(bào)監(jiān)測(cè)和智能分析功能,光盤(pán)數(shù)據(jù)庫(kù)和應(yīng)用軟件產(chǎn)品得到推廣,使得信息分析和預(yù)測(cè)水平有了大幅提升,比如1987年發(fā)行的Medline光盤(pán)產(chǎn)品、1988年的科技信息網(wǎng)絡(luò)STN Express■軟件以及90年代初期的大量面向個(gè)人計(jì)算機(jī)的數(shù)據(jù)應(yīng)用軟件。
1.4 開(kāi)放網(wǎng)絡(luò)和自動(dòng)加工處理時(shí)期的數(shù)據(jù)挑戰(zhàn)與服務(wù)創(chuàng)新
20世紀(jì)90年代以來(lái)網(wǎng)絡(luò)技術(shù)、個(gè)人數(shù)據(jù)終端普遍采納,數(shù)據(jù)存儲(chǔ)成本快速下降,科技信息資源的分布發(fā)生了巨大變化。首先,以互聯(lián)網(wǎng)企業(yè)和技術(shù)服務(wù)企業(yè)為代表的新生業(yè)態(tài)迅速崛起,以圖書(shū)檔案和科技情報(bào)機(jī)構(gòu)為中心的科技信息服務(wù)體系受到挑戰(zhàn)或顛覆;其次,數(shù)據(jù)可得性大大增加,數(shù)據(jù)規(guī)模和數(shù)據(jù)多樣性大大增加,以搜索引擎為代表的數(shù)據(jù)自動(dòng)抓取、分析和推送技術(shù)極大增強(qiáng)了數(shù)據(jù)分析和處理能力,數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)得到廣泛推廣應(yīng)用;再次,信息服務(wù)提供商更加積極地關(guān)注用戶(hù)個(gè)性需求和反饋,對(duì)用戶(hù)交互、行為數(shù)據(jù)和個(gè)性化推薦更加關(guān)注。這一時(shí)期,“總量巨大(Volume)”、“類(lèi)型多樣(Variety)”的兩個(gè)“V”的問(wèn)題已經(jīng)凸顯,“大數(shù)據(jù)”問(wèn)題初現(xiàn)端倪。相對(duì)于互聯(lián)網(wǎng)企業(yè)而言,傳統(tǒng)科技情報(bào)服務(wù)機(jī)構(gòu)逐步通過(guò)兼并聯(lián)合、擴(kuò)展數(shù)據(jù)來(lái)源,提升數(shù)據(jù)應(yīng)用能力予以應(yīng)對(duì)。這一時(shí)期,面向網(wǎng)絡(luò)的數(shù)據(jù)開(kāi)放服務(wù)、數(shù)據(jù)集成與融合技術(shù)、數(shù)據(jù)應(yīng)用分析工具與“數(shù)據(jù)+應(yīng)用”的深度服務(wù)模式快速發(fā)展。比如SciFinder、SciVal、Scopus等數(shù)據(jù)分析工具的開(kāi)發(fā)和 WorldCat全球協(xié)作機(jī)制和協(xié)同服務(wù)模式的發(fā)展。
2 大數(shù)據(jù)時(shí)代科技情報(bào)工作面臨的主要挑戰(zhàn)
大數(shù)據(jù)的4V特征,即超大規(guī)模和快速增長(zhǎng)的數(shù)據(jù)體量(Volume)、異構(gòu)和多樣性的數(shù)據(jù)結(jié)構(gòu)(Variety)、大量不相關(guān)信息的低價(jià)值密度(Value)和大量實(shí)時(shí)分析應(yīng)用工具的使用(Velocity),是數(shù)據(jù)分析和利用的主要障礙,在科技情報(bào)領(lǐng)域也同樣如此。此外,從整個(gè)社會(huì)和用戶(hù)需求角度看,科技情報(bào)機(jī)構(gòu)的資源角色和地位進(jìn)一步弱化,用戶(hù)需求向更深更廣信息分析領(lǐng)域拓展,情報(bào)服務(wù)與創(chuàng)新服務(wù)的融合以及資源-服務(wù)的一體化對(duì)科技情報(bào)機(jī)構(gòu)的服務(wù)能力也提出了更高挑戰(zhàn)。
2.1 科技情報(bào)服務(wù)機(jī)構(gòu)的資源優(yōu)勢(shì)弱化
在數(shù)據(jù)開(kāi)放趨勢(shì)下,可得可用的信息資源更加豐富,科技情報(bào)服務(wù)機(jī)構(gòu)資源獨(dú)占優(yōu)勢(shì)不復(fù)存在。以往科技情報(bào)服務(wù)過(guò)于依賴(lài)其資源優(yōu)勢(shì),而對(duì)信息加工、信息分析的優(yōu)勢(shì)沒(méi)用充分重視,存在短期的“轉(zhuǎn)型瓶頸”。而政府?dāng)?shù)據(jù)公開(kāi)、研究機(jī)構(gòu)數(shù)據(jù)公開(kāi)獲取以及數(shù)據(jù)集市商務(wù)模式(GitHub)的出現(xiàn),加劇了科技情報(bào)機(jī)構(gòu)作為數(shù)據(jù)樞紐角色的弱化。以政府?dāng)?shù)據(jù)公開(kāi)為例,美國(guó)政府目前可提供192440個(gè)數(shù)據(jù)集[12],英國(guó)政府可提供1353個(gè)部門(mén)和機(jī)構(gòu)開(kāi)放的20688個(gè)數(shù)據(jù)集、386個(gè)APP應(yīng)用[13]。數(shù)據(jù)開(kāi)放可得,意味著業(yè)務(wù)機(jī)構(gòu)可直接跳過(guò)科技情報(bào)服務(wù)中介而直接存取和利用信息,對(duì)科技情報(bào)機(jī)構(gòu)的資源業(yè)務(wù)服務(wù)帶來(lái)了挑戰(zhàn)。如美國(guó)NTIS提供的科技報(bào)告服務(wù),因政府部門(mén)科技報(bào)告的免費(fèi)公開(kāi),在1999年以后連續(xù)多年虧損。因而,單純提供內(nèi)容獲取或計(jì)量的服務(wù)模式并不能完全支持業(yè)務(wù)決策的需要。
2.2 科技情報(bào)服務(wù)的用戶(hù)需求轉(zhuǎn)變
大數(shù)據(jù)環(huán)境下,用戶(hù)不再滿足于信息資源的整序獲取,不再滿足于以文獻(xiàn)單元為主要特征的加工整理和存取分析,而是對(duì)信息分析深度和廣度提出了更高要求:在深度上突出碎片化信息加工和計(jì)算化服務(wù)[14-15],包括數(shù)據(jù)資源快速評(píng)價(jià)推薦、知識(shí)單元的抽取和分析、多維數(shù)據(jù)融合、細(xì)粒度數(shù)據(jù)分析以及可視化、計(jì)算化的數(shù)據(jù)呈現(xiàn)與分析,力爭(zhēng)將大數(shù)據(jù)去冗分類(lèi)、去粗存精、去偽存真;在廣度上以全局性和宏觀戰(zhàn)略性情報(bào)服務(wù)為特征[16],包括動(dòng)態(tài)監(jiān)測(cè)服務(wù)、態(tài)勢(shì)分析研究服務(wù)和前瞻預(yù)測(cè)研究服務(wù)三種類(lèi)型,需要對(duì)多源數(shù)據(jù)、異構(gòu)數(shù)據(jù)、隨機(jī)動(dòng)態(tài)數(shù)據(jù)進(jìn)行收割、融合、跟蹤和監(jiān)控。同時(shí),用戶(hù)數(shù)據(jù)或信息資源利用也不同于以往數(shù)據(jù)閱讀、數(shù)據(jù)參考和數(shù)據(jù)統(tǒng)計(jì)等淺層利用,而是在決策分析和學(xué)術(shù)研究中尋求高階數(shù)據(jù)分析、尋求多維數(shù)據(jù)的降維理解、尋求專(zhuān)家智慧的介入矯正、尋求從數(shù)據(jù)分析向情報(bào)解析的升級(jí)。因此,科技情報(bào)服務(wù)不可避免地將由傳統(tǒng)的依托資源數(shù)據(jù)的數(shù)據(jù)分析服務(wù)向多源多方協(xié)作的情報(bào)解析和計(jì)算分析服務(wù)轉(zhuǎn)變,是對(duì)現(xiàn)有科技情報(bào)機(jī)構(gòu)的分析技術(shù)能力的挑戰(zhàn)。
2.3 資源服務(wù)一體化下的服務(wù)能力不足
科技情報(bào)機(jī)構(gòu)過(guò)去一直強(qiáng)調(diào)資源保障能力,服務(wù)協(xié)作能力并未上升到戰(zhàn)略地位。當(dāng)大數(shù)據(jù)開(kāi)放環(huán)境使資源獲取相對(duì)容易時(shí),反而發(fā)現(xiàn)“要讀的太多,要挖掘、發(fā)現(xiàn)和分析的隱織的內(nèi)容太多太復(fù)雜,要掌握的方法、技術(shù)與工具太多太復(fù)雜,有效分析和利用信息成為一個(gè)日益復(fù)雜、負(fù)擔(dān)沉重的問(wèn)題”[17]。對(duì)科技情報(bào)機(jī)構(gòu)而言,提出了兩個(gè)要求:第一,要求全面介入,無(wú)處不在,并注重分析方法和分析技術(shù)的全面協(xié)助;第二,要求在科技情報(bào)服務(wù)流程中更早更深地介入用戶(hù)服務(wù),提供更加精細(xì)化的服務(wù)內(nèi)容,并提供更好的內(nèi)容質(zhì)量控制水平。
相比于傳統(tǒng)的委托服務(wù)模式,新的科技情報(bào)服務(wù)團(tuán)隊(duì)將由行業(yè)專(zhuān)家、數(shù)據(jù)分析員、情報(bào)分析員 3 個(gè)角色構(gòu)成[18],并在選題階段更早介入服務(wù)流程,同時(shí)融合數(shù)據(jù)服務(wù)、信息服務(wù)和知識(shí)服務(wù),提供資源與服務(wù)一體化的服務(wù)體系(見(jiàn)圖1)。依托大數(shù)據(jù)的科技情報(bào)服務(wù)要求與創(chuàng)新主體高度融合,以用戶(hù)解決問(wèn)題為中心,融入解決問(wèn)題的過(guò)程,支持對(duì)問(wèn)題解決方案的探索、構(gòu)建和測(cè)試等服務(wù)機(jī)制[19],從選題確立到任務(wù)分解、任務(wù)實(shí)施、數(shù)據(jù)解析,均需雙方和行業(yè)專(zhuān)家頻繁交互與協(xié)作,以應(yīng)對(duì)分析需求的易變性和不可預(yù)見(jiàn)性[20-21]。在服務(wù)過(guò)程中,大數(shù)據(jù)分析和可視化技術(shù)提升了用戶(hù)對(duì)數(shù)據(jù)的認(rèn)知和理解,也可能將“情報(bào)服務(wù)”提升到知識(shí)協(xié)作、協(xié)同創(chuàng)新的高度,這也意味著科技情報(bào)服務(wù)人員的能力要求更高,可能需身兼行業(yè)專(zhuān)家、數(shù)據(jù)分析員、情報(bào)分析員中的多種角色。
3 大數(shù)據(jù)時(shí)代科技情報(bào)工作的資源保障體系建設(shè)
資源保障是信息服務(wù)的基礎(chǔ),建立全面、高質(zhì)、開(kāi)放的可得資源體系仍是科技情報(bào)工作的首要任務(wù)。
3.1 建立信息資源保障的大數(shù)據(jù)理念
大數(shù)據(jù)環(huán)境下,信息資源保障的內(nèi)涵有所不同:第一,信息資源利用形式更開(kāi)放快捷,大量信息資源來(lái)不及建立知識(shí)產(chǎn)權(quán)屏障就已過(guò)時(shí),使得信息資源的價(jià)值實(shí)現(xiàn)更依賴(lài)資源利用和分析的溢出效應(yīng),而非知識(shí)產(chǎn)權(quán)變現(xiàn);第二,信息資源的邊界越來(lái)越模糊,以往受限于機(jī)構(gòu)邊界和知識(shí)產(chǎn)權(quán)保護(hù)而構(gòu)建的信息資源保障“優(yōu)選精選”理念,正面臨低廉存儲(chǔ)、海量來(lái)源的資源體系沖擊;第三,信息資源的表現(xiàn)形式更多樣,質(zhì)量參差不齊,直接利用困難,資源保障體系的重心逐漸由收藏保障向利用保障轉(zhuǎn)移;第四,隨著獨(dú)有信息資源優(yōu)勢(shì)的弱化,信息資源保障的開(kāi)放性和協(xié)作利用將更為突出。
3.2 擴(kuò)展多元數(shù)據(jù)來(lái)源和新型數(shù)據(jù)存儲(chǔ)
科技信息機(jī)構(gòu)應(yīng)擴(kuò)展資源的廣度,關(guān)注片段信息或社會(huì)網(wǎng)絡(luò)數(shù)據(jù)等低價(jià)值密度信息資源或新型信息資源的采集和保存[2]。在具體的采集和開(kāi)發(fā)過(guò)程中,有兩種典型做法:一種主張搶救性保存,因擔(dān)心數(shù)字信息資源的易逝性,如不加以保存以后將無(wú)法利用,因而突出優(yōu)先存儲(chǔ),逐步利用的原則,并不一定要優(yōu)先設(shè)定明確和具體的應(yīng)用目標(biāo)。典型的是美國(guó)國(guó)會(huì)圖書(shū)館啟動(dòng)的網(wǎng)絡(luò)存檔項(xiàng)目,其已采集網(wǎng)絡(luò)數(shù)據(jù)500TB以上,尤其是2010年啟動(dòng)的Twitter存檔的特種館藏項(xiàng)目已存儲(chǔ)2006~2010年的1700億條133.2TB的Twitter記錄[22],并以每天5億條的規(guī)模快速增長(zhǎng)。目前雖然尚未完全開(kāi)放服務(wù)并且也面臨數(shù)據(jù)解析整理的技術(shù)困難,但歷史學(xué)和人文學(xué)者均期待其資源的開(kāi)放利用[23]。一種主張縱向驅(qū)動(dòng)和片段利用驅(qū)動(dòng),突出以若干利用和主題推動(dòng)項(xiàng)目的存儲(chǔ),最終實(shí)現(xiàn)數(shù)據(jù)匯集和大數(shù)據(jù)。如聯(lián)合國(guó)在雅加達(dá)設(shè)立全球脈動(dòng)(Globle Pulse)大數(shù)據(jù)利用[24]和大多數(shù)的政府開(kāi)放數(shù)據(jù)集建設(shè)都采用縱向驅(qū)動(dòng)方式。
3.3 推動(dòng)深層數(shù)據(jù)存儲(chǔ)和核心資源質(zhì)量
相對(duì)于文獻(xiàn)資源、規(guī)范元數(shù)據(jù)等資源形式,推動(dòng)深層數(shù)據(jù)類(lèi)型的采集和保存將有效提升科技情報(bào)機(jī)構(gòu)的信息分析能力。以往科技情報(bào)機(jī)構(gòu)的資源主體是文獻(xiàn)信息、描述信息、事實(shí)信息以及部分淺層知識(shí)資源,現(xiàn)在需要進(jìn)一步加強(qiáng)內(nèi)容實(shí)體信息、科學(xué)數(shù)據(jù)、深層知識(shí)資源以及用戶(hù)行為信息的保存,繼續(xù)發(fā)展和完善知識(shí)庫(kù)、本體庫(kù)、情景庫(kù)、資料庫(kù)、實(shí)體庫(kù)等新型數(shù)據(jù)庫(kù)類(lèi)型[16]。比如中信所在專(zhuān)利分析中對(duì)人名、機(jī)構(gòu)名和技術(shù)術(shù)語(yǔ)、領(lǐng)域深層主題及其相互關(guān)系的構(gòu)建[3],中科院科學(xué)數(shù)據(jù)中心對(duì)科學(xué)數(shù)據(jù)與科技文獻(xiàn)集成服務(wù)關(guān)鍵技術(shù)研究與應(yīng)用[25]等。
3.4 科學(xué)規(guī)劃參考資源架構(gòu)體系
大數(shù)據(jù)環(huán)境下,大多數(shù)科技情報(bào)機(jī)構(gòu)都需要考慮自建數(shù)據(jù)源、開(kāi)放數(shù)據(jù)源與商業(yè)數(shù)據(jù)源的混搭利用。美國(guó)中央情報(bào)局的首席技術(shù)官 Gus Hunter在推進(jìn)OpenStack項(xiàng)目時(shí),提出了參考資源架構(gòu)(Reference Architecture)的規(guī)劃理念。相對(duì)于規(guī)范的學(xué)術(shù)資源和科技信息,大數(shù)據(jù)更零散、更原始、更復(fù)雜,巨量、快速和多樣的數(shù)據(jù)存在明顯的碎片化特征,并不能直接利用[2]。因而,科技情報(bào)機(jī)構(gòu)需要建立更加具有層次性、協(xié)調(diào)性的數(shù)據(jù)來(lái)源和數(shù)據(jù)參考規(guī)劃,突出海量數(shù)據(jù)支撐與核心資源質(zhì)量控制相結(jié)合的資源保障策略。一方面需要加強(qiáng)對(duì)科技信息獲取渠道及其內(nèi)容的質(zhì)量評(píng)價(jià),構(gòu)建多維度科技信息質(zhì)量評(píng)價(jià)指標(biāo)體系和綜合運(yùn)用多種質(zhì)量控制策略[26];一方面需要加強(qiáng)對(duì)信息資源的深度加工與科學(xué)解析,提升數(shù)據(jù)的可理解性和可用性。
3.5 加強(qiáng)多源科技情報(bào)資源的集成與聚合
大數(shù)據(jù)環(huán)境下,科技信息服務(wù)需要面對(duì)方法、工具、數(shù)據(jù)的離散化分布[3],需要融合多種來(lái)源結(jié)構(gòu)異質(zhì)的數(shù)據(jù),集成多種數(shù)據(jù)分析方法,并且通過(guò)融合多源數(shù)據(jù)發(fā)現(xiàn)資源之間潛在關(guān)聯(lián)[27]。關(guān)聯(lián)性或弱信息的挖掘,被認(rèn)為是大數(shù)據(jù)服務(wù)區(qū)別以往科技情報(bào)服務(wù)的典型差異[28-29]。而通過(guò)把不同渠道、利用多種采集方式獲取的具有不同數(shù)據(jù)結(jié)構(gòu)的信息匯聚到一起,形成具有統(tǒng)一格式、面向多種應(yīng)用的數(shù)據(jù)集合,這一過(guò)程稱(chēng)為多源數(shù)據(jù)融合[2]。相對(duì)于以往圖書(shū)情報(bào)機(jī)構(gòu)基于目錄的OPAC、基于元數(shù)據(jù)收割協(xié)議的數(shù)字館藏、基于協(xié)議標(biāo)準(zhǔn)的跨庫(kù)檢索等聚合方法,當(dāng)前的數(shù)字資源聚合更注重內(nèi)容層面的知識(shí)發(fā)現(xiàn),尤其是數(shù)據(jù)驅(qū)動(dòng)的弱信息關(guān)注[30]以及注重內(nèi)容片斷進(jìn)行搜索、過(guò)濾、瀏覽、鏈接、注釋和分析的戰(zhàn)略性閱讀[31]。
資源融合過(guò)程也是數(shù)據(jù)處理和分析技術(shù)的應(yīng)用過(guò)程。李廣建等統(tǒng)計(jì)了國(guó)際上143個(gè)數(shù)字資源整合項(xiàng)目[32],歸納出數(shù)據(jù)倉(cāng)庫(kù)、Mediator/ Wrapper(中介器或封裝器)、Agent和P2P等四種整合機(jī)制,而且約占85%的項(xiàng)目或系統(tǒng)采用前兩種方法,其中涉及海量存儲(chǔ)技術(shù)、ETL技術(shù)、信息源監(jiān)控與更新技術(shù)、信息源選擇技術(shù)、信息抽取技術(shù)、查詢(xún)處理技術(shù)、結(jié)果整合技術(shù)、語(yǔ)義整合技術(shù)等。尤其針對(duì)云計(jì)算環(huán)境下多源、異構(gòu)、大規(guī)模、動(dòng)態(tài)信息資源特征和人們?nèi)找姘l(fā)展的個(gè)性化信息服務(wù)需求,基于語(yǔ)義的本體資源聚合、分布式協(xié)作資源聚合成為當(dāng)前關(guān)注的焦點(diǎn)[33]。
3.6 積極推動(dòng)資源開(kāi)放獲取與協(xié)作
大數(shù)據(jù)環(huán)境下,科技情報(bào)機(jī)構(gòu)還應(yīng)充分利用開(kāi)放數(shù)據(jù),加強(qiáng)機(jī)構(gòu)間的協(xié)作共享。具體需要從業(yè)務(wù)模式和技術(shù)手段層面加以規(guī)劃,改變傳統(tǒng)科技情報(bào)獲取方法,降低用戶(hù)情報(bào)獲取難度,促進(jìn)資源有效利用。從業(yè)務(wù)模式上看,要加大政府開(kāi)放信息源的有效利用和商業(yè)機(jī)構(gòu)的技術(shù)力量協(xié)作,以提高數(shù)據(jù)使用的內(nèi)在效率為原則,盈利動(dòng)機(jī)為補(bǔ)充,引入社會(huì)力量參與[34]。以英國(guó)政府開(kāi)放數(shù)據(jù)為例,目前已有多家數(shù)據(jù)創(chuàng)業(yè)公司與data.gov.uk合作,如Open Corporates的全球企業(yè)信息查詢(xún)、Placr的整合位置與數(shù)據(jù)查詢(xún)、Locatable的綜合稅率和交通情況的居住地與購(gòu)房決策查詢(xún)等。從技術(shù)手段看,則需增加數(shù)據(jù)的可得性。通常采用關(guān)聯(lián)數(shù)據(jù)集(Linked Data Set)技術(shù)支持開(kāi)放共享,以RDF(資源描述框架)構(gòu)建數(shù)據(jù)模型,利用URI(統(tǒng)一資源標(biāo)示符)定義數(shù)據(jù)實(shí)體,通過(guò)HTTP協(xié)議瀏覽并獲取數(shù)據(jù)[35]。
4 大數(shù)據(jù)時(shí)代科技情報(bào)工作的服務(wù)模式創(chuàng)新
資源、技術(shù)與服務(wù)是科技情報(bào)工作的核心要素,資源的改變、技術(shù)的提升必然需要匹配服務(wù)的創(chuàng)新與升級(jí)。大數(shù)據(jù)環(huán)境下,科技情報(bào)服務(wù)模式的創(chuàng)新強(qiáng)調(diào)以用戶(hù)需求為中心,注重運(yùn)用大數(shù)據(jù)技術(shù)分析方法,并建立拓展的資源保障體系與用戶(hù)需求之間的關(guān)聯(lián)[29]。結(jié)合大數(shù)據(jù)本身特征,科技情報(bào)服務(wù)將進(jìn)一步突出輕量化服務(wù)、細(xì)粒度服務(wù)、技術(shù)服務(wù)和一體化服務(wù)的趨勢(shì)。
4.1 輕量數(shù)據(jù)分析服務(wù)
輕量數(shù)據(jù)分析的服務(wù)設(shè)計(jì)主要基于動(dòng)態(tài)數(shù)據(jù)和片段數(shù)據(jù)的快速增長(zhǎng),較小地犧牲信息分析準(zhǔn)確性而開(kāi)展的快速信息分析方式,即“短、平、快”的服務(wù)模式。動(dòng)態(tài)數(shù)據(jù)的迅速更新與快速增長(zhǎng)導(dǎo)致全量數(shù)據(jù)分析的難度與時(shí)間復(fù)雜度增加,大而全的分析模式反而會(huì)降低情報(bào)分析結(jié)果的時(shí)效性,降低情報(bào)價(jià)值。因而,輕量化科技情報(bào)服務(wù)模式要突出三個(gè)要點(diǎn):一是強(qiáng)調(diào)數(shù)據(jù)的快速解析與知識(shí)發(fā)現(xiàn),一般采用即時(shí)跟蹤和動(dòng)態(tài)監(jiān)控的服務(wù)方式[36];二是突出最大可能降低信息分析的效度損耗,建立高效的數(shù)據(jù)篩選機(jī)制,從大量信息中準(zhǔn)確選擇目標(biāo)數(shù)據(jù),盡可能通過(guò)較小數(shù)據(jù)吞吐發(fā)現(xiàn)問(wèn)題;三是突出用戶(hù)價(jià)值,通過(guò)用戶(hù)定制、用戶(hù)交互實(shí)時(shí)獲取用戶(hù)需求,滿足用戶(hù)多變需求。
4.2 細(xì)粒度情報(bào)解析服務(wù)
細(xì)粒度情報(bào)解析主要面向用戶(hù)的深層信息需求以及對(duì)海量數(shù)據(jù)信息的降維與濃縮需求。細(xì)粒度情報(bào)解析服務(wù)的實(shí)現(xiàn)方式主要有:第一,對(duì)文獻(xiàn)實(shí)體知識(shí)單元的提取和分析,對(duì)文獻(xiàn)主題、章節(jié)結(jié)構(gòu)、文獻(xiàn)元素(如圖表、數(shù)據(jù)、化學(xué)式、專(zhuān)利號(hào))等進(jìn)行有效提取和聚合分析,典型如學(xué)術(shù)本體、知識(shí)地圖、知識(shí)擴(kuò)散與突變等偵測(cè);第二,對(duì)文獻(xiàn)資源之間的弱關(guān)聯(lián)關(guān)系的發(fā)現(xiàn)[37],尤其是數(shù)據(jù)背后關(guān)系網(wǎng)絡(luò)的發(fā)現(xiàn),發(fā)現(xiàn)數(shù)據(jù)或知識(shí)之間的相關(guān)關(guān)系;第三,對(duì)內(nèi)容片斷進(jìn)行搜索、過(guò)濾、瀏覽、鏈接、注釋和分析的戰(zhàn)略性解析。
從服務(wù)表現(xiàn)形式上,細(xì)粒度情報(bào)服務(wù)導(dǎo)致從單一渠道獲取數(shù)據(jù)的數(shù)量與質(zhì)量下降,為了保證情報(bào)分析的有效性需要擴(kuò)大數(shù)據(jù)來(lái)源,提高多源數(shù)據(jù)分析能力。一方面,針對(duì)不同渠道采集的異構(gòu)數(shù)據(jù)進(jìn)行有效解析和聚合;另一方面要關(guān)注泛在網(wǎng)絡(luò)知識(shí)的利用,以及將開(kāi)放數(shù)據(jù)內(nèi)在的交互性、開(kāi)放性轉(zhuǎn)化為可以利用資源,并利用海量數(shù)據(jù)的可知識(shí)對(duì)象化、可計(jì)算化開(kāi)展服務(wù)。
4.3 技術(shù)應(yīng)用即服務(wù)方式
技術(shù)應(yīng)用即服務(wù)方式是對(duì)資源保障分析的延伸,將信息分析過(guò)程技術(shù)化、工具化,并以服務(wù)的形式提供給用戶(hù)。典型的應(yīng)用如萬(wàn)方創(chuàng)新助手、百度數(shù)據(jù)開(kāi)放平臺(tái)、百度開(kāi)題助手、騰訊云分析等平臺(tái),在數(shù)據(jù)服務(wù)基礎(chǔ)上,將數(shù)據(jù)解析和處理工具也提供給用戶(hù),用戶(hù)不僅利用數(shù)據(jù),而且也能享受服務(wù)方提供的高度定制化的技術(shù)工具。相對(duì)一般的SaaS服務(wù),科技情報(bào)機(jī)構(gòu)的技術(shù)應(yīng)用服務(wù)本身不存在數(shù)據(jù)委托存儲(chǔ)的數(shù)據(jù)安全問(wèn)題,同時(shí)更能體現(xiàn)科技情報(bào)機(jī)構(gòu)資源與分析技術(shù)的協(xié)同效應(yīng)。同時(shí),技術(shù)服務(wù)也為科技情報(bào)機(jī)構(gòu)之間提供了資源和服務(wù)合作的橋梁。歐美學(xué)術(shù)圖書(shū)館就建議情報(bào)服務(wù)機(jī)構(gòu)提供從資源到資源管理的完整服務(wù)體系[38]。
4.4 全流程一體化服務(wù)
全流程一體化服務(wù)強(qiáng)調(diào)科技情報(bào)服務(wù)對(duì)業(yè)務(wù)過(guò)程的全程參與與支持,滿足用戶(hù)的多元需求。大數(shù)據(jù)時(shí)代數(shù)據(jù)準(zhǔn)確采集與精確加工難度增加,業(yè)務(wù)部門(mén)或用戶(hù)對(duì)情報(bào)機(jī)構(gòu)的依賴(lài)性將愈發(fā)明顯,科技情報(bào)可將服務(wù)鏈擴(kuò)展到情報(bào)采集、加工、服務(wù)、服務(wù)反饋及延伸應(yīng)用的全生命周期鏈。典型應(yīng)用是OCLC提出的學(xué)術(shù)圖書(shū)館研究支撐服務(wù)[39]。OCLC發(fā)現(xiàn)研究者對(duì)情報(bào)機(jī)構(gòu)的需求不僅僅是文獻(xiàn)提供與保障,還有研究機(jī)會(huì)發(fā)現(xiàn)(研究項(xiàng)目趨勢(shì))、研究者的知識(shí)產(chǎn)權(quán)管理與商業(yè)價(jià)值實(shí)現(xiàn)、研究合作者發(fā)現(xiàn)、管理和存儲(chǔ)文本與數(shù)據(jù)集、大量文本或數(shù)據(jù)分析、改進(jìn)信息檢索或管理能力、引文管理、尋找機(jī)會(huì)、職位晉升或工作機(jī)會(huì)發(fā)現(xiàn)、學(xué)術(shù)聲譽(yù)管理、出版前出版中和出版后的文獻(xiàn)管理等。
5 結(jié)語(yǔ)
在文獻(xiàn)服務(wù)、技術(shù)服務(wù)、應(yīng)用服務(wù)和決策服務(wù)的演進(jìn)過(guò)程中,不僅科技情報(bào)工作的服務(wù)對(duì)象逐漸從文獻(xiàn)資料、系統(tǒng)信息過(guò)渡到覆蓋全生命周期數(shù)據(jù)、文獻(xiàn)知識(shí)單元、分析與應(yīng)用工具以及決策與咨詢(xún)建議的立體服務(wù)結(jié)構(gòu),而且用戶(hù)需求和受眾的情報(bào)利用方式也發(fā)生了變化。以學(xué)術(shù)領(lǐng)域的情報(bào)工作服務(wù)為例,知識(shí)大數(shù)據(jù)的興起不僅推動(dòng)了學(xué)術(shù)知識(shí)工程和數(shù)據(jù)存儲(chǔ)服務(wù)在科技領(lǐng)域的深度應(yīng)用[40],科學(xué)家和人文學(xué)者對(duì)知識(shí)數(shù)據(jù)的利用方式改變也催生了知識(shí)大數(shù)據(jù)服務(wù)的誕生[41]。在商業(yè)領(lǐng)域,Chen和Chiang通過(guò)梳理情報(bào)分析技術(shù)進(jìn)展,發(fā)現(xiàn)情報(bào)分析從面向數(shù)據(jù)庫(kù)的結(jié)構(gòu)化數(shù)據(jù)分析向面向網(wǎng)絡(luò)的非結(jié)構(gòu)化數(shù)據(jù)分析、移動(dòng)網(wǎng)絡(luò)和感知數(shù)據(jù)分析的BI&A3.0快速轉(zhuǎn)變[42]。雖然科技情報(bào)機(jī)構(gòu)面臨著大數(shù)據(jù)在資源保障和信息分析技術(shù)上的挑戰(zhàn),但另一方面科技情報(bào)的應(yīng)用領(lǐng)域越來(lái)越廣泛、用戶(hù)對(duì)科技情報(bào)機(jī)構(gòu)分析能力的依賴(lài)將越來(lái)越強(qiáng),面臨巨大的發(fā)展機(jī)遇。
參考文獻(xiàn):
[1] 王飛躍. 知識(shí)產(chǎn)生方式和科技決策支撐的重大變革――面向大數(shù)據(jù)和開(kāi)源信息的科技態(tài)勢(shì)解析與決策服務(wù)[J].中國(guó)科學(xué)院院刊, 2012, 27(5): 527-537.
[2] 李廣建,楊林.大數(shù)據(jù)視角下的情報(bào)研究與情報(bào)研究技術(shù)[J].圖書(shū)與情報(bào),2012(6):1-8.
[3] 賀德方. 基于大數(shù)據(jù)、云服務(wù)的科技情報(bào)工作思考[J]. 數(shù)字圖書(shū)館論壇, 2013 (6): 2-9.
[4] 喬曉東,朱禮軍,李穎,等. 大數(shù)據(jù)時(shí)代的技術(shù)情報(bào)工程[J]. 情報(bào)學(xué)報(bào), 2014, 33(12): 1255-1263.
[5] 曾建勛,魏來(lái). 大數(shù)據(jù)時(shí)代的情報(bào)學(xué)變革[J]. 情報(bào)學(xué)報(bào), 2015, 34(1): 37-44.
[6] 王曉佳,楊善林,陳志強(qiáng). 大數(shù)據(jù)時(shí)代下的情報(bào)分析與挖掘技術(shù)研究[J]. 情報(bào)學(xué)報(bào), 2013, 32(6): 564-574.
[7] 張斌, 馬費(fèi)成. 大數(shù)據(jù)環(huán)境下數(shù)字信息資源服務(wù)創(chuàng)新[J]. 情報(bào)理論與實(shí)踐, 2014(6):28-33.
[8] Santovena A Z. Big data: evolution, components, challenges and opportunities[D]. Massachusetts Institute of Technology, 2013.
[9] Rider,F(xiàn).The scholar and the future of the research library: A problem and its solution[M].New York city: Hadham Press,1944.
[10] Kraus R. Statistical déjà vu: The National Data Center Proposal of 1965 and its descendants[J]. Journal of Privacy and Confidentiality, 2013, 5(1): 1
[11] U.S.Bureau of the Budget,Office of Statistical Standards,Review of Proposal for a National Data Center,Statistical Evaluation Report No. 6, December 1965, reprinted in Edgar S. Dunn, Jr., Social Information Processing and Statistical Systems-Change and Reform[M].New York: John Wiley & Sons, 1974:204.
[12] The Home of the U.S. Government's Open Data[EB/OL].[2015-10-10].https://data.gov/.
[13] Openning Up Government UK[EB/OL].[2015-10-10].https://data.gov.uk/data/search.
[14] 李國(guó)杰, 程學(xué)旗. 大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域――大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J]. 中國(guó)科學(xué)院院刊, 2012, 27(6):647-657.
[15] 鄔賀銓.大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)[J].求是,2013(4):47-49.
[16] 趙凡, 冷伏海. 科技情報(bào)研究與服務(wù)的發(fā)展現(xiàn)狀與趨勢(shì)[J]. 數(shù)字圖書(shū)館論壇, 2006(10):52-60.
[17] 張曉林. 研究圖書(shū)館2020:嵌入式協(xié)作化知識(shí)實(shí)驗(yàn)室?[J]. 中國(guó)圖書(shū)館學(xué)報(bào), 2012(1):11-20.
[18] 劉如,吳晨生,李夢(mèng)輝. 大數(shù)據(jù)時(shí)代科技情報(bào)工作的機(jī)遇與變革[J]. 情報(bào)理論與實(shí)踐, 2015, 38(6): 35-39.
[19] 張曉林. 走向知識(shí)服務(wù):尋找新世紀(jì)圖書(shū)情報(bào)工作的生長(zhǎng)點(diǎn)[J]. 中國(guó)圖書(shū)館學(xué)報(bào), 2000, 26(5):32-37.
[20] 錢(qián)力, 張曉林, 李春旺,等. 利用OSGi的科技情報(bào)分析集成服務(wù)架構(gòu)研究與應(yīng)用[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù), 2014(12):62-70.
[21] 毛曉燕. 大數(shù)據(jù)環(huán)境下圖書(shū)館信息服務(wù)走向分析[J]. 圖書(shū)館工作與研究, 2014(3):72-75.
[22] Library of Congress, “Update on the Twitter Archive At the Library of Congress”(January)[EB/OL].[2015-11-15].http://loc.gov/today/pr/2013/files/twitter_report_2013jan.pdf.
[23] Zimmer M. The Twitter Archive at the Library of Congress: Challenges for information practice and information policy[J]. First Monday, 2015, 20(7).
[24] Pulse U N G. Big data for development: Challenges &opportunities[M]. NacionesUnidas, Nueva York, mayo, 2012.
[25] 中科院數(shù)據(jù)云.科學(xué)數(shù)據(jù)與科技文獻(xiàn)集成服務(wù)關(guān)鍵技術(shù)研究與應(yīng)用[EB/OL].[2015-11-10].http:///linkdata/597.jhtml.
[26] 裴雷, 孫建軍. 中國(guó)科技報(bào)告質(zhì)量評(píng)價(jià)體系與推進(jìn)策略[J]. 情報(bào)學(xué)報(bào), 2014(8):813-823.
[27] 楊善林, 羅賀, 丁帥. 基于云計(jì)算的多源信息服務(wù)系統(tǒng)研究綜述[J]. 管理科學(xué)學(xué)報(bào), 2012, 15(5):83-96.
[28] 官思發(fā),朝樂(lè)門(mén).大數(shù)據(jù)時(shí)代信息分析的關(guān)鍵問(wèn)題、挑戰(zhàn)與對(duì)策[J].圖書(shū)情報(bào)工作,2015,59(3):12-18,34.
[29] 李廣建,化柏林.大數(shù)據(jù)分析與情報(bào)分析關(guān)系辨析[J].中國(guó)圖書(shū)館學(xué)報(bào),2014(5):14-22.
[30] Palmer C L. Weak information work and “doable” problems in interdisciplinary science[J]. Proceedings of the American Society for Information Science and Technology, 2006, 43(1): 1-16.
[31] Renear A H, Palmer C L. Strategic reading, ontologies, and the future of scientific publishing[J]. Science, 2009, 325(5942): 828-832.
[32] 李廣建, 汪語(yǔ)宇, 張麗. 數(shù)字資源整合的實(shí)現(xiàn)機(jī)制及關(guān)鍵技術(shù)――對(duì)國(guó)外數(shù)字資源整合系統(tǒng)的實(shí)證研究[J]. 中國(guó)圖書(shū)館學(xué)報(bào), 2007, 33(2): 75-80.
[33] 劉向, 王偉軍, 李延暉. 云計(jì)算環(huán)境下信息資源集成與服務(wù)系統(tǒng)的體系架構(gòu)[J]. 情報(bào)科學(xué), 2014, 32(6): 128-133.
[34] 王晴. 論科學(xué)數(shù)據(jù)開(kāi)放共享的運(yùn)行模式, 保障機(jī)制及優(yōu)化策略[J]. 國(guó)家圖書(shū)館學(xué)刊, 2014, 23(1): 3-9.
[35] 李志芳, 鄧仲華. 國(guó)內(nèi)開(kāi)放科學(xué)數(shù)據(jù)的分布及其特點(diǎn)分析[J]. 情報(bào)科學(xué), 2015(3): 9.
[36] 繆其浩. 當(dāng)情報(bào)遇到大數(shù)據(jù)――大數(shù)據(jù)熱點(diǎn)情報(bào)跟蹤的回顧與感悟[J]. 情報(bào)探索, 2013(5):1-3.
[37] Palmer C L, Cragin M H, Hogan T P. Weak information work in scientific discovery[J].Information processing & manage
ment, 2007, 43(3): 808-820.
[38] Malpas,Constance.Cloud-sourcing Research Collections:Managing Print in the Mass-digitized Library Environment[R/OL].[2015-11-15].http:///research/publications/library/2011/2011-01.pdf.
[39] Susan Kroll and Rick Forsman. A Slice of Research Life: Information Support for Research in the United States[R/OL]. [2015-11-15].http:///research/publications/library/2010/2010-15.pdf.
[40] Lyon Liz. The Informatics Transform: Re-Engineering Libraries for the Data Decade[J].The International Journal of Digital Curation, 2012, 7(1): 126-138.
關(guān)鍵詞:考綱;中考化學(xué);復(fù)習(xí)備考;策略
中圖分類(lèi)號(hào):G632.41 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2017)23-0208-04
中考化學(xué)復(fù)習(xí)策略?xún)?yōu)化與否直接關(guān)系到學(xué)生中考化學(xué)成績(jī)的高低,科學(xué)的復(fù)習(xí)可以收到事半功倍的效果。中考化學(xué)復(fù)習(xí)時(shí)應(yīng)采取什么樣的復(fù)習(xí)策略呢?
一、精準(zhǔn)把握命題特點(diǎn)是科學(xué)備考的前提
廣州市初中畢業(yè)生化學(xué)學(xué)業(yè)考試是義務(wù)教育階段化學(xué)課程的終結(jié)性考試,考試結(jié)果既是衡量學(xué)生是否達(dá)到畢業(yè)標(biāo)準(zhǔn)的主要依據(jù),也是高中階段學(xué)校招生的重要依據(jù)之一,屬選拔性和水平性相結(jié)合的考試。本文結(jié)合廣州近五(2011―2015)年中考化學(xué)年報(bào)及中考化學(xué)試題,以《廣州中考指導(dǎo)書(shū)》及《義務(wù)教育化學(xué)課程標(biāo)準(zhǔn)》為綱,把握中考命題的特點(diǎn)。
(一)研究課標(biāo),解讀考綱
根據(jù)教育部頒布的《義務(wù)教育化學(xué)課程標(biāo)準(zhǔn)(2011年版)》(以下簡(jiǎn)稱(chēng)《化學(xué)課程標(biāo)準(zhǔn)》),為更好地執(zhí)行《化學(xué)課程標(biāo)準(zhǔn)》,明確初中化學(xué)教學(xué)的基本要求和評(píng)價(jià)要求,廣州市編制了《廣州市初中畢業(yè)生學(xué)業(yè)考試――化學(xué)考試大綱》(以下簡(jiǎn)稱(chēng)《化學(xué)考試大綱》),廣州市初中畢業(yè)生學(xué)業(yè)考試化學(xué)試卷就是《化學(xué)課程標(biāo)準(zhǔn)》、《化學(xué)考試大綱》和《評(píng)價(jià)標(biāo)準(zhǔn)(化學(xué))》而編制的。廣州市中考化學(xué)命題依據(jù)“知識(shí)不超綱,能力不封頂”的原則。
根據(jù)每年《廣州中考指導(dǎo)書(shū)》,結(jié)合《化學(xué)課程標(biāo)準(zhǔn)》組織學(xué)習(xí)《化學(xué)考試大綱》,考試大綱所呈現(xiàn)出來(lái)的有三方面的內(nèi)容――考試目標(biāo)、考試方式和試卷結(jié)構(gòu)以及考試內(nèi)容范圍。本文重點(diǎn)解讀考綱的考試目標(biāo)及考試內(nèi)容范圍。詳見(jiàn)表1。
考試目標(biāo)是根據(jù)《化學(xué)課程標(biāo)準(zhǔn)》對(duì)認(rèn)知性學(xué)習(xí)目標(biāo)的要求和初中化學(xué)教學(xué)的特點(diǎn),中考試題在認(rèn)知領(lǐng)域考查分為三個(gè)水平等級(jí)。
重點(diǎn)有于解讀考試的范圍和要求。當(dāng)每年發(fā)的考試大綱與往年的考試大綱從考試范圍六個(gè)方面進(jìn)行逐一比對(duì),發(fā)現(xiàn)是否有異同或有沒(méi)有增減,并緊扣考試大綱的各條要求,明確復(fù)習(xí)備考總體方向。
(二)鉆研年報(bào),巧用數(shù)據(jù)
《廣州市初中畢業(yè)生學(xué)業(yè)考試年報(bào)》(以下簡(jiǎn)稱(chēng)《年報(bào)》)。《年報(bào)》呈現(xiàn)內(nèi)容有試題說(shuō)明、統(tǒng)計(jì)數(shù)據(jù)與分析、試題分析、復(fù)習(xí)備考與教學(xué)建議等方面的內(nèi)容。復(fù)習(xí)備考工作開(kāi)始之初,必須對(duì)《年報(bào)》深入鉆研,吸收有效信息,并巧用數(shù)據(jù),指導(dǎo)復(fù)習(xí)備考工作的開(kāi)展。以下從四個(gè)方面對(duì)《年報(bào)》進(jìn)行深入探討:
1.考試的能力要求及變化,明確考試方向。《年報(bào)》中指出,試卷符合考綱規(guī)定的要求,選擇題考點(diǎn)常規(guī),不偏不怪,緊扣學(xué)科基礎(chǔ)知識(shí),非選擇題對(duì)單質(zhì)、氧化物、酸、堿、鹽的典型性質(zhì)全面涉及,對(duì)物質(zhì)的制備等實(shí)驗(yàn)類(lèi)型全面涉及。考試總體的能力要求沒(méi)有太大的變化,說(shuō)明命題還是比較穩(wěn)定的。隨著時(shí)間的推移,關(guān)于“化學(xué)核心觀念”及試題“聯(lián)系實(shí)際,凸顯應(yīng)用,圖文并茂”等方面能力要求發(fā)生了變化。詳見(jiàn)表2。
從上表可知,試題對(duì)于化學(xué)核心觀念能力要求,從注重到關(guān)注過(guò)渡到全面涉及。也說(shuō)明考試方向從分類(lèi)觀、微粒觀、變化觀、守恒觀等化學(xué)核心觀念要求方面加深過(guò)。
另外試題“聯(lián)系實(shí)際,凸顯應(yīng)用,圖文并茂”,說(shuō)明試題重視與生活、生產(chǎn)實(shí)際相聯(lián)系,體現(xiàn)了化學(xué)離不開(kāi)生活、化學(xué)離不開(kāi)實(shí)驗(yàn),化學(xué)思維離不開(kāi)探究,學(xué)生懂得從各種信息呈現(xiàn)形式中獲取其本質(zhì)意義。因此,復(fù)習(xí)備考過(guò)程中引導(dǎo)學(xué)生加強(qiáng)自學(xué)能力的養(yǎng)成,綜合提高自身化學(xué)學(xué)科素養(yǎng),才能適應(yīng)現(xiàn)中考的要求。這種強(qiáng)調(diào)學(xué)生自學(xué)和閱讀能力的命題特點(diǎn)也是綜合素質(zhì)培養(yǎng)的大勢(shì)所趨。
2.考點(diǎn)的考查規(guī)律及命題變化,明確考試范圍
從試題特點(diǎn)分析可知,考點(diǎn)內(nèi)容的覆蓋考試范圍達(dá)90%以上,題型配置和內(nèi)容比例保持基本穩(wěn)定,考查了九年級(jí)化學(xué)的主體內(nèi)容,考查了主要的、重要的學(xué)科基本觀念和思想方法。近五年試題內(nèi)容、分值分布比例情況分析,詳見(jiàn)表3。
從以上數(shù)據(jù)分析中,我們能準(zhǔn)確地獲知近五年中考題在每個(gè)知識(shí)模塊的分布情況及在總分所占分值比例,化學(xué)學(xué)科基本思想和化學(xué)研究基本方法、常見(jiàn)物質(zhì)和化學(xué)實(shí)驗(yàn)總分所占比例在70%左右,而且這三部分內(nèi)容所點(diǎn)比例基本保持穩(wěn)定。它們是中考備考的重點(diǎn),要立足基礎(chǔ)、兼顧選拔、深挖教材內(nèi)容背后的化學(xué)原理和學(xué)科思想。從常見(jiàn)的物質(zhì)中,發(fā)現(xiàn)近兩年題量顯明增加,分值變化不大,說(shuō)明命題更為細(xì)化,知識(shí)點(diǎn)更深入。另外,近兩年“物質(zhì)的微粒構(gòu)成”的分值較前幾年有所增加,說(shuō)明命題體現(xiàn)學(xué)科的核心觀念。
3.試題呈現(xiàn)方式的變化,明確命題意圖。試題是命題者從不同切入點(diǎn)命題達(dá)到呈現(xiàn)考點(diǎn),通過(guò)研讀比對(duì)近五年試題就可以發(fā)現(xiàn)命題者命題思路,從而為科學(xué)備考做到心中有數(shù)。如以近五年中考中的物質(zhì)的微粒構(gòu)成,詳見(jiàn)表4。
從近五年的試題中分析,物質(zhì)的微粒構(gòu)成是每年必考的知識(shí)點(diǎn)。《大綱》對(duì)于物質(zhì)構(gòu)成的知識(shí)要點(diǎn)進(jìn)行細(xì)化,呈現(xiàn)方式的變化每年略有不同,但還是注重原子結(jié)構(gòu)及其表示方法、化學(xué)式、常見(jiàn)元素化合價(jià)的判斷、物質(zhì)組成的描述、物質(zhì)變化的微觀本質(zhì)。從數(shù)據(jù)分析中,準(zhǔn)確地看到近五年中考知識(shí)要點(diǎn)及各要點(diǎn)所占分值,且近兩年分值有所增加。分子、原子、離子、原子團(tuán)及元素符及化學(xué)式每年必考,通過(guò)對(duì)數(shù)分析發(fā)掘出命題呈現(xiàn)方式發(fā)生了變化。
4.從試題難易比例去分析,明確備考重點(diǎn)。通過(guò)對(duì)每年試題難易數(shù)據(jù)的分析,分析全卷易、中、難試題的比例從而有利于備課制定備考方案,以保持平穩(wěn),重視基礎(chǔ),兼顧選拔,體現(xiàn)水平性考試與選拔作用的命題要求,所以必須面向?qū)W生全體落實(shí)基礎(chǔ)知識(shí)。具體見(jiàn)表5。
從表5中的區(qū)分度和信度數(shù)據(jù)來(lái)看,近五年來(lái)試卷難度、區(qū)分度都較好。從數(shù)據(jù)分析中,備課組發(fā)現(xiàn)選擇題的難度近兩年有所降低,非選擇部分的難度沒(méi)有太大的變化,但容易題有所下降,中等難度題有所提升。因此對(duì)考生來(lái),保分就是要嚴(yán)抓基礎(chǔ),做好化學(xué)學(xué)科基本思想和化學(xué)研究基本方法、常見(jiàn)物質(zhì)和化學(xué)實(shí)驗(yàn)的復(fù)習(xí)。而從這五年較難題上增加了分值,要讓優(yōu)秀學(xué)生從選拔中脫穎而出,較難題拿分是培優(yōu)的突破口。
(三)夯基礎(chǔ),用好教材
從近五年《年報(bào)》分析可知:中考以保持平穩(wěn),重視基礎(chǔ),兼顧選拔。必須面向?qū)W生全體夯實(shí)基礎(chǔ)知識(shí),同時(shí)注重用好教科書(shū),所有知識(shí)均能在教材上找到相應(yīng)的落腳點(diǎn),發(fā)揮教科書(shū)的教學(xué)功能,回歸化學(xué)學(xué)科的教育本質(zhì)。
1.重視基礎(chǔ)。從近五《年報(bào)》均指出,強(qiáng)調(diào)學(xué)科知識(shí)的基礎(chǔ)性和廣泛的實(shí)用性,突出對(duì)化學(xué)學(xué)科思想、基本觀念、學(xué)科研究方法及科學(xué)探究能力的考查。選擇題考點(diǎn)常規(guī),不偏不怪,緊扣學(xué)科基礎(chǔ)知識(shí)。非選擇題對(duì)單質(zhì)、氧化物、酸、堿、鹽的典型性質(zhì)有全面涉及。
2.綱不離本。從近五《年報(bào)》均指出,以課本與指導(dǎo)書(shū)為大綱,堅(jiān)持“不超,不難,不怪”。希望通過(guò)中考題,學(xué)生真切地感受到學(xué)以致用,化學(xué)是一門(mén)讓人熱愛(ài)、讓人思考、讓人創(chuàng)造的一門(mén)自然科學(xué)。用好化學(xué)教科書(shū),發(fā)揮教科書(shū)的教學(xué)功能。
3.命題之源。認(rèn)真研讀中考指導(dǎo)書(shū)對(duì)中考化學(xué)的考試范圍與要求,做到知識(shí)不超綱,所有知識(shí)點(diǎn)均能在教材上找到相應(yīng)的落腳點(diǎn)。教材中的習(xí)題、例題、插圖、圖表、閱讀材料都常用作編題的材料。這樣的試題引導(dǎo)教學(xué)重視教材,落實(shí)基礎(chǔ)。具體詳見(jiàn)表6
二、取得可喜成績(jī)是復(fù)習(xí)備考的成果
學(xué)校經(jīng)過(guò)三年的實(shí)施與踐行,取得不錯(cuò)的教育效果。近三年中考成績(jī)均超番禺區(qū)、廣州市的平均分。具體詳見(jiàn)表7。
通過(guò)備課組深入研究考綱,結(jié)合年報(bào),制定精準(zhǔn)策略,并實(shí)踐踐行,從上表中數(shù)據(jù)可知,近三年我校化學(xué)學(xué)科的中考成績(jī)均超區(qū)平均分3分以上,超廣州市均在8分以上。2016年中考較2015年市、區(qū)再有近1分的提高。
總之,中考化學(xué)高效復(fù)習(xí)課堂教學(xué)的方法多樣化,只要堅(jiān)守“以學(xué)生為本”的教學(xué)理念,在中考化學(xué)總復(fù)習(xí)中,知識(shí)的掌握、能力的提升不可能一蹴而就,必須著眼于知識(shí)、能力和覺(jué)悟三者的有機(jī)統(tǒng)一,立足于教材,關(guān)注熱點(diǎn),掌握科學(xué)有效的方法,進(jìn)而提高能力。要讓學(xué)生從訓(xùn)練中能夠不斷積累應(yīng)考經(jīng)驗(yàn)和技能。
參考文獻(xiàn):
[1]周鑫榮.高三化學(xué)復(fù)習(xí)中提高習(xí)題訓(xùn)練有效性的策略[J].化學(xué)教育,2013,(02).
[2]傅繪景.中考化學(xué)高效復(fù)習(xí)策略[J].新課程,2015,(01).
[3]劉秀娟.巧用數(shù)據(jù)分析指導(dǎo)化學(xué)中考備考[J].新課程,2014,(07).
[4]廣州市教育研究院.2014年廣州市初中畢業(yè)生學(xué)業(yè)考試年報(bào)[M].廣東教育出版社,2015.
[5]廣州市教育研究院.2015年廣州市初中畢業(yè)生學(xué)業(yè)考試年報(bào)[M].廣東教育出版社,2015.
[6]廣州市教育研究院.2016年廣州市初中畢業(yè)生學(xué)業(yè)考試指導(dǎo)書(shū)化學(xué)[M].廣東教育出版社,2015.
Based upon Test under the Outline under Midterm Exams Chemical Refresher the Test Strategy
―For Guangzhou City 2011―2015 Date under Midterm Exams Chemical
CHEN De-quan
(Guangzhou City Panyu Area Shilou Middle School,Guangzhou,Guangdong 511447,China)
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:SCI期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊