前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經(jīng)網(wǎng)絡(luò)語(yǔ)義分割主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:名實(shí)體分類; 神經(jīng)網(wǎng)絡(luò); DBN; 字特征
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-2163(2014)02-
Study on Chinese Named Entity Categorization based on Deep Belief Nets
CHEN Yu, ZHENG Dequan, ZHAO Tiejun
(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)
Abstract: DBN is a classification of fast and global optimum neural network. It contains several layers of unsupervised networks and one layer of supervised network. The paper approves this novelty machine learning approach is suitable to the domain of named entity categorization. The paper applies RBM,an unsupervised learning method, to reconstruct more representative features from character-based features. Subsequently, the paper utilizes BP, a supervised learning method, to fine-tune parameters in whole network and accomplish the categorization task. In the end, the paper tests DBN on ACE 04 Chinese corpus and achieve 91.45% precision, which is much better than Support Vector Machine and Back-propagation neural network.
Key words: Named Entities Categorization; Neural Network; DBN; Character-based Feature
0引 言
傳統(tǒng)的信息抽取任務(wù)包括名實(shí)體抽取、關(guān)系抽取和事件抽取,而名實(shí)體抽取又可分為兩個(gè)子任務(wù):一是識(shí)別消息文本中的名實(shí)體,二是將已識(shí)別的名實(shí)體進(jìn)行分類,本文主要關(guān)注名實(shí)體抽取的第二個(gè)子任務(wù)。名實(shí)體是一個(gè)事物或事物集合的名稱,在消息文本中,往往是信息的主要載體,所以名實(shí)體抽取是信息抽取的基礎(chǔ)任務(wù)。名實(shí)體分類對(duì)名實(shí)體的語(yǔ)義表述具有重要指示意義,是名實(shí)體抽取準(zhǔn)確與否的標(biāo)準(zhǔn)之一。按照Automatic Context Extraction (ACE)大會(huì)的定義,名實(shí)體一般分為人名、地名和機(jī)構(gòu)名等。早期,研究主要聚焦于利用基于模式匹配的方法進(jìn)行名實(shí)體分類,并取得了較高的準(zhǔn)確率。Mcdonald[1]利用名詞的內(nèi)外部信息組成的模式對(duì)名詞進(jìn)行分類,Wacholder[2]則利用對(duì)不同名詞類別進(jìn)行聚類的方式輔助人工撰寫的模式實(shí)現(xiàn)名詞分類。但是上述方法都需要大量人工統(tǒng)計(jì)的模式,而一旦名實(shí)體抽取范圍或者對(duì)象語(yǔ)言變化,即要費(fèi)時(shí)費(fèi)力地修改甚至重寫相應(yīng)的模式。此后,基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法顯示了所具備的強(qiáng)大自學(xué)習(xí)能力,克服了基于模式方法的缺點(diǎn)。同時(shí),支持向量機(jī)和反向傳播神經(jīng)網(wǎng)絡(luò)是傳統(tǒng)的機(jī)器學(xué)習(xí)分類器,可通過(guò)利用足夠大量的實(shí)例進(jìn)行自訓(xùn)練,并用訓(xùn)練好的模型未知實(shí)例進(jìn)行分類。Zhou和Su[3]提取了4種不同的詞性和句法特征表示名詞的語(yǔ)義特征,再用隱馬爾科夫模型進(jìn)行分類,Isozaki[4]利用5-gram結(jié)合3種詞法特征組成特征向量用于支持向量機(jī)訓(xùn)練模型并對(duì)名實(shí)體分類。此外,對(duì)于名詞分類的研究大多只是集中于英文語(yǔ)料,對(duì)中文語(yǔ)料的研究仍相對(duì)較少,其名詞分類的難度要遠(yuǎn)大于英文,主要原因是[5]:
(1詞語(yǔ)之間沒(méi)有明顯的分割標(biāo)志;
(2)漢語(yǔ)中的詞存在更多歧義現(xiàn)象;
(3)漢語(yǔ)詞語(yǔ)由字組合而成,組合的復(fù)雜度高;
(4)漢語(yǔ)的詞法語(yǔ)態(tài)信息不如英語(yǔ)豐富[6]。例如:漢語(yǔ)詞語(yǔ)沒(méi)有時(shí)態(tài)、字母大小寫的特征等。在已有研究中,Jing[7]提出了利用基于字的特征表征名詞信息,結(jié)果表明,基于字的特征結(jié)果要優(yōu)于基于詞的特征,且克服了以上大部分的漢語(yǔ)難點(diǎn)。
本文提出一種基于字特征提取名詞特征向量,并利用Deep Belief Nets(DBN)神經(jīng)網(wǎng)絡(luò)構(gòu)造分類器進(jìn)行名實(shí)體分類的方法。方法中,首先對(duì)直接反映名實(shí)體的字特征向量進(jìn)行特征提取,得到更加復(fù)雜、更具表征能力的特征,再利用有監(jiān)督過(guò)程對(duì)這些特征向量進(jìn)行分類,獲得了較直接對(duì)字特征向量進(jìn)行分類更好的效果。實(shí)驗(yàn)結(jié)果表明,DBN方法分類效果明顯優(yōu)于其他傳統(tǒng)的機(jī)器學(xué)習(xí)算法。
1 Deep Belief Nets 神經(jīng)網(wǎng)絡(luò)的介紹
DBN神經(jīng)網(wǎng)絡(luò)是一種全局最優(yōu)的快速神經(jīng)網(wǎng)絡(luò)分類方法,由若干層RBM網(wǎng)絡(luò)(Restricted Boltzmann machine)和一層反向傳遞網(wǎng)絡(luò)(Back-Propagation,簡(jiǎn)稱BP網(wǎng)絡(luò))組成,因而是一種多層神經(jīng)網(wǎng)絡(luò)[8]。DBN結(jié)合了無(wú)監(jiān)督學(xué)習(xí)方法的特征提取能力和有監(jiān)督學(xué)習(xí)方法的分類能力。總體來(lái)說(shuō),DBN具有以下如下幾點(diǎn)優(yōu)勢(shì):
(1)無(wú)監(jiān)督的RBM方法提取輸入特征向量的結(jié)構(gòu)化信息,組成表征能力更好的特征向量;
(2)有監(jiān)督的BP方法將錯(cuò)誤信息反向傳播到整個(gè)網(wǎng)絡(luò)以修改網(wǎng)絡(luò)的參數(shù),使特征向量映射到其他空間時(shí)更為準(zhǔn)確;
(3)DBN的多層網(wǎng)絡(luò)結(jié)構(gòu)能夠自我弱化學(xué)習(xí)過(guò)程中產(chǎn)生的錯(cuò)誤信息,并對(duì)特征向量在各個(gè)相異空間的重要特征信息實(shí)行優(yōu)化組合,使無(wú)監(jiān)督過(guò)程產(chǎn)生的信息更加結(jié)構(gòu)化;
(4)DBN是一個(gè)快速的學(xué)習(xí)算法,RBM將整個(gè)網(wǎng)絡(luò)的參數(shù)快速定位到最優(yōu)參數(shù)的鄰域,與傳統(tǒng)的BP算法相比,收斂速度更快。
DBN的結(jié)構(gòu)如圖1所示,在訓(xùn)練模型的過(guò)程中主要可分為兩步。第一步,分別單獨(dú)、且無(wú)監(jiān)督地訓(xùn)練每一層RBM,確保特征向量映射到不同特征空間時(shí),可最多地保留特征信息。RBM網(wǎng)絡(luò)只能確保層內(nèi)的權(quán)值對(duì)該層特征向量映射達(dá)到最優(yōu),而非對(duì)整個(gè)DBN的特征向量映射均能達(dá)到最優(yōu)。第二步,利用反向傳播網(wǎng)絡(luò)有監(jiān)督地微調(diào)整個(gè)DBN網(wǎng)絡(luò),克服RBM僅能保證層間參數(shù)只對(duì)該層最優(yōu)化的弊端,并對(duì)特征向量進(jìn)行分類。RBM訓(xùn)練模型的過(guò)程可以看作是初始化BP的權(quán)值參數(shù),使DBN方法克服了傳統(tǒng)反向傳播神經(jīng)網(wǎng)絡(luò)容易陷入局部最優(yōu)和訓(xùn)練時(shí)間長(zhǎng)的缺點(diǎn)。
圖1 DBN結(jié)構(gòu)圖
Fig.1 The structure of a DBN
DBN方法是一種多層神經(jīng)網(wǎng)絡(luò),底層的神經(jīng)網(wǎng)絡(luò)接收直接表示(多數(shù)為二元值)的特征向量值,在自底向上的傳遞過(guò)程中,從具體的特征向量逐漸轉(zhuǎn)化為抽象的特征向量,在頂層的神經(jīng)網(wǎng)絡(luò)形成更易于分類的組合特征向量,增加網(wǎng)絡(luò)層數(shù)能夠?qū)⑻卣飨蛄扛映橄蠡6遥m然RBM確保訓(xùn)練后的層內(nèi)參數(shù)對(duì)特征向量映射達(dá)到最優(yōu),但是不能完全消除映射過(guò)程中產(chǎn)生的錯(cuò)誤和不重要的特征信息。尤其是,多層神經(jīng)網(wǎng)絡(luò)的每一層網(wǎng)絡(luò)均會(huì)弱化上一層網(wǎng)絡(luò)產(chǎn)生的錯(cuò)誤特征信息和次要特征信息,因此多層網(wǎng)絡(luò)較單層網(wǎng)絡(luò)精確度更高。在名實(shí)體分類問(wèn)題中,基于特征方法的一個(gè)重要特性是特征向量的稀疏問(wèn)題,DBN方法對(duì)特征的提取與結(jié)構(gòu)化對(duì)稀疏特征向量具有很好的辨別能力,能很好地解決這類問(wèn)題[9,10]。
2 特征選取
基于字的特征非常適用于中文信息抽取領(lǐng)域,因其避免了漢語(yǔ)詞語(yǔ)沒(méi)有邊界信息等的缺點(diǎn),將字與字如何組合成詞語(yǔ),交由機(jī)器學(xué)習(xí)模型去決定。例如:“老”與“李”組合成“老李”,并被分類為人名;“老”與“撾”組合成“老撾”,并被分類為國(guó)家。即使是在小規(guī)模的語(yǔ)料中,這種組合方式是極其復(fù)雜的,表示名詞的特征向量的維數(shù)高。本文將語(yǔ)料中名詞出現(xiàn)的字組成字典 ,將每一個(gè)名詞e的基于字的特征向量表示為 ,特征向量與字典具有相同的維數(shù),其中 的值滿足等式(1),可具體表示為:
(1)
除了基于字的特征外,本文也加入了ACE語(yǔ)料里標(biāo)注的名實(shí)體的指稱信息作為特征。名實(shí)體的指稱分三類,分別是命名性指稱、名詞性指稱和代詞性指稱。最后,本文將名詞的基于字特征和指稱信息特征結(jié)合,作為名實(shí)體的特征向量。雖然名實(shí)體還有其他詞法及句法特征,但是本文重在驗(yàn)證DBN方法在自然語(yǔ)言處理領(lǐng)域的適用性,故未涉及更多特征信息。
3 實(shí)驗(yàn)與分析
本文選用ACE 04的語(yǔ)料作為測(cè)試數(shù)據(jù),按照語(yǔ)料標(biāo)注說(shuō)明,名實(shí)體可分為五類,每一個(gè)名詞屬于且只屬于一類,分別為人名(Person)、組織機(jī)構(gòu)名(Organization)、行政區(qū)名(Geo-political entity)、地名(Location)和設(shè)施名(Facility)。對(duì)名實(shí)體分類,即是對(duì)名實(shí)體指代進(jìn)行分類。名實(shí)體指代是名實(shí)體在文檔中的表述,每一個(gè)名實(shí)體指代包含主體(head)和擴(kuò)展(extent)兩部分,指代主體包含名實(shí)體主要信息。雖然指代的擴(kuò)展部分能提供更多信息,但是也擴(kuò)大了字符字典的規(guī)模,帶來(lái)噪音。相關(guān)文獻(xiàn)證明,只利用指代的主體部分的效果優(yōu)于結(jié)合擴(kuò)展部分[9]。
本文從語(yǔ)料中提取出10 228個(gè)名實(shí)體指代,利用4折交叉驗(yàn)證法訓(xùn)練模型,也就是說(shuō),7 746個(gè)指代作為訓(xùn)練語(yǔ)料用于訓(xùn)練模型,2 482個(gè)指代作為測(cè)試語(yǔ)料用于測(cè)試模型,其分布如表1所示。字符字典的維數(shù)為1 185,測(cè)試語(yǔ)料在本文中使用了準(zhǔn)確率評(píng)價(jià)模型,由于本文的實(shí)驗(yàn)是對(duì)已識(shí)別的名實(shí)體分類,其召回率等于準(zhǔn)確率。
本文共進(jìn)行了三組不同的實(shí)驗(yàn),第一組實(shí)驗(yàn)用于驗(yàn)證DBN分類器的效果,第二組實(shí)驗(yàn)用于驗(yàn)證RBM的層數(shù)對(duì)DBN提取特征的作用,第三組實(shí)驗(yàn)用于比較層內(nèi)節(jié)點(diǎn)數(shù)對(duì)DBN網(wǎng)絡(luò)效果的影響。
在第一組實(shí)驗(yàn)中,本文將DBN、SVM和傳統(tǒng)的反向傳播算法的名實(shí)體分類效果進(jìn)行了比較,其中,DBN的網(wǎng)絡(luò)結(jié)構(gòu)是3層RBM加一層反向傳播網(wǎng)絡(luò),進(jìn)行了多組實(shí)驗(yàn),選取最好的DBN模型結(jié)構(gòu),每層RBM的節(jié)點(diǎn)數(shù)由下至上依次為900,600,300;SVM利用的是線性核函數(shù),懲罰系數(shù)為1,其余參數(shù)為默認(rèn)值,這種結(jié)構(gòu)的SVM分類效果也是比其他結(jié)構(gòu)的SVM更優(yōu);反向傳播算法的網(wǎng)絡(luò)結(jié)構(gòu)與DBN相同,利于與DBN的結(jié)果相比較,結(jié)果如表2所示。實(shí)驗(yàn)證明,DBN的效果較其他兩種模型具有明顯的提高,說(shuō)明DBN能從基于字特征向量中對(duì)字與字之間的關(guān)系進(jìn)行正確的組合與識(shí)別,提取出更具代表性的特征用于分類。
在第二組實(shí)驗(yàn)中,本文比較了一層、兩層和三層RBM的效果,一層RBM層內(nèi)節(jié)點(diǎn)為900,兩層RBM層內(nèi)節(jié)點(diǎn)分別為900和600,三層RBM的層內(nèi)節(jié)點(diǎn)分別為900,600和300,結(jié)果如表3所示[10]。實(shí)驗(yàn)結(jié)果證明,隨著層數(shù)的增加效果越來(lái)越好,說(shuō)明更多的層數(shù)能夠提取出更多準(zhǔn)確的特征。另一方面,三層RBM比兩層RBM的效果提高不明顯,說(shuō)明兩層RBM對(duì)于名實(shí)體分類已經(jīng)提取足夠的分類特征,Hinton[8]也在其相關(guān)研究中指出,三層RBM網(wǎng)絡(luò)已經(jīng)能提取足夠的特征用于分類。
在第三組實(shí)驗(yàn)中,本文利用一層RBM網(wǎng)絡(luò)結(jié)合BP的模型,改變RBM層內(nèi)節(jié)點(diǎn)數(shù),結(jié)果如表4所示。實(shí)驗(yàn)結(jié)果表明,第一層RBM層內(nèi)節(jié)點(diǎn)數(shù)為900的分類器效果最好,因?yàn)?00接近輸入特征向量的維數(shù),說(shuō)明神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)應(yīng)對(duì)輸入特征向量降維,且不宜下降過(guò)快,導(dǎo)致震蕩和難以收斂,并且,只包含一層RBM的DBN的效果依然優(yōu)于SVM和反向傳播算法。
本文最后觀察了每一個(gè)類別的分類效果,并用準(zhǔn)確率,召回率和F系數(shù)去衡量,結(jié)果如表5所示。結(jié)果表明,人名、行政區(qū)名和組織結(jié)構(gòu)名的效果最好,因?yàn)檎Z(yǔ)料中這三個(gè)類別的實(shí)例比例較大,地名和設(shè)施名的效果較差,因?yàn)檎Z(yǔ)料中這兩個(gè)類別的實(shí)例比例較小,每一類別的分類的效果與此類別的實(shí)例在語(yǔ)料中比例成正比。
4 結(jié)論及將來(lái)的工作
DBN對(duì)于名實(shí)體分類是一種全新的機(jī)器學(xué)習(xí)算法,對(duì)高維特征向量具有很強(qiáng)的提取特征和進(jìn)行特征分類能力。本文將基于字特征和指稱特征作為表述名實(shí)體指代的特征向量,并用DBN對(duì)其進(jìn)行分類,實(shí)驗(yàn)結(jié)果表明,DBN的分類效果要明顯好于SVM和反向傳播算法,是一種在信息抽取領(lǐng)域具有良好實(shí)用性的優(yōu)秀算法。將來(lái)的工作擬在以下幾個(gè)方面展開:(1) 將本文提出的方法在其它數(shù)據(jù)集上測(cè)試,以進(jìn)一步驗(yàn)證方法的有效性;(2) 將該方法應(yīng)用于關(guān)系識(shí)別方面;(3) 利用該方法多任務(wù)地進(jìn)行名實(shí)體抽取與關(guān)系抽取。
參考文獻(xiàn):
[1] MACDONALD D. Internal and external evidence in the identification and semantic categorization of proper names[M]. Corpus Processing for Lexical Acquisition, MIT Press. 1993:61-76.
[2] WACHOLDER N, RAVIN Y, CHOI M. Disambiguation of proper names in text[C]// Proceedings of the Fifth Conference on Applied Natural Language Processing,1997.
[3] ZHOU GuoDong, SU Jian. Named entity recognition using an hmm-based chunk tagger[C]//proceedings of ACL,2002:473-480.
[4] ISOZAKI H, KAZAWA H. Efficient support vector classifiers for named entity recognition[C]//proceedings of IJCNLP,2002:1-7.
[5] ZHAO Jian, WANG Xiaolong, GUAN Yi. Comparing features combination with features fusion in Chinese named entity recognition[J]. Computer Applications. 2005, 25(11).
[6] ZHAO Jun. A survey on named entity recognition, disambiguation and cross-lingual coreferences resolution. Journal of Chinese Information Processing[J]. 2009, 23(2).
[7] JING Hongyan, FLORIAN R, LUO Xiaoqiang, et al. How to get a Chinese name (entity): Segmentation and combination issues[C]//proceedings of EMNLP. 2003:200-207.
[8] HINTON G, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets[J]. Neural Computation. 2006,18:15271554.
關(guān)鍵詞:軟計(jì)算;認(rèn)知;認(rèn)知模型;語(yǔ)境
中圖分類號(hào):B0 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1002-2589(2017)03-0083-02
軟計(jì)算是指對(duì)于研究對(duì)象只求近似而非精確解釋的有效計(jì)算方法,是一種包含多種不同算法的計(jì)算方法集,如模糊邏輯、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)等。軟計(jì)算的認(rèn)識(shí)模型構(gòu)架,簡(jiǎn)單來(lái)說(shuō),就是軟計(jì)算及其理論構(gòu)建中所表現(xiàn)出的對(duì)于認(rèn)知以及認(rèn)知發(fā)生過(guò)程的組織結(jié)構(gòu)和表征模式的宏觀理解。軟計(jì)算是與傳統(tǒng)的硬計(jì)算不同的新型計(jì)算方法,傳統(tǒng)的硬計(jì)算要求計(jì)算的精確性、確定性,而軟計(jì)算則允許了不精確以及不確定的存在;軟計(jì)算與硬計(jì)算的這種差異,從根本上來(lái)講,是由于它們是基于不同的認(rèn)知模型構(gòu)建的。在傳統(tǒng)的硬計(jì)算理論中,認(rèn)知的本質(zhì)就是“符號(hào)+規(guī)則”,認(rèn)知過(guò)程就是符號(hào)串按照一定規(guī)則變換的過(guò)程。而在軟計(jì)算理論中,認(rèn)知是依賴于語(yǔ)境的,認(rèn)知具有具身性、生成性、延展性和嵌入性,認(rèn)知在功能上是模塊化的,在發(fā)生上是動(dòng)態(tài)適應(yīng)的,在總體上看來(lái)是語(yǔ)境性的。
一、軟計(jì)算的靜態(tài)認(rèn)知模型構(gòu)架
在軟計(jì)算理論系統(tǒng)內(nèi),認(rèn)知不再是一個(gè)嚴(yán)密和精確的邏輯符號(hào)系統(tǒng)或邏輯運(yùn)算過(guò)程,而是一個(gè)由不同的功能模塊構(gòu)成的集成系統(tǒng)。總體來(lái)看,認(rèn)知系統(tǒng)應(yīng)該被分為具有范圍非特異性的“中樞系統(tǒng)”和具有范圍特異性的“輸入系統(tǒng)”。范圍非特異的“中樞系統(tǒng)”的典型功能就是通過(guò)范圍非特異性的認(rèn)知系統(tǒng)來(lái)固化信念,形成新的認(rèn)知模塊,它負(fù)責(zé)陌生的語(yǔ)境處理。范圍特異性的“輸入系統(tǒng)”是由不同的子功能模塊構(gòu)成,它負(fù)責(zé)熟悉的語(yǔ)境處理,不同的功能模塊負(fù)責(zé)不同的語(yǔ)境,不同的功能模塊之間有一定的封閉性。
認(rèn)知“中樞系統(tǒng)”主要功能在于適應(yīng)陌生的語(yǔ)境,解決淺層輸入系統(tǒng)無(wú)法處理的問(wèn)題,并在新的語(yǔ)境適應(yīng)過(guò)程中形成專門處理這一問(wèn)題或這一類問(wèn)題的新算法。認(rèn)知中樞系統(tǒng)的一個(gè)重要特征是容錯(cuò)性,認(rèn)知中樞系統(tǒng)不會(huì)因?yàn)橐淮畏答伒氖《K止或崩潰,中樞系統(tǒng)通過(guò)分析由輸入系統(tǒng)傳遞來(lái)的問(wèn)題或信息,不斷提出問(wèn)題的解決方案,直至問(wèn)題解決或問(wèn)題不需要解決為止。認(rèn)知中樞系統(tǒng)的另一個(gè)重要特征是非范圍特異性,這主要表現(xiàn)在兩個(gè)方面:其一,中樞系統(tǒng)會(huì)接受來(lái)自輸入系統(tǒng)各個(gè)不同模塊傳遞來(lái)的信息,它與輸入系統(tǒng)之間不存在絕對(duì)界限;其二,中樞系統(tǒng)是以解決問(wèn)題為導(dǎo)向,認(rèn)知中樞系統(tǒng)不會(huì)拘泥于某一種反應(yīng)模式或邏輯系統(tǒng),它會(huì)根據(jù)具體問(wèn)題提出不同解決方案,而這些方案也許是“輸入系統(tǒng)”某些模塊的組合和重構(gòu),或者是與這些功能模塊完全不同的全新算法。人工神經(jīng)網(wǎng)絡(luò)就是一種類似于“認(rèn)知中樞系統(tǒng)”的軟計(jì)算方法,它是一個(gè)非線性的并行的、分布處理結(jié)構(gòu),具有極好的可塑性和自組織性。這就意味著,它能夠接受和處理模糊的、隨機(jī)的、陌生的問(wèn)題,并形成能夠處理某一問(wèn)題的固化的神經(jīng)網(wǎng)絡(luò)。
“認(rèn)知輸入系統(tǒng)”的主要功能在于處理熟悉語(yǔ)境,是認(rèn)知的初級(jí)層次,它能夠?qū)σ恍┮呀?jīng)熟悉的問(wèn)題做出恰當(dāng)?shù)姆答仯罢J(rèn)知輸入系統(tǒng)”包含有許多的子系統(tǒng),如知覺(jué)系統(tǒng)、邏輯系統(tǒng)、語(yǔ)言系統(tǒng)、運(yùn)動(dòng)系統(tǒng)等。輸入系統(tǒng)的其中一個(gè)特征是范圍特異性,它的子系統(tǒng)各自處理不同的問(wèn)題,彼此之間幾乎不存在聯(lián)系。與中樞系統(tǒng)不同,輸入系統(tǒng)對(duì)于問(wèn)題的處理是被動(dòng)而快速的,一個(gè)算法就是一個(gè)功能模塊,語(yǔ)言系統(tǒng)專門處理語(yǔ)言問(wèn)題,識(shí)別系統(tǒng)專門處理模式識(shí)別,就如同人的條件反射一樣。而在軟計(jì)算理論中,許多的算法也具有范圍特異性,不同的算法適用于不同的問(wèn)題域;如遺傳算法主要用來(lái)解決搜索問(wèn)題,人工神經(jīng)網(wǎng)絡(luò)用來(lái)處理模式分類問(wèn)題,模糊邏輯主要用來(lái)處理不精確的概念和模糊事件。
總體而言,軟計(jì)算不是一個(gè)已經(jīng)定型或固化的算法系統(tǒng),而是一個(gè)不斷發(fā)展的算法,基于軟計(jì)算思維可以構(gòu)造各種各樣的算法,如蟻群算法、模擬退火算法、混沌理論等;而構(gòu)成軟計(jì)算的各種具體的算法又有自身的局限性,只能處理特定的問(wèn)題。因而我們可以說(shuō),軟計(jì)算理論體現(xiàn)出了“中樞系統(tǒng)+輸入系統(tǒng)”式的靜態(tài)認(rèn)知模型構(gòu)架方式。
二、軟計(jì)算的動(dòng)態(tài)認(rèn)知模型構(gòu)架
軟計(jì)算以模糊的自然語(yǔ)言表達(dá)代替精確的人工符號(hào)表達(dá),不去試圖構(gòu)造某種絕對(duì)嚴(yán)密精確的、完美的形式邏輯系統(tǒng),而是以問(wèn)題解決為導(dǎo)向,以更為靈活的方式和貼近實(shí)際的方式解決問(wèn)題,因而它不是一種純粹的造算法,它更像是一種生成算法,一種與具體語(yǔ)境共生的算法。傳統(tǒng)的硬計(jì)算在解決問(wèn)題時(shí),總是試圖從純粹的數(shù)學(xué)關(guān)系出發(fā),構(gòu)造出關(guān)于問(wèn)題的數(shù)學(xué)模型(確定變量、常量以及它們之間函數(shù)關(guān)系)。然而,在現(xiàn)實(shí)世界中許多問(wèn)題的數(shù)學(xué)模型很難構(gòu)建或無(wú)法構(gòu)建。因?yàn)椋澜绫旧硎莿?dòng)態(tài)的、非線性、復(fù)雜的、不確定的,而傳統(tǒng)的硬計(jì)算則要求計(jì)算是嚴(yán)密的、精確的,二者之間存在著諸多不相容之處。
而在軟計(jì)算理論系統(tǒng)內(nèi),認(rèn)知不再是封閉和靜態(tài)的符號(hào)推演,而是基于語(yǔ)境的智能適應(yīng),也就是一個(gè)動(dòng)態(tài)的進(jìn)化發(fā)展過(guò)程。首先,認(rèn)知不是某種先驗(yàn)的邏輯系統(tǒng)或絕對(duì)理念,而是后天的語(yǔ)境反應(yīng)。軟計(jì)算方法的構(gòu)造都不是憑空捏造或先天就存在于人腦中的,而是根據(jù)具體問(wèn)題而提出的。如模糊邏輯,它的產(chǎn)生是由于在我們的世界中總是存在著許多無(wú)法解釋、預(yù)測(cè)、確定的事物或事件,對(duì)于這些事物或事件的研究和分析我們無(wú)法依靠精確的邏輯分析,對(duì)于它們的研究我們需要借助于模糊集以及模糊邏輯。通過(guò)模糊邏輯,我們可以處理原來(lái)二值邏輯無(wú)法處理的模糊概念和模糊關(guān)系等模糊現(xiàn)象,比如“年輕與年老”“小魚還是大魚”“相像關(guān)系”。其次,認(rèn)知是一個(gè)動(dòng)態(tài)發(fā)展的系統(tǒng),而非靜態(tài)封閉的。因?yàn)檎J(rèn)知總是與語(yǔ)境相聯(lián)系的,而語(yǔ)境總是在不斷變化的,所以認(rèn)知也是不斷變化發(fā)展的。在應(yīng)用軟計(jì)算方法解決具體問(wèn)題時(shí),問(wèn)題不會(huì)在一次計(jì)算過(guò)程中就被一勞永逸地解決;相反,問(wèn)題的解決是計(jì)算方法與問(wèn)題產(chǎn)生的具體語(yǔ)境不斷接近和契合的調(diào)整過(guò)程。以遺傳算法為例,它是模擬生物優(yōu)勝劣汰的進(jìn)化過(guò)程而構(gòu)造的一種算法,遺傳算法包括幾個(gè)必要的運(yùn)算過(guò)程:選擇運(yùn)算、交叉運(yùn)算、變異運(yùn)算。在遺傳算法中,通過(guò)編碼組成初始群體后,遺傳操作的任務(wù)就是對(duì)群體中的個(gè)體按照它們對(duì)環(huán)境適應(yīng)度(適應(yīng)度評(píng)估)施加一定的操作(選擇、交叉、變異),從而實(shí)現(xiàn)優(yōu)勝劣汰的進(jìn)化過(guò)程,在沒(méi)有達(dá)到適應(yīng)度要求時(shí),遺傳操作是不能終止的,它要不斷進(jìn)行交叉、變異運(yùn)算,直至找到最優(yōu)運(yùn)算才能終止。
簡(jiǎn)而言之,軟計(jì)算具有很好的適應(yīng)性和可塑性,在處理問(wèn)題時(shí)有較好的靈活性。這是因?yàn)樵谲浻?jì)算思維理念中,認(rèn)知從來(lái)都不是一個(gè)封閉的靜態(tài)系統(tǒng),而是一個(gè)開放的動(dòng)態(tài)適應(yīng)系統(tǒng),即“語(yǔ)境刺激―認(rèn)知適應(yīng)”系統(tǒng)。認(rèn)知是基于語(yǔ)境的,認(rèn)知的發(fā)展與語(yǔ)境的變化相輔相成,二者不可分割。
三、軟計(jì)算的語(yǔ)境模型構(gòu)架
在傳統(tǒng)的一元論或二元論影響下,人們往往把認(rèn)知看作是某種孤立的、絕對(duì)的東西,比如“理念”或“規(guī)則”等,將認(rèn)知與其具體的語(yǔ)境割裂開來(lái),無(wú)視具體的環(huán)境或具體的認(rèn)知主體在認(rèn)知過(guò)程中的作用和意義。傳統(tǒng)的硬計(jì)算受此影響,將認(rèn)知?dú)w于二值邏輯運(yùn)算,把計(jì)算從語(yǔ)境中孤立出來(lái)。因此,傳統(tǒng)的計(jì)算思維在面對(duì)許多動(dòng)態(tài)的、模糊的、不確定的問(wèn)題時(shí)變得束手無(wú)策、漏洞百出。軟計(jì)算理論對(duì)此做出了深刻反思,它將認(rèn)知的客體、認(rèn)知的主體、認(rèn)知的結(jié)果統(tǒng)一于語(yǔ)境,認(rèn)為認(rèn)知是身體―心智―世界構(gòu)成的動(dòng)力耦合系統(tǒng)。
首先,認(rèn)知的發(fā)生離不開認(rèn)知主體的參與,也就是說(shuō)認(rèn)知的發(fā)生應(yīng)該有必要的載體否則就是不可能的,比如在人的認(rèn)知活動(dòng)中,我們的大腦和身體的其他部分都是這個(gè)過(guò)程不可或缺的組成部分,沒(méi)有身體和大腦的參與認(rèn)知不可能發(fā)生。人工神經(jīng)網(wǎng)絡(luò)是模擬人腦生物神經(jīng)系統(tǒng)結(jié)構(gòu)和運(yùn)行機(jī)制而構(gòu)造的一種軟計(jì)算方法,與人腦相似的物質(zhì)系統(tǒng)是人工神經(jīng)網(wǎng)絡(luò)算法運(yùn)行必不可少的運(yùn)行單元。其次,認(rèn)知的發(fā)生具有情境性,我們的認(rèn)知總是基于一定的情景,并且只有在一定的情境中才能得到解釋和說(shuō)明。比如,在模糊集合中我們需要構(gòu)造隸屬度函數(shù),這里的隸屬度函數(shù)的取值取決于不同的情境,而隸屬度函數(shù)本身就是一個(gè)語(yǔ)境,它是一個(gè)模糊集合適用的范圍。另外,認(rèn)知是身體―心智―世界三者構(gòu)成的動(dòng)力耦合系統(tǒng),因而三者之間并不是絕對(duì)同一的,所以它們之間的信息傳遞必然存在著不完整、不精確、不確定。這也正是軟計(jì)算為什么允許模糊性、不精確性、不確定性存在的原因。
總之,在軟計(jì)算理論中,認(rèn)知是語(yǔ)境性的,它是由身體―心智―世界構(gòu)成的一個(gè)動(dòng)力耦合系統(tǒng),也就是由“語(yǔ)用反應(yīng)”“語(yǔ)形約定”和“語(yǔ)義反饋”三個(gè)語(yǔ)境維度構(gòu)成的一個(gè)動(dòng)態(tài)系統(tǒng)。這在認(rèn)知活動(dòng)中,體現(xiàn)為認(rèn)知主體、認(rèn)知客體與認(rèn)知結(jié)果之間的相互關(guān)系。其中,語(yǔ)用語(yǔ)境就是指客觀的認(rèn)知對(duì)象與認(rèn)知主體之間的相互聯(lián)系,如身體對(duì)于世界的感知反應(yīng),即認(rèn)知的語(yǔ)用反應(yīng)過(guò)程,語(yǔ)用語(yǔ)境是整個(gè)認(rèn)知發(fā)生的基礎(chǔ),這一過(guò)程就類似于軟計(jì)算方法提出的問(wèn)題語(yǔ)境;語(yǔ)形語(yǔ)境指認(rèn)知主體的直觀反應(yīng)與知識(shí)系統(tǒng)之間的聯(lián)系,在語(yǔ)形語(yǔ)境中,主體的直觀反應(yīng)被抽象為規(guī)范的知識(shí),即語(yǔ)形規(guī)范過(guò)程,語(yǔ)形語(yǔ)境是認(rèn)知的核心部分,這與軟計(jì)算方法的構(gòu)造過(guò)程是相似的;語(yǔ)義語(yǔ)境指的是認(rèn)知主體對(duì)于客觀的認(rèn)知對(duì)象的反饋,這也就是軟計(jì)算方法的具體運(yùn)用過(guò)程,它的完成標(biāo)志著一個(gè)認(rèn)知過(guò)程的實(shí)現(xiàn)。
總結(jié),縱觀軟計(jì)算理論的具體內(nèi)涵和算法特征,我們可以發(fā)現(xiàn):軟計(jì)算從根本上重構(gòu)了人們對(duì)于認(rèn)知的看法。在軟件理論思S中,認(rèn)知首先是語(yǔ)境的,認(rèn)知發(fā)生于語(yǔ)境且依賴于語(yǔ)境,沒(méi)有語(yǔ)境就沒(méi)有認(rèn)知;其次認(rèn)知具有模塊性,我們可以將認(rèn)知?jiǎng)澐譃椴煌墓δ苣K(中樞系統(tǒng)和輸入系統(tǒng)),不同的功能模塊各有其特征,試圖將認(rèn)知統(tǒng)一于規(guī)則或程序是徒勞的,這種嘗試往往是不可能成功的;最后認(rèn)知是一個(gè)開放的智能適應(yīng)系統(tǒng),而不是封閉的靜態(tài)系統(tǒng)。總而言之,軟計(jì)算不單單是計(jì)算方法上的一種革新,它更是認(rèn)知思想上的一次變革。深入理解軟計(jì)算的認(rèn)知模型構(gòu)架,不僅有利于我們更好地認(rèn)識(shí)軟計(jì)算的理論內(nèi)涵,也有利于軟計(jì)算自身的發(fā)展。
參考文獻(xiàn):
[1]劉曉力.哥德?tīng)枌?duì)心―腦―計(jì)算機(jī)問(wèn)題的解[J].自然辯證法研究,1999(11).
[2]王大將,王敏.軟計(jì)算融合技術(shù)研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2012(4).
[3]J?A?福多.心理模塊性[M].上海:華東師范大學(xué)出版社,2001.
摘 要:基于視覺(jué)的人體運(yùn)動(dòng)分析是計(jì)算機(jī)領(lǐng)域中備受關(guān)注的前沿方向之一,而人行為理解由于在智能監(jiān)控、人機(jī)交互、虛擬現(xiàn)實(shí)和基于內(nèi)容的視頻檢索等方面有著廣泛的應(yīng)用前景更是成為了未來(lái)研究的前瞻性方向之一。行為理解問(wèn)題一般遵從如下基本過(guò)程:特征提取與運(yùn)動(dòng)表征;行為識(shí)別;高層行為與場(chǎng)景理解。著重從這三個(gè)方面逐一回顧了近年來(lái)人行為理解研究的發(fā)展現(xiàn)狀和常用方法,并對(duì)當(dāng)前該研究方向上亟待解決的問(wèn)題和未來(lái)趨勢(shì)作了較為詳細(xì)的分析。
關(guān)鍵詞:特征選擇;運(yùn)動(dòng)表征;行為識(shí)別;高層行為與場(chǎng)景理解
Abstract:Human movement analysis from video sequences is an active research area in computer vision and human motion understanding is a future direction of prospective study as it has many potential application domains such as smart surveillance, human computer interface, virtual reality contendbased video indexing, etc. Human action understanding is generally pidedintothreefundamental subprocesses:feature extraction and motion representation,activity recognition and higher level activity and scene understanding.This paper analyzed the state of the art in human action understanding in detail from three fundamental processes. At the end,provided and analyzed some detailed discussions on vital problems and future directions in human action understanding.
Key words:feature extraction;motion representation;activity recognition;high level activity and scene understanding
0 引言
近年來(lái),人運(yùn)動(dòng)視覺(jué)分析由于在智能監(jiān)控[1]、高級(jí)人機(jī)交互[2]、虛擬現(xiàn)實(shí)[3]和基于內(nèi)容的視頻檢索與解說(shuō)[4,5]等方面有著廣泛的應(yīng)用前景和潛在的經(jīng)濟(jì)價(jià)值,激發(fā)了廣大科研工作者及相關(guān)商家的濃厚興趣,并成為了計(jì)算機(jī)領(lǐng)域中備受關(guān)注的前沿方向之一。目前,在世界范圍內(nèi)已經(jīng)開展了大量的視覺(jué)分析研究項(xiàng)目。例如1997年美國(guó)國(guó)防高級(jí)研究項(xiàng)目署(Defense Advanced Research Projects Agency,DARPA)設(shè)立了視覺(jué)監(jiān)控重大項(xiàng)目VSAM(visual surveillance and monitoring)[6],主要研究用于戰(zhàn)場(chǎng)及普通民用場(chǎng)景監(jiān)控的自動(dòng)視頻理解技術(shù);實(shí)時(shí)視覺(jué)監(jiān)控系統(tǒng)W4[7]不僅能夠定位和分割出人的身體部分以及實(shí)現(xiàn)多人跟蹤,而且能檢測(cè)人是否攜帶物體等簡(jiǎn)單行為;1999年歐盟Framework5程序委員會(huì)設(shè)立重大項(xiàng)目ADVISOR系統(tǒng)[8],旨在開發(fā)一個(gè)公共交通(如地鐵、機(jī)場(chǎng))的安全管理系統(tǒng),它覆蓋了人群和個(gè)人的行為模式分析、人機(jī)交互等研究;2000年,DARPA又資助了HID(human identification at a distance)計(jì)劃[9],其任務(wù)是開發(fā)多模式監(jiān)控技術(shù)以實(shí)現(xiàn)遠(yuǎn)距離情況下人的檢測(cè)、分類和識(shí)別,從而增強(qiáng)國(guó)防、民用等場(chǎng)所抵御恐怖襲擊的能力;英國(guó)雷丁大學(xué)(University of Reading)[10]先后開展了REASON(robust methods for monitoring and understanding people in public spaces)、ETISE(evaluation of video scene understanding)、ISCAPS(integrated surveillance of crowded areas for public security)等項(xiàng)目以研究基于視覺(jué)的單人行為以及人與人之間的交互行為識(shí)別和場(chǎng)景理解等;此外還有能夠?qū)θ诉M(jìn)行跟蹤與行為理解的實(shí)時(shí)系統(tǒng)Pfinder(person finder)[11],由歐盟和奧地利科學(xué)基金會(huì)共同資助的大型視頻監(jiān)控技術(shù)研究項(xiàng)目AVITRACK(aircraft surroundings, categorized vehicles & inpiduals tracking for apron’s activity model interpretation & check)[12]等。國(guó)內(nèi)在該領(lǐng)域的研究起步相對(duì)要晚,但也有許多大學(xué)和研究機(jī)構(gòu)如中國(guó)科學(xué)院自動(dòng)化所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室[13]、亞洲微軟研究院[14]、北京大學(xué)視覺(jué)與聽(tīng)覺(jué)信息處理國(guó)家重點(diǎn)實(shí)驗(yàn)室[15]以及清華大學(xué)等對(duì)人視覺(jué)分析關(guān)鍵技術(shù)進(jìn)行了深入的研究。在學(xué)術(shù)方面,一些國(guó)際權(quán)威期刊如PAMI、IP、IJCV、CVIU、IVC和重要的學(xué)術(shù)會(huì)議如CVPR、ICCV和ICPR等將智能化視頻監(jiān)控技術(shù)研究,尤其是人運(yùn)動(dòng)視覺(jué)分析作為主題內(nèi)容之一。這些期刊為該領(lǐng)域的研究人員提供了更多的交流機(jī)會(huì)[1]。
人運(yùn)動(dòng)視覺(jué)分析是利用計(jì)算機(jī)技術(shù)從包含人的圖像序列中檢測(cè)、分類、跟蹤人,并對(duì)其行為進(jìn)行理解與描述。其中運(yùn)動(dòng)檢測(cè)[16~18]、目標(biāo)分類[19]、跟蹤[20~23]屬于視覺(jué)分析中的底層和中層處理部分(有興趣的讀者可參考文獻(xiàn)[24~28]);而行為理解和描述是經(jīng)過(guò)對(duì)運(yùn)動(dòng)對(duì)象的連續(xù)跟蹤觀察,分析識(shí)別目標(biāo)當(dāng)前處于哪種行為模式,并利用語(yǔ)言進(jìn)行描述,以及判斷該行為是否屬于異常行為,其屬于高層處理部分。當(dāng)前,人行為理解與描述受到了廣泛關(guān)注,發(fā)表在上述權(quán)威期刊和重要學(xué)術(shù)會(huì)議上的關(guān)于行為理解研究的論文正逐年增加。由圖1可見(jiàn),關(guān)于人行為理解研究的會(huì)議文章從2002年起急劇增加,并且到2005和2006年每年發(fā)表的會(huì)議論文均保持在70篇以上;期刊文章從2003年也開始大幅增加,尤其是2007年前5個(gè)月的文章數(shù)量就超過(guò)2005年全年的數(shù)量并接近2006年全年發(fā)表的數(shù)量。行為理解已經(jīng)成為了未來(lái)研究的前瞻性方向之一。因?yàn)槿诉\(yùn)動(dòng)視覺(jué)分析研究的最終目標(biāo)就是要讓計(jì)算機(jī)能像人那樣通過(guò)視覺(jué)觀察和理解世界[29],也就是通過(guò)視覺(jué)觀察來(lái)分析和理解人類活動(dòng)及場(chǎng)景信息等。行為理解是跟蹤器中像素測(cè)度與行為描述之間的橋梁,是使計(jì)算機(jī)向更加人性化(從“l(fā)ooking at people”向“understanding people”)轉(zhuǎn)變的關(guān)鍵所在。
通過(guò)對(duì)大量行為理解研究文獻(xiàn)的整理發(fā)現(xiàn):人行為理解研究一般遵從特征提取與運(yùn)動(dòng)表征、行為識(shí)別、高層行為與場(chǎng)景理解等幾個(gè)基本過(guò)程[30~33](圖2)。特征提取與運(yùn)動(dòng)表征是在對(duì)目標(biāo)檢測(cè)、分類和跟蹤等底層和中層處理的基礎(chǔ)上,從目標(biāo)的運(yùn)動(dòng)信息中提取目標(biāo)圖像特征并用來(lái)表征目標(biāo)運(yùn)動(dòng)狀態(tài);行為識(shí)別則是將輸入序列中提取的運(yùn)動(dòng)特征與參考序列進(jìn)行匹配,判斷當(dāng)前的動(dòng)作處于哪種行為模型;高層行為與場(chǎng)景理解是結(jié)合行為發(fā)生的場(chǎng)景信息和相關(guān)領(lǐng)域知識(shí),識(shí)別復(fù)雜行為,實(shí)現(xiàn)對(duì)事件和場(chǎng)景的理解。
隨著人行為理解研究的不斷發(fā)展和深入,對(duì)該領(lǐng)域的工作及進(jìn)展作詳細(xì)的回顧和分析顯得很有必要。盡管Aggarwal[24]、Gavrila[25]、Moeslund[26]和Hu[27]等人對(duì)行為理解的方法有所闡述,但他們都是簡(jiǎn)單性地總結(jié)分析其方法,并沒(méi)有對(duì)當(dāng)前行為理解的研究現(xiàn)狀進(jìn)行系統(tǒng)分析。為了使廣大相關(guān)科研人員能更好地了解和掌握行為理解技術(shù)發(fā)展的新動(dòng)向,促進(jìn)行為理解技術(shù)的發(fā)展,本文從行為理解的一般性處理框架出發(fā),對(duì)目前人行為理解的算法研究現(xiàn)狀、存在問(wèn)題及發(fā)展趨勢(shì)等進(jìn)行詳細(xì)介紹。
1 特征選擇與運(yùn)動(dòng)表征
在人運(yùn)動(dòng)視覺(jué)分析中,由于視角的影響,同一種行為可能有不同的投影軌跡,而不同的行為可能有相同的投影軌跡。此外,光照變化、遮擋等現(xiàn)實(shí)環(huán)境因素也都給行為理解帶來(lái)了很大困難。所以從原始視頻數(shù)據(jù)中提取何種底層特征(如形狀信息包括側(cè)影、輪廓,運(yùn)動(dòng)信息包括位置、速度、方向等)描述人運(yùn)動(dòng),以及如何選擇充分有效的描述方法表征人運(yùn)動(dòng)狀態(tài)并且能夠在時(shí)間分辨率和維數(shù)上減少計(jì)算量成為行為理解的關(guān)鍵問(wèn)題之一。
1.1 特征選擇
表1為2000—2007年400多篇關(guān)于行為理解研究的權(quán)威期刊與重要國(guó)際會(huì)議文章中使用特征的統(tǒng)計(jì)分析表。由表1可見(jiàn),目前行為理解研究所采用的特征主要有如下四種:外觀形狀特征、運(yùn)動(dòng)特征、時(shí)空特征、形狀特征與運(yùn)動(dòng)特征兩者的混合特征。其中,形狀特征和運(yùn)動(dòng)特征是兩種最常用、也是最主要的特征,其比例均保持在30%以上。另外,時(shí)空特征在行為理解研究中開始得到越來(lái)越廣泛的使用。
基于外觀形狀特征[34~42]方法是先利用人體幾何結(jié)構(gòu)、輪廓或姿態(tài)以及區(qū)域顏色等信息來(lái)估計(jì)運(yùn)動(dòng)目標(biāo)每時(shí)刻的靜止姿態(tài),然后用這些靜止姿態(tài)序列來(lái)描述人體運(yùn)動(dòng)。外觀形狀特征容易獲得且比較穩(wěn)定,對(duì)紋理變化不敏感。基于運(yùn)動(dòng)特征方法[43~47]則沒(méi)有利用有關(guān)人體結(jié)構(gòu)的任何形狀信息,而是直接從圖像序列中提取出目標(biāo)運(yùn)動(dòng)特性(時(shí)分)信息(如光流信息、運(yùn)動(dòng)方向、軌跡、位置、速度等)來(lái)表征運(yùn)動(dòng)狀態(tài)。心理學(xué)研究表明,運(yùn)動(dòng)特征具有靜態(tài)形狀特征無(wú)法比擬的優(yōu)勢(shì),即使是在遠(yuǎn)距離或惡劣的能見(jiàn)度情況下和最小運(yùn)動(dòng)系統(tǒng)——MLD(moving light display)[48],人能夠根據(jù)運(yùn)動(dòng)模式輕松地區(qū)別和識(shí)別目標(biāo)的運(yùn)動(dòng)類型,而形狀特征在此種情況下往往變得模糊不清。但目前的計(jì)算機(jī)視覺(jué)方法很難準(zhǔn)確地提取運(yùn)動(dòng)特征,所以,為了充分利用形狀特征和運(yùn)動(dòng)特征各自的優(yōu)勢(shì),研究人員采用兩者的混合特征[49~51]識(shí)別人的行為。此外,時(shí)空特征[52~57]是近年來(lái)行為理解研究中使用比較多的特征。時(shí)空特征通過(guò)采用二維形狀在一段時(shí)間內(nèi)形成的空時(shí)立體或差分圖像來(lái)描述行為,集合了形狀和運(yùn)動(dòng)特征兩者的優(yōu)點(diǎn)。由于時(shí)空特征考慮了運(yùn)動(dòng)信息,也有學(xué)者將其歸類于運(yùn)動(dòng)特征。
1.2 運(yùn)動(dòng)表征
人運(yùn)動(dòng)表征是指從人的運(yùn)動(dòng)序列中提取合適的特征數(shù)據(jù)來(lái)描述人的運(yùn)動(dòng)狀態(tài),這是人行為理解中至關(guān)重要的一步。依據(jù)所用的特征,運(yùn)動(dòng)表征方法可分成基于外觀形狀特征的和基于運(yùn)動(dòng)特征的。
1.2.1 基于外觀形狀特征的運(yùn)動(dòng)表征方法
依據(jù)是否利用人體形狀模型的先驗(yàn)知識(shí),基于外觀形狀的運(yùn)動(dòng)表征方法又可分成基于模型和基于外觀特征(或基于視覺(jué)特征方法)兩類。
基于模型方法的核心思想是首先建立描述空間中人體形狀模型;然后利用目標(biāo)的形態(tài)特征和關(guān)節(jié)位置等信息,將模型與輸入圖像序列在首幀匹配,在后續(xù)幀的跟蹤過(guò)程中,定義損失函數(shù)描述輸入圖像數(shù)據(jù)與模型之間的近似關(guān)系,并采用人體運(yùn)動(dòng)參數(shù)限制條件和最優(yōu)策略如最小平方[58]或隨機(jī)采樣策略如粒子濾波[59,60]等方法最小化損失函數(shù)來(lái)求得當(dāng)前的運(yùn)動(dòng)姿態(tài)。常用的模型結(jié)構(gòu)可以分為矩形框、棍棒形狀[61]、二維輪廓[38]和3D立體模型[58]。基于模型方法集合了先驗(yàn)?zāi)P椭R(shí)和當(dāng)前輸入,能夠適合復(fù)雜行為的行為理解;但通常要求首先選擇模型,初始化較難、計(jì)算量大,而且由于人運(yùn)動(dòng)的高自由度,容易產(chǎn)生局部最小值,很難找到全局最優(yōu)且魯棒的模型參數(shù),此外由于在后續(xù)的跟蹤中存在累計(jì)誤差,不能分析、跟蹤長(zhǎng)序列運(yùn)動(dòng)。
基于外觀方法并不試圖恢復(fù)人體運(yùn)動(dòng)的結(jié)構(gòu)模型,而是直接從圖像中提取物體的二維空間信息,如高度、寬度、側(cè)影輪廓和顏色等,并用這些特征直接或通過(guò)與已經(jīng)訓(xùn)練好的模型進(jìn)行匹配來(lái)獲得對(duì)當(dāng)前運(yùn)動(dòng)的描述。在這類方法中,形狀分析理論常用來(lái)描述運(yùn)動(dòng)目標(biāo)的形狀變化特征(有關(guān)形狀分析請(qǐng)參考文獻(xiàn)[62])。常用的形狀分析方法有質(zhì)心—邊界距離[34,36]、傅里葉描述符[41]、形狀上下文[42]和統(tǒng)計(jì)形狀分析[32,35,63,64]等。其中,質(zhì)心—邊界距離方法使用一維函數(shù)編碼從形狀的質(zhì)心到形狀邊界點(diǎn)的距離,這種描述符簡(jiǎn)單但不能精確地對(duì)非凸起形狀進(jìn)行編碼,如質(zhì)心與一個(gè)邊界點(diǎn)之間的距離連線可能與另一個(gè)邊界點(diǎn)相交,造成細(xì)節(jié)的丟失。Poppe等人[41]提出用傅里葉描述算子恢復(fù)人姿態(tài);其思想是用固定的邊界采樣點(diǎn)對(duì)人體二維側(cè)影輪廓進(jìn)行采樣,并對(duì)采樣點(diǎn)進(jìn)行傅里葉變換,利用變換后傅里葉系數(shù)的低頻部分描述形狀的大體特征,用高頻部分來(lái)反映形狀的微觀特征即詳細(xì)特征。由于傅里葉描述算子只能描述單個(gè)閉環(huán)曲線,這種方法一般用于描述外部邊界點(diǎn);在噪聲環(huán)境下,傅里葉轉(zhuǎn)換性能不是很好。Mori和Malik[42]則提出用形狀上下文[65]描述算子表征人體側(cè)影形狀來(lái)恢復(fù)人體運(yùn)動(dòng)的三維姿態(tài)。一個(gè)點(diǎn)的形狀上下文算子就是試圖捕捉點(diǎn)集中其他點(diǎn)相對(duì)于該點(diǎn)的分布,它是一種基于內(nèi)部或外部邊界采樣點(diǎn)的局部描述算子。傅里葉描述算子和形狀上下文算子具有平移、旋轉(zhuǎn)和尺度不變性。與傅里葉算子和形狀上下文描述算子不同的是,Hu[66]提出一種基于區(qū)域的不變矩理論,并構(gòu)造出共七個(gè)不變矩,它們具有平移、旋轉(zhuǎn)和縮放不變性,目前已經(jīng)廣泛應(yīng)用于圖像的模式識(shí)別中。Poppe和Poel[67]對(duì)傅里葉描述算子、形狀上下文和不變矩三種算子在側(cè)影輪廓描述上的性能進(jìn)行了比較,并且實(shí)驗(yàn)結(jié)果表明傅里葉描述算子和形狀上下文直方圖在形變側(cè)影描述上比Hu更具有優(yōu)勢(shì)。20 世紀(jì)70年代后期,Dryden等人[63]提出的統(tǒng)計(jì)形狀理論發(fā)展成一種用形狀概率分布分析物體形狀的實(shí)用統(tǒng)計(jì)方法,并且在圖像分析、目標(biāo)識(shí)別等領(lǐng)域得到廣泛應(yīng)用。文獻(xiàn)[64]進(jìn)一步討論了投影形狀和不變量,以及形狀模型、特征和它們各自在高層視覺(jué)中的作用。Jin等人[32]用統(tǒng)計(jì)形方法描述每幀中的目標(biāo)輪廓,并用完全Procrustes均值形狀作為極點(diǎn),構(gòu)造一個(gè)與數(shù)據(jù)集近似的線性空間——切空間;然后用這個(gè)線性化的輪廓作為訓(xùn)練數(shù)據(jù)去學(xué)習(xí)動(dòng)態(tài)系統(tǒng)、估計(jì)系統(tǒng)參數(shù),從而識(shí)別人行為。
此外,目標(biāo)形狀變化的動(dòng)態(tài)特性也為目標(biāo)識(shí)別和動(dòng)作分類提供了重要信息。N.Vaswani等人[68]提出用形狀變化的動(dòng)態(tài)特性來(lái)建模和分類動(dòng)作;Liu等人[69]提出在傅里葉描述算子的基礎(chǔ)上建立自回歸模型學(xué)習(xí)形狀變化的動(dòng)態(tài)信息;基于統(tǒng)計(jì)形狀理論,Veeraraghavan等人[35]提出用自回歸模型(AR)和平穩(wěn)自回歸模型(ARMA)學(xué)習(xí)形狀變化的動(dòng)態(tài)特性,并用模型之間的距離量測(cè)作為兩個(gè)形狀序列之間的相似性測(cè)量,取得了較好的分類效果。
基于外觀特征方法不要求特定的模型,比較簡(jiǎn)單,能夠適用于大量的環(huán)境條件下。但外觀特征方法由于沒(méi)有模型先驗(yàn)信息限制,很難建立連續(xù)幀之間的特征對(duì)應(yīng)關(guān)系,并且很難區(qū)別信號(hào)和噪聲,一般對(duì)噪聲敏感。此外,外觀特征受視角影響大,所以許多學(xué)者[58,70~72]研究基于多視角環(huán)境中人的行為分析和識(shí)別。
1.2.2 基于運(yùn)動(dòng)特征的運(yùn)動(dòng)表征方法
基于運(yùn)動(dòng)特征的表征方法可以細(xì)分為:
a)基于預(yù)先確定區(qū)域(如腿、頭)跟蹤的運(yùn)動(dòng)軌跡分析方法。其關(guān)鍵是運(yùn)動(dòng)匹配[43,45,73],思想是在一幀圖像中提取出興趣點(diǎn)或區(qū)域、典型特征,并且在隨后圖像幀中進(jìn)行跟蹤,多幀之間的這些特定點(diǎn)或區(qū)域位置匹配就會(huì)產(chǎn)生一條運(yùn)動(dòng)軌跡;然后對(duì)軌跡進(jìn)行參數(shù)化處理,如將軌跡轉(zhuǎn)換成水平、垂直方向的速度以及時(shí)空曲率等來(lái)描述運(yùn)動(dòng)特性。
b)基于非預(yù)先確定的目標(biāo)區(qū)域運(yùn)動(dòng)分析方法。其最典型的代表是光流法[44,46,47,74]。與運(yùn)動(dòng)軌跡不同的是,光流法是計(jì)算空間運(yùn)動(dòng)物體表面上像素點(diǎn)運(yùn)動(dòng)產(chǎn)生的瞬時(shí)速度場(chǎng)。它通過(guò)計(jì)算圖像序列中連續(xù)兩幀亮度信息來(lái)得到,指的是圖像亮度模式的表觀(或視在)運(yùn)動(dòng)(apparent motion)。例如Zhu等人[47]提出用光流直方圖來(lái)描述動(dòng)作的運(yùn)動(dòng)信息,然后用支持向量機(jī)作分類器識(shí)別運(yùn)動(dòng)員的擊球動(dòng)作。光流法在無(wú)須背景區(qū)域的任何先驗(yàn)知識(shí)條件下就能夠?qū)崿F(xiàn)對(duì)運(yùn)動(dòng)目標(biāo)的檢測(cè)和跟蹤。光流計(jì)算的基本等式是假設(shè)相鄰兩幅圖像中對(duì)應(yīng)兩點(diǎn)的灰度不變得到的。在這個(gè)假設(shè)條件下首先要求兩幅圖像相鄰時(shí)刻之間的間隔是很小的(幾十毫秒之內(nèi)),并且要求場(chǎng)景光照均勻。此外光流法的計(jì)算量較大。
時(shí)空特征不僅包含人動(dòng)作姿態(tài)的空間信息(人體軀干和肢體的位置、方向等),而且還包含運(yùn)動(dòng)的動(dòng)態(tài)信息(人體的全局運(yùn)動(dòng)和肢體的相對(duì)運(yùn)動(dòng)),從而避免了光流場(chǎng)計(jì)算可能遇到的問(wèn)題(包括孔徑、全局平滑性約束、奇異性等)和外觀形狀特征跟蹤問(wèn)題[75,76](自遮擋、重新初始化、外觀改變、運(yùn)動(dòng)信息缺乏等)等。所以近年來(lái)時(shí)空特征在行為識(shí)別中得到了大量的使用[52~57]。Bobick和Davis[52]集合時(shí)空運(yùn)動(dòng)特征,提出了用運(yùn)動(dòng)歷史圖(MHIs)和運(yùn)動(dòng)能量圖(MEIs)來(lái)描述運(yùn)動(dòng)。其中運(yùn)動(dòng)歷史圖反映運(yùn)動(dòng)是怎么產(chǎn)生的,而運(yùn)動(dòng)能量圖反映運(yùn)動(dòng)發(fā)生的位置。文獻(xiàn)[53,54]則提出用迭代濾波(recursive filtering)和幀分組(frame grouping)來(lái)描述運(yùn)動(dòng)信息。用迭代濾波方法對(duì)視頻序列中的每幀圖像進(jìn)行濾波處理得到一幅濾波圖像,其反映當(dāng)前幀的場(chǎng)景空間分布信息、相鄰幀之間的時(shí)分關(guān)系以及短時(shí)間內(nèi)的運(yùn)動(dòng)速度;幀分組方法思想是單獨(dú)分類視頻切片中的每個(gè)濾波圖像,然后用多數(shù)投票方法分類這些已標(biāo)志的濾波圖像的運(yùn)動(dòng)類型。
基于運(yùn)動(dòng)特征和外觀形狀特征表征的方法都有各自的缺點(diǎn),基于運(yùn)動(dòng)特征能夠描述人的近似運(yùn)動(dòng)方向和軌跡等,但很難準(zhǔn)確、穩(wěn)定地捕捉目標(biāo)運(yùn)動(dòng)特性;另一方面,外觀形狀特征能夠描述人的姿態(tài)信息,但由于沒(méi)有運(yùn)動(dòng)信息,描述行為動(dòng)作的能力有限。所以研究人員[56~58]通過(guò)采用融合兩種特征的方法來(lái)對(duì)人行為進(jìn)行建模和識(shí)別。
2 行為識(shí)別
行為識(shí)別問(wèn)題可以簡(jiǎn)單地看做是時(shí)變特征數(shù)據(jù)的分類問(wèn)題,即將測(cè)試序列與預(yù)先標(biāo)定的代表典型行為的參考序列進(jìn)行匹配,那么其關(guān)鍵問(wèn)題是如何從學(xué)習(xí)樣本中獲取參考行為序列以及如何度量參考序列與測(cè)試序列之間的相似性。由于人動(dòng)作執(zhí)行的速度不一樣,學(xué)習(xí)和匹配行為序列時(shí)還必須能夠處理相似運(yùn)動(dòng)模式在空間和時(shí)間尺度上輕微的特征變化。目前,行為識(shí)別方法一般可以分成靜態(tài)識(shí)別和動(dòng)態(tài)識(shí)別。靜態(tài)識(shí)別方法是把行為看做由一組按時(shí)間順序串連起來(lái)的靜態(tài)圖像序列,其常用的方法有模板匹配方法;動(dòng)態(tài)識(shí)別方法是定義每個(gè)靜態(tài)姿勢(shì)作為圖模型上的一個(gè)節(jié)點(diǎn)或狀態(tài),這些節(jié)點(diǎn)或狀態(tài)之間通過(guò)某種關(guān)系如概率聯(lián)系起來(lái)。任何運(yùn)動(dòng)序列可以看做這些靜態(tài)姿勢(shì)的不同狀態(tài)之間的一次遍歷過(guò)程。常用的識(shí)別方法有隱馬爾可夫模型(hidden Markov models,HMMs)、動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(dynamic Bayesian network,DBN)等。這些方法可以總歸為基于狀態(tài)轉(zhuǎn)移的圖模型方法。
2.1 基于模板匹配方法
基于模板匹配方法是用從輸入圖像序列提取的特征與在訓(xùn)練階段預(yù)先保存好的模板進(jìn)行相似度比較,選擇與測(cè)試序列距離最小的已知模板的所屬類別作為被測(cè)試序列的識(shí)別結(jié)果。Bobick和Davis[52]將圖像序列目標(biāo)運(yùn)動(dòng)信息轉(zhuǎn)換成運(yùn)動(dòng)能量圖像(MEI)和運(yùn)動(dòng)歷史圖像(MHI),采用馬氏距離度量測(cè)試序列與模板之間的相似性;Masoud等人[53]則采用無(wú)限沖擊響應(yīng)濾波器來(lái)描述運(yùn)動(dòng),并將其投影到特征空間,然后用Hausdorff距離度量測(cè)試序列與參考序列之間的相似性。此外,還有學(xué)者采用Procrustes距離[50]來(lái)度量測(cè)試序列與模板之間的相似性。這些最近鄰方法盡管在一定程度上反映了運(yùn)動(dòng)的時(shí)分關(guān)系,計(jì)算量小,但并沒(méi)有對(duì)運(yùn)動(dòng)的時(shí)分限制條件進(jìn)行建模,魯棒性較差。為此,Veeraraghavan等人[35]用動(dòng)態(tài)時(shí)間規(guī)整(dynamic time warping,DTW)來(lái)匹配運(yùn)動(dòng)序列。DTW是一種時(shí)變數(shù)據(jù)序列匹配方法,常用于微生物學(xué)的DNA匹配、字符串和符號(hào)的比較以及語(yǔ)音分析[77]。DTW算法的思想是給定參考模板特征矢量序列與輸入特征矢量序列,尋找一個(gè)最佳的時(shí)間規(guī)整函數(shù),使得輸入序列的時(shí)間軸映射到參考模板的時(shí)間軸上總的累計(jì)失真最小。對(duì)DTW而言,即使測(cè)試序列模式與參考序列模式的時(shí)間尺度不能完全一致,只要時(shí)間次序約束存在,它仍能較好地完成測(cè)試序列與參考序列之間的模式匹配。DTW具有概念簡(jiǎn)單、算法魯棒的優(yōu)點(diǎn),能夠?qū)D像序列進(jìn)行分類。文獻(xiàn)[35]在形狀空間中用動(dòng)態(tài)時(shí)間規(guī)整方法計(jì)算兩個(gè)形狀序列之間的距離來(lái)識(shí)別動(dòng)作和步態(tài),取得了很好的分類結(jié)果。然而,DTW算法計(jì)算量較大,缺乏考慮相鄰時(shí)序之間的動(dòng)態(tài)特性,而在實(shí)際中,運(yùn)動(dòng)序列中相鄰序列在時(shí)間和空間上有高度的相關(guān)性。
基于模板匹配方法計(jì)算復(fù)雜度低、實(shí)現(xiàn)簡(jiǎn)單,但缺乏考慮運(yùn)動(dòng)序列中相鄰時(shí)序之間的動(dòng)態(tài)特性,對(duì)于噪聲和運(yùn)動(dòng)時(shí)間間隔變化敏感。
2.2 基于狀態(tài)轉(zhuǎn)移圖模型方法
基于狀態(tài)轉(zhuǎn)移圖模型方法[78,79]是將每個(gè)靜態(tài)姿勢(shì)或運(yùn)動(dòng)狀態(tài)作為圖中的一個(gè)節(jié)點(diǎn)或狀態(tài),對(duì)應(yīng)于各個(gè)姿勢(shì)或運(yùn)動(dòng)狀態(tài)節(jié)點(diǎn)之間的依存關(guān)系通過(guò)某種概率聯(lián)系起來(lái),這樣任何運(yùn)動(dòng)序列可以看做在圖中不同節(jié)點(diǎn)或狀態(tài)之間的一次遍歷過(guò)程。常用于行為理解的圖模型方法有隱馬爾可夫及其改進(jìn)模型[80~95]、動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)[96~102]、人工神經(jīng)網(wǎng)絡(luò)[45,103]、有限狀態(tài)機(jī)[104,105]和置信網(wǎng)絡(luò)[106]等。本文對(duì)前三種常用方法進(jìn)行總結(jié)分析。
2.2.1 隱馬爾可夫及改進(jìn)模型
與DTW相比,隱馬爾可夫模型是一種更加成熟的匹配時(shí)變數(shù)據(jù)的技術(shù)。HMMs用馬爾可夫過(guò)程建立相鄰實(shí)例之間的相互關(guān)系,并假設(shè)觀察序列由固定個(gè)數(shù)的隱狀態(tài)構(gòu)成的隱過(guò)程決定,是一種隨機(jī)狀態(tài)機(jī)。HMMs的使用涉及到訓(xùn)練和分類兩個(gè)階段。訓(xùn)練階段包括指定一個(gè)隱馬爾可夫模型的隱藏狀態(tài)數(shù),并且優(yōu)化相應(yīng)的狀態(tài)轉(zhuǎn)換和輸出概率,以便于產(chǎn)生的輸出符號(hào)與對(duì)特定運(yùn)動(dòng)類別之內(nèi)所觀察到的圖像特征相匹配。受HMMs在語(yǔ)音數(shù)據(jù)分析[80]成功應(yīng)用的影響,研究人員將HMMs用于視覺(jué)識(shí)別[73,81~83]。Bregler[81]基于人體動(dòng)力學(xué)在不同抽象等級(jí)的統(tǒng)計(jì)分析,提出了用一個(gè)綜合性的網(wǎng)絡(luò)來(lái)識(shí)別人的運(yùn)動(dòng):在底層處理階段,以混合高斯模型來(lái)估計(jì)基于運(yùn)動(dòng)、彩色相似度和空間接近程度等小區(qū)域塊,不同的身體部分區(qū)域在圖像序列中被跟蹤;在中層處理階段,具有一致運(yùn)動(dòng)特性的區(qū)域被匹配為動(dòng)力學(xué)系統(tǒng)中的簡(jiǎn)單運(yùn)動(dòng)(如行走被認(rèn)為是兩個(gè)簡(jiǎn)單運(yùn)動(dòng)的組成:一個(gè)是腿的支撐,一個(gè)是腿在空中的擺動(dòng));在高層處理階段,HMMs被用來(lái)作為這些中級(jí)動(dòng)力系統(tǒng)的混合模型以表達(dá)復(fù)雜的運(yùn)動(dòng),識(shí)別過(guò)程通過(guò)最大化HMMs的后驗(yàn)概率來(lái)完成。實(shí)驗(yàn)表明,在學(xué)習(xí)能力和處理未分割的連續(xù)數(shù)據(jù)流方面,HMMs比DTW有更好的優(yōu)越性。
HMMs有很強(qiáng)的輸出獨(dú)立性假設(shè)限制,其信號(hào)處理過(guò)程是一個(gè)單路馬爾可夫過(guò)程,不能處理多個(gè)且相互依存的序列,導(dǎo)致其不能考慮上下文的特征,限制了特征的選擇;而且其拓?fù)浣Y(jié)構(gòu)是事先給定的,它的模型參數(shù)需要用EM算法來(lái)估計(jì)(BaumWelch 算法);對(duì)觀測(cè)矩陣的初始值比較敏感,如果初始值選擇不當(dāng),會(huì)造成概率函數(shù)的局部最大值。另外,分類模型不靈活,不能處理運(yùn)動(dòng)中分層與共享結(jié)構(gòu)。為了識(shí)別復(fù)雜動(dòng)作與人們之間的交互行為,Brand等人[84]提出一種耦合隱馬爾可夫模型(coupled hidden Markov models, CHMM)[84~86]來(lái)建模行為中兩個(gè)相互關(guān)聯(lián)的隨機(jī)過(guò)程,并用CHMM對(duì)手勢(shì)進(jìn)行識(shí)別。結(jié)果表明,與傳統(tǒng)HMMs相比,CHMM具有更好的分類效果,計(jì)算速度快,而且對(duì)初始條件不敏感。Fine等人[87]為處理自然序列中復(fù)雜的多尺度結(jié)構(gòu),提出了層級(jí)隱馬爾可夫模型(hierarchical hidden Markov model,HHMM)。HHMM具有多層隱馬爾可夫模型的結(jié)構(gòu),所以能夠更為清楚地表達(dá)出人運(yùn)動(dòng)中不同層次的行為細(xì)節(jié)。Nguyen等人[88,89]采用HHMM識(shí)別人的行為,并取得了很好的分類效果。此外還有抽象隱馬爾可夫模型(abstract hidden Markov model, AHMM)[90]、可變長(zhǎng)馬爾可夫模型(variable length Markov model,VLMM)[91]、熵隱馬爾可夫模型[92,93]和分層隱馬爾可夫模型(layered hidden Markov model,LHMM)[94,95]等也被用于復(fù)雜行為識(shí)別。
2.2.2 動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)
由于HMMs不能有效處理三個(gè)或三個(gè)以上獨(dú)立的過(guò)程[86],學(xué)者提出了HMMs的推廣方法——?jiǎng)討B(tài)貝葉斯網(wǎng)絡(luò)(dynamic Bayesian networks,DBNs)[96]。動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)是一種對(duì)隨機(jī)過(guò)程描述的有向圖解,通過(guò)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)反映變量間的概率依存關(guān)系及其隨時(shí)間變化的情況,不受馬爾可夫鏈的鏈狀結(jié)構(gòu)約束,因此不但能夠在每個(gè)時(shí)刻上對(duì)多個(gè)隨機(jī)變量所對(duì)應(yīng)的不同特征之間的依存關(guān)系進(jìn)行概率建模而不僅僅是一個(gè)隱藏狀態(tài)變量,而且考慮了各個(gè)時(shí)刻間的轉(zhuǎn)移概率,能夠很好地反映特征之間的時(shí)序關(guān)系,適用于不確定性和概率性事物。所以動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)逐漸成為人行為理解研究中一個(gè)有力的數(shù)學(xué)工具[97~102]。Park和Aggarwal[97]提出用層級(jí)貝葉斯網(wǎng)絡(luò)方法識(shí)別兩個(gè)人之間的動(dòng)作。該方法在貝葉斯網(wǎng)絡(luò)的低層估計(jì)被跟蹤身體部分的姿態(tài);然后在貝葉斯網(wǎng)絡(luò)高層估計(jì)整個(gè)身體的姿態(tài);最后用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)處理綜合多個(gè)身體部分組成的狀態(tài)。Muncaster等人[102]提出一個(gè)一般的d-層動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)識(shí)別復(fù)雜的事件,在每一層用確定性的退火聚類算法自動(dòng)檢測(cè)觀測(cè)層的狀態(tài)。文獻(xiàn)[98,99]則用貝葉斯網(wǎng)絡(luò)識(shí)別停車場(chǎng)和地鐵監(jiān)控環(huán)境下的復(fù)雜行為。
貝葉斯網(wǎng)絡(luò)的主要優(yōu)點(diǎn)是利用先驗(yàn)知識(shí)建立視覺(jué)特征之間的因果關(guān)系來(lái)處理視頻處理中固有的不確定性問(wèn)題。動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)還可以任意改變拓?fù)浣Y(jié)果或增刪變量以反映變量間各種不同的關(guān)聯(lián)關(guān)系,而不影響訓(xùn)練算法本身,因此具有良好的可解釋性,其拓?fù)浣Y(jié)構(gòu)具有精確及易于理解的概率語(yǔ)義。相比馬爾可夫鏈,貝葉斯網(wǎng)絡(luò)訓(xùn)練比較復(fù)雜。
2.2.3 神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是由人工建立的以有向圖為拓?fù)浣Y(jié)構(gòu)的動(dòng)態(tài)系統(tǒng),它通過(guò)對(duì)連續(xù)或斷續(xù)的輸入作狀態(tài)響應(yīng)而進(jìn)行信息處理,在分析時(shí)變數(shù)據(jù)時(shí)具有很大的優(yōu)勢(shì)。Buccolieri等人[103]用神經(jīng)網(wǎng)絡(luò)對(duì)輪廓進(jìn)行分析來(lái)識(shí)別人的姿態(tài)。由于神經(jīng)網(wǎng)絡(luò)通常需要用大量的數(shù)據(jù)來(lái)訓(xùn)練網(wǎng)絡(luò),研究學(xué)者在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上提出了時(shí)延神經(jīng)網(wǎng)絡(luò)(timedelay neural network,TDNN)。時(shí)延神經(jīng)網(wǎng)絡(luò)是在多層前饋感知器神經(jīng)網(wǎng)絡(luò)模型中引入時(shí)延單元使得神經(jīng)網(wǎng)絡(luò)增加記憶功能;同時(shí),時(shí)變序列的前述值被用來(lái)預(yù)測(cè)下一個(gè)值。由于大量數(shù)據(jù)集成為可能,時(shí)延神經(jīng)網(wǎng)絡(luò)的重點(diǎn)就可以放在時(shí)分信息的表達(dá),這樣由此導(dǎo)出的神經(jīng)網(wǎng)絡(luò)模型適合應(yīng)用于處理序列數(shù)據(jù)。Yang和Ahuja[45]應(yīng)用時(shí)延神經(jīng)網(wǎng)絡(luò)于手勢(shì)識(shí)別,并取得了較高的識(shí)別率。
除了上述兩類方法,支持向量機(jī)(support vector machine,SVM)由于能夠較好地解決常見(jiàn)的非線性分類問(wèn)題中的小樣本、非線性、高維數(shù)和局部極小點(diǎn)等實(shí)際問(wèn)題,同時(shí)可以避免神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選擇和局部極小點(diǎn)問(wèn)題,成為20世紀(jì)90年代末發(fā)展最快的研究方向之一,并且在行為理解中也得到了充分的應(yīng)用[47,54,107~109]。Cao等人[54]用SVM建立濾波圖像分類器來(lái)對(duì)運(yùn)動(dòng)分類。文獻(xiàn)[109]提出一種基于光流直方圖運(yùn)動(dòng)描述算子,并用SVM訓(xùn)練分類器識(shí)別運(yùn)動(dòng)員的動(dòng)作。
3 高層行為與場(chǎng)景理解
盡管用上述行為識(shí)別方法能夠識(shí)別較復(fù)雜的動(dòng)作,但要理解“場(chǎng)景中在發(fā)生什么事情”等復(fù)雜行為與事件,不僅需要解釋和理解視覺(jué)輸入,還需要場(chǎng)景中相關(guān)信息與背景知識(shí),尤其是對(duì)涉及人活動(dòng)的場(chǎng)景理解更需要抽象且有代表意義的策略。高層行為事件與場(chǎng)景理解是在對(duì)場(chǎng)景圖像信息的各種處理和分析的基礎(chǔ)上,解釋和描述場(chǎng)景圖像的內(nèi)容,包括場(chǎng)景中人與人、人與物體的行為以及它們之間的時(shí)空關(guān)系,這也稱為高層視覺(jué)。目前研究較多的事件檢測(cè)是對(duì)整個(gè)視頻序列內(nèi)容以及真實(shí)場(chǎng)景的總結(jié)分析過(guò)程。其核心思想是利用物體或環(huán)境知識(shí)去理解場(chǎng)景中發(fā)生的動(dòng)作或?qū)⒁l(fā)生的動(dòng)作,廣泛應(yīng)用于停車場(chǎng)、超市、地鐵以及機(jī)場(chǎng)等公共場(chǎng)所的智能監(jiān)控中檢測(cè)是否有異常行為發(fā)生并告警。VSAM、Pfinder和AVITRACK等系統(tǒng)都具有場(chǎng)景理解與事件檢測(cè)的功能。目前高層行為與場(chǎng)景理解的方法包括基于規(guī)則推理網(wǎng)絡(luò)[33,105,106,110~113]、隨機(jī)文法(包括隨機(jī)上下文無(wú)關(guān)文法:stochastic context free grammar,SCFG)[114~116]、概率狀態(tài)依存語(yǔ)法(probabilistic state dependent grammars,PSDG)[117]、因果分析[118]等。
Badler[105]提出一種基于運(yùn)動(dòng)動(dòng)詞的分層框架來(lái)分析運(yùn)動(dòng)。一個(gè)運(yùn)動(dòng)動(dòng)詞就是一種行為,而這些動(dòng)詞是預(yù)先定義在靜態(tài)圖像的規(guī)則基礎(chǔ)上,用自動(dòng)狀態(tài)機(jī)建立起行為之間的聯(lián)系。這種系統(tǒng)理論上可以解釋人行為中的復(fù)雜事件,但系統(tǒng)僅僅在人工環(huán)境中進(jìn)行測(cè)試。Kojima和Tamura[111]則提出一種事件框架來(lái)識(shí)別單個(gè)人的動(dòng)作。首先提取出人體頭、身體和手的運(yùn)動(dòng),定義事件幀(case frame)來(lái)描述動(dòng)作規(guī)則,從而建立起人運(yùn)動(dòng)姿態(tài)、位置信息與運(yùn)動(dòng)概念之間的對(duì)應(yīng)關(guān)系。Hongeng等人[112]則提出事件是由動(dòng)作線程構(gòu)成,而且每個(gè)線程有單個(gè)角色執(zhí)行,每個(gè)單一動(dòng)作線程通過(guò)貝葉斯方法,利用角色的軌跡和運(yùn)動(dòng)塊特性來(lái)識(shí)別,這樣事件可以通過(guò)許多在時(shí)分限制上相關(guān)的動(dòng)作線程來(lái)表達(dá)。Robertson等人[113]組合運(yùn)動(dòng)軌跡信息與局部運(yùn)動(dòng)描述算子,借助圖像特征數(shù)據(jù)概率搜索方法來(lái)描述和識(shí)別動(dòng)作,并用編碼場(chǎng)景規(guī)則的HMM平滑動(dòng)作序列,這樣通過(guò)計(jì)算當(dāng)前動(dòng)作序列下的HMM概率來(lái)識(shí)別高層行為。基于規(guī)則的方法在動(dòng)作分析中顯示了其優(yōu)點(diǎn),但由于某些行為的模糊性,基于規(guī)則推理方法很難給每個(gè)行為定義準(zhǔn)確的規(guī)則,而且不同的應(yīng)用領(lǐng)域定義的規(guī)則也不相同。
隨機(jī)文法由于能夠從包括HMM不能同時(shí)處理的多個(gè)過(guò)程中提取出有意思的行為,被用來(lái)有效地描述真實(shí)場(chǎng)景。Ivanov和Bobick[115]提出兩步策略來(lái)理解自動(dòng)監(jiān)控系統(tǒng)中的高層行為和事件。在低層處理部分用HMM檢測(cè)和識(shí)別簡(jiǎn)單的行為模式,并將輸出向量映射為離散語(yǔ)法字母表;在高層部分則采用隨機(jī)上下文無(wú)關(guān)文法模型分析、理解低層輸出,最終實(shí)現(xiàn)行為理解。但這種方法受其語(yǔ)法的上下文無(wú)關(guān)約束的限制。復(fù)雜的行為,尤其是有目的的行為,其狀態(tài)通常是前后相關(guān)的,也就是下面的行為依賴于當(dāng)前的狀態(tài),這樣使得行為并不是上下文無(wú)關(guān)的。此外,兩步識(shí)別策略不支持從低層數(shù)據(jù)到高層理解的在線無(wú)縫概率推理。基于這樣的缺點(diǎn),Nguyen等人[119]提出用抽象隱馬爾可夫記憶模型(abtract hidden Markov memory model,AHMEM)識(shí)別復(fù)雜室內(nèi)環(huán)境中人的高層行為。Park和Aggarwal[118]提出一種事件語(yǔ)義學(xué)來(lái)表達(dá)和識(shí)別人之間的交互行為,并用語(yǔ)言學(xué)中的動(dòng)詞元結(jié)構(gòu)按每三個(gè)運(yùn)動(dòng)目標(biāo)一組的結(jié)構(gòu)形式來(lái)描述運(yùn)動(dòng)。時(shí)空限制用于決策樹來(lái)識(shí)別特殊的交互行為。在這個(gè)框架下,人的動(dòng)作以“主語(yǔ)+動(dòng)詞+賓語(yǔ)”結(jié)構(gòu)來(lái)自動(dòng)表達(dá),同時(shí)人的交互行為根據(jù)人動(dòng)作之間的因果語(yǔ)義關(guān)系來(lái)描述。
當(dāng)前對(duì)高層行為與場(chǎng)景理解的研究還很不完善,高層行為與場(chǎng)景理解研究受一些視覺(jué)基礎(chǔ)問(wèn)題的束縛,如像素級(jí)的分割、遮擋以及處理可變性的能力。目前的研究都是針對(duì)特定領(lǐng)域應(yīng)用的研究,有些只是提取場(chǎng)景信息高層的語(yǔ)義,不可能在任意圖像中確定不同的景物。
4 行為理解存在的問(wèn)題與發(fā)展趨勢(shì)
盡管近年來(lái)利用機(jī)器學(xué)習(xí)工具構(gòu)建人行為的統(tǒng)計(jì)模型、理解人行為的研究有了一定的進(jìn)展,但由于動(dòng)態(tài)場(chǎng)景中運(yùn)動(dòng)的快速分割、寬松的著裝、遮擋、陰影和光照變化、運(yùn)動(dòng)的非剛性和高自由度[24,120]、行為發(fā)生的場(chǎng)景和人運(yùn)動(dòng)的模糊性(關(guān)于行為、事件、狀態(tài)有著不同的概念)等因素的影響,使得人視覺(jué)行為理解成為一個(gè)復(fù)雜且極具挑戰(zhàn)性的任務(wù)。相對(duì)于檢測(cè)、跟蹤等技術(shù)的顯著發(fā)展,其行為理解的研究進(jìn)展比較緩慢。目前行為理解的研究仍處于初級(jí)階段,即原子動(dòng)作[29]分析,也就是簡(jiǎn)單日常標(biāo)準(zhǔn)動(dòng)作如行走、跳、站起、坐等[30~37]和以人行為為目標(biāo)的簡(jiǎn)單事件檢測(cè)等[97,102,121~123]。其亟待解決的問(wèn)題和未來(lái)的發(fā)展趨勢(shì)有以下幾個(gè)方面:
a)運(yùn)動(dòng)特征選擇與表達(dá)。如何選擇特征來(lái)充分表達(dá)運(yùn)動(dòng)成為行為理解的關(guān)鍵問(wèn)題之一。一般是盡可能選擇較多的特征或者是在連續(xù)特征的典型匹配過(guò)程中引入人運(yùn)動(dòng)模型的簡(jiǎn)化約束條件來(lái)減少、消除歧義性。但如果選取的特征過(guò)多、特征向量維數(shù)過(guò)大,則會(huì)增加計(jì)算的復(fù)雜度;而選擇特征過(guò)少,又可能不足以識(shí)別與理解人行為,而引入人運(yùn)動(dòng)模型的簡(jiǎn)化約束條件與一般的圖像條件卻又是不吻合的[28]。因此,能否借鑒人類的學(xué)習(xí)、識(shí)別與理解機(jī)理,定義一個(gè)動(dòng)態(tài)特征模型,首先提取有關(guān)行為的主要特征,當(dāng)這些特征不足以完成識(shí)別與理解時(shí),系統(tǒng)逐步提取候選的細(xì)節(jié)特征;另外一種更好的辦法是使用行為的二維表達(dá)捕捉行為的視覺(jué)不變特征[49,124],那樣對(duì)行為理解不會(huì)引起歧義。但是如何選擇視覺(jué)不變特征卻又是一項(xiàng)很困難的任務(wù)。此外,提取特征的不穩(wěn)定性也為行為理解帶來(lái)很大的困難,但多模特征融合將為行為理解提供一種很好的解決辦法。例如在某些環(huán)境中,可視信息受干擾,變得敏感不可靠時(shí),聲音特征將為基于視頻的行為理解提供一個(gè)很好的補(bǔ)充[125,126];在遮擋的情況下,基于多攝像機(jī)信息融合方法由于能夠很好地解決遮擋問(wèn)題,在行為理解研究[70~72]也將會(huì)得到快速的發(fā)展。
對(duì)于運(yùn)動(dòng)特征表征來(lái)說(shuō),不同復(fù)雜程度的運(yùn)動(dòng)通常會(huì)采用不同的運(yùn)動(dòng)表達(dá)方法,即使是同一種動(dòng)作在不同的場(chǎng)合,由于快慢速度不一致等都會(huì)產(chǎn)生不同的時(shí)空關(guān)系。如何表征這些細(xì)微的時(shí)空變化并沒(méi)有一個(gè)很好的辦法。一個(gè)可行的辦法是采用多分辨率的方法[127]來(lái)表征和分析運(yùn)動(dòng),但計(jì)算量較大。
b)行為識(shí)別。目前人行為理解雖然取得一定的進(jìn)展,但行為理解研究還只局限于簡(jiǎn)單、固定視角且已切分好后的動(dòng)作,對(duì)不同動(dòng)作連續(xù)變化的長(zhǎng)運(yùn)動(dòng)序列的研究比較少[54],而且魯棒差,在噪聲、亮度和光照變化強(qiáng)烈以及視角變化的復(fù)雜環(huán)境中正確識(shí)別率大大降低。目前的行為識(shí)別方法如狀態(tài)轉(zhuǎn)移的圖模型方法和模板匹配方法通常在計(jì)算代價(jià)和運(yùn)動(dòng)識(shí)別的準(zhǔn)確度之間進(jìn)行折中,而且都是先訓(xùn)練后使用,只能識(shí)別訓(xùn)練中預(yù)先定義好的動(dòng)作,沒(méi)有自動(dòng)學(xué)習(xí)新行為的能力,缺乏考慮場(chǎng)景等背景知識(shí),很難根據(jù)目標(biāo)行為和場(chǎng)景的先驗(yàn)知識(shí)進(jìn)行自動(dòng)機(jī)器學(xué)習(xí)。例如HMMs等方法被看成一個(gè)黑盒,它不解釋某種行為是什么,只輸出一種未知行為與認(rèn)知的模式行為之間的概率。所以仍需要尋找和開發(fā)新技術(shù),以利于在提高行為識(shí)別性能的同時(shí),又能有效地降低計(jì)算的復(fù)雜度。
c)高層行為與場(chǎng)景理解。行為本身具有很強(qiáng)的模糊性,同一行為、事件、狀態(tài)在不同的場(chǎng)景有著不同的概念,當(dāng)同一場(chǎng)景中有多個(gè)目標(biāo)出現(xiàn)時(shí)其行為模糊性更加明顯。所以,如何借助于先進(jìn)的視覺(jué)算法和人工智能等領(lǐng)域的成果,將現(xiàn)有的簡(jiǎn)單行為識(shí)別與理解推廣到更為復(fù)雜場(chǎng)景下的事件與場(chǎng)景理解,是將計(jì)算機(jī)視覺(jué)低、中層次的處理推向高層抽象思維的關(guān)鍵問(wèn)題。
d)行為理解與生物特征識(shí)別相結(jié)合。在智能安全監(jiān)控、智能人機(jī)交互中,行為理解與生物特征相結(jié)合顯得更加重要,不但要求系統(tǒng)能夠識(shí)別被監(jiān)控對(duì)象的當(dāng)前行為狀態(tài),而且能夠識(shí)別當(dāng)前被監(jiān)控的對(duì)象身份。生物特征技術(shù)識(shí)別如步態(tài)識(shí)別[50]、人臉識(shí)別等[128,129]給對(duì)象身份識(shí)別提供了一個(gè)很好的解決辦法。所以與生物特征識(shí)別相結(jié)合的行為理解將會(huì)是未來(lái)的研究方向之一。
e)算法評(píng)價(jià)。一般而言,魯棒性、準(zhǔn)確度、速度是人行為識(shí)別的三個(gè)基本要求,要求能夠快速準(zhǔn)確地識(shí)別運(yùn)動(dòng)且連續(xù)地工作,對(duì)于如噪聲、光照、天氣等因素的影響不能太敏感。但目前的識(shí)別方法更多關(guān)注的是識(shí)別率,對(duì)魯棒性和速度兩個(gè)指標(biāo)研究要求很少。另外,對(duì)行為識(shí)別方法沒(méi)有統(tǒng)一的視頻測(cè)試序列,大部分研究方法都是具體問(wèn)題具體分析,是用各自選擇的視頻序列進(jìn)行實(shí)驗(yàn)分析,無(wú)法對(duì)提出的算法進(jìn)行統(tǒng)一評(píng)價(jià)。
5 結(jié)束語(yǔ)
人行為理解已經(jīng)成為計(jì)算機(jī)視覺(jué)領(lǐng)域一個(gè)重要的研究方向之一,在智能監(jiān)控、人機(jī)交互等方面的應(yīng)用前景引起了廣大科研人員的濃厚興趣。本文從特征選擇與運(yùn)動(dòng)表征、行為識(shí)別方法以及高層行為與場(chǎng)景理解三個(gè)方面總結(jié)了近年來(lái)人行為理解研究現(xiàn)狀和進(jìn)展。其征提取和運(yùn)動(dòng)表征可以歸結(jié)為行為建模,即如何描述行為動(dòng)作。目前的方法需要根據(jù)具體實(shí)際應(yīng)用情況,在動(dòng)作模型描述精確度和計(jì)算復(fù)雜度中折中,選擇適當(dāng)?shù)姆椒▉?lái)對(duì)行為建模。本文將行為識(shí)別算法細(xì)分成模板匹配方法、基于圖模型的方法等,同時(shí)對(duì)各種常用的數(shù)據(jù)匹配方法進(jìn)行逐一分析,并且討論了目前的高層行為與場(chǎng)景理解的研究發(fā)展與現(xiàn)狀。最后提出了目前行為理解存在的問(wèn)題和未來(lái)的發(fā)展趨勢(shì)。盡管當(dāng)前行為理解研究取得了一定的進(jìn)展,但依然處于萌芽階段,需要提出新的方法來(lái)解決相關(guān)問(wèn)題,提高行為理解的性能。
參考文獻(xiàn):
[[1]王亮,胡衛(wèi)明,譚鐵牛.人運(yùn)動(dòng)的視覺(jué)分析綜述[J].計(jì)算機(jī)學(xué)報(bào),2002,25(3):225-237.
[2]JAIMES A,SEBE N.Multimodal human computer interaction:a survey[C]//Proc ofIEEE International Workshop on Human Computer Interaction in Conjunction with ICCV2005.Beijing:[s.n.],2005.
[3]NIJHOLT A.Meetings, gatherings, and events in smart environments[C]//Proc of ACM SIGGRAPH International Conference on Virtual Reality Continuum and Its Applications in Industry.2004:229-232.
[4]KITTLER J,BALLETTE M,CHRISTMAS W J,et al. Fusion of multiple cue detectors for automatic sports video annotation[C]//Proc of Workshop on Structural, Syntactic and Statistical Pattern Recognition.2002:597-606.
[5]TJONDRONEGORO D,CHEN Y P P,PHAM B.Content ased video indexing for sports applications using integrated multimodal approach[C]//Proc of the 13th Annual ACM International Conference on Multimedia.2005:1035-036.
[6]COLLINS R,LIPTON A,KANADE T, et-al.A system for video surveillance and monitoring: VSAM final report,CMU-RI-TR-00-12[R].[S.l.]:Carnegie Mellon University,2000.
[7]HARITAOGLU I,HARWOOD D,DAVIS L S.W4: realtime surveillance of people and their activities[J].IEEE Trans on PatternAnalysis and Machine Intelligence,2000,22(8):809-830.
[8]NAYLOR M,ATTWOOD C I.Annotated digital video for intelligent surveillance and optimized retrieval:final report[R].[S.l.]:ADVISOR Conortium,2003.
[9]HID[EB/OL].www-static.cc.gatech.edu/gvu/perception//projects/hid.
[10]REASON[EB/OL].cvg.cs.reading.ac.uk/.
[11]WREN C R,AZARBAYEJANI A,DARRELL T, et-al . Pfinder:real time tracking of the human body[J].IEEE Trans on Pattern Analysis and Machine Intelligence,1997,19(7):780-785.
[12]BLAUENSTEINER P,KAMPEL M.Visual surveillance of an airport’s apron:an overview of the AVITRACK project[EB/OL].prip.tuwien.ac.at/~kampel/ papers/blauoeagm04.pdf.
[13][EB/OL].nlpr-web.ia.ac.cn/.
[14][EB/OL].research.microsoft.com/asia/group/vc/.
[15][EB/OL].cis.pku.edu.cn/introduction.htm.
[16]SHEIKH Y,SHAH M.Bayesian modeling of dynamic scenes for object detection[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2005,27(11):1778-792.
[17]ELGAMMAL A,HARWOOD D,DAVIS L.Non arametric model for background subtraction[C]//Proc of the 6th European Conference on Computer Vision. Dublin,Ireland:[s.n.], 2000:751-67.
[18]左軍毅,潘泉,梁彥,等.基于模型切換的自適應(yīng)背景建模方法[J].自動(dòng)化學(xué)報(bào),2007,33(5):467-473.
[19]JAVED O,SHAH M.Tracking and object classification for automated surveillance[C]//Proc of the 7th European Conference on Computer Vision.Copenhagen:[s.n.],2002.
[20]CHEN Yun-qiang,RUI Yong,HUANG T S.Multicue HMMUKF for realtime contour tracking[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2006,28(9):1525-529.
[21]YANG Tao,LI S Z,PAN Quan, et-al . Real time multiple objects tracking with occlusion handling in dynamic scenes[C]//Proc of IEEE International Conference on Computer Vision and Pattern Recognition.San Diego,CA:[s.n.],2005.
[22]WANG Yong zhong,LIANG Yan,ZHAO Chun hui, et-al. Adaptive multi cue kernel tracking[C]//Proc of IEEE International Conference on Multimedia & Expo.2007:1814-1817.
[23]李培華.一種改進(jìn)的Mean Shift跟蹤算法[J].自動(dòng)化學(xué)報(bào),2007,33(4):347-354.
[24]AGGARWAL J K,CAI Q.Human motion analysis: a review[C]//Proc of IEEE Nonrigid and Articulated Motion Workshop.Piscataway:IEEE Computer Society,1997:90-102.
[25]GAVRILA D M.The visual analysis of human movement: a survey[J].Computer Vision and Image Understanding,1999,73(1): 82-98.
[26]MOESLUND T B,GRANUM E.A survey of computer visionbased human motion capture[J].Computer Vision and Image Understanding,2001,81(3):231-268.
[27]HU Wei ming,TAN Tie niu,WANG Liang, et-al. A survey on visual surveillance of object motion and behaviors[J].IEEE Trans on Systems, Man, and CyberneticsPart C: Application and Reviews,2004,34(3):334-352.
[28]劉相濱,向堅(jiān)持,王勝春.人行為識(shí)別與理解研究探討[J].計(jì)算機(jī)與現(xiàn)代化,2004(12):1-5,27.
[29]BUXTONH,GONG Shao gang.Advanced visual surveillance using Bayesian networks[C]//Proc of the 5th IEEE International Confe rence on Computer Vision.Massachusetts:[s.n.],1995.
[30]BREMOND F,THONNAT M,ZUNIGA M.Video understanding framework for automatic behavior recognition[J].Behavior Research Methods Journal,2006,38(3):416-426.
[31]AMER A,DUBOIS E,MITICHE A.A realtime system for high level video representation:application to video surveillance[C]//Proc of SPIE International Symposium on Electronic Imaging, Conference on Visual Communication and Image Processing.Santa Clara:[s.n.],2003:530-541.
[32]JIN Ning,MOKHTARIAN F.Human motion recognition based on statistical shape analysis[C]//Proc of IEEE Conference on Advanced Video and Signal Based Surveillance.2005.
[33]ELBASI E,ZUO Long,MEHROTRA K, et-al. Control charts approach for scenario recognition in video sequences[J].Turk J Elec Engin,2005,13:303-310.
[34]FUJIYOSHI H,LIPTON A J.Real time human motion analysis by image skeletonization[C]//Proc of the 4th IEEE Workshop on Applications of Computer Vision.1998:15-21.
[35]VEERARAGHAVAN A,ROYCHOWDHURY A K,CHELLAPPA R.Matching shape sequences in video with applications in human movement analysis[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2005,27(12):1896-1909.
[36]CHEN H S,CHEN H T,CHEN Yiwen,et al.Human action recognition using star skeleton[C]//Proc of the 4th ACM International Workshop on Video Surveillance and Sensor Networks.2006.
[37]WANG Liang,SUTER D.Learning and matching of dynamic shape manifolds for human action recognition[J].IEEE Trans on Image Processing,2007,16(6):1646-1661.
[38]JU S X,BLACKY M J,YACOOBZ Y.Cardboard people:a paramete rized model of articulated image motion[C]//Proc of International Conference on Automatic Face and Gesture Recognition.1996:38-44.
[39]MITTAL A,ZHAO Liang,DAVIS L S.Human body pose estimation using silhouette shape analysis[C]//Proc of IEEE Conference on Advanced Video and Signal Based Surveillance.2003:263-270.
[40]CORREAL P,CZYZ J,MARQUEST, et-al. Silhouette based probabilistic 2D human motion estimation for realtime applications[C]//Proc of International IEEE International Conference on Image Proce ssing.2005.
[41]POPPER,POEL M.Example based pose estimation in monocular images using compact Fourier descriptors,TRCTIT-05-49[R].Enschede:University of Twente, 2005.轉(zhuǎn)貼于
[42]MORI G,MALIK J.Recovering 3D human body configurations using shape contexts[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2006,28(7):1052-1062.
[43]CEDRASC,SHAH M.Motion based recognition:a survey[J].Image and Vision Computing,1995,13(2):129-155.
[44]BLACK M J,YACOOB Y,JU S X.Recognizing human motion using parameterized models of optical flow[M]//Motion based recognition.[S.l.]:Kluwer Academic Publishers,1997:245-269.
[45]YANG M H,AHUJA N.Recognizing hand gesture using motion trajectories[C]//Proc of IEEE International Conference on Computer Vision and Image Understanding.1999.
[46]EFROS A,BERG A,MORIG, et-al . Recognizing actions at a distance[C]//Proc of IEEE International Conference on Computer Vision.Nice,F(xiàn)rance:[s.n.],2003.
[47]ZHU Guangyu,XU Changsheng.Action recognition in broadcast tennis video[C]//Proc of the 18th International Conference on Pattern Recognition.2006.
[48]JOHANSSONG.Visual perception of biological motion and a model for its analysis[J].Perception and Psychophysics,1973,14(2):201-211.
[49]NIU Feng,ABDELMOTTALEB M.View invariant human activity recognition based on shape and motion features[C]//Proc of the 6th IEEE International Symposium on Multimedia Software Engineering.2004.
[50]WANG Liang,NING Hua zhong,TAN Tie niu, et-al. Fusion of static and dynamic body biometrics for gait recognition[J].IEEE Trans on Circuits and Systems for Video Technology,2004,14(2):149-158.
[51]FANTIC,ZWLNIKMANORL,PERONAP.Hybrid models for human motion recognition[C]//Proc of IEEE Conference Computer and Pattern Recognition.2005:1166-1173.
[52]BOBICKAF,DAVISJW.The recognition of human movement using temporal templates[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2001,23(3):257-267.
[53]MASOUDO,PAPANIKOLOPOULOS N.A method for human action recognition[J].Image and Vision Computing,2003,21:729-743.
[54]CAO Dongwei,MASOUDOT,BOLEY D.On line motion classification using support vector machines[C]//Proc of IEEE International Conference on Robotics and Automation.New Orleans:[s.n.],2004.
[55]LAPTEV I,LINDEBERG T.Local descriptors for spatio temporal recognition[C]//Proc of International Workshop on Spatial Coherence for Visual Motion Analysis.Prague:[s.n.],2004.
[56]DOLL’AR P,RABAUD V,COTTRELL G, et-al. Behavior recognition via sparse spatiotemporal features[C]//Proc of the 2nd Joint IEEE International Workshop on Visual Surveillance and Performance Eva luation of Tracking and Surveillance.2005.
[57]BLANKM,GORELICKL,SHECHTMANE, et-al. Actions as space time shapes[C]//Proc of IEEE International Conference on Computer Vision.Beijing:[s.n.],2005.
[58]GAVRILA D,DAVIS L.3D modelbased tracking of human upper body movement: a multiview approach[ C]//Proc of International Symposium on Computer Vision.1995:253-258.
[59]ISARDM,BLAKEA.Condensation-conditional density propagation for visual tracking[J].International Journal of Computer Vision,1998,29(1):5-28.
[60]DEUTSCHER J,BLAKE A,REID I.Articulated body motion capture by annealed particle filtering[C]//Proc of IEEE Computer Society Conference on Computer Vision and Pattern Recognition.1998.
[61]NIYOGI S,ADELSON E.Analyzing and recognizing walking figures in xyt[C]//Proc of Computer Vision and Pattern Recognition.1994:469-474.
[62]LONCARICS.A survey of shape analysis techniques[J].Pattern Recognition,1998,32(8):983-1001.
[63]DRYDENI L,MARDIA K V.Statistical shape analysis[M].[S.l.]:Wiley,1998.
[64]DRYEN I.Statistical shape analysis in high level vision[C]//Proc of IMA Workshop on Image Analysis and High Level Vision.2000.
[65]BELONGIE S,MALIK J,PUZICHA J.Shape matching and objects recognition using shape contexts[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2002,24(4):509-522.
[66]HU M K.Visual pattern recognition by moment invariants[J].IEEE Trans on Information Theory,1962,8(2):179-187.
[67]POPPE R,POEL M.Comparison of silhouette shape descriptors for example based human pose recovery[C]//Proc of the 7th IEEE International Conference on Automatic Face and Gesture Recognition.Southampton:[s.n.], 2006.
[68]VASWANI N,CHOWDHURY A R,CHELLAPPA R.Activity recognition using the dynamics of the configuration of interacting objects[C]//Proc of IEEE Conference on Computer Vision and Pattern Recognition .2003.
[69]LIU Che bin,AHUJA N.A model for dynamic shape and its applications[C]//Proc of IEEE Conference on Computer Vision and Pattern Recognition.2004.
[70]PARK S,TRIVEDI M M.A two stage multi view analysis framework for human activity and interactions[C]//Proc of IEEE Workshop on Motion and Video Computing.2007.
[71]TYAGI A,POTAMIANOS G,DAVIS J W, et-al. Fusion of multiple camera views for kernel based 3D tracking[C]//Proc of IEEE Workshop on Motion and Video Computing.2007.
[72]ZOUBA N,BREMOND F,THONNAT M, et-al. Multisensors analysis for everyday activity monitoring[C]//Proc of the 4th International Conference on Sciences of Electronic, Technologies of Information and Telecommunications.2007.
[73]BASHIRFI,KHOKHARA A, SCHONFELDD.Object trajectory based activity classification and recognition using hidden Markov models [J].IEEE Trans on Image Processing,2007,16(7):1912-1919.
[74]ROBERTSON N,REID I.A general method for human activity recognition in video[J].Computer Vision and Image Understanding,2006,104:232-248.
[75]YACOOB Y,BLACK M J.Parameterized modeling and recognition of activities[J].Computer Vision and Image Understanding,1999,73(2):232-247.
[76]CARLSSON S,SULLIVAN J.Action recognition by shape matching to key frames[C]//Proc ofWorkshop on Models Versus Exemplars in Computer Vision.2001.
[77]RABINER L,JUANG B.Fundamentals of speech recognition[M].[S.l.]:Prentice Hall,1993.
[78]MURPHY K P.An introduction to graphical models[R].2001.
[79]STENGEL M.Introduction to graphical Models,hidden Markov models and Bayesian networks[EB/OL].(2003-02-07).http:markusstengel.de/varions/uni/speech/tutorial.pdf.
[80]RABINER L R.A tutorial on hidden Markov models and selected applications in speech recognition[J].Proc of the IEEE,1989,77(2):257-286.
[81]BREGLER C.Learning and recognizing human dynamics in video sequences[C]//Proc of IEEE Conference on Computer Vision and Pattern Recognition.Puerto Rico:[s.n.],1997:568-574.
[82]YAMATO J,OHYA J,ISHII K.Recognizing human action in timesequential images using hidden Markov model[C]//Proc of IEEE Conference on Computer Vision and Pattern Recognition.Champaign, Illinois:[s.n.],1992:379-385.
[83]TOREYIN B U,DEDEOGLU Y,CETIN A E.HMM based falling person detection using both audio and video[C]//Proc of IEEE International Workshop on HumanComputer Interaction.Beijing:[s.n.],2005.
[84]BRAND M,OLIVER N,PENTLAND A.Coupled hidden Markov models for complex action recognition[C]//Proc of IEEE Internatio nal Conference on Computer Vision and Pattern Recognition.1997:994-999.
[85]KRISTJANSSON T T,F(xiàn)REY B J,HUANGTS, et-al. Event coupled hidden Markov models[C]//Proc of IEEE International Conference on Multimedia and Expo.2000:385-388.
[86]OLIVER N,ROSARIO B,PENTLAND A.A Bayesian computer vision system for modeling human interactions[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2000,22(8):831-843.
[87]FINES,SINGERY,TISHBYN.The hierarchical hidden Markov model: analysis and applications[J].Machine Learning,1998,32(1):41-62.
[88]NGUYEN N T,PHUNG D Q,VENKATESH S, et-al. Learning and detecting activities from movement trajectories using the hierachical hi dden Markov model[C]//Proc of Computer Vision and Pattern Re cognition. San Diego:[s.n.],2005:955-960.
[89]KAWANAKA D,OKATANI T,DEGUCHI K, et-al. Hierarchical HMM based recognition of human activity[C]//Proc of MVA.2005.
[90]BUI H H,VENKATESH S,WESTGA, et-al. Tracking and surveillance in widearea spatial environments using the abstract hidden Markov model[J].International Journal of Pattern Recognition and Artificial Intelligence,2001,15(1):177-195.
[91]GALATA A,JOHNSON N,HOGG D.Learning variable length Markov models of behavior[J].Computer Vision and Image Understan ding,2001,81(3):398-413.
[92]SMINCHISESCUC,KANAUJIA A,LI Zhiguo, et-al. Conditional models for contextual human motion recognition[C]//Proc of the 10th IEEE International Conference on Computer Vision.2005.
[93]BRAND M,KETTNAKER V.Discovery and segmentation of activities in video[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2000,22(8):844-851.
[94]OLIVER N,HORVITZ E,GARG A.Layered representations for human activity recognition[C]//Proc of the 4th IEEE International Conference on Multimodal Interfaces.2002:3-8.
[95]ZHANG Dong,GATICAPEREZ D,BENGIOS, et-al. Modeling inpidual and group actions in meetings with layered HMMs[J].IEEE Trans on Multimedia,2006,8(3):509-520.
[96]MURPHYK.DynamicBayesiannet works:representation,inference and learning[D].Berkeley:University of California,2002.
[97]PARK S,AGGARWAL J K.Recognition of twoperson interactions using a hierarchical Bayesian network[C]//Proc of ACM SIGMM International Workshop on Video Surveillance.Berkeley:[s.n.],2003:65-76.
[98]DU You tian,CHEN Feng,XU Wenli, et-al. Interacting activity recognition using hierarchical durational state dynamic Bayesian network[C]//Proc of Pacific Rim Conference on Multimedia.2006:185-192.
[99]MOENNELOCCOZN,BREMONDF,THONNAT M.Recurrent Bayesian network for the recognition of human behaviours video[C]//Proc of ICVS. Graz:IEEE Computer Society Press,2003:68-77.
[100]GONG Shao gang,XIANG Tao.Recognition of group activities using dynamic probabilistic networks[C]//Proc of International Conference on Computer Vision.2003:742-749.
[101]LUO Ying,WU T D,HWANG J N.Object based analysis and interpretation of human motion in sports video sequences by dynamic Bayesian networks[J].Computer Vision and Image Understanding,2003,92(2):196-216.
[102]MUNCASTER J,MA Yunqian.Activity recognition using dynamic Bayesian networks with automatic state selection[C]/Proc of IEEE Workshop on Motion and Video Computing.2007.
[103]BUCCOLIERI F,DISTANTE C,LEONE A.Human posture recognition using active contours and radial basis function neural network[C]//Proc of Conference on Advanced Video and Signal Based Surveillance.2005.
[104]HONG Pengyu,TURK M,HUANG T S.Gesture modeling and recognition using finite state machines[C]//Proc of IEEE Conference on Face and Gesture Recognition.2000.
[105]BADLER N.Temporal scene analysis:conceptual description of object movements,No.80[R].Toronto:University of Toronto,1975.
[106]INTILLE S,BOBICK A.Representation and visual recognition of complex, multiagent actions using belief networks,No.454[R].[S.l.]:MIT,1998.
[107]MORI T,SHIMOSAKA M,SATO T.SVMbased human action recognition and its remarkable motion features discovery algorithm[C]//Proc of International Symposium on Experimental Robotics.2003.
[108]LAPTEV S I,CAPUTO B.Recognizing human actions: a local SVM approach[C]//Proc ofInternational Conference on Pattern Recognition.2004.
[109]ZHU Guang yu,XU Chang sheng,GAO Wen, et-al. Action recognition in broadcast tennis video using optical flow and support vector machine[C]//Proc of ECCV.2006.
[110]CUTLER R,TURK M.Viewbased interpretation of real time optical flow for gesture recognition[C]//Proc of the 3rd International Confe rence on Face Gesture Recognition.1998.
[111]KOJIMA A,TAMURA T.Natural language description of human activities from video images based on concept hierarchy actions[J].International Journal of Computer Vision,2001,50:171184.
[112]HONGENGS,NEVATIA R.Multi agent event recognition[C]//Proc of International Conference on Computer Vision.2001:84-91.
[113]ROBERTSON N,REID I.Behavior understanding in video: a combined method[C]//Proc of the 10th IEEE International Conference on Computer Vision.2005:808-815.
[114]PYNADATHD V,WELLMAN M P.Generalized queries on probabilistic context free grammars[J].IEEE Trans on Pattern Analysis and Machine Intelligence,1998,20(1):65-77.
[115]IVANOV Y,BOBICK A.Recognition of visual activities and interactions by stochastic parsing[J].IEEE Trans on Pattern Recognition and Machine Intelligence,2000,2(8):852-872.
[116]RYOOM S,AGGARWAL J K.Recognition of composite human activities through contextfree grammar based representation[C]//Proc of IEEE Computer Society Conference on Computer Vision and Pattern Recognition.2006.
[117]PYNADATHDV,WELLMANMP.Probabilistic state dependent grammars for plan recognition[C]//Proc of the 16th Conference on Uncertainty in Artificial Intelligence.San Francisco, CA:[s.n.], 2000:507-514.
[118]PARKS,AGGARWAL J K.Event semantics in twoperson interactions[C]//Proc of International Conference on Pattern Recognition.Cambridge:[s.n.],2004.
[119]NGUYEN N T,BUI H H,VENKATESHS, et-al. Recognising and monitoring highlevel behaviours in complex spatial environments[C]//Proc of IEEE Computer Vision and Pattern Recognition Canference.2003.
[120]KAMBHAMETTUC,GOLDGOFDB,TERZOPOULOSD,et-al.Nonrigid motion analysis[M]//Handbook of PRIP:computer vision.Orlando:Academic Press,1994.
[121]FERRYMAN J,BORGM,THIRDED, et-al. Automated scene understanding for airport aprons[C]//Proc of the 18th Australian Joint Conference on Artificial Intelligence.Sidney:SpringerVerlag,2005.
[122]BIRD N D,MASOUD O,PAPANIKOLOPOULOSNP, et-al. Detection of loitering inpiduals in public transportation areas[J].IEEE Trans on Intelligent Transportation Systems,2005,6(2):167-177.
[123]LUSi jun,ZHANG Jian,F(xiàn)ENGDD.Detecting unattended packages through human activity recognition and object association[J].Journal of the Pattern Recognition,2007,40(8):2173-2184. [124]OGALEA S,KARAPURKAR A,ALOMONOS Y.Viewinvariant modeling and recognition of human actions using grammars[C]//Proc of International Conference on Computer Vision.Beijing:[s.n.],2005.
[125]GATICAPEREZD,LATHOUDG,ODOBEZJM, et-al. Audio visual probabilistic tracking of multiple speakers in meetings[J]. IEEE Trans on Audio, Speech, and Language Processing,2007,15(2):601-616.
[126]CRISTANI M,BICEGOM,MURINOV.Audio visual event recognition in surveillance video sequences[J].IEEE Trans on Multime dia,2007,9(2):257-267.
[127]LI Hong,GREENSPAN M.Multi scale gesture recognition from time varying contours[C]//Proc of the 10th IEEE International Conference on Computer Vision.2005:236-243.
關(guān)鍵詞:圖形圖像搜索 以圖搜圖 移動(dòng)電子商務(wù)
中圖分類號(hào):G350 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2016)04(a)-0090-04
1 基于移動(dòng)電子商務(wù)的圖形圖像搜索
移動(dòng)電子商務(wù),移動(dòng)設(shè)備輕便易攜、碎片化、娛樂(lè)化特征明顯,可隨時(shí)隨地滿足用戶的即時(shí)性消費(fèi)需求,由此,移動(dòng)終端日漸成為用戶網(wǎng)上購(gòu)物的重要選擇。同時(shí),移動(dòng)購(gòu)物和生活場(chǎng)景相互交融,偶發(fā)性和沖動(dòng)型消費(fèi)快速滋長(zhǎng),電商情境化趨勢(shì)日益彰顯;另一方面,智能移動(dòng)終端對(duì)音頻、視頻、圖像等各類信息采集方便,以圖片為例,其中適合圖像搜索的圖片為20%,假設(shè)0.5%人次成功轉(zhuǎn)移,1%平均購(gòu)買轉(zhuǎn)化率,平均購(gòu)物單價(jià)為200元,如,按平均10%的傭金計(jì)算,那么一年產(chǎn)業(yè)規(guī)模也超過(guò)220億元。加上其他收入,比如:廣告、手機(jī)搜索等,總體市場(chǎng)規(guī)模不低于600億元。
隨著移動(dòng)電子商務(wù)日益興起,圖形圖像搜索已能為客戶帶來(lái)全新的用戶體驗(yàn)。在購(gòu)物領(lǐng)域,非常典型的就是服裝服飾等非標(biāo)類產(chǎn)品,占到整個(gè)電子商務(wù)的55%市場(chǎng)份額。淘寶用戶只要看到了目標(biāo)商品,就可以使用圖片搜索功能對(duì)比同款產(chǎn)品的市場(chǎng)價(jià)格,也能找到更多相似款。這是移動(dòng)電子商務(wù)能帶來(lái)的極致便捷體驗(yàn)。圖形圖像搜索技術(shù)一直受到巨頭們的青睞,百度為深入研究“深度學(xué)習(xí)”算法,特地設(shè)立了IDL(Institute of Deep Learning)研究院。谷歌更是在短短幾年內(nèi),陸續(xù)收購(gòu)了七八家涉足圖像識(shí)別的技術(shù)公司,并試圖以谷歌眼鏡搶占智能移動(dòng)終端的場(chǎng)景入口。圖圖搜利用微信公眾號(hào),以微信拍照購(gòu)物搜索功能,率先成為第一家接入微信的圖像搜索引擎網(wǎng)站。谷歌、騰訊、百度等大公司也都在圖片搜索領(lǐng)域有資源投入,為圖片購(gòu)物搜索發(fā)展帶來(lái)了壓力的同時(shí),更為市場(chǎng)帶來(lái)了各大圖像技術(shù)競(jìng)相追逐的動(dòng)力。
2 典型應(yīng)用舉例
2.1 手機(jī)購(gòu)物網(wǎng)站相似商品搜索
可以是用戶上傳圖片搜索,也可以是站內(nèi)圖片點(diǎn)擊搜索。(如圖1所示)
2.2 移動(dòng)拍照購(gòu)物
隨手拍照―― 準(zhǔn)確搜到相關(guān)商品。(如圖2所示)
2.3 區(qū)域搜索
給定一張時(shí)尚或明星圖片,根據(jù)自主的圖片選定區(qū)域,能夠識(shí)別與圖片選定區(qū)域內(nèi)容相似的其他商品圖片,然后根據(jù)相似度排序。(如圖3所示)
3 關(guān)鍵技術(shù)總結(jié)
3.1 圖像搜索系統(tǒng)結(jié)構(gòu)
基于移動(dòng)電子商務(wù)的圖形圖像搜索技術(shù),通常的做法包括IEEE的標(biāo)準(zhǔn),都是用圖像特征值來(lái)實(shí)現(xiàn)的。搜索引擎將目標(biāo)圖片進(jìn)行特征提取,形成一組特征描述或特征向量。當(dāng)用戶搜索時(shí),將查詢圖像的特征描述與數(shù)據(jù)庫(kù)中其他圖像的特征描述進(jìn)行自動(dòng)匹配,并返回匹配結(jié)果。(如圖4所示)
3.2 核心技術(shù)
上述圖像搜索系統(tǒng)的技術(shù)核心就是對(duì)圖像特征的提取,特征提取是計(jì)算機(jī)視覺(jué)和圖像處理中的一個(gè)概念。它指的是使用計(jì)算機(jī)提取圖像信息,決定每個(gè)圖像的點(diǎn)是否屬于一個(gè)圖像特征。特征被檢測(cè)后它可以從圖像中被抽取出來(lái),這個(gè)過(guò)程可能需要許多圖像處理的計(jì)算機(jī),其結(jié)果被稱為特征描述或者特征向量。
常用的圖像特征有顏色(Color)、紋理(Texture)、形狀(Shape)、空間(Space)關(guān)系等。
(1)顏色特征:顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對(duì)應(yīng)的景物的表面性質(zhì)。一般顏色特征是基于像素點(diǎn)的特征,此時(shí)所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻(xiàn)。顏色直方圖是最常用的表達(dá)顏色特征的方法,其優(yōu)點(diǎn)是不受圖像旋轉(zhuǎn)和平移變化的影響,進(jìn)一步借助歸一化還可不受圖像尺度變化的影響,其缺點(diǎn)是沒(méi)有表達(dá)出顏色空間分布的信息。此外,顏色特征提取還有顏色集、顏色矩、顏色聚合向量、顏色相關(guān)圖等方法。
(2)紋理特征:紋理特征也是一種全局特征,它與顏色特征不同,紋理特征不是基于像素點(diǎn)的特征,它需要在包含多個(gè)像素點(diǎn)的區(qū)域中進(jìn)行統(tǒng)計(jì)計(jì)算。在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會(huì)由于局部的偏差而無(wú)法匹配成功。在檢索具有粗細(xì)、疏密等方面較大差別的紋理圖像時(shí),利用紋理特征是一種有效的方法。常用的紋理特征提取與匹配方法有灰度共生矩陣、Voronio棋盤格特征法和結(jié)構(gòu)法、隨機(jī)場(chǎng)模型法、Tamura紋理特征、自回歸紋理模型、小波變換等。
(3)形狀特征:各種基于形狀特征的檢索方法都可以比較有效地利用圖像中感興趣的目標(biāo)來(lái)進(jìn)行檢索。通常情況下,形狀特征有兩類表示方法:一類是輪廓特征;另一類是區(qū)域特征。圖像的輪廓特征主要針對(duì)物體的外邊界,而圖像的區(qū)域特征則關(guān)系到整個(gè)形狀區(qū)域。典型的形狀特征描述方法有傅里葉形狀描述符法、Hough變換檢測(cè)平行直線方法、有限元法(Finite Element Method或FEM)、旋轉(zhuǎn)函數(shù)(Turning)和小波描述符(Wavelet Deor)等方法。
(4)空間關(guān)系特征:所謂空間關(guān)系,是指圖像中分割出來(lái)的多個(gè)目標(biāo)之間的相互的空間位置或相對(duì)方向關(guān)系,這些關(guān)系也可分為連接/鄰接關(guān)系、交疊/重疊關(guān)系和包含/包容關(guān)系等,空間關(guān)系特征的使用可加強(qiáng)對(duì)圖像內(nèi)容的描述區(qū)分能力。提取圖像空間關(guān)系特征可以有兩種方法:一種方法是首先對(duì)圖像進(jìn)行自動(dòng)分割,劃分出圖像中所包含的對(duì)象或顏色區(qū)域,然后根據(jù)這些區(qū)域提取圖像特征;另一種方法則簡(jiǎn)單地將圖像均勻地劃分為若干規(guī)則子塊,然后對(duì)每個(gè)圖像子塊提取特征。
自從Hinton在2012年將深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)帶入到圖像分類領(lǐng)域后,深度學(xué)習(xí)在圖像處理相關(guān)領(lǐng)域的研究一下子變得異常火熱起來(lái)。基于深度學(xué)習(xí)原理的圖像檢索,更多的是從一種圖像理解的角度來(lái)進(jìn)行的,得到的是一種更加抽象的描述,也可以理解為“語(yǔ)義”,它更多的是在解釋這個(gè)圖像描繪的是什么物體或者什么場(chǎng)景之類的。這種仿照人腦的識(shí)別過(guò)程而設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)提取圖片中的語(yǔ)義信息,彌補(bǔ)了其他傳統(tǒng)算法在這方面的不足。(如圖5所示)
3.3 應(yīng)用集成設(shè)計(jì)
應(yīng)用集成設(shè)計(jì)如圖6所示。
3.4 系統(tǒng)關(guān)鍵技術(shù)指標(biāo)
(1)該平臺(tái)表現(xiàn)出良好的用戶服務(wù)支持能力。經(jīng)系統(tǒng)實(shí)際運(yùn)行測(cè)試,目前平臺(tái)已入駐企業(yè)近萬(wàn)家,平臺(tái)運(yùn)行平穩(wěn),響應(yīng)速度快,具有良好的用戶體驗(yàn)。(2)項(xiàng)目自上線以來(lái),該平臺(tái)運(yùn)行平穩(wěn),在高性能單服務(wù)器上支持并發(fā)搜索5 000以上。(3)擁有的圖像算法,搜索結(jié)果效率高,核心算法庫(kù)搜索響應(yīng)速度
4 產(chǎn)業(yè)機(jī)遇與面臨問(wèn)題
圖像搜索,可以簡(jiǎn)單地認(rèn)為是“以圖搜圖”,但又不只是圖像識(shí)別這么簡(jiǎn)單。如果把圖像搜索等同于圖片識(shí)別,它并不算什么高超的技術(shù),不同領(lǐng)域的圖像識(shí)別技術(shù)已經(jīng)趨于成熟。識(shí)別只是圖像搜索的第一步,第二步是理解,第三步是檢索,每一步都存在著技術(shù)難點(diǎn)。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,圖片已逐漸替代文字成為了移動(dòng)終端的主要信息載體,圖形圖像搜索以圖搜圖的產(chǎn)品特點(diǎn),天然貫通了移動(dòng)終端到電子商務(wù)平臺(tái)圖片信息傳遞的過(guò)程,利用圖像搜索服務(wù)來(lái)引導(dǎo)移動(dòng)電子商務(wù)消費(fèi)已成為趨勢(shì)。
5 圖形圖像搜索的發(fā)展方向
在移動(dòng)電子商務(wù)領(lǐng)域內(nèi),對(duì)比其他搜索產(chǎn)品,將對(duì)以下三點(diǎn)技術(shù)指標(biāo)進(jìn)行重點(diǎn)研究和提升:(1)實(shí)現(xiàn)“所見(jiàn)即所得”,讓圖像搜索由被動(dòng)到主動(dòng);(2)實(shí)現(xiàn)動(dòng)態(tài)圖像搜索,手機(jī)網(wǎng)絡(luò)視頻購(gòu)物;(3)實(shí)現(xiàn)移動(dòng)場(chǎng)景下對(duì)“線下實(shí)體”的搜索,成為用戶的第三只眼。
參考文獻(xiàn)
[1]余飛.基于HTML5的圖形圖像協(xié)同處理技術(shù)研究與實(shí)現(xiàn)[D].長(zhǎng)江大學(xué),2015.
[2]陳微微.基于顏色特征提取的圖像搜索引擎研究[D].重慶理工大學(xué),2012.
OFDMA測(cè)距中一種新的定時(shí)偏移估計(jì)算法倪浩 任光亮 常義林 (783)
無(wú)線Ad Hoc網(wǎng)絡(luò)單信道并行傳輸?shù)牟┺慕鉀Q策略李曉記 陳晨 仇洪冰 莫瑋 (789)
LDPC碼串行譯碼策略的收斂速度分析楊洋 陳超 白寶明 王新梅 (795)
IP/WDM網(wǎng)絡(luò)中自適應(yīng)區(qū)分權(quán)重的HTA動(dòng)態(tài)業(yè)務(wù)流疏導(dǎo)算法徐展琦 丁秋菊 陳曉輝 丁喆 (801)
混合雙基地雷達(dá)系統(tǒng)結(jié)構(gòu)對(duì)方位估計(jì)性能的影響劉志國(guó) 廖桂生 王亞利 (808)
LTE系統(tǒng)中可配置FFT/IFFT的設(shè)計(jì)與實(shí)現(xiàn)劉德福 雷天民 馬卓 李穎 王旸 (813)
一種超模糊熵ULPCNN圖像自動(dòng)分割新方法劉勍 許錄平 馬義德 蘇哲 王勇 (817)
一種非局部擴(kuò)散的圖像修復(fù)模型郝巖 馮象初 許建樓 (825)
一種高效的非均勻轉(zhuǎn)動(dòng)目標(biāo)成像方法王虹現(xiàn) 李亞超 全英匯 張守宏 (829)
一種基于L1稀疏正則化和非負(fù)矩陣分解的盲源信號(hào)分離新算法殷海青 劉紅衛(wèi) (835)
新型低復(fù)雜度心理聲學(xué)模型馬鴻飛 夏雨 郭澤華 (842)
免疫非支配自適應(yīng)粒子群多目標(biāo)優(yōu)化馬晶晶 楊咚咚 焦李成 (846)
求解約束優(yōu)化問(wèn)題M-精英協(xié)同進(jìn)化算法慕彩紅 焦李成 劉逸 (852)
一種新的改進(jìn)粒子濾波算法楊璐 李明 張鵬 (862)
一類廣義混雜系統(tǒng)的隨機(jī)穩(wěn)定性及穩(wěn)定化楊瑩 李俊民 陳國(guó)培 (866)
分布式調(diào)試中基于事件模型的確定性重演策略李青山 李珺 葉宏 杜林 (872)
改進(jìn)的NURBS-PO法分析電大平臺(tái)附近天線方向圖黃鍇 賀之莉 梁昌洪 (879)
一種新型的微帶三通帶濾波器設(shè)計(jì)賴鑫 梁昌洪 李良 溫海賓 (884)
一種提高稀布線陣優(yōu)化布陣效率的方法張帥 龔書喜 路寶 龔琦 (888)
適用于裁剪NURBS曲面RCS預(yù)估的改進(jìn)的物理光學(xué)法關(guān)瑩 龔書喜 徐云學(xué) 張帥 姜文 (893)
集成Si基低噪聲放大器的注入損傷研究柴常春 張冰 任興榮 冷鵬 (898)
一種R-C-R組合式12位逐次逼近A/D轉(zhuǎn)換器佟星元 陳杉 蔡乃瓊 朱樟明 楊銀堂 (904)
一種二階曲率補(bǔ)償?shù)母呔葞痘鶞?zhǔn)電壓源來(lái)新泉 郝琦 袁冰 陳雷 葉強(qiáng) (911)
模塊密度譜分的網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)方法付立東 高琳 (916)
低功耗無(wú)磁流量測(cè)量MCU的系統(tǒng)設(shè)計(jì)朱起淅 車德亮 沈緒榜 (921)
一種新的紅外復(fù)雜背景自適應(yīng)抑制算法汪大寶 劉上乾 張峰 (927)
特征選擇對(duì)FHMM性能影響研究陳昌紅 趙恒 梁繼民 焦李成 (934)
小波域中的廣義非局部平均去噪算法馮象初 劉濤 李亞峰 (941)
雙瑞利衰落下AP中繼車際通信系統(tǒng)誤符號(hào)率分析李兆訓(xùn) 李峰 仵國(guó)鋒 胡捍英 (947)
異構(gòu)網(wǎng)絡(luò)中多媒體業(yè)務(wù)的聯(lián)合呼叫接納控制王亞楠 夏海輪 馮春燕 (953)
水下航行體目標(biāo)成像及處理研究王志杰 楊寶民 (960)
一種寬頻帶低交叉極化傘形印刷振子陣列天線陳盼 曹祥玉 高軍 (966)
用于全局優(yōu)化問(wèn)題的混合免疫進(jìn)化算法劉星寶 蔡自興 王勇 彭偉雄 (971)
MU-MIMO下行鏈路雙閾值有限反饋機(jī)會(huì)通信策略李釗 楊家瑋 趙林靖 (581)
高性能EBCOT編碼加速算法及其實(shí)現(xiàn)結(jié)構(gòu)劉凱 李云松 郭杰 (587)
IEEE1900.4框架下一種有效的終端重構(gòu)策略張文柱 曾業(yè) 孫曉艷 (594)
基于時(shí)變AR模型的雷達(dá)ESM信號(hào)多徑抑制李林 姬紅兵 時(shí)銀水 (602)
雙環(huán)控制單周期PFC轉(zhuǎn)換器高層次模型及電路李婭妮 楊銀堂 朱樟明 (608)
足球視頻的語(yǔ)義顏色提取與語(yǔ)義鏡頭分割牛振興 李潔 高新波 (613)
MIMO中繼系統(tǒng)的最優(yōu)聯(lián)合MMSE決策反饋收發(fā)機(jī)設(shè)計(jì)李川 劉偉 李建東 周利華 (619)
一種多小區(qū)MIMO系統(tǒng)的分層預(yù)編碼方案郝東來(lái) 葛建華 (624)
一種FFT并行處理機(jī)的設(shè)計(jì)與實(shí)現(xiàn)張犁 李雙飛 石光明 李甫 (630)
采用粒子濾波和模糊聚類法的非線性多目標(biāo)跟蹤張俊根 姬紅兵 (636)
一種社會(huì)網(wǎng)絡(luò)搜索免疫優(yōu)化算法孫奕菲 焦李成 (642)
DS-UWB系統(tǒng)中基于線性預(yù)測(cè)的盲多用戶檢測(cè)康曉非 楊家瑋 (648)
隨機(jī)集粒子濾波的快速被動(dòng)數(shù)據(jù)關(guān)聯(lián)算法楊柏勝 姬紅兵 高小東 (655)
采用相干單距離多普勒干涉的太空碎片成像劉亞波 張磊 邢孟道 保錚 (660)
認(rèn)知無(wú)線電中自適應(yīng)分步合并協(xié)作頻譜感知算法丁漢清 楊家瑋 趙志遠(yuǎn) (665)
測(cè)量目標(biāo)高度的雙基地MIMO雷達(dá)虛擬陣元技術(shù)金明 李軍 廖桂生 黎薇萍 (671)
脈內(nèi)聚束SAR方位高分辨率寬測(cè)繪帶成像武其松 邢孟道 劉保昌 保錚 (676)
塊迭代線性預(yù)測(cè)的超光譜圖像分布式壓縮算法吳憲云 李云松 吳成柯 孔繁鏘 李文明 (683)
一種設(shè)計(jì)DFT調(diào)制濾波器組的新算法蔣俊正 王小龍 水鵬朗 (689)
非理想互連的傳輸線模型及串?dāng)_分析丁同浩 李玉山 張偉 曲詠哲 閆旭 (694)
一種改進(jìn)的準(zhǔn)循環(huán)LDPC碼環(huán)消除算法崔俊云 白寶明 郭旭東 (700)
一類逼近容量LDPC糾刪碼的二部圖構(gòu)造算法慕建君 焦曉鵬 曹訓(xùn)志 (705)
基于S變換的混合DS/FH擴(kuò)頻信號(hào)參數(shù)估計(jì)朱明哲 姬紅兵 (710)
一種簡(jiǎn)單的UWB-TOA估計(jì)方法熊海良 汪俊 田紅心 楊宏 易克初 (716)
圖像去噪的改進(jìn)迭代非局部平均濾波方法馮象初 郝彬彬 朱見(jiàn)廣 (722)
利用PSO同時(shí)優(yōu)化陣列天線的輻射和散射特性張帥 龔書喜 路寶 凌勁 查鋒濤 (726)
均勻橢球粒子的彩虹角分析李祥震 韓香娥 (731)
動(dòng)態(tài)改變鄰域空間和搜索步的自由搜索算法李團(tuán)結(jié) 曹玉巖 孫國(guó)鼎 (737)
基于循環(huán)平穩(wěn)的級(jí)聯(lián)空時(shí)GPS抗干擾方法石斌斌 程翥 錢林杰 皇甫堪 (743)
融合灰色預(yù)測(cè)和HOGI特征的紅外目標(biāo)跟蹤方法張齊 曹琦 王曉薇 畢篤彥 (751)
快變信道環(huán)境下OFDMA系統(tǒng)的信道估計(jì)算法李丹 馮穗力 葉梧 莊宏成 (758)
混沌映射的粒子群優(yōu)化方法劉道華 原思聰 蘭洋 馬新建 (764)
一種鄰域一致性的NSCT域多傳感器圖像融合算法霍冠英 李慶武 石丹 (770)
《西安電子科技大學(xué)學(xué)報(bào)》征稿簡(jiǎn)則 (F0003)
MIMO鏈路adhoc網(wǎng)絡(luò)中一種新的MAC協(xié)議陳丹 李建東 李長(zhǎng)樂(lè) (385)
認(rèn)知無(wú)線電中衰落信道下的能量檢測(cè)信噪比墻閆琦 楊家瑋 張?chǎng)?董偉 (391)
一種自適應(yīng)的關(guān)鍵幀量化參數(shù)確定方法李明 常義林 楊付正 萬(wàn)帥 (396)
基于網(wǎng)絡(luò)編碼的SVC高效傳輸系統(tǒng)盧冀 肖嵩 吳成柯 (405)
一類具有低密度生成矩陣的非二元準(zhǔn)循環(huán)LDPC碼陳超 白寶明 王新梅 (412)
一種低速率多模MBE線性預(yù)測(cè)語(yǔ)音編解碼器梁彥霞 楊家瑋 李燁 (417)
CPM信號(hào)的多分支分?jǐn)?shù)多比特差分檢測(cè)孫錦華 吳小鈞 (423)
基于張量局部和全局信息的人臉識(shí)別算法溫浩 孫蕾 (429)
基于循環(huán)正交序列和廣義AIC的信道估計(jì)李丹萍 張海林 (436)
一種高分辨的稀疏孔徑ISAR成像方法李軍 邢孟道 張磊 吳順君 (441)
基于最小化測(cè)量誤差的被動(dòng)定位算法陳金廣 李潔 高新波 (447)
利用先驗(yàn)知識(shí)的空時(shí)自適應(yīng)檢測(cè)方法周宇 張林讓 劉楠 劉昕 (454)
快速增量主分量算法的近似協(xié)方差矩陣實(shí)現(xiàn)曹向海 劉宏偉 吳順君 (459)
高效的寬帶數(shù)字信道化接收機(jī)設(shè)計(jì)常虹 趙國(guó)慶 牛新亮 (464)
解線頻調(diào)步進(jìn)頻率ISAR成像研究劉亞波 李軍 李亞超 邢孟道 (469)
一種用于低壓Boost型DC-DC轉(zhuǎn)換器的啟動(dòng)電路陳富吉 來(lái)新泉 李玉山 葉強(qiáng) 袁冰 (476)
窄帶信號(hào)頻率和角度估計(jì)新方法劉曉軍 劉聰鋒 廖桂生 (481)
一種寬帶數(shù)字信道化接收機(jī)王宏偉 趙國(guó)慶 王玉軍 鮑丹 (487)
融合Ratio邊緣信息的水平集SAR圖像分割方法呂雁 馮大政 (492)
共形天線陣列方向圖分析與綜合張凡 張福順 趙鋼 林晨 (496)
電大尺寸輻射問(wèn)題的預(yù)修正多層快速多極子分析王元源 謝擁軍 王鵬 (502)
一種傳感器網(wǎng)絡(luò)訪問(wèn)控制機(jī)制劉云 裴慶祺 (507)
考慮電感效應(yīng)和工藝波動(dòng)影響的互連延時(shí)建模與計(jì)算楊楊 柴常春 董剛 楊銀堂 冷鵬 (513)
(4,4)碳納米管/碳化硅納米管異質(zhì)結(jié)的輸運(yùn)特性劉紅霞 宋久旭 張鶴鳴 (520)
一種空時(shí)域結(jié)合濾波的運(yùn)動(dòng)弱小目標(biāo)檢測(cè)方法王博 張建奇 (524)
一種檢測(cè)局部放電信號(hào)的新方法李亞峰 王保保 馮象初 (529)
圖像特征匹配中一種快速關(guān)鍵維過(guò)濾搜索算法何周燦 王慶 楊恒 (534)
一種細(xì)節(jié)保持的Retinex圖像增強(qiáng)算法馬時(shí)平 張明 畢篤彥 許悅雷 (541)
傳感器網(wǎng)絡(luò)密鑰傳播與進(jìn)化劉文菊 劉志宏 裴慶祺 楊超 (547)
一種容量上界最大化的量化反饋方法解芳 袁超偉 程鐵錚 趙偉 (554)
框架時(shí)序邏輯語(yǔ)言MSVL中面向?qū)ο髾C(jī)制的實(shí)現(xiàn)王小兵 段振華 (559)
記憶功放的BP神經(jīng)網(wǎng)絡(luò)分離預(yù)失真方法崔華 趙祥模 艾渤 (565)
一種高性能低復(fù)雜度的V-BLAST檢測(cè)方案郭明喜 賈沖 沈越泓 高媛媛 (570)
基于正交投影的寬帶相干信源空間譜測(cè)向算法謝锘 張潤(rùn)生 葛建華 張建立 (576)
相關(guān)信道下多用戶MIMO系統(tǒng)聯(lián)合收發(fā)機(jī)設(shè)計(jì)陳睿 李建東 劉偉 李川 (181)
認(rèn)知網(wǎng)絡(luò)中快速自適應(yīng)功率控制算法李建東 薛富國(guó) 楊春剛 李維英 石華 (186)
采用獨(dú)立分量分析的多用戶MIMO下行傳輸策略李釗 楊家瑋 姚俊良 陳婷 (192)
導(dǎo)向矢量不確定集約束的穩(wěn)健Capon波束形成算法劉聰鋒 廖桂生 (197)
一種最小模級(jí)聯(lián)相消器黃慶東 張林讓 盧光躍 (204)
一種直接回波數(shù)據(jù)域雷達(dá)自適應(yīng)通道均衡方法劉向陽(yáng) 廖桂生 朱圣棋 毛志杰 (210)
組網(wǎng)無(wú)源雷達(dá)變數(shù)目多目標(biāo)跟蹤算法時(shí)銀水 姬紅兵 楊柏勝 (218)
一種復(fù)合的SAR圖像去噪算法尹奎英 胡利平 劉宏偉 金林 (224)
雙站SAR圖像幾何失真校正方法研究易予生 張林讓 劉昕 劉楠 張波 (231)
機(jī)載三通道SAR/GMTI快速目標(biāo)運(yùn)動(dòng)參數(shù)估計(jì)錢江 呂孝雷 邢孟道 李涼海 張振華 (235)
基于實(shí)值特征子空間迭代的DOA估計(jì)算法楊雪亞 陳伯孝 朱根生 (242)
自適應(yīng)的改進(jìn)Goldstein干涉相位圖濾波算法嚴(yán)衛(wèi)東 倪維平 趙亦工 蘆穎 吳俊政 (248)
一種新的Contourlet域魯棒水印算法同鳴 馮瑋 姬紅兵 (254)
高分辨距離像數(shù)據(jù)的檢測(cè)新方法夏宇垠 馮大政 李濤 (260)
一種新的非相干積累算法李濤 馮大政 夏宇垠 (267)
對(duì)動(dòng)目標(biāo)檢測(cè)雷達(dá)的正弦波調(diào)頻干擾朱燕 崔艷鵬 趙國(guó)慶 (273)
一種無(wú)線傳感器網(wǎng)絡(luò)移動(dòng)性支持自適應(yīng)MAC協(xié)議陳晨 高新波 (279)
基于模糊函數(shù)零點(diǎn)切片特征優(yōu)化的輻射源個(gè)體識(shí)別王磊 姬紅兵 李林 (285)
一種寬帶低散射印刷振子天線陣列袁宏偉 龔書喜 王文濤 張鵬飛 (290)
一種微帶貼片天線RCS減縮新方法凌勁 龔書喜 張鵬飛 袁宏偉 路寶 王文濤 (295)
結(jié)合波原子和Cycle Spinning的圖像去噪宋宜美 宋國(guó)鄉(xiāng) (300)
一種實(shí)用的傳感器網(wǎng)絡(luò)廣播認(rèn)證協(xié)議杜志強(qiáng) 沈玉龍 馬建峰 周利華 (305)
一種Tanner圖短環(huán)計(jì)數(shù)新方法焦曉鵬 慕建君 周利華 (311)
一種用于14位1.28MS/sΣΔADC的數(shù)字抽取濾波器設(shè)計(jì)楊銀堂 李迪 石立春 (315)
全數(shù)字接收機(jī)中一種低功耗插值濾波器結(jié)構(gòu)及其VLSI實(shí)現(xiàn)鄧軍 楊銀堂 (320)
降低OFDM信號(hào)PAPR的低復(fù)雜度PTS方法王進(jìn)祥 吳新春 毛志剛 周彬 (326)
一種全速率的多天線中繼STBC協(xié)作機(jī)制張?zhí)炜?程婕 馮春燕 (334)
一種無(wú)需次級(jí)通道模型的有源噪聲控制算法張瑞華 謝智波 (340)
結(jié)構(gòu)相似性灰關(guān)聯(lián)在強(qiáng)噪聲圖像增強(qiáng)中的應(yīng)用馬苗 焦莉莉 (346)
采用遺傳算法的雙頻Wilkinson功分器的優(yōu)化設(shè)計(jì)王巍 李文宬 蘭中文 陳丹 張凱 (353)
一種用于實(shí)時(shí)業(yè)務(wù)的無(wú)縫切換方案張載龍 孫建 張順頤 孫雁飛 李君 (359)
基于指數(shù)小波分形特征的SAR圖像特定目標(biāo)檢測(cè)劉冬 張弓 (366)
一、引言
隨著互聯(lián)網(wǎng)的飛速發(fā)展,消費(fèi)類電子、通信、影視及廣播、計(jì)算機(jī)技術(shù)日益緊密地結(jié)合起來(lái),使得基于互聯(lián)網(wǎng)的多媒體產(chǎn)業(yè)成為本世紀(jì)初發(fā)展最快、規(guī)模最大的產(chǎn)業(yè)之一。
多媒體是建立在計(jì)算機(jī)圖形學(xué)、人機(jī)接口技術(shù)、傳感技術(shù)和人工智能等學(xué)科基礎(chǔ)上的綜合性極強(qiáng)的高新信息技術(shù),由其帶來(lái)的虛擬現(xiàn)實(shí)技術(shù)能創(chuàng)造身臨其境的神奇效果,從而廣泛應(yīng)用于影視、廣告、游戲、教育、會(huì)展等領(lǐng)域。2002年全球多媒體產(chǎn)業(yè)產(chǎn)值達(dá)300億美元,今年將突破400億美元。在中國(guó)市場(chǎng),視訊技術(shù)主要應(yīng)用于政府會(huì)議。
由于政府的工作性質(zhì)和政府對(duì)提高辦公效率的需求,這部分應(yīng)用還會(huì)繼續(xù)增加。另一方面,隨著以中國(guó)電信、中國(guó)聯(lián)通為代表的新電信運(yùn)營(yíng)商的崛起和企業(yè)內(nèi)部基于IP技術(shù)的寬帶基礎(chǔ)網(wǎng)絡(luò)建設(shè),把需要占用較多帶寬的視頻通訊應(yīng)用到寬帶網(wǎng)絡(luò)上,將成為視訊技術(shù)加速發(fā)展的新動(dòng)力。
二、視頻壓縮標(biāo)準(zhǔn)的發(fā)展
傳統(tǒng)的壓縮編碼是建立在香農(nóng)(Shannon)信息論基礎(chǔ)上的,它以經(jīng)典的集合論為基礎(chǔ),用統(tǒng)計(jì)概率模型來(lái)描述信源,但它未考慮信息接受者的主觀特性及事件本身的具體含義、重要程度和引起的后果。因此,壓縮編碼的發(fā)展歷程實(shí)際上是以香農(nóng)信息論為出發(fā)點(diǎn),一個(gè)不斷完善的過(guò)程。
從不同角度考慮,數(shù)據(jù)壓縮縮碼具有不同的分類方式。按信源的統(tǒng)計(jì)特性可分為預(yù)測(cè)編碼、變換編碼、矢量量化編碼、子帶-小波編碼、神經(jīng)網(wǎng)絡(luò)編碼方法等。按圖像傳遞的景物特性可分為分形編碼、基于內(nèi)容的編碼方法等。
隨著產(chǎn)業(yè)化活動(dòng)的進(jìn)一步開展,國(guó)際標(biāo)準(zhǔn)化組織于1986年、1998年先后成立了聯(lián)合圖片專家組JPEG和運(yùn)動(dòng)圖像壓縮編碼組織MPEG。GPEG專家組主要致力于靜態(tài)圖像的幀內(nèi)壓縮編碼標(biāo)準(zhǔn)ISO/IEC10918的制定;MPEG專家組主要致力于運(yùn)動(dòng)圖像壓縮編碼標(biāo)準(zhǔn)的制定。經(jīng)過(guò)專家組不懈的努力,基于第一代壓縮編碼方法(如預(yù)測(cè)編碼、變換編碼、熵編碼及運(yùn)動(dòng)補(bǔ)償?shù)?的三種壓縮編碼國(guó)際標(biāo)。
三、視頻壓縮技術(shù)
眾所周知,人類通過(guò)視覺(jué)獲取的信息量約占總信息量的70%,而且視頻信息具有直觀性、可信性等一系列優(yōu)點(diǎn)。所以,視訊技術(shù)中的關(guān)鍵技術(shù)就是視頻技術(shù)。
目前,視頻技術(shù)的應(yīng)用范圍很廣,如網(wǎng)上可視會(huì)議、網(wǎng)上可視電子商務(wù)、網(wǎng)上政務(wù)、網(wǎng)上購(gòu)物、網(wǎng)上學(xué)校、遠(yuǎn)程醫(yī)療、網(wǎng)上研討會(huì)、網(wǎng)上展示廳、個(gè)人網(wǎng)上聊天、可視咨詢等業(yè)務(wù)。
但是,以上所有的應(yīng)用都必須壓縮。傳輸?shù)臄?shù)據(jù)量之大,單純用擴(kuò)大存儲(chǔ)器容量、增加通信干線的傳輸速率的辦法是不現(xiàn)實(shí)的,數(shù)據(jù)壓縮技術(shù)是個(gè)行之有效的解決辦法,通過(guò)數(shù)據(jù)壓縮,可以把信息數(shù)據(jù)量壓下來(lái),以壓縮形式存儲(chǔ)、傳輸,既節(jié)約了存儲(chǔ)空間,又提高了通信干線的傳輸效率,同時(shí)也可使計(jì)算機(jī)實(shí)時(shí)處理音頻、視頻信息,以保證播放出高質(zhì)量的視頻、音頻節(jié)目。可見(jiàn),多媒體數(shù)據(jù)壓縮是非常必要的。由于多媒體聲音、數(shù)據(jù)、視像等信源數(shù)據(jù)有極強(qiáng)的相關(guān)性,也就是說(shuō)有大量的冗余信息。數(shù)據(jù)壓縮可以將龐大數(shù)據(jù)中的冗余信息去掉(去除數(shù)據(jù)之間的相關(guān)性),保留相互獨(dú)立的信息分量,因此,多媒體數(shù)據(jù)壓縮是完全可以實(shí)現(xiàn)的。
圖像編碼方法可分為兩代:第一代是基于數(shù)據(jù)統(tǒng)計(jì),去掉的是數(shù)據(jù)冗余,稱為低層壓縮編碼方法;第二代是基于內(nèi)容,去掉的是內(nèi)容冗余,其中基于對(duì)象(Object-Based)方法稱為中層壓縮編碼方法,其中基于語(yǔ)義(Syntax-Based)方法稱為高層壓縮編碼方法。基于內(nèi)容壓縮編碼方法代表新一代的壓縮方法,也是目前最活躍的領(lǐng)域,最早是由瑞典的Forchheimer提出的,隨后日本的Harashima等人也展示了不少研究成果。
1.形狀編碼。形狀信息的獲得首先要對(duì)圖形進(jìn)行分析和分割,把各個(gè)代表不同內(nèi)容的目標(biāo)分割后再用形狀表示。形狀信息通常用二值A(chǔ)lpha平面和灰度Alpha平面來(lái)表示。二值A(chǔ)lpha平面可用臨近信息進(jìn)行算術(shù)編碼(CAE);灰度Alpha平面可用運(yùn)動(dòng)補(bǔ)償加DCT變換方式類似紋理編碼一樣進(jìn)行編碼。
其中用于圖像壓縮的變換有離散Forier變換(DFT)、離散小波變換(DWT)、奇異值分解(SVD)、K-L變換、Walsh變換、Hadamard變換、Harr變換、Slant變換、離散余弦變換(DCT)。其中K-L變換的去相關(guān)性最好,而DCT是接近K-L變換效果的最便于實(shí)現(xiàn)的變換。和MPEG-1/2一樣,MPEG-4也選擇了DCT。通常,用于數(shù)據(jù)壓縮的熵編碼方法有霍夫曼(Huffman)編碼、矢量量化、算術(shù)編碼、游程編碼、LZW編碼等。對(duì)于紋理編碼,MPEG-4選擇了把游程編碼、矢量量化和Huffman編碼進(jìn)行混合編程編碼(VLC)。紋理編碼要經(jīng)過(guò)DCT變換、量化、DC/AC預(yù)測(cè)、掃描、基于Hufman的VLC編碼。
2.運(yùn)動(dòng)估計(jì)和補(bǔ)償。MPEG-4中提供了基于塊的運(yùn)動(dòng)估計(jì)和補(bǔ)償技術(shù)來(lái)有效地利用各個(gè)VOP中視頻內(nèi)容上的時(shí)間冗余。一般,運(yùn)動(dòng)估計(jì)和補(bǔ)償可以看作針對(duì)任意形狀圖像序列的塊匹配技術(shù)的延伸。塊匹配過(guò)程對(duì)于標(biāo)準(zhǔn)宏塊使用;預(yù)測(cè)誤差和用于預(yù)測(cè)的宏塊運(yùn)動(dòng)向量一起被編碼;高級(jí)運(yùn)動(dòng)補(bǔ)償模式支持重疊塊運(yùn)動(dòng)補(bǔ)償,可對(duì)8×8塊運(yùn)動(dòng)向量進(jìn)行編碼。為了使運(yùn)動(dòng)估計(jì)得到高編碼效率,預(yù)測(cè)圖像和被預(yù)測(cè)圖像越相似越好,所以在運(yùn)動(dòng)估計(jì)之前要先進(jìn)行補(bǔ)償。在目標(biāo)邊界上的MB先用水平填補(bǔ)而后用垂直填補(bǔ),其余完全在VOP之外的MB用擴(kuò)張?zhí)钛a(bǔ)。
3.紋理編碼。紋理指的是I-VOP圖像和P/B-VOP經(jīng)運(yùn)動(dòng)補(bǔ)償后殘留的圖像信息。紋理一般在變換域進(jìn)行壓縮編碼和熵編碼。
準(zhǔn)正式編輯已經(jīng)出版:靜態(tài)圖像壓縮編碼標(biāo)準(zhǔn)(JPEG);數(shù)字聲像儲(chǔ)存壓縮編碼標(biāo)準(zhǔn)(MPEG-1);通用視頻圖像壓縮編碼標(biāo)準(zhǔn)(MPEG-2)。隨后,MPEG專家組于1999年2月正式公布了MPEG-4(ISO/IEC14496)V1.0版本。同年底MPEG-4V2.0版本亦告完成,且于2000年年初正式成為國(guó)際標(biāo)準(zhǔn)。MPEG-4標(biāo)準(zhǔn)將眾多的多媒體應(yīng)用集成于一個(gè)完整的框架內(nèi),旨在為多媒體通信及應(yīng)用環(huán)境提供標(biāo)準(zhǔn)的算法及工具,從而建立起一種能被多媒體傳輸、存儲(chǔ)、檢索等應(yīng)用普遍采用的統(tǒng)一數(shù)據(jù)格式,并根據(jù)不同的應(yīng)用需求,現(xiàn)場(chǎng)配置解碼器,開放的編碼系統(tǒng)也可隨時(shí)加入新的有效的算法模塊。為支持對(duì)視頻內(nèi)容的訪問(wèn),MPEG-4提出了“視頻對(duì)象”的概念。
目前,MPEG專家組又推出了專門支持多媒體信息且基于內(nèi)容檢索的編碼方案MPEG-7及多媒體框架標(biāo)準(zhǔn)MPEG-21。另外,由ITU-T和MPEG聯(lián)合開發(fā)的新標(biāo)準(zhǔn)H.264是最新的視頻編碼算法。為了降低碼率,獲得盡可能更好圖像質(zhì)量,H.264標(biāo)準(zhǔn)吸取了MPEG-4的長(zhǎng)處,具有更高的壓縮比、更好的信道適應(yīng)性,必將在數(shù)字視頻的通信和存儲(chǔ)領(lǐng)域得到廣泛的應(yīng)用,其發(fā)展?jié)摿Σ豢上蘖俊?/p>
四、MPEG-4的主要技術(shù)
MPEG-4具有很多優(yōu)點(diǎn)。它的壓縮率可以超過(guò)100倍,而仍保有極佳的音質(zhì)和畫質(zhì);它可利用最少的數(shù)據(jù),獲取最佳的圖像質(zhì)量,滿足低碼率應(yīng)用的需求;它更適合于交互式AV服務(wù)及遠(yuǎn)程監(jiān)控。為了滿足各種應(yīng)用的需求,MPEG-4標(biāo)準(zhǔn)的使用范圍相當(dāng)龐大,具有廣泛的適應(yīng)性和可擴(kuò)展性。
關(guān)鍵詞:網(wǎng)絡(luò)培訓(xùn)學(xué)院;知識(shí)元;知識(shí)管理體系
中圖分類號(hào):F61 文獻(xiàn)標(biāo)識(shí)碼:A
中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院服務(wù)于中國(guó)郵政80余萬(wàn)名郵政員工,擔(dān)負(fù)著服務(wù)社會(huì)公眾的職能。如何利用飛速發(fā)展的Web技術(shù)為郵政企業(yè)員工提供更加有效的信息服務(wù)和更加正確、精簡(jiǎn)的知識(shí),是未來(lái)發(fā)展過(guò)程中需要解決的問(wèn)題。作為當(dāng)前知識(shí)管理大多采用的有效工具,基于“知識(shí)元”構(gòu)建中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)管理體系值得探討。
1 “知識(shí)元”和“知識(shí)元庫(kù)”的基本含義
人們對(duì)知識(shí)的需求一般不是以文獻(xiàn)為單位的,從“知識(shí)元”層面研究標(biāo)引,揭示單篇文獻(xiàn)個(gè)體中的“知識(shí)元”信息與某領(lǐng)域共性中的“知識(shí)結(jié)構(gòu)”的鏈接關(guān)系,從而找出信息與知識(shí)導(dǎo)航鏈接的普遍規(guī)律,為用戶提供直接獲取有效知識(shí)元而不是大量文獻(xiàn)的有效方法。因此,知識(shí)元標(biāo)引是知識(shí)管理的起點(diǎn)。
1.1 “知識(shí)元”的基本含義
知識(shí)元是構(gòu)造知識(shí)結(jié)構(gòu)的基元。常見(jiàn)的知識(shí)元定義:指不可再分割的具有完備知識(shí)表達(dá)的知識(shí)單位。比如,一節(jié)教材是由若干個(gè)知識(shí)點(diǎn)組成,每個(gè)知識(shí)點(diǎn)又是由若干個(gè)內(nèi)容相對(duì)獨(dú)立的部分組成,這些相對(duì)獨(dú)立的部分被稱為知識(shí)元。
人類知識(shí)結(jié)構(gòu)是由不同的知識(shí)單元組成的知識(shí)體系,每個(gè)知識(shí)單元又是由不同的獨(dú)立知識(shí)元通過(guò)知識(shí)元鏈接排列組合而成;那么不同知識(shí)單元之間就可以通過(guò)知識(shí)元鏈接形成不同的知識(shí)鏈,進(jìn)而編織成為整個(gè)知識(shí)結(jié)構(gòu)的知識(shí)網(wǎng)絡(luò)。
1.2 “知識(shí)元庫(kù)”的基本含義
知識(shí)元數(shù)據(jù)庫(kù)(簡(jiǎn)稱知識(shí)元庫(kù))是由獨(dú)立的現(xiàn)行知識(shí)元構(gòu)成的數(shù)據(jù)庫(kù),經(jīng)分類、加工、序化和組織過(guò)的知識(shí)集合,并按一定規(guī)則存儲(chǔ)在計(jì)算機(jī)中。知識(shí)元的不同排列組合構(gòu)成不同的知識(shí)單元,知識(shí)單元按照一定的組合構(gòu)成知識(shí)元庫(kù)。
知識(shí)元數(shù)據(jù)庫(kù)架構(gòu)主要由知識(shí)網(wǎng)絡(luò)、知識(shí)倉(cāng)庫(kù)、基本信息庫(kù)、鏈接系統(tǒng)等組成;由淺入深可分為基本信息庫(kù)、知識(shí)倉(cāng)庫(kù)、知識(shí)元數(shù)據(jù)庫(kù)三個(gè)層次,如圖1所示。
2 構(gòu)建基于“知識(shí)元”的中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)管理體系的必要性和可行性分析
知識(shí)管理的過(guò)程包括知識(shí)的識(shí)別、獲取、保存、傳遞、共享、保護(hù)及知識(shí)的資本化和產(chǎn)品化。目前,知識(shí)元被廣泛應(yīng)用于知識(shí)資源庫(kù)的建設(shè)、文獻(xiàn)管理和專業(yè)領(lǐng)域的知識(shí)設(shè)計(jì)等方面。
2.1 基于“知識(shí)元”郵政知識(shí)管理體系構(gòu)建的必要性
2.1.1 構(gòu)建基于“知識(shí)元”郵政知識(shí)管理體系是提升郵政員工素質(zhì)和能力的需要
在信息化郵政中,知識(shí)是郵政競(jìng)爭(zhēng)力的主導(dǎo)因素。廣泛開展學(xué)習(xí)郵政知識(shí)、特別是信息技術(shù)知識(shí)活動(dòng),是提高郵政員工素質(zhì)的重要舉措。隨著近年來(lái)郵政業(yè)務(wù)發(fā)展、郵政市場(chǎng)開拓、新技術(shù)應(yīng)用以及流程的優(yōu)化,新的郵政知識(shí)內(nèi)容不斷涌現(xiàn),因此,發(fā)展信息化郵政必須培養(yǎng)高素質(zhì)員工。實(shí)現(xiàn)郵政員工的知識(shí)信息化,已成為郵政業(yè)企業(yè)乃至世界各國(guó)郵政適應(yīng)信息化發(fā)展的要求、加快信息化建設(shè)的共同做法。
2.1.2 構(gòu)建基于“知識(shí)元”郵政知識(shí)管理體系是實(shí)施郵政知識(shí)服務(wù)發(fā)展的需要
基于“知識(shí)元”郵政知識(shí)管理體系就是在網(wǎng)絡(luò)環(huán)境下,以知識(shí)信息的搜尋、組織、分析重組為基礎(chǔ),根據(jù)用戶的問(wèn)題和環(huán)境,提供能夠有效支持知識(shí)應(yīng)用和知識(shí)創(chuàng)新的服務(wù)。它是從各種顯性和隱性知識(shí)資源中,針對(duì)人們的需要將知識(shí)提煉出來(lái)的過(guò)程。網(wǎng)絡(luò)環(huán)境下,在知識(shí)處理、挖掘、過(guò)濾、檢索、推送等技術(shù)和其他信息技術(shù)的研究和應(yīng)用都比較成熟的條件下,將知識(shí)服務(wù)通過(guò)知識(shí)管理服務(wù)系統(tǒng),實(shí)行比較科學(xué)和行之有效的服務(wù)模式,是中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院實(shí)現(xiàn)知識(shí)服務(wù)的有效手段。
2.1.3 構(gòu)建基于“知識(shí)元”郵政知識(shí)管理體系是實(shí)施郵政知識(shí)管理改革發(fā)展的需要
通過(guò)建立基于“知識(shí)元”郵政知識(shí)管理體系,將郵政知識(shí)的控制單元從文獻(xiàn)深化到文獻(xiàn)中的知識(shí)元,實(shí)現(xiàn)知識(shí)元的鏈接,是知識(shí)管理的一場(chǎng)革命,有利于深化人們對(duì)郵政知識(shí)的檢索、學(xué)習(xí)、理解和發(fā)現(xiàn)以及知識(shí)的利用、增值和創(chuàng)新,是從信息服務(wù)向知識(shí)服務(wù)過(guò)渡的基礎(chǔ)。目前信息采集、傳輸、檢索的傳統(tǒng)理論與方法已成為制約人類利用知識(shí)的瓶頸,基于“知識(shí)元”知識(shí)管理體系將有利于知識(shí)發(fā)現(xiàn)、創(chuàng)造、組織和應(yīng)用,是知識(shí)創(chuàng)新鏈中不可缺少的智能工具和關(guān)鍵環(huán)節(jié)。尋找新的知識(shí)創(chuàng)新鏈的有效方法與工具將成為認(rèn)知科學(xué)、信息科學(xué)、計(jì)算機(jī)科學(xué)、知識(shí)管理科學(xué)領(lǐng)域共同努力的目標(biāo)。
2.1.4 構(gòu)建基于“知識(shí)元”郵政知識(shí)管理體系是促進(jìn)網(wǎng)絡(luò)教學(xué)效果提升的需要
基于“知識(shí)元”郵政知識(shí)管理體系是對(duì)依托中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院相關(guān)學(xué)科文獻(xiàn)信息資源庫(kù)的補(bǔ)充、完善和深化,對(duì)郵政員工利用網(wǎng)絡(luò)探索自主學(xué)習(xí)、協(xié)同學(xué)習(xí)、探究學(xué)習(xí)個(gè)性化教學(xué)等新型教學(xué)模式,培養(yǎng)學(xué)員的創(chuàng)新意識(shí)和能力必將起到積極的促進(jìn)作用。建立基于“知識(shí)元”郵政知識(shí)管理體系,可通過(guò)網(wǎng)絡(luò)鏈接和影像,將知識(shí)元數(shù)據(jù)庫(kù)嵌入到郵政員工崗位培訓(xùn)體系、各學(xué)科專業(yè)數(shù)據(jù)庫(kù)中,使所有數(shù)據(jù)庫(kù)在知識(shí)元這一神經(jīng)網(wǎng)絡(luò)支配下成為一個(gè)內(nèi)容高度關(guān)聯(lián)的有機(jī)整體。當(dāng)用戶對(duì)某個(gè)知識(shí)點(diǎn)不理解時(shí),只需借助文獻(xiàn)資源數(shù)據(jù)庫(kù)中的主題詞檢索相關(guān)的知識(shí)元名稱,相關(guān)知識(shí)內(nèi)容即以圖片、文本、聲音、動(dòng)畫及視頻形式呈現(xiàn),使學(xué)習(xí)者快速、簡(jiǎn)潔地查找知識(shí)、理解知識(shí),并通過(guò)文獻(xiàn)信息進(jìn)一步認(rèn)識(shí)和掌握知識(shí)發(fā)現(xiàn)、知識(shí)創(chuàng)新的規(guī)律。
2.2 基于“知識(shí)元”郵政知識(shí)管理體系構(gòu)建的可行性
2.2.1 具有豐富的知識(shí)管理資源基礎(chǔ)
基于“知識(shí)元”構(gòu)建郵政知識(shí)管理體系需要以各種類型豐富的知識(shí)資源為基礎(chǔ)。隨著中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院服務(wù)功能的不斷拓展和知識(shí)內(nèi)容的不斷豐富,知識(shí)資源將日趨具有較強(qiáng)的系統(tǒng)性和完整性,而且中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院和全網(wǎng)31個(gè)省二級(jí)中心的學(xué)習(xí)資源日益豐富,積累了豐富的郵政類課件資源和綜合知識(shí)資源,為構(gòu)建基于“知識(shí)元”郵政知識(shí)管理體系打下了堅(jiān)實(shí)的基礎(chǔ)。
2.2.2 具有相對(duì)完備的知識(shí)管理網(wǎng)絡(luò)保證
中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院和全網(wǎng)31個(gè)省二級(jí)中心的服務(wù)功能和管理功能日趨完善,這為構(gòu)建基于“知識(shí)元”郵政知識(shí)管理體系提供了堅(jiān)實(shí)的技術(shù)基礎(chǔ)和人才保證。
2.2.3 知識(shí)元技術(shù)已得到廣泛應(yīng)用
在網(wǎng)絡(luò)環(huán)境下,知識(shí)元技術(shù)廣泛應(yīng)用于知識(shí)資源庫(kù)的建設(shè)、文獻(xiàn)管理和專業(yè)領(lǐng)域的知識(shí)設(shè)計(jì)范疇,知識(shí)處理、挖掘、過(guò)濾、檢索、推送等技術(shù)和其他信息技術(shù)的研究和應(yīng)用都比較成熟,為中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院把知識(shí)服務(wù)通過(guò)知識(shí)管理服務(wù)系統(tǒng),實(shí)行比較科學(xué)和行之有效的服務(wù)模式提供了保障。
3 基于“知識(shí)元”的中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)管理體系構(gòu)建
3.1 構(gòu)建基于“知識(shí)元”的中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)管理體系的原則
3.1.1 系統(tǒng)化原則
構(gòu)建基于“知識(shí)元”的中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)管理體系,應(yīng)以中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院涉及的知識(shí)體系為基礎(chǔ),避免簡(jiǎn)單或孤立地針對(duì)某一課程的知識(shí)或某一理論,應(yīng)對(duì)所有知識(shí)、理論在某一分類框架下進(jìn)行綜合、聚集,實(shí)現(xiàn)知識(shí)集成,具有系統(tǒng)性。因此,中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)體系應(yīng)覆蓋所有郵政業(yè)務(wù)、網(wǎng)絡(luò)組織、郵政生產(chǎn)及經(jīng)營(yíng)管理、郵政技術(shù)等內(nèi)容。
3.1.2 層次性原則
為保證知識(shí)體系邏輯清晰,便于日后系統(tǒng)開發(fā),中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)管理體系在具有系統(tǒng)化的條件下,還應(yīng)體現(xiàn)不同知識(shí)歸屬不同的層級(jí),以便明確知識(shí)之間的聯(lián)系及其所屬不同層級(jí)。
3.1.3 衍生性原則
隨著人類認(rèn)識(shí)自然和改造自然能力的提高。在原有基礎(chǔ)上,新知識(shí)不斷被創(chuàng)造出來(lái)。尤其是在全球化以及信息技術(shù)與互聯(lián)網(wǎng)快速發(fā)展的背景下,郵政知識(shí)、管理知識(shí)等甚至呈幾何級(jí)增長(zhǎng),新的理論和知識(shí)不斷被總結(jié)和歸納出來(lái),并被納入郵政企業(yè)管理體系中。因此,在現(xiàn)有知識(shí)的基礎(chǔ)上,中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)管理體系應(yīng)能體現(xiàn)創(chuàng)新知識(shí),實(shí)現(xiàn)知識(shí)衍生。
3.2 中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)體系框架
3.2.1 總體框架
從中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院涉及的相關(guān)知識(shí)看,郵政知識(shí)是所有知識(shí)的基礎(chǔ)和核心,因此,中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)元庫(kù)體系可以按照郵政業(yè)務(wù)知識(shí)、郵政生產(chǎn)組織管理知識(shí)、郵政網(wǎng)運(yùn)知識(shí)、郵政營(yíng)銷知識(shí)、郵政經(jīng)營(yíng)管理知識(shí)、郵政技術(shù)知識(shí)、郵政其他知識(shí)等七部分作為總體框架。總體框架如圖2所示。
3.2.2 具體架構(gòu)
根據(jù)對(duì)中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院所含知識(shí)的研究,可以將知識(shí)元庫(kù)分為以下三類:概念型(Concept)知識(shí)庫(kù)——依據(jù)主題或概念組織而成,只包含敘述性知識(shí);流程型(Process)知識(shí)庫(kù)——依據(jù)活動(dòng)流程組織而成,包含敘述性知識(shí)與程序性知識(shí);關(guān)聯(lián)型(Competency)知識(shí)庫(kù)——依據(jù)人員與知識(shí)間的關(guān)系組織而成,也包含敘述性知識(shí)與程序性知識(shí)。在總體框架指導(dǎo)下,對(duì)某些知識(shí)和理論,可根據(jù)其產(chǎn)生的來(lái)源和背景,按照系統(tǒng)的“等級(jí)層次原理”進(jìn)行分類,不同子系統(tǒng)可按照各自的系統(tǒng)特質(zhì)區(qū)別開來(lái)。
3.2.2.1 郵政業(yè)務(wù)知識(shí)概念型知識(shí)庫(kù)
概念型知識(shí)庫(kù)匯集了所有跟郵政業(yè)務(wù)相關(guān)的概念,不同概念又可以通過(guò)層次關(guān)系進(jìn)行鏈接。以郵政業(yè)務(wù)知識(shí)為例,如圖3所示。
3.2.2.2 郵政業(yè)務(wù)知識(shí)流程型知識(shí)庫(kù)
郵政業(yè)務(wù)流程型知識(shí)庫(kù)將郵政業(yè)務(wù)中涉及到的所有流程型知識(shí)匯聚到一起,按照業(yè)務(wù)流程組織知識(shí)。郵政業(yè)務(wù)中掛號(hào)信函的處理流程如圖4所示。
3.2.2.3 郵政業(yè)務(wù)知識(shí)關(guān)聯(lián)型知識(shí)庫(kù)
關(guān)聯(lián)型知識(shí)庫(kù)主要體現(xiàn)知識(shí)之間的聯(lián)系,包括概念型知識(shí)和流程型知識(shí)之間的關(guān)聯(lián)、概念型知識(shí)與概念型知識(shí)的關(guān)聯(lián)、流程型知識(shí)與流程型知識(shí)的關(guān)聯(lián)等。如郵政企業(yè)大學(xué)中內(nèi)訓(xùn)師與培訓(xùn)授課之間的聯(lián)系,四位老師都是內(nèi)訓(xùn)師,與其培訓(xùn)授課之間的聯(lián)系,如圖5所示。
3.3 基于“知識(shí)元”的中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)管理服務(wù)體系
按照中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院知識(shí)結(jié)構(gòu),運(yùn)用知識(shí)元抽取和知識(shí)元標(biāo)引技術(shù),中國(guó)郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院可以搭建四層服務(wù)管理體系,即基礎(chǔ)資料、知識(shí)元庫(kù)、郵政分專業(yè)資源庫(kù)以及應(yīng)用平臺(tái)。以當(dāng)前郵政網(wǎng)絡(luò)培訓(xùn)學(xué)院積累的各種教學(xué)、視頻、案例資源為基礎(chǔ),通過(guò)知識(shí)元標(biāo)引技術(shù)形成知識(shí)元庫(kù),結(jié)合郵政各專業(yè)業(yè)務(wù)結(jié)構(gòu),形成郵政分專業(yè)的資源庫(kù),最后利用知識(shí)地圖、知識(shí)查詢和知識(shí)推送技術(shù)搭建應(yīng)用平臺(tái)。具體搭建思路如圖6所示。
3.3.1 基礎(chǔ)數(shù)據(jù)源
基礎(chǔ)數(shù)據(jù)源在這里指知識(shí)元庫(kù)建立的原始數(shù)據(jù),它是整個(gè)郵政企業(yè)大學(xué)知識(shí)管理服務(wù)體系建立的基礎(chǔ)。對(duì)于郵政企業(yè)大學(xué)來(lái)說(shuō),基礎(chǔ)數(shù)據(jù)源是能夠反映和覆蓋郵政所有專業(yè)核心知識(shí)內(nèi)容的資源。包括所有的教材資料、視頻資料、全國(guó)各專業(yè)優(yōu)秀案例資料、期刊雜志資料和其他相關(guān)資料。
3.3.2 知識(shí)元庫(kù)
郵政企業(yè)大學(xué)知識(shí)元庫(kù)是將各類基礎(chǔ)數(shù)據(jù)源通過(guò)知識(shí)標(biāo)引技術(shù)產(chǎn)生概念型知識(shí)元、流程型知識(shí)元以及關(guān)聯(lián)型知識(shí)元,并在知識(shí)元產(chǎn)生的過(guò)程中,將各類知識(shí)元之間的關(guān)系標(biāo)注出來(lái)。比如同義關(guān)系、包含關(guān)系、上下位關(guān)系等。
3.3.3 郵政專業(yè)資源庫(kù)
在知識(shí)元庫(kù)的基礎(chǔ)上,依據(jù)當(dāng)前郵政專業(yè)分類框架,將不同專業(yè)知識(shí)元分別人庫(kù),既方便郵政各專業(yè)人員學(xué)習(xí),又可以容易地做到各專業(yè)知識(shí)元庫(kù)的維護(hù)和拓展。
3.3.4 應(yīng)用平臺(tái)
應(yīng)用平臺(tái)是以建立的郵政各專業(yè)資源庫(kù)為基礎(chǔ),利用較先進(jìn)的知識(shí)地圖、知識(shí)檢索和知識(shí)推送技術(shù)開發(fā)的應(yīng)用服務(wù)平臺(tái)。
3.3.4.1 知識(shí)地圖
知識(shí)地圖(Knowledge Map)是一種能在語(yǔ)義和知識(shí)層次上描述知識(shí)的模型,是一種有效的知識(shí)管理工具,它在領(lǐng)域知識(shí)管理的實(shí)際應(yīng)用中發(fā)揮了一定作用。知識(shí)地圖實(shí)質(zhì)上是利用現(xiàn)代化信息技術(shù)制造的企業(yè)知識(shí)資源的總目錄及各知識(shí)款目之間關(guān)系的綜合體。
3.3.4.2 知識(shí)查詢
知識(shí)查詢是由用戶提交查詢關(guān)鍵詞,由系統(tǒng)利用SQL查詢服務(wù)實(shí)現(xiàn),查詢結(jié)果是一系列有組織的知識(shí)元。用戶通過(guò)系統(tǒng)提供的瀏覽功能進(jìn)行瀏覽,尋找自己感興趣的知識(shí)元。查詢過(guò)程如圖7所示。
3.3.4.3 知識(shí)推送服務(wù)
知識(shí)推送服務(wù)是通過(guò)知識(shí)推送服務(wù)中心完成的,知識(shí)推送服務(wù)中心既是知識(shí)服務(wù)系統(tǒng)向用戶提供知識(shí)推送服務(wù)的門戶,也是知識(shí)服務(wù)系統(tǒng)獲取用戶知識(shí)獲取習(xí)慣的主要渠道,它同時(shí)向知識(shí)服務(wù)系統(tǒng)和用戶提供知識(shí)。知識(shí)推送服務(wù)中心由知識(shí)需求獲取模塊、知識(shí)需求分析處理模塊、用戶知識(shí)發(fā)現(xiàn)模塊、知識(shí)定制模塊、搜索引擎、推送引擎和知識(shí)空間等7個(gè)主要部件構(gòu)成,如圖8所示。
參考文獻(xiàn)
1 姚海法.關(guān)于建立軍事知識(shí)元管理服務(wù)俸系的思考.信息管理,2007,1
2 溫有奎,徐國(guó)華.知識(shí)元鏈接理論.情報(bào)學(xué)報(bào),2003,6
3 溫有奎.基于“知識(shí)元”的知識(shí)組織與檢索Ⅱ.計(jì)算機(jī)工程與應(yīng)用,2005,1
收稿日期:2012-09-28
關(guān)鍵詞:大數(shù)據(jù) 情報(bào)分析 競(jìng)爭(zhēng)情報(bào) 商務(wù)智能 生物醫(yī)學(xué) 政府治理 軍事情報(bào)
中圖分類號(hào): G250.2 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1003-6938(2014)05-0007-06
Intelligence Analysis in Different Domains and Its Development under the Environment of Big Data
Abstract Big data has caught the attention of five domains: competitive intelligence, business management, bioinformatics, government governance and military intelligence. In order to understand the differences between different domains of intelligence analysis, this article reviews the current status of the conception and practice on intelligence analysis across five domains, reveals the characteristics of intelligence analysis, and then illustrates the development of intelligence analysis across five domains under the big data environment, and points out the effects of big data for intelligence analysis.
Key words big data; intelligence analysis; competitive intelligence; business intelligence; bioinformatics; government governance; military intelligence
1 前言
不同研究領(lǐng)域有其自身的研究對(duì)象、理論源流、學(xué)術(shù)習(xí)慣以及概念框架體系,它們會(huì)深刻影響各領(lǐng)域?qū)ν恍g(shù)語(yǔ)的界定和理解。如競(jìng)爭(zhēng)情報(bào)、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報(bào)等領(lǐng)域不僅都會(huì)涉及“情報(bào)分析”這一概念,而且都是圍繞著情報(bào)分析而開展相關(guān)研究工作的。但是,這些領(lǐng)域中的情報(bào)分析的內(nèi)涵與外延、實(shí)施情報(bào)分析的過(guò)程等均有其自身的特點(diǎn),不可一概而論。本文的目的,是分析競(jìng)爭(zhēng)情報(bào)、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報(bào)等五個(gè)領(lǐng)域中“情報(bào)分析”概念與實(shí)踐的特點(diǎn),以及大數(shù)據(jù)環(huán)境下這些領(lǐng)域中情報(bào)分析的發(fā)展動(dòng)向,揭示情報(bào)分析的學(xué)科差異,為建立統(tǒng)一的情報(bào)分析方法體系提供理論素材。
2 不同領(lǐng)域的情報(bào)分析及其在大數(shù)據(jù)環(huán)境下的發(fā)展
信息與情報(bào)是不同概念,情報(bào)是對(duì)信息進(jìn)行深度加工或從各種文本中挖掘的知識(shí),可以是一種產(chǎn)品、活動(dòng)、組織,或是一組知識(shí)的專門表達(dá)形式[1-2];生成情報(bào)所采取的分析方法與執(zhí)行過(guò)程稱為情報(bào)分析研究。對(duì)于競(jìng)爭(zhēng)情報(bào)、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報(bào)等學(xué)科領(lǐng)域而言,它們的產(chǎn)生與發(fā)展與情報(bào)分析研究在具體問(wèn)題域中的應(yīng)用有著直接、密切的關(guān)系,盡管這五個(gè)領(lǐng)域?qū)η閳?bào)分析的概念理解及實(shí)踐特點(diǎn)不盡相同,但情報(bào)分析都是這些領(lǐng)域知識(shí)的核心內(nèi)容,也是支持該領(lǐng)域研究的關(guān)鍵,而且,在大數(shù)據(jù)環(huán)境下,大數(shù)據(jù)理念與方法正在對(duì)這五個(gè)領(lǐng)域產(chǎn)生著深刻的影響。這是本文選取競(jìng)爭(zhēng)情報(bào)、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報(bào)等領(lǐng)域作為研究對(duì)象的重要原因。
2.1 競(jìng)爭(zhēng)情報(bào)領(lǐng)域
“競(jìng)爭(zhēng)情報(bào)”(Competitive Intelligence,CI)是企業(yè)用來(lái)提高競(jìng)爭(zhēng)優(yōu)勢(shì)的情報(bào)分析工作,它通過(guò)感知外部環(huán)境變化、競(jìng)爭(zhēng)對(duì)手的技術(shù)跟蹤等手段,建立一個(gè)關(guān)于競(jìng)爭(zhēng)對(duì)手或外部環(huán)境的預(yù)警系統(tǒng),并支持決策服務(wù),使企業(yè)在激烈的競(jìng)爭(zhēng)中維持優(yōu)勢(shì)地位[3-5]。由此可見(jiàn),CI是對(duì)外部競(jìng)爭(zhēng)環(huán)境進(jìn)行全面監(jiān)控的過(guò)程,是一種“知己知彼”的交互分析過(guò)程。與其他領(lǐng)域的情報(bào)分析相比,通過(guò)CI分析所得到的情報(bào)更具有目的性、針對(duì)性及對(duì)抗性等特征,同時(shí)對(duì)自身跟對(duì)手的差距、潛在的機(jī)會(huì)等問(wèn)題給出了解答。
企業(yè)進(jìn)行CI活動(dòng)時(shí),合法性是開展整個(gè)活動(dòng)的基礎(chǔ),即CI活動(dòng)必須遵守法律或商業(yè)道德規(guī)范。競(jìng)爭(zhēng)對(duì)手或市場(chǎng)的相關(guān)信息主要是通過(guò)公開信息來(lái)源(如出版資料、科研報(bào)告、互聯(lián)網(wǎng)、新聞、數(shù)據(jù)庫(kù)、政策法規(guī)等)獲得,其它在不違法的前提下所能獲得的非公開發(fā)表的信息(如通過(guò)第三方獲取的信息、錄用對(duì)手公司的離職人員所獲得信息、人際網(wǎng)絡(luò)等灰色信息等)也是CI的重要信息來(lái)源[3][6]。也就是說(shuō),CI主要的信息來(lái)源是基于“文本型式”的科技文獻(xiàn)、網(wǎng)絡(luò)信息、政府信息、新聞、政策研究、產(chǎn)品信息等類型,并結(jié)合灰色信息來(lái)提高CI分析的有效性及真實(shí)性。從分析方法來(lái)看,因外部競(jìng)爭(zhēng)環(huán)境復(fù)雜性與競(jìng)爭(zhēng)對(duì)手多樣性而產(chǎn)生出多種CI方法,常見(jiàn)如定標(biāo)比超、SWOT、專利分析、五力分析、財(cái)務(wù)分析等方法[5];此外,利[7]根據(jù)五力分析與SWOT分析拓展出基于競(jìng)爭(zhēng)要素的CI四維分析框架。在技術(shù)工具方面,分析人員可選擇數(shù)據(jù)挖掘、文本挖掘、網(wǎng)絡(luò)挖掘、可視化技術(shù)、信息抽取、一般統(tǒng)計(jì)分析、軟件等方法或工具[8],將數(shù)據(jù)或信息轉(zhuǎn)化為“可操作的情報(bào)”(Actionable Intelligence),再根據(jù)企業(yè)的不同需求(如管理決策、營(yíng)運(yùn)能力、市場(chǎng)監(jiān)控等)形成各種情報(bào)產(chǎn)品(如每月情報(bào)通訊、咨詢報(bào)告、競(jìng)爭(zhēng)對(duì)手文檔、形勢(shì)分析等),提供企業(yè)作為戰(zhàn)略行動(dòng)依據(jù)、危機(jī)預(yù)警判斷、商業(yè)談判等重大決策參考。
大數(shù)據(jù)環(huán)境下,公開信息來(lái)源越來(lái)越多樣化,考驗(yàn)著企業(yè)的情報(bào)獲取與分析能力,特別是企業(yè)對(duì)外部環(huán)境變化的及時(shí)感知與動(dòng)態(tài)應(yīng)變能力, CI在企業(yè)戰(zhàn)略預(yù)警與危機(jī)管理等方面發(fā)揮著越來(lái)越重要的作用[9]。從當(dāng)前的研究與實(shí)踐來(lái)看,CI 面臨著“全信息源獲取”、“分析復(fù)雜化與實(shí)時(shí)化”兩個(gè)急迫解決的問(wèn)題,就前者而言,企業(yè)可以通過(guò)信息技術(shù)解決全信息源獲取的技術(shù)性問(wèn)題;對(duì)后者來(lái)說(shuō),隨著企業(yè)可以獲取越來(lái)越多的異構(gòu)的數(shù)據(jù)及信息,要求CI能夠處理更加復(fù)雜的分析對(duì)象,其分析方法需要結(jié)合更多智能化技術(shù),工作流程需要結(jié)合多種方法來(lái)解決問(wèn)題[10-11],例如,除了上述常見(jiàn)的分析方法之外,非結(jié)構(gòu)化數(shù)據(jù)處理、關(guān)聯(lián)關(guān)系分析、網(wǎng)絡(luò)挖掘(如輿情分析、觀點(diǎn)挖掘等)、實(shí)時(shí)分析及云計(jì)算等方法或技術(shù)都是企業(yè)進(jìn)行CI分析的新挑戰(zhàn)[12]。此外,除了獲取公開信息來(lái)源之外,由社交媒體產(chǎn)生的社會(huì)化數(shù)據(jù)[13],也引發(fā)了企業(yè)CI對(duì)競(jìng)爭(zhēng)對(duì)手進(jìn)行實(shí)時(shí)監(jiān)控與分析的需求。總言之,從基本目的來(lái)看CI分析在大數(shù)據(jù)環(huán)境下的發(fā)展,會(huì)發(fā)現(xiàn)CI正從對(duì)現(xiàn)有競(jìng)爭(zhēng)對(duì)手和外部環(huán)境進(jìn)行分析以輔助企業(yè)保持競(jìng)爭(zhēng)優(yōu)勢(shì),轉(zhuǎn)向?qū)?shí)時(shí)數(shù)據(jù)或信息進(jìn)行快速分析響應(yīng),通過(guò)多種分析方法的結(jié)合做到知識(shí)發(fā)現(xiàn)以及構(gòu)建適應(yīng)外部環(huán)境的持續(xù)應(yīng)變分析模式[14],用來(lái)支持企業(yè)在競(jìng)爭(zhēng)環(huán)境中做出高效精準(zhǔn)決策。
2.2 商業(yè)管理領(lǐng)域
商業(yè)管理領(lǐng)域所涉及的情報(bào)分析是指“商務(wù)智能”(Business Intelligence,BI)或商業(yè)情報(bào)。BI通常被定義為由數(shù)據(jù)倉(cāng)庫(kù)、ETL、聯(lián)機(jī)分析、數(shù)據(jù)挖掘、客戶關(guān)系管理、知識(shí)管理等多種技術(shù)融合而成的方法及系統(tǒng),用來(lái)管理企業(yè)內(nèi)的相關(guān)商業(yè)數(shù)據(jù)、專家信息及知識(shí)。不同于CI關(guān)注外部情報(bào),BI針對(duì)企業(yè)內(nèi)部的各種數(shù)據(jù)及信息進(jìn)行分析,從而達(dá)到企業(yè)績(jī)效管理、客戶關(guān)系優(yōu)化、監(jiān)控商業(yè)活動(dòng)等管理目的[15-16]。由此可見(jiàn),BI是一種用來(lái)提高企業(yè)營(yíng)銷管理能力的一套集成分析方法與系統(tǒng),分析所得的情報(bào)被應(yīng)用在解決客戶及產(chǎn)品的需求趨勢(shì)、潛在服務(wù)與產(chǎn)品的關(guān)系、銷售預(yù)測(cè)、營(yíng)銷策略創(chuàng)新等問(wèn)題。
從實(shí)踐角度看, BI的實(shí)施包括了輸入、流程及輸出等三個(gè)主要步驟:①輸入是指數(shù)據(jù)來(lái)源,BI的信息源是基于“數(shù)值型式”的業(yè)務(wù)數(shù)據(jù)、客戶相關(guān)數(shù)據(jù)、專家信息、檢索日志記錄等,或是企業(yè)內(nèi)部現(xiàn)有數(shù)據(jù)倉(cāng)庫(kù)的存儲(chǔ)內(nèi)容。②流程是指數(shù)據(jù)處理與分析過(guò)程,在BI的實(shí)施過(guò)程中,利用ETL等技術(shù)方法將企業(yè)的各種業(yè)務(wù)數(shù)據(jù)導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)、或是進(jìn)行數(shù)據(jù)集成,并進(jìn)行數(shù)據(jù)分析與挖掘,再將分析結(jié)果結(jié)合企業(yè)的戰(zhàn)略、運(yùn)營(yíng)、關(guān)鍵績(jī)效指標(biāo)或模型庫(kù)等加以實(shí)踐應(yīng)用,最終達(dá)到組織層次的商業(yè)績(jī)效管理、以及戰(zhàn)略層次的戰(zhàn)略規(guī)劃[17]。③輸出是指BI系統(tǒng)或平臺(tái)產(chǎn)生的各種情報(bào)產(chǎn)品,如產(chǎn)品銷售報(bào)表、客戶分析報(bào)表、產(chǎn)品定價(jià)方案、績(jī)效管理報(bào)表、財(cái)務(wù)報(bào)表等。從技術(shù)角度來(lái)看,Chen等人[18]認(rèn)為BI分析經(jīng)歷過(guò)三個(gè)演化階段:第一個(gè)階段是BI1.0,其技術(shù)基礎(chǔ)是結(jié)構(gòu)化數(shù)據(jù)管理與數(shù)據(jù)倉(cāng)庫(kù);到了2000年的互聯(lián)網(wǎng)出現(xiàn)后,BI進(jìn)入了BI2.0階段,即以網(wǎng)絡(luò)環(huán)境為主的商業(yè)情報(bào)分析,BI開始重視實(shí)時(shí)數(shù)據(jù)分析、集體智慧、觀點(diǎn)挖掘、關(guān)聯(lián)數(shù)據(jù)、網(wǎng)絡(luò)分析或文本挖掘等技術(shù)[19],表明了基于企業(yè)內(nèi)及結(jié)構(gòu)化數(shù)據(jù)的情報(bào)分析已無(wú)法滿足決策要求了,而是需要結(jié)合更多的企業(yè)外部及非結(jié)構(gòu)化數(shù)據(jù),來(lái)挖掘用戶對(duì)企業(yè)業(yè)務(wù)開展、市場(chǎng)活動(dòng)的想法;第三階段是BI3.0階段,它是在移動(dòng)終端、RFID及情景感測(cè)等技術(shù)發(fā)展背景下產(chǎn)生的,對(duì)企業(yè)而言,如何高效處理這類移動(dòng)性強(qiáng)、與位置相關(guān)、以人為中心、情境敏感的數(shù)據(jù),將是BI分析的巨大挑戰(zhàn)。
大數(shù)據(jù)環(huán)境下,各種新型信息技術(shù)改變了企業(yè)的營(yíng)銷決策與商業(yè)模式,也對(duì)BI的架構(gòu)、功能和所要發(fā)揮的作用產(chǎn)生了巨大的影響。馮芷艷等人[20]從管理學(xué)角度提出大數(shù)據(jù)背景下現(xiàn)代企業(yè)商業(yè)管理研究的前沿課題,例如,企業(yè)應(yīng)利用智能化技術(shù)等手段,挖掘提煉出社會(huì)化網(wǎng)絡(luò)環(huán)境中典型的行為模式、個(gè)性化行為,其中對(duì)新型數(shù)據(jù)源的實(shí)時(shí)清洗、實(shí)時(shí)挖掘、實(shí)時(shí)建模、實(shí)時(shí)輿情監(jiān)測(cè)等都是值得發(fā)展的分析技術(shù),同時(shí),還要在精準(zhǔn)性與實(shí)時(shí)分析之間尋求企業(yè)績(jī)效管理的平衡點(diǎn)。由此可以看出,企業(yè)的BI分析在大數(shù)據(jù)環(huán)境下,正從過(guò)去基于歷史數(shù)據(jù)的情報(bào)分析向“實(shí)時(shí)分析”(Real-Time Analysis)的方向轉(zhuǎn)變。具體來(lái)說(shuō),BI若要進(jìn)行實(shí)時(shí)分析,必須先解決數(shù)據(jù)采集、數(shù)據(jù)分析、決策支持及信息反饋等環(huán)節(jié)中的滯后問(wèn)題,Seufert及Schiefer等人[21]認(rèn)為必須通過(guò)信息集成設(shè)施與商業(yè)環(huán)境集成來(lái)解決這些問(wèn)題,包括以事件(Events)驅(qū)動(dòng)機(jī)制替代周期性的批量處理方式來(lái)解決數(shù)據(jù)采集滯后的問(wèn)題,利用聯(lián)機(jī)分析或數(shù)據(jù)挖掘來(lái)解決分析滯后的問(wèn)題等等。此外,Lim等人[22]強(qiáng)調(diào)新型數(shù)據(jù)源對(duì)BI分析的影響,并指出現(xiàn)有的BI系統(tǒng)與大數(shù)據(jù)分析技術(shù)(如Hadoop、MapReduce)、文本挖掘(如從搜索引擎轉(zhuǎn)向企業(yè)搜索系統(tǒng)、從情感分析轉(zhuǎn)向觀點(diǎn)挖掘、從信息抽取轉(zhuǎn)向Q&A系統(tǒng))、網(wǎng)絡(luò)分析(如鏈接挖掘、社區(qū)發(fā)現(xiàn)、社會(huì)化推薦)等技術(shù)進(jìn)行整合,是最值得深入研究的內(nèi)容。
2.3 生物醫(yī)學(xué)領(lǐng)域
生物醫(yī)學(xué)領(lǐng)域中的情報(bào)分析主要是指“生物醫(yī)學(xué)信息學(xué)”(Biomedical Informatics,BMI)[23],它是由信息計(jì)量學(xué)、醫(yī)學(xué)信息學(xué)(Medical Informatics)與生物信息學(xué)(Bioinformatics)等多種學(xué)科融合而產(chǎn)生的新興領(lǐng)域,主要利用情報(bào)學(xué)、護(hù)理學(xué)、生物工程、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)等領(lǐng)域的分析方法與技術(shù)來(lái)研究生物醫(yī)學(xué)問(wèn)題,支持衛(wèi)生保健、臨床實(shí)驗(yàn)及醫(yī)學(xué)知識(shí)發(fā)現(xiàn)過(guò)程中的決策與服務(wù)。具體來(lái)說(shuō),BMI分析的基本目的在于了解生命的起源、進(jìn)化、遺傳和發(fā)育的本質(zhì),通過(guò)相關(guān)分析方法或技術(shù)挖掘出潛藏在眾多生物信息數(shù)據(jù)庫(kù)中的新知識(shí),輔助或直接開展基因組序列分析、基因進(jìn)化分析、藥物設(shè)計(jì)、預(yù)測(cè)蛋白質(zhì)分子結(jié)構(gòu)與功能、基因區(qū)域預(yù)測(cè)及基因功能預(yù)測(cè)等工作[24-26]。
BMI的分析對(duì)象是生物醫(yī)學(xué)數(shù)據(jù)(Biomedical Data),包括患者的敘述性數(shù)據(jù)(如病征描述內(nèi)容)、數(shù)據(jù)測(cè)量的文本數(shù)據(jù)、遺傳信息、記錄信號(hào)、圖紙或影像數(shù)據(jù)等[27],這些素材除了可從綜合數(shù)據(jù)庫(kù)(如Web of Knowledge、Science Direct等)獲得之外,BMI領(lǐng)域的專業(yè)數(shù)據(jù)庫(kù)(如Genebank、EMBL、DDBJ、Swiss2Port等)、醫(yī)學(xué)中心或生物信息中心(如EBI、EMBL、NCBI、NIH等)也是主要的獲取渠道。由于生物醫(yī)學(xué)領(lǐng)域的數(shù)據(jù)復(fù)雜性,促使人們必須開發(fā)更新、更靈敏的計(jì)算機(jī)技術(shù)或算法來(lái)處理及分析生物醫(yī)學(xué)數(shù)據(jù)。從分析方法來(lái)看,BMI除了沿用生物醫(yī)學(xué)領(lǐng)域的專門分析方法(如序列對(duì)比、結(jié)構(gòu)對(duì)比、功能對(duì)比預(yù)測(cè)等)之外,也借鑒了數(shù)據(jù)挖掘、文本挖掘、本體構(gòu)建、知識(shí)發(fā)現(xiàn)等相關(guān)方法和技術(shù)[25][28-29],借鑒相關(guān)領(lǐng)域的分析方法原因有二:一是幫助加快及改進(jìn)生物計(jì)算分析效率,并降低人工分析及物力投入成本;二是解決遺傳語(yǔ)言中存在的語(yǔ)義鴻溝(Semantic Gap)、生物醫(yī)學(xué)本體構(gòu)建及其概念分類與檢索等障礙。通過(guò)BMI分析所得到的情報(bào)產(chǎn)出有各種形式,如研究論文、特定主題分析報(bào)告、診斷報(bào)告書、基因表達(dá)圖譜等,其產(chǎn)出結(jié)果可用來(lái)解釋生命進(jìn)化、人體生理與病理關(guān)系等現(xiàn)象,同時(shí)對(duì)疾病診斷、藥物研發(fā)或遺傳解碼等實(shí)踐應(yīng)用提供了有效支持。
大數(shù)據(jù)環(huán)境下,數(shù)據(jù)分析及信息處理方法已經(jīng)成為BMI分析的基礎(chǔ)工作,同時(shí),大數(shù)據(jù)理念與方法,對(duì)BMI分析從“發(fā)現(xiàn)及關(guān)聯(lián)”轉(zhuǎn)向“組合及預(yù)測(cè)”、從系統(tǒng)層次的分析轉(zhuǎn)向分子層次的分析,起到了重大影響[28]。Miller[30]也認(rèn)為BMI面對(duì)急速增加的生物醫(yī)學(xué)數(shù)據(jù)數(shù)量的問(wèn)題,特別是下一世代的序列分析技術(shù),將能解析出更多的基因序列,致使數(shù)據(jù)結(jié)構(gòu)更加復(fù)雜化,因此需要在全基因組層面上開展多中心、大樣本、反復(fù)驗(yàn)證的基因關(guān)聯(lián)研究(Genome-wide Association Studies),從而輔助科研人員對(duì)基因組或疾病做深入的科學(xué)探究。此外,BMI也開始關(guān)注生物醫(yī)學(xué)數(shù)據(jù)與網(wǎng)絡(luò)數(shù)據(jù)的結(jié)合,通過(guò)社會(huì)網(wǎng)絡(luò)分析、網(wǎng)絡(luò)分析或云計(jì)算等方法來(lái)鑒別、預(yù)測(cè)或追蹤藥物治療、不同地區(qū)人口的關(guān)注疾病等問(wèn)題[31]。總言之,為了能支持上述BMI分析,分析前的預(yù)處理工作必須做到真正意義上的“整合”,即情報(bào)分析活動(dòng)的第一步驟,對(duì)多源數(shù)據(jù)進(jìn)行抽取、比對(duì)、清洗與轉(zhuǎn)換,從而提高及保證生物醫(yī)學(xué)多源數(shù)據(jù)融合的效率與質(zhì)量。
2.4 政府治理領(lǐng)域
Web2.0與開放數(shù)據(jù)(Open Data)對(duì)政府治理產(chǎn)生了許多刺激作用,說(shuō)明了公共數(shù)據(jù)(Public Data)開放對(duì)提高政府運(yùn)作的透明度、治理效率及影響決策等的重要性。目前,政府治理領(lǐng)域所指的情報(bào)分析尚無(wú)公認(rèn)定義,整體來(lái)說(shuō),更傾向通過(guò)“政府?dāng)?shù)據(jù)挖掘”(Government Data Mining,GDM),即通過(guò)對(duì)稅務(wù)、就業(yè)、執(zhí)法、國(guó)家安全(如航空運(yùn)輸、金融交易、監(jiān)視等)等相關(guān)數(shù)據(jù)的深入挖掘,分離出潛藏在數(shù)據(jù)中的噪音及有價(jià)值的情報(bào),用來(lái)提高政府治理的水平[32]。由此可見(jiàn),GDM的基本目的是促進(jìn)公共治理與解決社會(huì)服務(wù)問(wèn)題,即強(qiáng)化數(shù)據(jù)-治理-服務(wù)三者之間的關(guān)聯(lián)關(guān)系,并涉及了信息公開與共享、信息增值與再利用、數(shù)據(jù)訪問(wèn)與存取、數(shù)據(jù)保密、數(shù)據(jù)整合等研究課題。
GDM的分析對(duì)象是政府開放的公共數(shù)據(jù),如,美國(guó)政府以數(shù)據(jù)共享及再利用為目標(biāo),建立了開放美國(guó)政府?dāng)?shù)據(jù)的Data.gov網(wǎng)站,對(duì)用戶提供多種數(shù)據(jù)集和輸出接口,以方便政府?dāng)?shù)據(jù)再利用及增值開發(fā),并結(jié)合Data.gov與云計(jì)算,構(gòu)建了面向美國(guó)所有政府部門的Apps.gov云服務(wù)門戶[33]。以美國(guó)Data.gov網(wǎng)站開放的數(shù)據(jù)類型為例,截至2014年7月5日,網(wǎng)站上共開放了110,875個(gè)數(shù)據(jù)集,涉及了企業(yè)、地球觀測(cè)、教育、地理空間等21類。從分析方法來(lái)看,數(shù)據(jù)挖掘是GDM的關(guān)鍵技術(shù),常見(jiàn)如統(tǒng)計(jì)分析、分類、聚類、關(guān)聯(lián)規(guī)則、決策樹、神經(jīng)網(wǎng)絡(luò)等。劉典文[34]梳理了數(shù)據(jù)挖掘在公共管理領(lǐng)域的各種應(yīng)用,如通過(guò)孤立點(diǎn)分析找出詐欺行為的特征、通過(guò)聚類分析找出城市交通系統(tǒng)規(guī)劃及站點(diǎn)分布等,而電子政務(wù)、政府績(jī)效管理、公共危機(jī)管理等也是廣泛運(yùn)用數(shù)據(jù)挖掘來(lái)找出更多有價(jià)值的情報(bào)。通過(guò)GDM分析得到的情報(bào),可通過(guò)每月統(tǒng)計(jì)報(bào)表、問(wèn)題解決方案、特定事件監(jiān)測(cè)匯報(bào)等型式呈現(xiàn)結(jié)果,向決策者或管理者提供政府信息資源增值、信息孤島與社會(huì)服務(wù)問(wèn)題解決、城市管理與監(jiān)控等方面的治理支持。
大數(shù)據(jù)環(huán)境下,Yiu[35]認(rèn)為大數(shù)據(jù)分析是改變政府治理與社會(huì)服務(wù)的重要方法或技術(shù),它強(qiáng)化了跨部門之間的數(shù)據(jù)共享與關(guān)聯(lián)、支持組織學(xué)習(xí)與績(jī)效管理,并將管理顆粒度細(xì)化到個(gè)人,從而可廣泛地應(yīng)用于各種政府服務(wù)管理,如實(shí)時(shí)信息管理、多源數(shù)據(jù)融合分析稅務(wù)詐欺、個(gè)性化服務(wù)、城市人口監(jiān)控與預(yù)測(cè)等。為了解決部門條塊分割的管理碎片化及資源分配問(wèn)題,陳美[36]認(rèn)為可以通過(guò)建立集成各種交通數(shù)據(jù)的綜合多維交通信息體系,實(shí)現(xiàn)各種政府?dāng)?shù)據(jù)的綜合分析,快速解決交通事故、應(yīng)對(duì)惡劣氣候?qū)煌ǖ牟涣加绊憽⒓皶r(shí)實(shí)施道路養(yǎng)護(hù)等等。王志軍[37]以北京石景山區(qū)的城市供水管網(wǎng)漏損應(yīng)用示范點(diǎn)為例,以流量法、壓力法和噪音法分析該區(qū)的供水管網(wǎng)相關(guān)數(shù)據(jù),找出漏損情況及匹配適合的檢漏方法,達(dá)到了精細(xì)化分析、智能化管理,并取得了節(jié)約耗能的效果。除了分析公共數(shù)據(jù)外,喻國(guó)明[38]利用數(shù)據(jù)挖掘及社會(huì)語(yǔ)義分析工具分析百度搜索詞,探討了中國(guó)社會(huì)的輿情現(xiàn)實(shí)的走勢(shì)與發(fā)展,發(fā)現(xiàn)社會(huì)民生、公共安全、衛(wèi)生及環(huán)境生態(tài)是近年來(lái)中國(guó)社會(huì)輿論持續(xù)關(guān)注的基本問(wèn)題,對(duì)于社會(huì)管理和社會(huì)協(xié)調(diào)有重要的啟示。由此可見(jiàn),在大數(shù)據(jù)環(huán)境下GDM分析的發(fā)展重點(diǎn)在于,從公共數(shù)據(jù)或其他開放數(shù)據(jù)分析中,精準(zhǔn)、及時(shí)掌握政府部門在各種社會(huì)服務(wù)中的運(yùn)行規(guī)律,以及深刻察覺(jué)其中的治理問(wèn)題,并提供以數(shù)據(jù)為支撐的決策情報(bào)與問(wèn)題解決方案。
2.5 軍事情報(bào)領(lǐng)域
軍事情報(bào)(Military Intelligence,MI)是指是為了保障軍事斗爭(zhēng),有目的地搜集敵方、我方、友方、中立方等相關(guān)方面的素材信息(包括公開信息、秘密信息、部隊(duì)及技術(shù)偵查情報(bào)、軍事戰(zhàn)備相關(guān)情報(bào)等),再經(jīng)深入的綜合分析后得到的情報(bào)[39]。在這種情報(bào)分析中,特別強(qiáng)調(diào)要避免因忽視危機(jī)信號(hào)、過(guò)度過(guò)濾信息、信息交流不暢、情報(bào)政治化等因素造成的情報(bào)失察(Intelligence Failure)或情勢(shì)誤判[40]。也就是說(shuō),MI分析的基本目的在于情報(bào)保障及避免情報(bào)失察,其分析任務(wù)是面向國(guó)家安全的情報(bào)偵察探測(cè)、分析模擬、戰(zhàn)略研擬、決策參考等方面。
MI的分析對(duì)象依據(jù)不同標(biāo)準(zhǔn)而劃分不同類型,按真實(shí)程度可劃分真假情報(bào);按性質(zhì)可劃分軍事指揮、后勤、裝備等情報(bào);按載體可劃分文字、聲像、實(shí)物等情報(bào)[40]。具體來(lái)說(shuō),MI是從公開與非公開數(shù)據(jù)源、軍事信息系統(tǒng)、衛(wèi)星預(yù)警系統(tǒng)等各種渠道取得的基于“戰(zhàn)事局勢(shì)”的偵查情報(bào)、傳感數(shù)據(jù)、地理數(shù)據(jù)、照片、聲音、武器裝備等等相關(guān)素材。從分析方法來(lái)看,MI除了一般的基礎(chǔ)分析方法(如數(shù)學(xué)方法、文獻(xiàn)研究等)之外,情報(bào)素材鑒別方法(先期過(guò)濾工作)、作戰(zhàn)想定方法(基于軍事任務(wù))、成果評(píng)估方法(確定軍事情報(bào)價(jià)值)都是體現(xiàn)軍事情報(bào)領(lǐng)域研究特點(diǎn)的專門分析方法[41]。經(jīng)過(guò)MI分析得到的情報(bào),可通過(guò)戰(zhàn)略分析評(píng)估報(bào)告、戰(zhàn)情模擬分析報(bào)告、特定目標(biāo)監(jiān)控報(bào)告等形式呈現(xiàn)內(nèi)容,并支撐軍事情報(bào)單位的軍事斗爭(zhēng)準(zhǔn)備,達(dá)到戰(zhàn)事情況監(jiān)控、戰(zhàn)勝對(duì)手、及時(shí)預(yù)測(cè)客觀情況等各項(xiàng)目標(biāo)。
大數(shù)據(jù)環(huán)境下,面對(duì)公開信息來(lái)源及新型網(wǎng)絡(luò)環(huán)境的數(shù)據(jù)過(guò)剩問(wèn)題,情報(bào)人員沒(méi)有足夠時(shí)間篩選潛在的有價(jià)值情報(bào)[42],例如,軍事情報(bào)單位得知可能在某日下午發(fā)動(dòng)網(wǎng)絡(luò)攻擊,但這樣的情報(bào)量是不足夠的,必須具體知道何人、何時(shí)、何地及如何阻止他們,而該網(wǎng)絡(luò)恐怖事件即將發(fā)生,不允許情報(bào)人員花費(fèi)時(shí)間分析該網(wǎng)絡(luò)攻擊的時(shí)間、地點(diǎn)與人物。又例如,2012年美國(guó)國(guó)防部高級(jí)研究計(jì)劃局推出XDATA項(xiàng)目,目的是開發(fā)大數(shù)據(jù)處理與分析相關(guān)的計(jì)算技術(shù)與開放源碼軟件,用來(lái)滿足國(guó)防軍事需求。但除了開發(fā)軟件工具包之外,項(xiàng)目更涉及了可拓展的分析與數(shù)據(jù)處理技術(shù)、可視化用戶界面技術(shù)、軟件集成研究及評(píng)價(jià)等等技術(shù),將來(lái)可以具體應(yīng)用在網(wǎng)絡(luò)科技、電子戰(zhàn)、電子防護(hù)、數(shù)據(jù)決策、大規(guī)模殺傷性武器防御、工程化彈性系統(tǒng)及監(jiān)視偵察系統(tǒng)等[43]。上述例子說(shuō)明,大數(shù)據(jù)環(huán)境給MI分析智能化帶來(lái)巨大的挑戰(zhàn),研究的課題包括但不限于:信息情報(bào)的自動(dòng)監(jiān)控與關(guān)鍵信息的自動(dòng)識(shí)別定位;不同來(lái)源的數(shù)據(jù)與同一事件的對(duì)應(yīng)關(guān)系發(fā)現(xiàn);非關(guān)鍵信息之間的隱藏關(guān)聯(lián)規(guī)則等等。
3 結(jié)語(yǔ)
本文梳理了競(jìng)爭(zhēng)情報(bào)、商業(yè)管理、生物醫(yī)學(xué)、政府治理及軍事情報(bào)五個(gè)領(lǐng)域中情報(bào)分析的概念與實(shí)踐的特點(diǎn),揭示了不同領(lǐng)域的情報(bào)分析的特征,以及大數(shù)據(jù)理念與技術(shù)對(duì)五個(gè)領(lǐng)域中的情報(bào)分析帶來(lái)的影響。為更加清楚起見(jiàn),本文從基本目的、問(wèn)題情景、研究任務(wù)、數(shù)據(jù)類型、數(shù)據(jù)來(lái)源、分析活動(dòng)、分析技術(shù)、產(chǎn)出形式、結(jié)果價(jià)值以及大數(shù)據(jù)的影響等十個(gè)方面列出了不同領(lǐng)域情報(bào)分析的特征(見(jiàn)表1),期望能幫助我們更加清楚地認(rèn)識(shí)情報(bào)分析的內(nèi)涵和外延。
參考文獻(xiàn):
[1]包昌火. 情報(bào)研究方法論[M]. 北京: 科學(xué)技術(shù)文獻(xiàn)出版社, 1990.
[2]Moore D T. Critical Thinking and Intelligence Analysis[M].Washington, D.C.: Joint Military Intelligence College,2010.
[3]陳峰. 競(jìng)爭(zhēng)情報(bào)概念及相關(guān)因素分析[J]. 圖書情報(bào)知識(shí),2003,(1): 20-22.
[4]包昌火.加強(qiáng)競(jìng)爭(zhēng)情報(bào)工作 提高我國(guó)企業(yè)競(jìng)爭(zhēng)能力[J].中國(guó)信息導(dǎo)報(bào),1998,(11): 30-33.
[5]王知津. 競(jìng)爭(zhēng)情報(bào)[M]. 北京: 科學(xué)技術(shù)文獻(xiàn)出版社, 2005.
[6]李正中,許蕾. 競(jìng)爭(zhēng)情報(bào)行為的正當(dāng)性與灰色信息收集方式的研究[J].情報(bào)學(xué)報(bào),2000,19(1): 77-81.
[7]利.基于要素細(xì)分的競(jìng)爭(zhēng)情報(bào)四維分析框架[J]. 情報(bào)學(xué)報(bào),2007,26(1): 89-99.
[8]Bose R. Competitive intelligence process and tools for intelligence analysis[J].Industrial Management & Data Systems,2008,108(4):510-528.
[9]包昌火,趙剛,黃英,等. 略論競(jìng)爭(zhēng)情報(bào)的發(fā)展走向[J]. 情報(bào)學(xué)報(bào),2004,23(3):352-366.
[10]化柏林.網(wǎng)絡(luò)海量信息環(huán)境下的情報(bào)方法體系研究[J]. 情報(bào)理論與實(shí)踐,2012,35(11):1-5.
[11]李廣建,楊林. 大數(shù)據(jù)視角下的情報(bào)研究與情報(bào)研究技術(shù)[J]. 圖書與情報(bào),2012,(6): 1-8.
[12]劉高勇,汪會(huì)玲,吳金紅. 大數(shù)據(jù)時(shí)代的競(jìng)爭(zhēng)情報(bào)發(fā)展動(dòng)向探析[J]. 圖書情報(bào)知識(shí),2013,(2):105-111.
[13]謝志航,冷洪霞,楊晶晶. 大數(shù)據(jù)背景下社會(huì)化媒體數(shù)據(jù)的情報(bào)價(jià)值探討[J]. 情報(bào)探索,2013,(10):6-8.
[14]黃曉斌,鐘輝新. 基于大數(shù)據(jù)的企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)模型構(gòu)建[J]. 情報(bào)雜志,2013,32(3): 37-43.
[15]Negash S. Business intelligence[J]. Communications of the Association for Information Systems,2004,(13):177-195.
[16]Ranjan J. Business Intelligence: Concepts, Components,Techniques and Benefits[J]. Journal of Theoretical and Applied Information Technology,2009,9(1): 60-70.
[17]朱曉武. 商務(wù)智能的理論和應(yīng)用研究綜述[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用,2007,(1): 114-117.
[18]Chen H C, Chiang R H L, Storey V C. Business Intelligence and Analytics: From Big Data to Big Impact[J]. MIS Quarterly,2012,36(4):1165-1188.
[19]Trujillo J, Maté A. Business Intelligence 2.0: A General Overview[M].Aufaure M,Zimányi E,Springer Berlin Heidelberg,2012:96,98-116.
[20]馮芷艷,郭迅華,曾大軍,等. 大數(shù)據(jù)背景下商務(wù)管理研究若干前沿課題[J].管理科學(xué)學(xué)報(bào),2013,16(1): 1-9.
[21]Seufert A, Schiefer J. Enhanced business intelligence - supporting business processes with real-time business analytics: 16th International Workshop on Database and Expert Systems Applications[Z]. Copenhagen,Denmark: IEEE Computer Society, 2005.
[22]Lim E P, Chen H C, Chen G Q. Business Intelligence and Analytics: Research Directions[J]. ACM Transactions on Management Information Systems,2013,3(4): 1-10.
[23]Bernstam E V, Smith J W, Johnson T R. What is biomedical informatics?[J]. Journal of Biomedical Informatics,2010,43(1):104-110.
[24]黃科,曹家樹,吳秋云,等. 生物信息學(xué)[J].情報(bào)學(xué)報(bào),2002, 21(4): 491-496.
[25]陳銘. 后基因組時(shí)代的生物信息學(xué)[J]. 生物信息學(xué), 2004,(2):29-34.
[26]陳潤(rùn)生. 當(dāng)前生物信息學(xué)的重要研究任務(wù)[J]. 生物工程進(jìn)展,1999,19(4):11-14.
[27]Shortliffe E, Barnett G O. Biomedical Data: Their Acquisition,Storage,and Use[M].London:Springer, 2014:
39-66.
[28]Bellazzi R, Diomidous M, Sarkar I, et al. Data analysis and data mining current issues in biomedical informatics[J]. Methods of Information in Medicine, 2011,
50(6): 536-544.
[29]Pardue J H, Gerthoffer W T. Knowledge acquisition, semantic text mining, and security risks in health and biomedical informatics[J]. World Journal of Biological
Chemistry,2012,(2): 27-33.
[30]Miller K. Big Data Analytics in Biomedical Research[J]. Biomedical Computation Review,2012,(2):14-21.
[31]Costa F F. Social networks, web-based tools and diseases: implications for biomedical research[J]. Drug Discovery Today,2013, 18(5-6):272-281.
[32]Cate F H. Government data mining: The need for a legal framework[J]. Harvard Civil Rights-Civil Liberties Law Review,2008,43(2):435-489.
[33]劉增明,賈一葦. 美國(guó)政府Data.gov和Apps.gov的經(jīng)驗(yàn)與啟示[J]. 電子政務(wù),2011,(4):90-95.
[34]劉典文.數(shù)據(jù)挖掘技術(shù)在公共管理領(lǐng)域的應(yīng)用[J]. 行政論壇,2010, 17(2): 42-46.
[35]Yiu C. The Big Data Opportunity: Making government faster, smarter and more personal[R]. London: Policy Exchange, 2012.
[36]陳美. 大數(shù)據(jù)在公共交通中的應(yīng)用[J]. 圖書與情報(bào), 2012,(6): 22-28.
[37]王志軍.大數(shù)據(jù)時(shí)代下的城市供水管網(wǎng)漏損管理[J]. 中國(guó)科技產(chǎn)業(yè),2014,(2):74-75.
[38]喻國(guó)明. 大數(shù)據(jù)分析下的中國(guó)社會(huì)輿情:總體態(tài)勢(shì)與結(jié)構(gòu)性特征[J]. 中國(guó)人民大學(xué)學(xué)報(bào),2013,(5): 2-9.
[39]周軍.試論軍事情報(bào)的概念[J].情報(bào)雜志,2004,(1): 33-34.
[40]沈固朝. 情報(bào)失察――西方情報(bào)研究的重要課題及其對(duì)我們的啟示[J].圖書情報(bào)工作,2009,(2):34-37.
[41]程立斌,林春應(yīng). 軍事情報(bào)研究方法體系探析[J]. 情報(bào)雜志,2007,(2):87-89.
[42]Magnuson S. Defense, Intel Communities Wrestle With the Promise and Problems of 'Big Data' (UPDATED)[J/OL].[2014-08-20].https:///read/1G1-323351157/defense-intel-communities-wrestle-with-the-promise.
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:北大期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:北大期刊
榮譽(yù):百種重點(diǎn)期刊
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊