公務員期刊網 精選范文 自動識別技術論文范文

    自動識別技術論文精選(九篇)

    前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的自動識別技術論文主題范文,僅供參考,歡迎閱讀并收藏。

    自動識別技術論文

    第1篇:自動識別技術論文范文

    關鍵詞:車牌定位 字符分割 字符識別

    1.引言

    隨著汽車數量的不斷遞增,擺在面前的是巨大的交通壓力,現代交通的發展迫切要求實現交通管理的自動化。因為車牌號碼是車輛的唯一“身份”標識,所以車牌識別系統可以作為車輛自動識別的一種重要形式, 對于交通管理、治安處罰等工作的智能化起著十分重要的作用。它可廣泛應用于交通流量檢測,交通控制于誘導,機場,港口,小區的車輛管理,停車自動收費,闖紅燈等違章車輛監控以及車輛安全防盜等領域。因此對基于特征的車牌識別算法的研究在大型停車場的管理系統和交通事故的破案方面具有特別重要的實際應用意義。

    2.車牌識別原理及流程

    車牌自動識別是利用車輛的動態視頻或靜態圖像進行車牌號碼、車牌顏色自動識別的模式識別技術。包括車牌定位算法、車牌字符分割算法和車牌字符識別算法等。

    本文設計的車牌識別系統總結了車牌識別技術的歷史,分析了車牌識別的研究現狀,對存在問題和意義提出了本設計的新方案。本設計的流程包括車牌圖像采集,圖像預處理,車牌定位,車牌字符分割,車牌字符的識別等幾個部分。

    3.各模塊的實現

    3.1 圖像采集。考慮圖像對后續操作的影響,圖像在拍攝時采用人工拍攝選取車牌最佳拍攝環境。

    3.2 圖像預處理。本算法中預處理是對圖像進行圖像轉換、圖像增強、邊緣檢測和二值化,。目的是突出車牌的主要特征,以便更好地提取車牌。

    3.3 車牌定位。從預處理后的汽車圖像中分割出車牌圖像。即在一幅車輛圖像中找到車牌的位置。本文采用基于數學形態學和邊緣特征的車牌定位方法。即先對車牌圖像進行預處理,然后再對預處理后的圖像進行大范圍搜索, 再用開閉合運算來填補車牌區域內細小孔洞和去除噪聲, 進而增強車牌區, 使車牌區成為一個連通區域, 找到符合汽車牌照特征的若干區域作為候選區,然后對這些侯選區域做進一步分析、評判,最后選定一個最佳的區域作為牌照區域,并將其從圖象中分割出來。該方法有效改進了傳統的車牌定位方法, 提高了車牌定位的速度和準確度。

    3.4 字符分割及歸一化。即對獲得的車牌分離出單個字符以便字符識別。本文采用改進的投影法。即將垂直投影法和固定邊界法相結合,達到了更好的分割效果。計算出列方向像素值之和。選取一較小的像素和閾值,找到車牌上漢字的左端,在用該閾值繼續尋找漢字右端的同時,根據車牌標準,利用高與寬的比例關系找到漢字的右端。重復該方法找到其他字符的左右端,然后將字符逐一分割。歸一化則是將分割出來的字符大小歸一化。

    3.5 字符識別。將字符轉換為文本形式直接顯示出來。 本文采用的識別方法是基于模板匹配的車牌識別方案。首先取字符模板,接著依次取待識別字符與模板進行匹配,將其與模板字符相減,得到的0越多那么就越匹配。把每一幅相減后的圖的0值個數保存,然后找數值最大的,即為識別出來的結果。

    4.識別結果

    5.結論

    本文主要解決了以下問題:⑴在背景的圖象中如何定位分割牌照區域;⑵對分割下來的牌照字符如何提取具有分類能力的特征;⑶如何識別字符。在車牌字符識別系統的研究領域,近幾年出現了許多可行的識別技術和方法,從這些技術和方法中可以看到兩個明顯的趨勢:⑴單一的識別技術無法達到理想的結果,多種方法的有機結合才能提高系統有效識別能力。本文的設計,也汲取了以上一些算法的思想,反復比較,綜合分析;⑵在有效性和實用的原則下。通過多次實驗,表明該車牌識別系統可有效地識別多幅車牌,但對于識別傾斜、污損比較嚴重的車牌方面的技術還有待解決。

    參考文獻:

    [1]劉屹松.基于模板匹配車牌識別系統的研究實現[碩士學位論文].北方工業大學,2009

    [2]劉智勇.基于MATLAB的車牌定位.中國科學院,2000

    第2篇:自動識別技術論文范文

    關鍵詞:射頻識別 物流 RFID

    一、射頻識別技術綜述

    射頻識別技術(Radio Frequency Identification Technology,簡稱RFID)是一種非接觸式的自動識別技術,它主要依靠射頻信號來自動定位目標對象并獲取相關的數據,整個識別過程不需要人工參與,實現自動識別。

    從八十年代開始這項技術走向了成熟,它比同期或早期的接觸式識別技術更靈活,RFID系統的射頻卡和讀寫器不用接觸就可以完成識別的工作,因此它可以應用在更廣泛的場合。它的產品形狀和大小各異,如:卡片型、硬幣型和有印刷天線的紙張等,但它們的基本的功能是一樣的,只要配合專用讀寫器,就能夠從外部寫入或讀取信息。

    雖然RFID的功能比較單一,卻在服飾業、食品業和物流業等許多行業起到了革命性的影響,主要體現在傳統的條形碼系統已經逐漸被RFID系統代替。在諸如美國的WalMart、英國的特易購Tesco和德國的Metro等大型世界級連鎖零售企業,都為了提升企業內部物流系統的效率,采用RFID系統。由此可見,這項技術已經在全世界的零售業產生了巨大的影響,而零售業又與現代物流業關系密切,應當考慮基于射頻識別技術來建立智能化的物流管理體系。

    二、射頻識別技術的優勢分析

    射頻識別具有技術方面的優勢。以前的條形碼技術已經使用了很長時間,但現在這種技術在許多情況下已經不能滿足使用者的需要了,條形碼雖然成本便宜,但它的存儲量很小,而且使用時不能改寫,這些缺點都限制了它在物流領域的應用前景。在信息時代的背景底下,用戶對大存儲量信息載體和無線信息交流方式有了強烈的需求,并且要在現代物流管理中實現自動識別,提高物流管理的效率,RFID技術在技術上的優勢就有了更加廣闊的應用空間。

    射頻識別具有應用方面的優勢。在物流領域,無論是傳統的管理方式,還是在更強調智能化管理的今天,物流管理最終的目標都是要通過向商品流通過程中的對象提品或服務,用來換取更多的利潤。而將RFID技術應用到商品從生產、倉儲、運送以及商品流通的完整物流管理流程里,能在很大程度上幫助物流企業提高業務的效率。

    三、基于射頻識別技術的智能化物流管理

    將射頻識別技術RFID與現代的物流管理相結合,將會極大地提升物流管理的智能化水平,其必將成為現代物流發展的趨勢。

    1、貨物運輸

    RFID系統可以在貨物運輸過程中,實時跟蹤貨物運輸的地點,自動收集貨物的信息,減少了貨物運輸過程中人為參與的環節,以此獲取更準確的貨物信息,實現貨物的在途控制。這樣,就可以隨時地監控全局,更好地調整資源和勞動力的配置,合理調度和分配運輸工具,有效利用了工作時間,降低了物流成本,提高生產效率。

    2、入庫發貨

    在倉庫的進貨口處,貼有電子標簽的貨物通過閱讀器自動采集信息,完成盤點并將信息輸入主機系統數據庫。入庫時,RFID系統可以根據貨物標簽中所記錄的相關數量和體積等信息,給出最合適的倉儲位置,以達到倉儲空間的最優化利用。入庫后,則通過閱讀器自動完成清點作業,并更新庫存信息;發貨時,由另一讀寫器識別并將信息輸入中央管理器,告知它被放在哪個位置。尤其在危險品貨物的入庫和發貨時,有更大的優勢,避免的工作人員直接接觸貨物所可能造成的傷害。

    3、商品庫存

    將RFID系統應用于商品的庫存管理,可以通過無線射頻自動收集信息,完成商品入庫的記錄工作,管理中心可以實時地了解倉庫儲存了多少商品,能夠精確地監控貨物的流動情況,實現庫存情況的實時控制,這樣可以增加處理貨物的速度,還可以監視貨物的其他信息,極大地增加了清點工作的透明度,提高了管理效率。

    4、倉庫安全

    電子物品監視系統(EAS)是一種設置在需要控制物品出入的門口的RFID技術,這個系統用來保證倉儲安全,防止商品被盜,主要應用在商店、圖書館和數據中心等地方,當未被授權的人從這些地方取走物品時,EAS系統會及時發出警告。首先在將EAS標簽粘在物品上,當物品被正常購買或者合法移出時,在出口通過一定的設備使EAS標簽失活,就可以順利取走。非法物品經過門口時,EAS裝置能自動檢測標簽的活性,立刻發出警告。

    5、搬運裝卸

    在火車運輸中,將射頻卡安裝在車廂頂部,讀寫器安裝在鐵路運輸沿線上,通過讀取的數據,能獲取火車的身份和監控火車的完整性,以防止遺漏在鐵軌上的車廂發生撞車事故。目前,射頻自動識別系統已經遍布全國14個鐵路局。

    6、流通加工

    用RFID技術在生產流水線上實現自動控制、監視,提高生產率,改進了傳統的生產方式,降低了生產成本。將RFID設備裝配在加工流水線上,應用智能標簽有助于大量地生產用戶特殊定制的產品。用戶可以從上萬種零部件中,選擇自己需要的特殊顏色、型號和樣式等,而且這種射頻卡可重復使用,每個射頻卡上保存有描述產品的詳細要求,流水線的每個工作點都有讀寫器,這樣可以保證產品在流水線上能順利的完成裝配和加工的任務。

    7、事故監控

    當事故發生,即使司機不知自己所在位置,也可以通過在沿途設置的RFID監測點得到反饋的信息,管理中心可以迅速準確地了解事故發生的位置與運送貨物的安全情況,保證在最快是時間內緊急救援,減少貨物的損失,降低物流風險和成本,提高物流效率。

    四、射頻識別技術在應用上的局限性

    射頻識別技術可以廣泛應用到物流的很多方面,但是也存在了一些制約其發展的因素:

    1、價格是RFID走向大面積市場應用的最大障礙

    RFID標簽的成本比較高,如果應用在集裝箱或者汽車、電器冰箱之類的大宗商品上,成本不算什么;但如果商品本身價格比較低,這一技術的成本就顯得比較高了。

    2、RFID技術存在安全隱患

    RFID標簽無法對閱讀器進行身份驗證,當RFID標簽接近閱讀器時,就會無條件的發出信號,無法辨別閱讀器是否合法,這會帶來比較大的安全隱患,可能造成貨品信息的泄露。

    3、RFID技術缺少統一的行業標準

    目前RFID技術存在兩個基礎技術協議,分別是MIT Auto-ID Center與日本的Ubiquitous ID Center提出的,兩種標準都有不同廠商支持,采用何種協議會影響對應廠商的市場份額,進而影響整個射頻識別產業的發展。

    參考文獻:

    1 張敏;現代物流與可持續發展[D];山東農業大學;2004年

    2 包建榮;基于以太網傳輸射頻識別應用系統的研究與設計[D];浙江工業大學;2004年

    第3篇:自動識別技術論文范文

    關鍵詞:RFID;系統;數據采集;資產全生命周期;智能識別;動態管理

    中圖分類號:TP315 文獻標識碼:A 文章編號:1009-3044(2013)10-2438-04

    1 項目背景

    隨著企業的不斷發展,信息化設備、檢測儀器、計量設備、生產設備、辦公設備等固定資產種類繁、數量多,這給資產管理部門帶來了很多的工作量,僅每年兩次的資產盤點就占用了資產管理部門大部分精力。在國家對資產管理越來越重視的大環境下,為了進一步完善目前的資產管理系統,加大資產管理的力度,保證資產的安全和數據的可靠,尤其加強對一些貴重資產和調撥頻率高的設備管理成為資產管理部門的重點工作。

    射頻識別技術RFID(Radio Frequency Identification Technology)是從八十年代起走向成熟的一種非接觸式的自動識別技術,它通過射頻信號自動識別目標對象并獲取相關數據。相對于條形碼技術有非接觸式、非視線識別、可擦寫信息、更大的讀寫距離、大容量(相對條形碼)、可多個識別等突出優勢,因此,將RFID技術引入資產管理的應用中,充分發揮RFID優點,構建一個適應性更強、安全性更高、數據信息更可靠的RFID資產管理系統,可以加大和加快對企業資產管理系統的改造。

    2 管理現狀

    目前,資產管理部門采用傳統的手工記錄方式加Excel表格方式來實現資產管理中資產數據的錄入和統計,隨著資產不斷增多,目前的管理方法已開始跟不上管理要求,表現如下:

    1) 資產的盤點、清查時,管理人員需一一手工確認資產上信息登記卡,工作量巨大。

    2) 資產臺帳分級多,統計、查詢麻煩。歸口實物臺帳、財務資產臺帳、各使用部門資產臺帳,臺帳眾多,容易造成數據管理的混亂。

    3)無法將采購合同、項目合同與資產管理相關聯。

    4) 數據保存在單臺PC里,無法實現數據共享。

    5) 無法追蹤資產狀態信息,實現包括在庫、已入賬(驗收后)、報損、待報損、未入賬(已簽合同采購,但未入賬)等資產全生命周期管理。

    6) 設備出入時無法自動、快速、準確審核確認,資產的安全性低。

    3 建設目標

    本系統的目標是依托RFID的技術優勢,通過安放在資產上的標簽,利用先進的RFID設備對數據自動采集,經后臺應用軟件的智能決策,提高資產管理的信息化、自動化、網絡化、智能化,通過查詢系統可以明確地查到每項資產的狀態、去向、使用人、使用年限等信息,在資產盤點時能有效降低員工勞動強度,最大限度的提高效率、準確率;實現資產管理部門的合同管理,方便查找合同與資產的對應關系,從管理上加大對資產的管理針對性。

    4 系統構架和組成

    4.1 基于RFID技術的企業資產管理系統結構

    如圖1所示。

    4.2 系統組成

    系統組成分為三個部分:RFID設備,網絡及服務器,資產管理應用軟件。

    4.2.1 RFID設備

    包含了RFID固定設備、智能手持終端、標簽等設備,主要用于收集原始數據。同時把采集到的信息傳送給資產管理軟件。

    4.2.2 網絡及服務器設備

    資產管理RFID系統所需要的網絡及服務器設備。

    4.2.3 資產管理應用系統

    接收、處理來自RFID設備采集到的數據,根據具體要求完成數據處理,實現數據統計、查詢、存儲或共享等,包括手持終端應用軟件。

    5 系統功能模塊

    根據工作流程中需求,資產管理軟件系統需包括合同管理模塊、資產管理模塊、查詢統計模塊、系統管理模塊、提示管理模塊、手持機模塊、接口擴展預留模塊等。

    5.1 模塊設計圖

    5.2 合同管理

    將購買資產的合同按合同管理的要求錄入系統,同時按合同中的設備清單錄入資產管理系統,完成資產和合同的對應關系。

    5.2.1 合同信息錄入

    將合同中體現的所有信息錄入到資產系統中,包括合同中發生的資產類型、數量、單價等。

    5.2.2 合同信息修改功能

    當合同中輸入的信息保存后,發現有錯誤數據時,可將此合同從系統中調出,對錯誤信息進行修改。

    5.2.3 合同信息查詢功能

    可根據合同編號、合同發生日期、合同輸入日期、合同狀態等條件對合同內容進行查詢。

    5.3 資產管理

    5.3.1 資產驗收管理

    驗收合同中采購的資產,驗收無誤后在資產管理系統中錄入資產信息。

    5.3.2 資產盤點管理

    資產盤點管理是在資產管理系統中按使用部門或資產類別等多種方式自動生成資產盤點任務,并可將盤點任務下載到手持PDA中。盤點人員使用PDA對指定資產進行盤點操作,盤點完成后盤點數據回傳到系統中,對比后形成盤盈、盤虧報表。

    5.3.3 資產領用管理

    資產領用人首先填寫申請,通過相關審批環節后領取資產,資產管理員錄入資產領用信息后,使用PDA到倉庫讀取領用資產的標簽和資產領用人員員工卡,實現資產與使用人員的關聯綁定。

    5.3.4 資產退還管理

    資產用完后需要退還倉庫的,由資產當前使用人將資產送到資產管理辦,資產辦人員使用PDA讀取退還資產信息,修改資產狀態、使用人、存放地點等信息,并打印退還單據。

    5.3.5 資產調撥管理

    由資產的使用人辦理調撥手續,通過相關負責人審批后送資產管理辦,資產辦人員使用PDA讀取調撥資產信息,修改資產使用部門、使用人、存放地點等信息,并打印調撥單據。

    5.3.6 資產報損管理

    資產報損時,修改資產的狀態,快速實現資產報損管理。

    5.4 查詢統計

    可按資產分類、品牌、入庫時間、盤點、領用、退還情況及合同信息進行查詢;并可按按照管理要求,統計相關數據,如年度資產購入數量、資產總額等,生成報表。

    5.5 外出資產驗證查詢

    由于資產在外出時是通過外出審批過程的,所在保安處根據資產標簽進行自動檢測資產的放行情況是否為可放行。示意圖如圖3所示。

    當設備外出審批通過后,管理人員在本模塊內設置設備外出權限。當設備外出時,安置在門口的識別設備自動采集到設備上的標簽信息,同時把信息回傳給系統驗證,系統驗證通過后,在門衛處的屏幕上顯示允許外出,提示門衛放行。

    當未經許可的設備外出時,驗證不通過系統能以聲音的方式提示告警。

    5.6 信息提醒

    系統提醒功能是根據借用資產應退還的日期,提醒資產管理人員,當日是否有資產需要退還。

    5.7 系統維護

    5.7.1 員工信息維護

    包括員工信息數據導入和權限設置。

    員工信息數據可從現有辦公的0A系統中導入,本模塊中提供數據導入接口。對員工的訪問資產管理系統的權限進行相關設置。

    5.7.2 資產類別信息維護

    資產類別信息可從現有的財務EAS系統中導入,本模塊中提供數據導入接口。

    5.8 手持機系統管理

    類似與計算機系統可實現資產驗收、盤點、領用、退還等功能。

    6 系統效能

    整個系統管理系統采用先進的RFID 技術,可以實時監控每個資產的狀態及流向,真正實現資產信息化動態管理,系統同管理手段的結合,可以實現資產管理的信息化、自動化、智能化和柔性化,在提高效率的同時,加大管理的力度。

    1) 提高效率。系統自動采集資產信息,在整個環節中大大的提高工作效率、提高信息透明化。

    2) 提高資產盤點的確認率。系統采集信息準確,大大提高了將來資產易維護和安全性,最大限度的減少人工記錄和統計的失誤率。

    3) 實時記錄資產的狀態信息。

    4) 智能決策支持。

    系統高效的、快捷、準確的統計功能(比如資產總量、資產分布、使用情況、資產狀態等相關數據的快速統計)能給管理層決策提供數據依據。

    5) 智能提示

    對資產歸還時間、設備維護時間可提供條件式的預警提示功能,方便管理部門進一步了解資產使用情況。

    6) 出入口信息智能確認

    出入口的審核確認,自動、快速、識別距離遠識別,大大提高資產的安全性。

    7) 采用高新技術,能大大提高管理力度,樹立企業新形象。

    7 結論與展望

    RFID技術在資產管理的應用有著廣泛的應用,而本資產管理RFID系統在中心的使用,讓實現管理變為可能。

    近年來,作為國家政府部門,在資產管理環節下大力度來加強管理,其出發點就是讓資源為社會提供高效優質的產品和服務。基于RFID技術的企業資產管理系統的使用為企業不同部門、不同性質的資產分類管理提供了客觀基礎,資產管理變得信息化、透明化、科學化,對資產實行分類、分級管理,明確不同的管理目標,有助于增強管理的針對性,形成資產管理的合力,改變當前的資產管理不善的局面。同時,本系統的實施,不僅實現了資產管理的有據可查,提高了管理的權威性,也能給企業資產的分配提供合理規劃依據,使資產的運行具有穩定性。

    參考文獻:

    [1] 高峰.基于RFID 的零售業倉儲管理信息系統應用設計[D].杭州:浙江大學碩士學位論文,2008.

    [2] 張文豐.RFID技術在企業資產管理的應用[J].商場現代化,2008(21).

    [3] 楊智明.保山學院固定資產管理系統分析與設計[D].昆明:云南大學碩士論文,2010.

    [4] 褚方鴻.英特爾基于 RFID 技術的倉儲管理解決方案[J].權威論壇,2006(8).

    [5] 張暉,王東輝.RFID 技術及其應用的研究[J].微計算機信息,2007(11).

    [6] 張于芝.無線射頻識別技術及其在圖書館的應用[J].現代情報,2007(2).

    第4篇:自動識別技術論文范文

    【關鍵詞】小波包分解特征融合;PCA

    1.引言

    人臉識別是人類視覺中最杰出的能力之一,但由于受技術條件的限制發展緩慢,因而在最初的二三十年里關于這個課題只有少量的論文出現。二十世紀六十年代,Bledsoe提出了人臉識別的半自動系統模型與特征提取方法。二十世紀七十年代,美、英等發達國家開始重視人臉識別的研究工作并取得進展。1972年Harmon用交互式人臉識別方法在理論上與實踐上進行了詳細的論述。就在這一年,Skai設計了人臉圖像自動識別系統。八十年代初T.minami研究出了優于Sakai的人臉圖像自動識別系統。進入九十年代后,由于微電子、計算機等技術的發展,加上人們對人臉圖像自動識別的迫切需求,利用人臉圖像進行自動的人臉識別和身份驗證的研究變得非常熱門,應用上取得了長足的進步。

    人臉識別(Face Recognition)一般可以描述為:給定一靜止或動態圖像,利用己有的人臉數據庫來確認圖像中的一個或多個人。從廣義上講,其研究內容包括以下五個方面:(1)人臉檢測(Face Detection):即從各種不同的場景中檢測出人臉的存在并確定位置。這一任務主要受光照、噪聲、頭部傾斜度以及各種遮擋的影口向。(2)人臉表征(Face Representation):即確定表示檢測出的人臉和數據庫中的己知人臉的描述方式。通常的表示方法包括幾何特征(如歐氏距離、曲率、角度籌)、代數特征(如矩陣特征矢量)、固定特征模板、特征臉、云紋圖等。(3)人臉鑒別(Face工dent1facation):即通常所說的人臉識別,就是將待識別的人臉與數據庫中的己知人臉比較,得出相關信息。這一過程的核心是選擇適當的人臉表示方式與匹配策略。(4)表情分析(Facial Expression Analysis):即對待識別人臉的表情進行分析,并對其加以分類。(5)物理分類(Physical Classification):即對待識別人臉的物理特征進行分類,得出其年齡、性別、種族等相關信息。本課題的研究內容屬干狹義的人臉識別方法,不涉及表情識別和物理分類方面。一個人臉自動識別系統包括三個主要技術環節,如圖1所示:

    圖1 人臉識別系統

    2.PCA變換的人臉識別原理

    2.1 對低頻分量進行PCA特征提取

    對人臉圖像訓練樣本依次進行一級小波分解,用低頻分量做訓練樣本集。總體散布矩陣Cx按公式(1)建立:

    (1)

    其中:x――低頻訓練樣本向量;mx――低頻訓練樣本集的均值向量。總體散布矩陣,Cx是一個實對稱矩陣,可以找到它的一組N個正交特征值,令ei和(i=1,2,3,…,N)分別為Cx的特征向量和特征值,將特征值按降序排列。對應特征值選取d個特征向量排列組成低頻變換矩陣A.通過公式(2)求出特征向量個數d:

    (2)

    其中為按降序排列的頭k個特征值,為按要求設定的閾值.將低頻訓練樣本集中的低頻分量向變換矩陣投影,得到一組低頻訓練樣本投影系數:

    i=1,2,3,…,N (3)

    2.2 對高頻分量進行PCA特征提取

    對原始圖像訓練樣本依次進行一級小波分解,對兩個高頻分量加權求和,并以此高頻分量作為訓練樣本集。得到一組高頻訓練樣本投影系數:

    (4)

    i=1,2,3,...,N (5)

    L1,L2表示LH,HL兩個高頻區域分量,,表示分配給兩個高頻區域分量的權重系數。

    1)對所有訓練樣本A進行二層小波包分解得A1與Ah=2,…,16;

    2)采用式(6)求2至5號高頻子圖的加權平均圖像;

    (6)

    3)分別對A1、Ah繼續PCA變換,得高頻子圖與低頻子圖的主分量Y1與Yh;

    4)對Y1與Yh采用式進行融合處理,融合公式如式(7)所示,得最終的鑒別向量Y;

    (7)

    識別階段:

    1)對所有測試樣本B進行二層小波包分解得與q=2,…,16;

    2)用式(8)求后2至5號高頻子圖的平均圖像;

    3)分別對B1、Bh進行PCA變換,得高頻子圖與低頻子圖的主分量Z1與Zh;

    4)利用式(9)對Z1與Zh采用式進行融合處理,得最終的鑒別向量Z;

    5)采用三階鄰近對測試樣本進行分類。

    由于該算法是先對圖像進行小波包分解,先對低頻圖像進PCA變換,然后對圖像高低頻圖像分別是PCA變換,因此稱其為WP2PCA,相應的把對小波包分解,只對低頻圖像進行PCA變換,用于識別的方法稱為WPPCA。

    3.仿真實驗與分析

    在Pentium(R)4CPU2.4GHz,256M內存,windows XP操作系統,Matlab7.0環境下進行了仿真實驗。

    其中選取參數,,分類器采用3階鄰近作為準則,距離為歐式距離。分別在ORL與YaleA人臉庫上對PCA、WPPCA、WP2PCA進行了識別率的測試。試驗1 ORL數據庫

    ORL數據庫包含了40個不同人臉,我們取其中的30個人的數據,每人10幅圖像,共300幅圖像,每幅圖像的大小為112*92,該庫包含了不同時間,不同視角,不同表情(閉眼、睜眼、微笑、吃驚、生氣、憤怒、高興)和不同的臉部細節(戴眼鏡、沒戴眼鏡、有胡子、沒胡子、不同發型)的條件下拍攝的。表1所示為Kq的計算結果。

    在ORL每類訓練樣本取5,對應的測試樣本分別取5,抽取和特征維數(即對應的投影空間向量數)分別為10、20、30、40、50、0、70、80、90、100、110、120,試驗結果如表2所示。

    YaleA庫由15個不同的人,每個人11幅圖像組成,包含了較大的光照和表情的變化,對該庫通過雙眼定位,提取人臉部分,并把每一幅圖像歸一化到46*58在YaleA每類訓練樣本取6,對應的測試樣本分別取5,抽取和特征維數(即對應的投影空間向量數)分別為5、10、15、20、25、30、35、40、45、50,采用PCA,WPPCA,WP2PCA識別率如表3所示。從實驗結果可以看出,WPPC與WP2PCA的最高識別率都搞CPA近2%,從實驗結果看出,盡管WP2PCA與WPPCA的最高識別率都是90.7%,但WP2PCA比WPPCA的優勢是當特征維數為15時就達到最高識別率90.7%,而WPPCA當特征維數為20時,才達到最高識別率90.7%。隨著特征維數的增加,三種方法的識別率都呈下降趨勢,這也說明隨著特征維數的增加,一些冗余信息也隨之增加,從而使識別率下降。

    4.結論

    文中提出基于小波包與PCA分解相結合的特征級融合人臉識別方法,該方法既利用包含人臉大部分信息的低頻分量;又根據人臉特點,對高頻分量進行了加權處理,充分利用高頻分量中有用的細節信號,提取出有助于提高識別率的高頻分量。利用高頻分量的有效信息與低頻分量的進行融合,從而達到提高識別率的目的。實驗證明此種方法可以明顯提高識別率,訓練時間大幅減少。

    參考文獻

    [1]王昆翔,李衍達,周杰.關于人臉圖像自動識別研究中的幾個問題[J].公安大學學報,2001(1).

    [2]李剛,高政.人臉識別理論研究進展[J].計算機與現代化,2003(3).

    [3]廖國瓊,劉云生.嵌入式實時數據庫ARTs-EDB事務調度實現技術[J].計算機工程,2005,31(16):37-39.

    [4]陳傳波,王樺.實時數據庫的事務調度研究[J].計算機應用,2005,25(9):2004-2006.

    第5篇:自動識別技術論文范文

    關鍵詞:倉庫管理系統;條形碼;紡織企業;計算機

    中圖分類號:TP31 文獻標識碼:A文章編號:1007-9599 (2010) 05-0000-02

    Textile Warehouse Management System Application of BarCode

    Gao Demei

    (Shandong Silk Textile Vocational College,Zibo255300,China)

    Abstract:From bar-code technology in the textile industry's need for storage management,benefits and the bar code is generated,printing, textile and other aspects of literacy Warehouse Management System application of bar code.

    Keywords:Warehouse management system;Barcode;Textile enterprises; computer

    一、紡織企業倉庫管理系統中條形碼應用的必要性

    紡織行業屬于勞動密集型行業,原料以及產品的出、入庫非常頻繁。采用傳統的手工方法已不能適應企業的發展,具體表現在:庫存物資積壓多,資金周轉慢,原始單據繁多,信息利用率低,數據處理單調,手工處理易出差錯以及管理手段落后等,這些都給進一步提高企業倉庫管理工作的質量和水平帶來很大的不便。

    使用存庫管理系統,可以及時了解生產動態和庫存積壓,加速資金周轉,同時可極大地減輕倉庫管理人員的工作強度,提高勞動效率,從而提高企業科學管理水平。然而,根據紡織企業的特點,人員文化素質較低,產品比較繁雜,如果使用一般的庫存管理系統,可能會帶來以下問題:

    (一)數據實時輸入困難。倉庫管理人員進行貨物的入庫記帳工作,必須使用鍵盤輸入品名、單價、規格、數量等信息,速度緩慢且容易出差錯,特別是當進出倉庫的產品多且操作人員不夠熟練時,遠遠不能滿足需求。

    (二)工作量巨大的倉庫盤點工作仍需先手工登記,再輸入計算機完成,倉庫管理人員的勞動強度仍然很大。

    (三)操作較為繁瑣。使用鍵盤操作倉庫管理系統,就必須根據屏幕提示一步步地進行工作,操作過程較復雜,一部分倉庫管理人員缺乏對計算機的了解,不習慣使用鍵盤操作計算機,完成其工作。

    基于上面的考慮,在研制倉庫管理系統時,有必要融合條形碼自動識別技術,提高管理系統的自動化程度。

    與鍵盤輸入相比,條形碼輸入的速度是鍵盤輸入的幾倍,而且采用條形碼技術誤碼率低于百萬分之一,這樣的特點保證了清點庫存產品時的效率和正確率。出入庫時使用條形碼識讀器掃描條形碼,簡單迅速,不易出錯。給每一包產品生成一個條形碼,若出現質量問題,便可根據條形碼找到數據庫中對應的記錄,從而找到相應的責任人。

    另外,條形碼標簽易于制作,對設備和材料沒有特殊要求,識別設備操作容易,不需要特殊培訓,且設備也相對便宜。條形碼技術目前已比較成熟,在紡織企業使用條形碼技術,能充分發揮條形碼技術的優勢,提高企業的管理水平。

    二、條形碼簡介

    條形碼技術是以計算機技術、光電傳感技術和通信技術為基礎而發展起來的一項自動識別技術。現在已經成為信息數據自動輸入、識別的重要方法和手段。

    條形碼是一種可印制的機器語言,它采用二進制的概念,以“0”和“l”表示編碼的特定組合單元,以規則排列的圖形符號來表示數據。

    在使用中,條形碼符號由一個紅外線或可見光源照射,深色的模塊吸收光,淺色或空的模塊則將光反射回掃描器。掃描器將光的情況轉換成電子脈沖,譯碼器使用數學算法將電子脈沖轉換成一種二進制碼,然后將譯碼后的信息傳送給一部手持式終端機、個人電腦、控制器或計算機主機。譯碼器可以內嵌到掃描器中或外接。常見的掃描器使用可見光和紅外線發光二級管(LED),氮氖激光或固態激光二級管(可見光和紅外線)等光源來識讀條形碼符號。一些掃描器要求接觸符號,另一些則可以從遠至幾英尺以外的距離來識讀符號。

    隨著現代化技術的應用,條形碼技術因能為信息管理系統提供高效、快速、價格低廉的數據輸入途徑,而被廣泛地應用于各個領域的信息管理系統中。

    條形碼技術是在計算機的應用實踐中產生和發展起來的一種實現快速、準確進行數據采集和自動識別的技術。條形碼技術的應用解決了數據采集和數據錄入的“瓶頸”問題,為制造業物料管理提供了有力的技術支持。

    條形碼編碼又是一個網絡技術。條形碼編碼信息能夠在分布廣泛的各種設備形成的網絡中傳遞。

    三、紡織企業應用條形碼技術的優點

    條形碼本身不是一套系統,而是一種十分有效的識別工具,它提供準確及時的信息來支持成熟的管理系統。條形碼技術是迄今為止最經濟、實用的一種自動識別技術。

    把條形碼技術應用與庫存管理系統中,主要利用條形碼技術以下幾個方面的優點:

    第一, 輸入速度快,與鍵盤輸入相比,條形碼輸入的速度是鍵盤輸入的幾倍。

    第二,可靠性高,鍵盤輸入數據出錯率為三百分之一,利用光學字符識別技術出錯率為萬分之一,而采用條形碼技術誤碼率低于百萬分之一。

    第三,采集信息量大,利用傳統的一維條形碼一次可采集幾十位字符的信息。二維條形碼更可以攜帶數千個字符的信息,可以包含圖形或漢字,并有一定的自動糾錯能力。

    第四,經濟性好,比起其它的自動識別技術,條形碼印刷和識讀設備的價格便宜,并且,隨著電子技術的發展,相關設備還在不斷地降低價格。

    第五,靈活實用,條形碼標識既可以作為一種識別手段單獨使用,也可以和有關識別設備組成一個系統,實現自動化識別,還可以和其他控制設備聯接起來實現自動化管理。另外,條形碼標簽易于制作,對設備和材料沒有特殊要求,識別設備操作容易,不需要特殊培訓,且設備也相對便宜。

    條形碼技術目前已比較成熟,在紡織企業使用條形碼技術,能充分發揮條形碼技術的優勢,提高企業的管理水平。

    四、條形碼符號的生成與條形碼的印制

    當項目代碼確定以后,需將這個代碼的數據信息轉化成為圖形化的條形碼符號。目前主要采用的是軟件生成方式,一般的條形碼打印設備和條形碼膠片生成設備均安裝了相應的條形碼生成軟件。

    條形碼是由一組按一定編碼規則排列的條、空符號,而條形碼生成軟件則需根據條形碼的圖形表示規則,將數據化信息轉化為相應的條空信息,并且生成對應的位圖。對于專用的條形碼打印機,由于內置了條形碼生成軟件,所以只要給打印機傳遞相應的命令,打印機就會自動生成條形碼符號。而普通的打印機則需要專門的條形碼軟件來生成條形碼符號。需要生成條形碼的廠商可以自行編制條形碼的生成軟件,也可選購商業化的編碼軟件,以便更加迅速、準確地完成條形碼的圖形化編輯。

    自行編制條形碼生成軟件:設計條形碼打印軟件的關鍵在于要了解條形碼的編碼規則和技術特性。條形碼是以條、空的寬度與組合方式來表達信息的,因此其條與空的尺寸精確與否直接關系到條形碼能否被正常地讀取。因為目前打印設備都是以點為基本打印單位,如果條形碼條、空的寬度不是點數的整數倍,則可能產生打印誤差,直接影響到條形碼的可識讀性。這也是為什么條形碼圖像經過縮放后經常不能被讀取的原因。另外,條形碼的條、空組合方式也因碼制不同而不同,因此編制軟件時需認真查閱相應的國家標準。

    選用商業化的編碼軟件:選用商業化的編碼軟件往往是最經濟、最快捷的方法。目前市場上有許多種商業化的編碼軟件,這些軟件功能強大,可以生成各種碼制的條形碼符號,能夠實現圖形壓縮、雙面排版、數據加密、數據庫管理、打印預覽和單個/批量制卡等功能。同時,可以向應用程序提供條形碼生成、條形碼設置、識讀接收、圖形壓縮和信息加密等二次開發接口(用戶可以自己替換),還可以向高級用戶提供內層加密接口等,而且價格也不高。

    目前較為先進的條形碼生成軟件有法國生產的CODESOFT,美國生產的Barcode等。最新版本的CODESOFT7軟件功能十分強大,支持所有主要的一維條形碼和二維碼,有通用版、專業版和企業版三種版本可供選擇,通用版僅用于條形碼的生成,價格比較便宜,而專業版和企業版則可以支持多種數據庫,可以方便地連到企業的內部信息系統,但是價格要高于通用版。企業可以根據具體情況選用不同的版本。

    對于一些紡織企業而言,有兩種實現方案,一是可以找專門的人開發,以方便以后的庫存管理系統設計人員的調用;也可以把這任務一起承包給庫存管理系統設計團隊,如果能實現,在兼容方面會減少很多矛盾,也節約不少財力和精力。

    由于企業規模比較大,產品較多,因此打印任務是比較繁重的,因此,可以考慮采用專用的條形碼打印機。由于標簽紙有些是貼在編織袋上,有的編織袋表面比較粗糙,用普通的標簽紙在搬運過程中很容易脫落,紡織企業可以與提供標簽紙的廠家聯系,在紙上涂一層特殊的強力膠,很好的解決這個問題,并且可以在編織袋的兩邊都貼上標簽,將條形碼脫落的問題降到最小。

    五、條形碼硬件的選擇

    條形碼識讀器也稱條形碼掃描器,利用光點與條形碼之間的相對運動來對條形碼數據進行采集。當光點從左到右掃描完一個符號時,因組成條形碼符號的元素對入光有不同的反射率,反射光的強度就會發生大小交替的變化,這種反射光強度的變化經過精心設計的光電接受系統,會轉化成電壓信號的變化,經整形,可輸出一系列與條形碼符號相對應的方波信號。

    條形碼識讀器根據用途不同,大體可以分為兩類:在線式條形碼識讀器和便攜式條形碼識讀器。在線式條形碼識讀器一般是非獨立使用的,在采集器與計算機之間由電纜連接傳輸數據,不能脫機使用。便攜式條形碼識讀器是為適應一些現場數據采集和掃描笨重物品的條形碼符號而設計的。便攜式條形碼識讀器中的基本數據必須通過PC的數據庫獲得,而存儲的操作結果也必須及時地導入到數據庫中。目前由于無線電網絡技術的應用,便攜式條形碼識讀器可以通過無線電波和PC、服務器進行實時數據通信和遠程控制。操作員能將所有操作后的數據在第一時間存入數據庫,即將數據庫系統延伸到每一個操作員的手中。

    根據紡織企業倉庫的具體情況,考慮到產品的體積比較大而且使用電纜易在紡織品倉庫中引起火災,可以選擇使用便攜式條形碼識讀器。

    總之,紡織企業的倉庫管理采用的數據庫管理系統中引用條形碼技術是十分必要的,是解決現存問題的有力手段。

    參考文獻:

    [1]張艷.條形碼在圖書館的應用及打印生成方法.科技情報開發與經濟,2004,14(8):41

    [2]張成,袁冰,王杰等.條碼技術在立體倉庫物料管理中的應用.中國制造業信息化,2003,32(10):76

    [3]張成.條碼技術在電氣制造企業庫存和生產過程管理中的應用研究[D].〔碩士學位論文〕.成都:四川大學,機械制造及其自動化,2004

    [4]藍偉坤,陳東.條碼技術在倉庫管理系統中的應用[J].湖北工學院學報

    第6篇:自動識別技術論文范文

    關鍵詞: 人臉識別; 數據采集; Adaboos算法; 考勤

    中圖分類號:TP311 文獻標志碼:A 文章編號:1006-8228(2017)04-53-03

    Abstract: There are two kinds of traditional enterprise time and attendance system, the manual system and the timecard system. The manual system is of great workload and low efficiency, while the timecard system has the phenomenon of fake registration and loss of the card, resulting in a higher cost. Therefore the use of enterprise camera to develop a face-recognition based enterprise time and attendance system can greatly improve the efficiency of enterprise check work attendance and reduce the cost of attendance management. This paper introduces the research and development process and the research results of an enterprise's face-recognition based time and attendance system.

    Key words: face recognition; data collection; Adaboos algorithm; check work attendance

    0 引言

    人臉圖像具有惟一性和穩定性,因此人臉識別廣泛應用于刑偵破案、視頻監控、表情分析、日常考勤等場合,逐漸成為人們工作和生活中的常用身份驗證手段。人臉識別技術應用于考勤系統,可以充分利用已經建好的人臉數據庫資源,更直觀、方便地核查身份。本文對應用于考勤系統的人臉識別技術進行了研究。

    1 系統設計概述

    本系統包含采集模塊和管理模塊兩大模塊。采集模塊主要包括視頻圖像的采集、處理、人臉檢測、人臉定位以及跟蹤;管理模塊主要包括人臉識別管理和考勤管理。系統架構和工作流程如圖1所示。

    系統分為服務器端、辦公室端和工廠端三部分。服務器端負責數據的存儲和讀寫;辦公室端負責軟件系統設置、考勤人員錄入、人員人臉特征采集、考勤情況統計等等;工廠端為人員考勤點[1]。

    人臉識別考勤系統的程序流程:管理員通過攝像頭將企業員工頭像錄入數據庫,員工每次考勤時將臉部對準攝像頭,系統提取頭像,經視頻識別模塊與數據庫中照片比對,配對成功后記一次考勤,并將考勤數據發送到考勤數據處理模塊。考勤數據模塊與企業財務系統對接,將考勤與員工的工資、獎金掛鉤。圖2為識別程序流程圖。

    2 數據庫整體框架

    本系統首先通過登錄模塊來確保登錄用戶具有合法性,保障了系統的安全。本文將用戶分為管理員和普通用戶,普通用戶可以查看員工的考勤記錄和修改自己的密碼,而管理員可以對所有窗口進行各種管理操作,如添加、刪除、修改員工基本信息,設置權限,添加員工請假信息等。其中本系統中還有一個人臉庫,它存儲每一個員工人臉照片,這些照片經過圖像預處理,分別存放在以員工名字命名的文件夾中,為人臉庫的訓練提供數據[2]。

    用戶登錄窗口是整個系統的入口,在用戶成功登錄后就可以按照權限進行相應的操作。管理員權限登錄成功后可以進行人臉檢測、人臉自動識別、保存視頻圖像等功能,而普通用戶就沒有這個權限。普通用戶的權限是可以查詢員工的出勤信息、修改自己的密碼等功能。

    用到數據庫的窗體主要有以下三個。

    ⑴ 員工注冊信息窗口,它用于管理員工的基本信息,包括員工信息的添加、刪除、修改和瀏覽等操作。

    ⑵ 員工出勤窗口,它用來記錄員工的出勤狀況如是否請假、遲到等,也包括對請假員工信息的錄入等。

    ⑶ 查詢窗口,它主要用來查詢員工的出勤信息,可以按多種條件進行查詢,比如按具體的日期、是否遲到、是否請假、正常出勤等條件進行查詢[3]。

    3 人臉識別算法的實現

    AdaBoost 算法以根弱學習的反饋信息自適應性的調整錯誤率下限,這就使得該算法更容易被應用于實際問題。同時,由于AdaBoost算法在效率上幾乎和原有的Boosting算法相差無幾,這就使得 Adaboost算法得到了極大的發展[4]。

    Adaboost算法的具體實現步驟如下。

    ⑴ 設輸入M個訓練樣本:{(x1,y1,…,(xm,ym))},其中Xi∈X,Yi=(+1,-1),初始化樣本權重D1(i)=1/m,i=1,…,m。

    ⑵ 對每次訓練都要進行一次操作:對弱分類器空間的每個弱分類器h進行操作為:將樣本空間X劃分為:X1,X2,…,Xn,計算每個劃分j=1,…,N及b={+1,-1}之間的區域標識權重。得到每個弱分類器h 在各個劃分上的輸出值為:

    ,計算歸一化因子:。

    ⑶ 從弱分類器空間中選擇出使歸一化因子Z 最小化的弱分類器h并加入到強分類器中,則:Zmin(Z)。

    模塊的輸入為所有訓練樣本的特征集,經過用戶指定的迭代次數T次后,共可得到T個分類能力比較強的弱分類器。在每次迭代時,根據訓練樣本的權重來訓練弱分類器,然后根據弱分類器的判斷結果和樣本的權重分布來選擇出一個錯誤率最小的弱分類器以作為本次迭代選出的分類能力較強的弱分類器 h,最后通過增大h所錯分的樣本權重值來更新每個訓練樣本的權值,以便在下次迭代中,使這些被錯分的樣本得到更多的重視,經過迭代最后共可產生T個弱分類器,將這些弱分類器組合后便可得到分類能力較強的強分類器[5]。

    4 結論與展望

    本文針對鐳射卡考勤存在的問題,運用軟件工程的方法,設計實現了人臉識別考勤系統,并將其用于廣東順德科晟電子有限公司。

    本文主要是做了以下幾方面的內容:

    ⑴ 介紹了人臉識別的方法原理和比較有特色的人臉識別及其算法。

    ⑵ 根據順德科晟電子有限公司原有考勤管理系統存在的問題,以及當前認人事考勤管理現狀,論證了對進行人臉識別考勤系統的必要性和緊迫性。

    ⑶ 針對廣東順德科晟電子有限公司的考勤管理系統的現狀,按照軟件工程的思想完成了對人臉識別考勤系統的需求分析和系統設計。

    ⑷ 設計了人臉識別考勤系統數據庫和數據字典。

    ⑸ 完成了人臉識別考勤系統的開發。

    由于本人水平有限,本系統的設計和開發還存在許多不周全之處,在下一步研究中還需要改進。

    參考文獻(References):

    [1] 齊禮成.基于人臉識別考勤系統的設計與實現[D].西安電子科技大學碩士學位論文,2012.

    [2] 郭磊.人臉檢測技術研究及實現[D].哈爾濱理工大學碩士學位論文,2009.

    [3] 劉明寶,姚鴻勛,高文.彩色圖像的時人臉跟蹤方法[J].計算機學報,1998.21(6).

    第7篇:自動識別技術論文范文

    1 引言

     

    伴隨著計算機技術的日益發展,會更加迫切要求應用目視解譯經和知識知指導遙感圖像計算機解譯。遙感數字圖像計算機解譯是以遙感圖像為研究對象,在計算機系統支持下,綜合運用地學分析,遙感圖像處理,地理信息系統以及模式識別與人工智能技術,實現地學專題信息的智能化獲取[1]。基于遙感圖像可以客觀真實和快速獲取地球表層信息的優勢,遙感數據被廣泛應用于自然災害評估,自然資源調查與評價,環境監測與軍事偵察上等。因此,利用計算機進行遙感圖像解譯,快速獲取地表不同專題信息,利用這些專題信息能夠迅速更新地理數據庫。這不僅是實現遙感圖像自動理解的基礎之一,而且也是地理信息系統中數據采集自動化研究的一個方向。本次論文是在充分了解綿陽地域概況的情況下,并獲取綿陽區域的TM影像圖,利用遙感軟件對該遙感影像進行預處理后,建立解譯標志,對遙感影像進行人機交互解譯,完成矢量化地圖的制作,在GIS軟件中進行屬性和拓撲關系的添加;矢量地圖和遙感影像疊加處理,最終得到功能齊全的遙感影像地圖。

     

    2 遙感圖像預處理

     

    遙感信息是對地表狀況的反映,但是衛星姿態、搭載掃描系統引起的遙感圖像畸變大。所以空間分布特征被部分地歪曲了,因此要對遙感圖像進行預處理。本次論文處理所用的遙感圖像為Landsat-5衛星獲取綿陽區域的TM影像圖,該遙感圖像是在中國科學院數據共享平臺下載獲得。采用的是WGS-84坐標。陸地衛星提供的TM影像,其覆蓋范圍較大,宏觀綜合性強。TM圖像具有8個波段,信息量豐富。由于TM影像圖具有宏觀性強,信息量豐富的特點通過對其解譯和制圖,可獲得綿陽地區豐富及具體的信息,繪制成詳細的區域地圖。

     

    2.1 組合多波段數據

     

    Landsat-5的TM影像共有7個波段,不同的波段組合可以增強不同的地表信息[2]。其中第3、第2、第1波段組合形成的真假彩色圖像雖然有理于各種地類識別。但是圖像平淡、色彩不飽和、信息量比較少。考慮到研究區域地表信息豐富,采用第4、第5,第3波段組合而成的非標準假彩色圖像。將上述轉換的單波段IMG文件組合為一個多波段圖像文件。組合波段結果如圖1所示。

     

    由圖1可知水體邊界、以及和水體有關的地物在圖像中比較清楚。河流、道路、橋梁邊界和輪廓清晰。房屋的布局清楚。街區內部結果特征較為明顯。植被有較高的辨識度。

     

    2.2 圖象幾何校正

     

    由于容易受到衛星姿態、搭載掃描系統引起的遙感圖像畸變大以及地表起伏等影響[2]。圖像必須經過幾何校正。在圖像幾何校正過程中,采集控制點是一項非常重要工作。控制點一般選擇圖像上特征較為明顯的點位。對于圖像使用選擇控制點的方法進行幾何精糾正,在一幅遙感圖像上和對應的地形圖上選擇至少9個分布均勻、特征明顯的典型地物目標作為控制點,建立影像坐標和地圖坐標之間的變換關系,按照這個變換關系進行控制點糾正。本文特征點采集與校正后結果如圖2,圖3所示。

     

    2.3 紋理分析

     

    遙感圖像的光譜信息是目視判讀的基本依據[3]。但是隨著圖像解譯與分析工作的深入開展,光譜信息已經不能快速有效地進行計算機分析和自動識別。紋理特征作為遙感圖像中重要的信息,通過灰度值得變化和重復性來反映地表物體的粗糙度,能充分反映影像特征。因此,對紋理信息的提取對遙感圖像的識別起著重要作用。紋理分析通過在一定的窗口內進行二次變異分析或三次對稱分析,使圖像的紋理結構得到增強,通過幾何校正以及紋理分析可以明顯看到綿陽市區河流和主要街道以及房屋的輪廓信息。幾何特征尤為明顯。結果如圖4所示。

     

    3 遙感圖像解譯

     

    遙感影像的解譯標志,是一種在遙感圖像上能反映和判別地物信息的影像特征。利用解譯標志能直接在圖像上判別出相應的地物,或者通過已識別出的地物或現象作進一步的推理分析,判別出其它不易在遙感影像上直接解譯的目標[4]。

     

    3.1 非監督分類

     

    數字圖像計算機解譯的基礎工作是數字圖像的分類。其方法包括:非監督分類和監督分類,目的是實現遙感圖像信息提取。非監督分類是在沒有訓練場地作為樣本的前提下,根據像元間相似度的大小進行歸類并且合并的方法。常用的方法是:分級集群法,動態聚類法。動態聚類法給出圖像粗糙的分類,然后在一定的原則下在不同的類別間重新組合樣本,一直到分類比較合理為止[7]。本文以動態聚類法進行非監督分類ISODATA(迭代自組織數據分析技術)方法在動態聚類法中具有代表性。結合研究區實際情況確定初始分類數,設置循環收斂閾值。執行非監督分類,獲得分類結果。圖5所示。

     

    3.2 監督分類

     

    監督分類與非監督分類的不同點是在遙感圖像上采樣區中圖像地物的類別屬性已有了先驗的知識。這些先驗知識通過實地的抽樣調查,配合人工目視判讀技術來獲取。采樣區已被選定,按照已知類別的特征去訓練判別函數,先驗的采樣區為訓練區,其用途是訓練判決函數。訓練區是圖像上已知類別屬性的圖像地物構成訓練區。一旦訓練區被選定后,相應對象類別的紋理特征便可以用訓練區中的樣本數據進行估計。

    由非監督分類結果和監督分類結果可知研究區的河流、植被、街區、房屋等均能從遙感影像圖上快速提取出來。這為接下來的制圖工作奠定了堅實的基礎。

     

    4 遙感制圖

     

    4.1 遙感影像地圖

     

    遙感影像地圖是以遙感影像并結合一定的地圖符號來體現制圖對影像地理空間和環境狀況的地圖[7]。在遙感影像地圖中,圖面內容要素主要由影像構成,輔助以一定的地圖符號來表現或說明制圖對象。

     

    4.2 矢量化地圖的制作

     

    本文在遙感圖像預處理和解譯的基礎上進行矢量化工作,在矢量化后還需在現場做進一步的確認,對錯誤之處進行及時修改。在修改后的矢量圖的基礎上使用ArcGIS軟件中先對矢量圖與遙感影像圖進行配準,結果見圖7。接著對矢量圖進行屬性和拓撲關系的添加,最后經矢量圖和遙感影像疊加處理完成遙感影像圖的制作。結果見圖8。

     

    5 結論

     

    利用計算機進行遙感圖像解譯,快速獲取地表不同信息,利用獲取的信息迅速地更新地理數據庫,這是實現遙感圖像自動完善的基礎之一,也是地理信息系統中數據采集自動化研究的一個方向,具有重要的理論意義和應用前景。

     

    遙感影像地圖具不僅具有原遙感圖像的影像內容,還具有線劃要素,數學基礎等,擁有直觀易讀的特點,與普通地圖相比,影像地圖具有豐富的地面信息,內容層次分明,圖面清晰易讀,充分表現出影像與地圖的雙重優勢。從而提高了地理信息為人們的視覺直接感知的可視化表達程度及輔助決策的準確度,在國民經濟建設中起重要的應用價值。

     

    第8篇:自動識別技術論文范文

    關鍵詞:檔案庫系統;Modbus/TCP;自動識別;COM

    中圖分類號:TP31

    隨著信息化建設的不斷深入,各單位已經全面的使用電子檔案系統,電子檔案具有傳遞便捷、資源共享、查閱方便等多種好處,不過由于紙質檔案的形成必須要經過人工操作,對原文件的任何篡改都會留下痕跡,所以紙質檔案在法律上的可信度很高,能夠起到原始憑證的作用。因此在實際工作中電子檔案并不能完全替代紙質檔案,很多情況下還是需要用到紙質檔案。如何將電子檔案利用與紙質檔案管理結合起來,大幅度降低檔案維護成本,提搞檔案管理效率,成為目前迫切需要解決的問題。

    本文針對以上問題,提出了自動檔案庫系統的解決方案。自動檔案庫由多層檔案柜、通信模塊和計算機控制系統等組成,能夠實現檔案的自動借閱和歸還,是綜合了信息自動化、存儲和自動識別技術于一身的立體集成化系統。設計該系統的目標是為了減少檔案管理人員的工作量,對檔案管理的業務流程進行調整和優化,進而規范檔案業務操作,提升檔案管理的自動化水平,大大提高工作效率。

    1 系統總體設計

    本文所設計的控制系統分為三層:應用管理層、檔案柜管理層和檔案柜控制層。應用管理層與檔案柜管理層通過TCP協議進行通信,檔案柜管理層與檔案柜控制層通過Modbus/TCP進行通信,如圖1所示。

    應用管理層為檔案管理系統,它構件了完整的檔案資源信息共享服務平臺,支持檔案管理全過程的信息化處理,主要包括以下功能:檔案接收、檔案移交、檔案查詢、檔案統計、檔案借閱、檔案歸還、檔案數據維護、檔案借閱記錄管理、檔案發送記錄管理、報表打印輸出、數據庫管理等。

    檔案柜管理層對檔案柜控制層的集中管理,包括兩個方面的內容:把應用管理層發來的指令轉化為對檔案柜控制層的指令,定時讀取檔案柜控制層的消息,并轉為系統事件通知應用管理層進行相應。

    檔案柜控制層根據檔案柜管理的指令,控制檔案柜的走層、檔案的存取、檔案盤庫等操作,實時根據傳感器改變狀態寄存器的內容。

    圖1 系統總體框架圖

    2 基于Modbus/TCP的傳輸控制協議

    Modbus是一種應用層報文傳輸協議,用于實現不同類型的網絡連接的設備之間的客戶機服務器之間的通信。Modbus/TCP協議一種的開放的通信協議,用戶可以根據需要靈活進行擴展。[1]它支持C/S模式,將應用層的Modbus消息封裝成IP包在網絡上傳輸。[2]

    Modbus/TCP是采用C/S模式來進行報文傳輸,此模式基于4種類型報文,即請求(Modbus Request)、指示(Modbus Confirmation)、響應(Modbus Indication)和證實(Modbus Response),如圖2所示。請求是客戶端發送給服務器用來啟動報文,指示是服務端接收的請求報文對客戶端的反饋,響應是服務器針對客戶端的請求發送的具體響應,證實是在客戶端接收的響應信息時給服務器的反饋。[3]

    圖2 Modbus/TCP報文傳輸

    協議檔案柜管理層由運行在PC機上檔案柜管理程序構成,檔案柜控制層由觸摸屏(TPC)和控制電機和傳感器的可編程邏輯器件(PLC)構成。協議檔案柜管理層通過網絡的Modbus/TCP協議,對各個觸摸屏(TPC)和可編程邏輯器件PLC的位變量、整型變量等的讀寫實現對檔案柜的遠程測控,如圖3所示。

    圖3 協議檔案柜管理層構成圖

    3 檔案自動識別

    目前成熟的檔案識別方法有條碼識別法[4]、RF識別法[5]。條碼識別法是在把打印好的條形碼粘貼到檔案盒上,把條形碼作為識別檔案的唯一標示;RF識別法則是通過粘貼在檔案盒上的電子標簽來識別檔案的。兩種識別方法特點不一,接下來對這兩種方法進行具體討論。

    使用條碼管理檔案,做法是為每個檔案盒編配唯一的條碼,條碼中包含特定規則的位置信息,然后將條碼貼到檔案盒外面的背脊上。一旦檔案盒中有檔案存入時,條碼、檔案盒和檔案就建立起了唯一的映射關系。將這種對應關系信息錄入到計算機上的檔案管理系統中,為每一份檔案建立一條記錄,保存這份檔案對應的條碼、在檔案柜中的位置、是否在柜等信息,這樣就打好了檔案識別的基礎。檔案首次入庫時,條碼與檔案的映射關系建立,數據庫中產生相關記錄。當需要借閱或者歸還檔案時,檔案識別系統就可以通過條碼定位檔案盒,找到了檔案盒就相當于找到了目標檔案。

    射頻識別系統由電子標簽和閱讀器兩部分組成。在檔案識別系統中通常的做法是把閱讀器安裝在檔案柜中,把電子標簽粘貼到檔案盒上。電子標簽中保存的數據通過特定的編碼存儲在電子標簽中,閱讀器可以非接觸的讀取電子數據。系統工作過程分為能力供給和信號識別兩個部分。其中能力供給指的是電子標簽對電子標簽閱讀器發出的微波查詢信號進行轉換,把微波信號轉換為電流;信號識別指的是微波查詢信號經過電子標簽內部的電路處理之后,攜帶了電子標簽內部存儲的數據信息,利用電子標簽自帶的微型天線返回到閱讀器中。經過能力供給和信號識別兩個過程,閱讀器就可以拿到電子標簽存儲的數據信息,實現檔案識別。以下針對條碼識別法、RF識別法分別比較兩者優缺點,如表1所示。

    表1 條碼識別法、RF識別法優缺點比較

    條碼識別法 RF識別法

    掃描速度 掃描槍一次只能掃描一個條碼 RFID閱讀器可同時辨識讀取多個RFID標簽

    抗污染能力和耐久性 條形碼采用紙張打印,抗污染能力和耐久性差 RFID一般采用塑料材質封裝,具有很強的耐污性和耐久性

    穿透性和無屏障閱讀 在沒有阻擋和近距離的情況下,條碼才能被識別 RFID通信具有一定的穿透性,除金屬材質外一般材質都能穿透

    成本 條碼和條碼掃描槍成本很低 RFID標簽和RFID閱讀器成本較高

    針對條碼識別法、RF識別法的特點,各單位可以根據需求選用不同的方案。條碼識別法和RF識別法在系統中識別和傳輸過程中,由于條碼被污染和斜放等情況,RF識別法信道中有噪聲干擾和標示有重疊的情況,引起數字信號波形的失真導致錯誤,針對錯碼的問題,通過兩種策略來處理。一種方法是在檔案標識上設置冗余的信息位,在一定錯誤率的情況下可以通過算法推算出錯誤的信息,常用算法有循環冗余CRC校驗;另外一種是設置校驗位,通過校驗位來驗證發送的信息,驗證不通過的情況下讓接收方請求重傳,常用算法有奇偶校驗、漢明校驗。因為檔案柜在掃描槍掃描過程中一般都是一次掃描,所以我們一般采用糾錯碼的策略來解決誤碼的問題。

    5 檔案自動盤庫

    為了解決人工歸還和借閱檔案時放錯位置的問題,設計檔案自動盤庫功能,通過該功能可以對整個檔案柜的檔案進行批量整理并與檔案信息系統中存放的檔案存放信息進行核對修改。

    自動盤庫操作流程如下所示:(1)執行檔案柜走層操作,準確走到確定層;(2)啟動盤庫掃描槍從左到右運動掃描整個層中的檔案,一層掃描完成后,盤庫掃描槍從右到左運動回到起始點再執行走層動作,直到掃描完畢,經過掃描得到的柜號、層號、檔案標識通過Modbus/TCP協議傳給檔案柜控制層,檔案柜控制層通知應用層程序,對掃描的數據進行處理;(3)檔案柜向上走一層,繼續流程2,直到完成所有層的掃描,自動盤庫完成。

    在進行盤庫操作時,檔案柜控制層把盤庫掃描槍掃描到一個檔案標識就會將柜號、層號、檔案標識發送給檔案柜管理層,檔案柜管理層觸發應用層程序的事件,應用程序處理相應事件顯示差異信息,用戶根據差異信息選擇進行更新檔案存取信息和借閱情況。

    5 檔案管理層接口規范

    不同廠商采用的硬件類型一般是不同的,同一廠商的不同型號的設備通常也有所區別,傳統的檔案管理軟件基本都是針對某一款特定的檔案柜設計的,所以不具有通用性。硬件上一些小改動或升級就會導致整個應用程序的大范圍改動甚至重寫。傳統的檔案管理程序與設備是一一對應的,每一種設備都需要開發專用的管理程序和相應驅動。傳統檔案管理層的開發示意圖如圖4所示。

    圖4 傳統檔案管理層的開發示意圖

    在實際的大型檔案管理系統中,檔案柜類型往往不止一種,同種類型的檔案柜每隔一段時間也會進行硬件升級,在這種情況下,檔案管理層的接口如果仍然按照傳統的結構進行設計,必然會帶來很多問題,在很大程度上增加系統開發和維護的成本。在本文的檔案柜系統設計中,檔案柜管理層為了實現與底層硬件設備的無關性,需要硬件設備已經統一的基于COM組件,不同硬件設備指需要按照統一COM編寫自己組件,就可以實現協議檔案柜管理層對檔案柜控制層的操作,如圖5所示。

    圖5 基于COM組件的檔案層接口規范

    6 結束語

    通過對自動檔案庫系統合理設計,將系統分為應用管理層、檔案柜管理層和檔案柜控制層。應用管理層與檔案柜管理層通過TCP/IP協議進行通信,檔案柜管理層與檔案柜控制層通過Modbus/TCP協議進行通信,針對人工歸還和借閱檔案時放錯位置的問題,專門設計檔案自動盤庫功能,同時為了實現檔案柜管理層與底層硬件設備的無關性,制定了檔案管理層接口規范。實際使用表明:基于Modbus/TCP協議自動檔案庫系統可以方便快捷的實現電子檔案系統與紙載檔案管理的無縫結合,在大幅度提高檔案的管理效率和檔案管理自動化水平的同時,降低了檔案管理費用和檔案管理人員的工作量,充分提高工作效率。

    參考文獻:

    [1]喬永衛,程帥.基于Modbus協議的自動控制系統的通信研究[J].自動化與儀表,2012(08):34-37.

    [2]白焰,鐘艷輝,秦宇飛.基于VC的Modbus協議通信測試軟件的實現―Modbus串口通信與Modbus/TCP通信[J].現代電力,2008(06):76-81.

    [3]翁建年,張浩,彭道剛.基于嵌入式ARM的Modbus_TCP協議的研究與實現[J].計算機應用與軟件,2009(10):36-39.

    [4]張應福.物聯網技術與應用[J].通信與信息技術,2010(01):50-54.

    [5]杜曉明,葛世倫.基于RFID和條形碼的中小企業倉庫管理系統研究[J].組合機床與自動化加工技術,2010(02):106-110.

    [6]郎為民.射頻識別(RFID)技術原理與應用[M].北京:機械工業出版社,2006.

    [7]康東,石喜勤,李勇鵬.射頻識別RFID核心技術與典型應用開發案例[M].北京:人民郵電出版社,2008.

    [8]Don 本質論[M].潘愛民,譯.北京:中國電力出版社,2001.

    [9](美)WilliamA.Shay.高傳善等譯.數據通信與網絡教程[M].北京:機械工業出版社,2005.

    [10]胡嘯,陳星,吳志剛.無線射頻識別安全初探[J].信息安全與通信保密,2005(06).

    [11]柴先明,黃知濤.信道編碼盲識別問題研究[J].通信對抗,2008(02):1-4.

    [12]Vaidya N,Das S R.RFID based networks exploiting diversity and redundancy[J].ACM SIGMOBILE Mobile Computing and Communications Review,2008(01):2-14.

    [13]葉佳帆.基于modbus/tcp以太網技術的靜電除塵器的研究[D].碩博學位論文,2009.

    第9篇:自動識別技術論文范文

    關鍵詞:博客;Blog;Web;數據挖掘;算法;熱點話題挖掘;現狀

    中圖分類號:TP392 文獻標識碼:A 文章編號:1009-3044(2013)12-2771-03

    1 博客簡介

    因特網(Internet)和萬維網(WWW)的出現,改變了人們的工作方式和生活方式。個人網站、論壇(BBS)等給了人們自由發表信息的途徑,而博客(Blog)的出現,使人們更加方便的展示自我。由于具有開放、簡便易用的特點,使博客具有獨特的魅力,使用博客的用戶越來越多。

    1.1 博客的定義

    博客的英文名字Blog,來源于Web Log這個名稱。博客源于RSS技術,作者以日志風格信息,讀者以評論方式與作者互動,是一種自由、簡單易用的信息傳播和互動方式。

    一個博客文章就是一個網頁,博客作者可以對文章分類。這些文章都按照發表日期的倒序排列,最新的文章在網頁最上面顯示。博客的內容和題材,在合乎法律的要求下相當廣泛,可以是新聞、時事評論、個人生活體驗、購物信息、專業技術技巧、學術知識、照片、小說、產品等,有個人博客、公司博客、組織博客等。

    1.2 博客的現狀

    據估計,目前全球的博客運營網站有數十萬個,有數億人使用博客。博客已經成為個人、企業、組織、團隊之間常用的溝通工具。2002年,中國大陸開始有了博客服務網站。現在中國大陸已經有大量的博客服務網站,發展迅速。截止到2013年4月,新浪博客服務網站點擊數最高的個人博客已經超過了21億次點擊,排在第二、第三的個人博客的點擊數均超過10億次,排在第100名的博客的點擊數也高達6千5百萬(來自新浪博客總流量排行)。中國互聯網信息中心(CNNIC)統計顯示,截止到2012年底,我國擁有博客(個人空間)的網民有3.73億,占網民總數的66.1%[1]。從市場份額看,典型的博客網站有:QQ空間、新浪博客、博客大巴、搜狐博客、和訊博客、博客園、CSDN博客、博客網、網易博客、鳳凰博客、中國博客、天涯博客、百度空間等。

    2 博客資源挖掘

    近幾年來,由于博客的快速發展,國內外很多科研人員開始對博客進行研究,獲得了豐富的研究成果。目前的研究主要集中在對博客內容進行挖掘、檢索等方面。

    2.1 國外對博客資源挖掘的研究

    IBM的D.Gruhl、R.Guha、D.Liben-Nowell和A. Tomkins從宏觀、微觀兩個層次上研究了博客網站里的主題傳播特征和博客用戶之間的交互特征,通過數學模型抽取出博客網站里可以表示新主題的關鍵詞,并對不同時期的關鍵詞進行分析,得出一些傳播特征[2]。日本的I.Ohmukai、H.Takeda、K.Numa等人利用語義網搜索技術建立一個更加方便發表博客的“語義博客系統”,并對信息的收集和發表的不同層次做了詳盡的分析[3]。HP實驗室的E.Adar、L.Zhang對博客網站里的信息傳播進行分類,設計出可視化的工具軟件來動態顯示不同博客之間的互相鏈接,并提出了一種新的Rank搜索算法[4]。

    博客上的信息是網絡信息的一種,但它又有自己的特點,對博客進行研究,首先需要能夠識別博客信息。東京工業大學的T. Nanno、T. Fujiki、Y. Suzuki、M. Okumura等學者提出了基于對日期表示和對HTML文檔的分析來自動收集、監控、挖掘博客(Blog)的方法[5]。馬里蘭大學的Kolari P、Finin T、Joshi A等學者提出了基于向量空間模型(SVM)的博客識別和發現的方法,去掉了較好的效果[6]。博客與傳統的個人網頁或網絡日記不完全相同,T. Fujiki、T. Nanno、M. Okumura等學者通過對自動提取的熱點關鍵詞的分類、比較,區別出了博客和個人網站、網絡日記的差異[7]。

    2.2 國內對博客資源的研究

    在博客識別方面的研究,國內已經出現比較可靠的方法或算法。哈爾濱工業大學的張迪通過比較博客網頁和普通的Web網頁,提取出博客網頁的特征,從網絡爬蟲下載得到的網頁中識別出博客網頁來,并且作者還對博客網頁相關內容進行了抽取[8]。重慶大學的張程、陳自郁等人針對當前因特網上大量出現的博客網頁,通過分析博客網頁的結構特點、技術特征,結合網頁DOM節點特性,提出了基于DOM樹分析和模式匹配的博客網頁自動識別算法,并通過實驗對該算法進行了驗證[9]。河南大學的李旻提出了博客綜合特征空間的概念,并且詳細論述了該空間中三大類共五種博客特征的概念、定義和抽取方法。研究了網頁的形式化表示方法,分析了特征項的提取、選擇及權重計算的整個過程,在這基礎上設計出了基于標簽信息的TF-IDF算法及標簽權重調整方案。最后提出一種基于綜合特征空間的博客網頁識別算法,并將該算法運用到基于頁面布局特征的博客網頁識別階段和基于文本內容特征的博客網頁識別階段[10]。哈爾濱工業大學的楊宇航、趙鐵軍、鄭德權、于浩提出了一種基于鏈接分析的對博客信息源進行量化評估的方法,在這個基礎上發現重要的博客信息源,既體現了博客信息的特點,又減少了作弊鏈接對結果的影響。作者用設計的博客信息源重要性評價指標進行評估,證明了該評估方法的有效性[11-12]。

    對博客作者的個人信息進行挖掘是博客數據挖掘的一個方面。上海交通大學的倪曉川通過挖掘博客網頁的內容來獲得博客作者的個人信息,構建博客作者的興趣集合,為此,他提出了一種采用文本分類技術的自動挖掘博客作者興趣的方法。該方法使用多分類器連合的技術來提高分類的精度和挖掘結果的可靠性,并且使用自上而下的層次分類方法,挖掘出更具體的博客作者的興趣,而且興趣可以用層次結構的形式展現。在此基礎上作者還提出了對博客作者、博客文章進行情感型和信息型判定的問題,作者將該問題看作是一個文本分類問題,可以采用文本分類技術解決這個問題[13]。

    博客球是包含所有博客的虛擬社區或社交網絡的集合名詞,可以把它看成是一個超大型的原始數據庫。西南石油大學的季文韜通過搭建博客球數據庫集群環境,建立了一個大型的博客球矩陣,通過分析博客網頁中的各個指標在矩陣中的權重從而確定矩陣元素。由于博客文章往往是個人所發,缺乏規范、約束,導致博客信息中存在不少噪音數據。于是作者采用奇異值分解(SVD)技術來對文本向量矩陣進行降噪,除去噪音數據,并利用k-Means聚類算法對降噪后的數據信息進行聚類分析,從中發現有價值的信息[14]。在論文中,作者通過分析、對比實驗結果,找出有效的博客球聚類方法。

    哈爾濱工業大學的軒文烽針對現有的博客關鍵詞抽取算法依賴于外部資源和具體的文本格式這個問題,提出了一種基于主題模型LDA(Latent Dirichlet Allocation)的博客文章關鍵詞抽取算法,并通過與TF-IDF(Term Frequency–Inverse Document Frequency)和層次隱馬爾科夫模型(Hierarchical Hidden Markov Model,HHMM)的對比實驗,對該算法的有效性進行了檢驗,最后運用皮爾遜相關系數從關鍵詞權重與其詞頻之間的線性相關程度這一角度分析了該算法優越性的原因。另外,作者通過比較、分析四種典型聚類算法K-means、K-means++、Markov Cluster、和Affinity Propagation,篩選出更適合博客關鍵詞抽取的算法Markov Cluster;以此為基礎,設計了一個用于對博客文章進行主題聚類的算法,該算法能自動對聚類結果進行描述。作者還在傳統鏈接分析的基礎上,結合博客網頁的關鍵特征,提出一種融合了用戶評論和正文相似性信息的博客文章排序算法[15]。

    3 博客領域熱點話題挖掘

    作為互聯網的一種應用,博客已經出現了較長時間,但是對博客領域的熱點話題挖掘并不是很多。

    通常我們所理解的新聞熱點話題,一般都是通過該話題新聞報道的數量來表示。比如一個事件發生以后,很多媒體都對該事件進行了報道,那么這個事件可以被認為是熱點事件,關于這個事件的所有媒體的相關報道組成了一個熱點話題。但是對于博客上的熱點話題,則與新聞報道的熱點話題不同。因為博客文章是個人所發,一般情況下,不會出現象新聞熱點話題那樣有大量媒體進行報道的情況,所以,我們判斷博客網站上的熱點話題,主要是依據博客文章的閱讀數量、評論數量、收藏或轉載數量及時間等[16]。

    運用熱點話題檢測與跟蹤技術,將大量的博客信息按照話題進行歸類和分組,對用戶感興趣的某些特定話題進行跟蹤,實現個性化的服務,取代人工以簡明、概要的方式呈現給用戶[17]。這種技術可以使用戶在動態變化的互聯網環境下找到自己需要的信息,使博客信息更有價值,更加準確、有效地為用戶使用。

    傳統的博客熱點話題發現主要是根據閱讀數量、評論數量等來得到的,并沒有考慮話題內容和評論內容[16]。為此,大連理工大學的時達明、林鴻飛提出了一種基于內容相關度和語義分析的博客熱點話題檢測方法。該方法在考慮了評論數量的同時,還通過分析評論內容與話題內容的相關度并分析評論中的語義來計算話題在該博客中的熱度,最終完成該博客的熱點話題發現[18]。實驗表明,他們使用的方法是有效的。

    華南理工大學的胡方濤在對網絡爬蟲進行了一定的分析研究之后,通過已有的聚類算法將采集下來的博客數據聚類,形成話題。然后根據博客數據的特有屬性,提取出博客話題排序特征,最后通過熱點話題計算公式算出每個話題的熱度值,發現其中的熱點話題。對于熱度較高的話題,通過計算評論的情感來進行話題支持度的分析[19]。熱點話題支持度的分析能夠使得網民在了解該熱點話題的同時,還能了解民眾對該熱點話題所持的一種情感態度。

    4 結束語

    本文探討了博客資源數據挖掘、面向博客的熱點話題挖掘的研究現狀。博客數據挖掘是Web數據挖掘的一種具體應用。雖然有不少研究者對博客數據挖掘進行了研究,但從整體上看,與Web數據挖掘比較,對面向博客的數據挖掘的研究還是很少。筆者以博客(或Blog)加挖掘作為篇名關鍵詞在知網上搜索,截止到2013年4月,只搜索到28篇文獻,而以Web(或網絡)加挖掘作為篇名關鍵詞進行搜索,搜索到了4057篇文獻。關于博客挖掘的文獻只占Web挖掘文獻的0.69%。這與我國3.73億網民擁有博客、個人博客網站有21億的點擊數這樣的博客使用現狀顯然不符。對博客數據挖掘,還有很大的研究空間。

    參考文獻:

    [1] 中國互聯網絡信息中心(CNNIC).第31次中國互聯網絡發展狀況統計報告[EB/OL]. http://.cn/hlwfzyj/hlwxzbg/hlwtjbg/201301/P020130122600399530412.pdf.

    [2] Gruhl D, Guha R, Liben-Nowell D,Tomkins A.Information Diffusion through Blogspace[C].ACM WWW, 2004.

    [3] Ohmukai I, Takeda H, Numa K.Personal Knowledge Publishing Suite with Weblog, Workshop on the Weblogging Ecosystem[C].Aggregation,Analysis and Dynamics,2004.

    [4] Adar E,Zhang L.Implicit Structure and the Dynamics of Blogspace, Workshop on the Weblogging Ecosystem at the 13th International World Wide Web Conference[C].New York,2004.

    [5] Nanno T, Fujiki TSuzuki,YOkumura M.Automatically Collection, Monitoring, and Mining Japanese Weblogs[C].WWW,2004.

    [6] Kolari P, Finin T, Joshi A. SVMs for the blogosphere: Blog identification and splog detection. In: Proc. of the AAAI Spring Symp. on Computational Approaches to Analyzing Weblogs[C].California: AAAI Press,2006:92-99.

    [7] T. Fujiki, T. Nanno, M. Okumura. Differences between Blogs and Web Diaries[C]. WWW2005, Chiba, Japan, 2005,5: 10-14.

    [8] 張迪.中文Blog網頁識別與內容抽取研究[D].哈爾濱:哈爾濱工業大學,2007.

    [9] 張程,陳自郁,古平, 等.基于DOM樹結構的Blog網頁自動識別[J].計算機應用研究,2008(5):1489-1491.

    [10] 李旻.基于綜合特征空間的Blog網頁識別方法研究[D].開封:河南大學,2009.

    [11] 楊宇航,趙鐵軍,鄭德權,等.基于鏈接分析的重要Blog信息源發現[J].中文信息學報,2007,21(5):68-72.

    [12] 楊宇航,趙鐵軍,鄭德權,等.基于鏈接分析的重要Blog信息源發現[A].孫茂松,陳群秀.內容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C].北京:清華大學出版社,2007.

    [13] 倪曉川.博客作者興趣挖掘與博客信息、情感分析的研究[D].上海:上海交通大學,2008.

    [14] 季文韜.基于數據挖掘的博客球聚類研究[D].成都:西南石油大學,2011.

    [15] 軒文烽.面向主題的博客資源挖掘關鍵技術研究[D].哈爾濱:哈爾濱工業大學,2011.

    [16] 劉旭.博客熱點話題挖掘方法[D].哈爾濱:哈爾濱工業大學,2010.

    [17] 丁偉莉.中文Blog熱門話題檢測與跟蹤技術研究[D].哈爾濱:哈爾濱工業大學,2007.

    主站蜘蛛池模板: 国产成人在线看| 成人精品一区二区三区中文字幕 | 成人怡红院视频在线观看| 日本在线观看成人小视频 | 国产成人精品无码专区| 免费观看一级成人毛片| 一级成人生活片免费看| 国产麻豆成人传媒免费观看| 亚洲精品成人片在线播放| 久久久久久亚洲av成人无码国产| 成人性开放大片| 欧美成人精品第一区二区三区| 在线视频免费国产成人| 99热成人精品国产免国语的| 国产成人精品综合在线| 成人黄动漫画免费网站视频| 亚洲欧美日韩成人网| 国产成人综合日韩精品无码| 我爱我色成人网| 成人网视频免费播放| 青青草成人免费| 久久久久亚洲AV成人无码电影| 国产成人精品男人的天堂网站| 成人午夜兔费观看网站| 欧美成人免费全部| 中国国产成人精品久久| 久久久久成人片免费观看蜜芽| 国产成人久久777777| 国产成人精品美女在线| 国产成人高清精品免费软件| 成人亚洲欧美日韩在线| 成人福利视频app| 成人在线手机视频| 天堂成人一区二区三区| 国产成人精品亚洲2020| 国产欧美日韩成人| 亚洲av成人一区二区三区| 国产成人无码18禁午夜福利P| 成人h动漫精品一区二区无码| 成人av电影网站| 国产成人在线免费观看|