前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數學建模常用模型及算法主題范文,僅供參考,歡迎閱讀并收藏。
前言:數學建模,就是根據實際問題來建立數學模型,對數學模型來進行求解,然后根據結果去解決實際問題。數學模型是一種模擬,是用數學符號,數學式子,程序,圖形等對實際課題本質屬性的抽象而又簡潔的刻畫,它或能解釋某些客觀現象,或能預測未來的發展規律,或能為控制某一現象的發展提供某種意義下的最優策略或較好策略。應用知識從實際課題中抽象、提煉出數學模型的過程就稱為數學建模。在21世紀新時代下,信息技術的快速發展使得數學建模成了解決實際問題的一個重要的有效手段。
正文:自從20世紀以來,隨著科學技術的迅速發展和計算機的日益普及,人們對各種問題的要求越來越精確,使得數學的應用越來越廣泛和深入,特別是在21世紀這個知識經濟時代,數學科學的地位會發生巨大的變化,它正在從國家經濟和科技的后備走到了前沿。經濟發展的全球化、計算機的迅猛發展、數學理論與方法的不斷擴充,使得數學已經成為當代高科技的一個重要組成部分和思想庫,數學已經成為一種能夠普遍實施的技術。培養學生應用數學的意識和能力已經成為數學教學的一個重要方面。而數學建模作為數學方面的分支,在其中起到了關鍵性的作用。
談到數學建模的過程,可以分為以下幾個部分:
一.模型準備
了解問題的實際背景,明確其實際意義,掌握對象的各種信息。以數學思想來包容問題的精髓,數學思路貫穿問題的全過程,進而用數學語言來描述問題。要求符合數學理論,符合數學習慣,清晰準確。
二.模型假設
根據實際對象的特征和建模的目的,對問題進行必要的簡化,并用精確的語言提出一些恰當的假設。
三.模型建立
在假設的基礎上,利用適當的數學工具來刻劃各變量常量之間的數學關系,建立相應的數學結構。
四.模型計算
利用獲取的數據資料,對模型的所有參數做出計算(或近似計算)。其中需要應用到一些計算工具,如matlab。
五.模型分析
對所要建立模型的思路進行闡述,對所得的結果進行數學上的分析。
六.模型檢驗
將模型分析結果與實際情形進行比較,以此來驗證模型的準確性、合理性和適用性。如果模型與實際較吻合,則要對計算結果給出其實際含義,并進行解釋。如果模型與實際吻合較差,則應該修改假設,再次重復建模過程。
數學建模中比較重要的是,我們需要根據實際問題,適當調整,采取正確的數學建模方法,以較為準確地對實際問題發展的方向進行有據地預測,達到我們解決實際問題的目的,
在近些年,數學建模涉及到的實際問題有關于各個領域,包括病毒傳播問題、人口增長預測問題、衛星的導航跟蹤、環境質量的評價和預測等等,這些就能說明數學建模涉及領域之廣泛,針對這些問題我們需要采取對應的數學建模方法,采用不同的數學模型,再綜合起來分析,得出結論,這需要我們要有一定的數學基礎和掌握一些應用數學方法,以適應各種實際問題類型的研究,也應該在一些數學方法的基礎上,進行不斷地拓展和延伸,這也是在新時代下對于數學工作者的基本要求,我們對數學建模的所能達到的要求就是實現對實際問題的定性分析達到定量的程度,更能直觀地展現其中的內在關系,體現數學建模的巨大作用。
而在對數學建模中的數據處理中,我們往往采用十類算法:
一.蒙特卡羅算法
也稱統計模擬方法,是二十世紀四十年代中期由于科學技術的發展和電子計算機的發明,而被提出的一種以概率統計理論為指導的一類非常重要的數值計算方法。當所求解問題是某種隨機事件出現的概率,或者是某個隨機變量的期望值時,通過某種“實驗”的方法,以這種事件出現的頻率估計這一隨機事件的概率,或者得到這個隨機變量的某些數字特征,并將其作為問題的解。如粒子輸運問題。
二.數據擬合、參數估計、插值等數據處理算法
比賽中通常會遇到大量的數據需要處理,而處理數據的關鍵就在于這些算法,通常使用Matlab作為工具,而在其中有一些要用到參數估計的方法,包括矩估計、極大似然法、一致最小方差無偏估計、最小風險估計、同變估計、最小二乘法、貝葉斯估計、極大驗后法、最小風險法和極小化極大熵法。最基本的方法是最小二乘法和極大似然法。數據擬合在數學建模中常常有應用,與圖形處理有關的問題很多與擬合有關系。
三.線性規劃、整數規劃、多元規劃、二次規劃等規劃類問題
建模競賽大多數問題屬于最優化問題,很多時候這些問題可以用數學規劃算法來描述,通常使用Lindo、Lingo軟件實現。它尤其適用于傳統搜索方法難于解決的復雜和非線性問題,在運籌學和模糊數學中也有應用。
四.圖論算法
這類算法可以分為很多種,包括最短路、網絡流、二分圖等算法,涉及到圖論的問題可以用這些方法解決,需要認真準備,其中,圖論具有廣泛的應用價值,圖論可將各種復雜的工程系統和管理問題用“圖”來描述,然后用數學方法求得最優結果,圖論是解決許多工程問題中算法設計的一種有效地數學模型,便于計算分析和計算機存儲。
五.動態規劃、回溯搜索、分治算法、分支定界等計算機算法
動態規劃的應用極其廣泛,包括工程技術、經濟、工業生產、軍事以及自動化控制等領域,并在背包問題、生產經營問題、資金管理問題、資源分配問題、最短路徑問題和復雜系統可靠性問題等中取得了顯著的效果。回溯算法是深度優先策略的典型應用,回溯算法就是沿著一條路向下走,如果此路不同了,則回溯到上一個分岔路,在選一條路走,一直這樣遞歸下去,直到遍歷萬所有的路徑。八皇后問題是回溯算法的一個經典問題,還有一個經典的應用場景就是迷宮問題。回溯算法是深度優先,那么分支限界法就是廣度優先的一個經典的例子。回溯法一般來說是遍歷整個解空間,獲取問題的所有解,而分支限界法則是獲取一個解。分治算法的基本思想是將一個規模為N的問題分解為K個規模較小的子問題,這些子問題相互獨立且與原問題性質相同。求出子問題的解,就可得到原問題的解。即一種分目標完成程序算法,簡單問題可用二分法完成。
這些算法是算法設計中比較常用的方法,很多場合可以用到競賽中。
六.最優化理論的三大非經典算法:模擬退火法、神經網絡、遺傳算法
模擬退火算法的依據是固體物質退火過程和組合優化問題之間的相似性。物質在加熱的時候,粒子間的布朗運動增強,到達一定強度后,固體物質轉化為液態,這個時候再-進行退火,粒子熱運動減弱,并逐漸趨于有序,最后達到穩定。
“物競天擇,適者生存”,是進化論的基本思想。遺傳算法就是模擬自然界想做的事。遺傳算法可以很好地用于優化問題,若把它看作對自然過程高度理想化的模擬,更能-顯出它本身的優雅——雖然生存競爭是殘酷的。 遺傳算法以一種群體中的所有個體為對象,并利用隨機化技術指導對一個被編碼的參數空間進行高效搜索 。
神經網絡從名字就知道是對人腦的模擬。它的神經元結構,它的構成與作用方式都是在模仿人腦,但是也僅僅是粗糙的模仿,遠沒有達到完美的地步。和馮·諾依曼機不同-,神經網絡計算非數字,非精確,高度并行,并且有自學習功能。
這些問題是用來解決一些較困難的最優化問題的算法,對于有些問題非常有幫助,但是算法的實現比較困難,需慎重使用。
七 .網格算法和窮舉法
對于小數據量窮舉法就是最優秀的算法,網格算法就是連續問題的枚舉。網格算法和窮舉法都是暴力搜索最優點的算法,在很多競賽題中有應用,當重點討論模型本身而輕視算法的時候,可以使用這種暴力方案,最好使用一些高級語言作為編程工具。
八.一些連續離散化方法
很多問題都是實際來的,數據可以是連續的,而計算機只認的是離散的數據,因此將其離散化后進行差分代替微分、求和代替積分等思想是非常重要的。
九.數值分析算法
在比賽中采用高級語言進行編程的話,那一些數值分析中常用的算法比如方程組求解、矩陣運算、 函數積分等算法就需要額外編寫庫函數進行調用。
十.圖像處理法
賽題中有一類問題與圖形有關,即使與圖形無關,論文中也應該要不乏圖片的,這些圖形如何展示以及如何處理就是需要解決的問題,通常使用Matlab進行處理。
這十類算法對于數據處理有很大的幫助,甚至從其中可以發現在它們中的很多算法都是數學某些分支的延伸,可能我們不一定能掌握里面的所有算法,但是我們可以盡可能學習,相信這對我們今后的數學學習有很大的幫助,然后,就是數學模型的類別。
常見的數學模型有離散動態模型、連續動態模型、庫存模型、線性回歸模型、線性規劃模型、綜合評價模型、傳染病模型等數學模型、常微分方程模型、常微分方程的數值穩定性、人口模型、差分方程模型,這些模型都有針對性地從實際問題中抽象出來,得到這些模型的建立,我們在其中加入適當合理的簡化,但要保證能反映原型的特征,在數學模型中,我們能進行理性的分析,也能進行計算和演繹推導,我們最終都會通過實踐檢驗數學建模的正確性,加以完善和提升,在對現實對象進行建模時,人們常常對預測未來某個時刻變量的值感興趣,變量可能是人口、房地產的價值或者有一種傳染病的人數。數學模型常常能幫助人們更好的了解一種行為或者規劃未來,可以把數學模型看做一種研究特定的實際系統或者人們感興趣的行為而設計的數學結構。
例如人口增長模型:
中國是世界上人口最多的發展中國家,人口多,底子薄,人均耕地少,人均占有資源相對不足,是我國的基本國情,人口問題一直是制約中國經濟發展的首要因素。人口數量、 質量和年齡分布直接影響一個地區的經濟發展、資源配置、社會保障、社會穩定和城市活力。 在我國現代化進程中,必須實現人口與經濟、社會、資源、環境協調發展和可持續發展, 進一步控制人口數量,提高人口質量,改善人口結構。對此,單純的人口數量控制(如已實施多年的計劃生育)不能體現人口規劃的科學性。 政府部門需要更詳細、 更系統的人口分析技術,為人口發展策略的制定提供指導和依據。長期以來,對人口年齡結構的研究僅限于粗線條的定性分析, 只能預測年齡結構分布的大致范圍,無法用于分析年齡結構的具體形態。 隨著對人口規劃精準度要求的提高,通過數學方法來定量計算各種人口指數的方法日益受到重視,這就是人口控制和預測。
人口增長模型是由生育、死亡、疾病、災害、環境、社會、經濟等諸多因素影響和制約的共同結果,如此眾多的因素不可能通過幾個指標就能表達清楚,他們對人口增長的潛在而復雜的影響更是無法精確計算。這反映出人口系統具有明顯的灰色性, 適宜采用灰色模型去發掘和認識原始時間序列綜合灰色量所包含的內在規律。灰色預測模型屬于全因素的非線性擬合外推類法,其特點是單數列預測,在形式上只用被預測對象的自身序列建立模型,根據其自身數列本身的特性進行建模、預測,與其相關的因素并沒有直接參與,而是將眾多直接的明顯的和間接的隱藏著的、已知的、未知的因素包含在其中,看成是灰色信息即灰色量,對灰色量進行預測,不必拼湊數據不準、關系不清、變化不明的參數,而是從自身的序列中尋找信息建立模型,發現和認識內在規律進行預測。
基于以上思想我們建立了灰色預測模型:
灰色建模的思路是:從序列角度剖析微分方程,是了解其構成的主要條件,然后對近似滿足這些條件的序列建立近似的微分方程模型。而對序列而言(一般指有限序列)只能獲得有限差異信息,因此,用序列建立微分方程模型,實質上是用有限差異信息建立一個無限差異信息模型。
在灰色預測模型中,與起相關的因素并沒有直接參與,但如果考慮到直接影響人口增長的因素, 例如出生率、死亡率、 遷入遷出人口數等,根據具體的數據進行計算, 則可以根據年齡移算理論,從某一時點的某年齡組人數推算一年或多年后年齡相應增長一歲或增長多歲的人口數。在這個人口數的基礎上減去相應年齡的死亡人數, 就可以得到未來某年齡組的實際人口數。對于0 歲的新生人口, 則需要通過生育率作重新計算。當社會經濟條件變化不大時, 各年齡組死亡率比較穩定, 相應活到下一年齡組的比例即存活率也基本上穩定不變。 因而可以根據現有的分性別年齡組存活率推算未來各相應年齡組的人數。
通過這樣的實例就能很細致地說明數學建模的方法應用,數學模型方法是把實際問題加以抽象概括,建立相應的數學模型,利用這些模型來研究實際問題的一般數學方法。它是將研究的某種事物系統,采用數學形式化語言把該系統的特征和數量關系,抽象出一種數學結構的方法,這種數學結構就叫數學模型。一般地,一個實際問題系統的數學模型是抽象的數學表達式,如代數方程、微分方程、差分方程、積分方程、邏輯關系式,甚至是一個計算機的程序等等。由這種表達式算得某些變量的變化規律, 與實際問題系統中相應特征的變化規律相符。一個實際系統的數學模型,就是對其中某些特征的變化規律作出最精煉的概括。
數學模型為人們解決現實問題提供了十分有效和足夠精確的工具, 在現實生活中, 我們經常用模型的思想來認識和改造世界,模型是針對原型而言的,是人們為了一定的目的對原型進行的一個抽象。
隨著科學技術的快速發展,數學在自然科學、社會科學、工程技術與現代化管理等方面獲得越來越廣泛而深入的應用, 尤其是在經濟發展方面, 數學建模也有很重要的作用。 數學模型這個詞匯越來越多地出現在現代人的生產、工作和社會活動中,從而使人們逐漸認識到建立數學模型的重要性。數學模型就是要用數學的語言、方法去近似地刻畫實際,是由數字、字母或其他數學符號組成的,描述現實對象數量規律的數學公式、 圖形或算法。也可以這樣描述:對于一個現實對象,為了一個特定目的,根據其內在規律,做出必要的簡化假設,運用適當的數學工具,得到的一個數學結構。數學建模的作用在21實際毋庸置疑,我們通過不斷學習數學建可以掌握解決實際問題的強大武器。
參考文獻:數學建模方法與案例,張萬龍,等編著,國防工業出版社(2014).
[關鍵詞]高職學生 數學建模
[作者簡介]鄭麗(1974- ),女,河北邯鄲人,邯鄲職業技術學院,副教授,研究方向為數學教育。(河北 邯鄲 056001)
[課題項目]本文系2012年河北省教育廳人文社會科學研究項目“基于數學建模的高職學生創新能力的培養”的部分研究成果。(課題編號:SZ123022)
[中圖分類號]G647 [文獻標識碼]A [文章編號]1004-3985(2014)12-0187-02
數學建模是在20世紀六七十年代進入一些西方國家大學的,我國幾所大學也在80年代初將數學建模引入課堂。1992年由中國工業與應用數學學會組織舉辦了我國10城市的大學生數學模型聯賽,74所院校參加了本次聯賽。教育部及時發現,并扶植、培育了這一新生事物,決定從1994年起由教育部高教司和中國工業與應用數學學會共同主辦全國大學生數學建模競賽,每年一屆。現在絕大多數本科院校和許多專科學校都開設了各種形式的數學建模課程和講座,每年有幾萬名來自各個專業的大學生參加競賽,有效激勵了學生學習數學的積極性,提高了學生運用數學解決問題的能力,為培養學生利用數學方法分析、解決實際問題開辟了一條有效途徑。
從1999年起,全國大學生數學建模競賽設立了專科組,高職院校作為高等教育的重要組成部分,在開展數學建模活動中投入了極大的熱情,數學建模也成為高職院校數學教學改革的一個熱點。作為高職院校的數學教師,筆者自2001年以來一直擔負著學校的數學建模培訓工作,每年學生們都積極參加數學建模競賽,也取得了國家級、省級的獎勵。結合高職院校的學生特點,以及十年間高職數學教學和數學建模活動的實踐,筆者對高職院校開展數學建模活動的意義進行了探討,并總結了高職院校實行數學建模培訓的思路與方法。
一、在高職院校開展數學建模活動的意義
(一)數學建模活動能夠滿足部分學生的學習需求
高職院校的學生大多是基礎知識相對薄弱的,但是也有不少學生基礎扎實,善于思考。高職院校目的是培養既有理論基礎,又有實踐能力和創新精神的復合型人才,這就要求我們既要進行大眾化的人才培養,又要滿足部分學生對知識、能力更高層次的需求。數學建模活動為這些學生帶來了新的挑戰和機會,為他們展示創新思維與實踐能力提供了舞臺。
(二)數學建模活動可以培養學生的創新精神,提高學生的綜合素質
通過數學建模訓練,可以擴充學生的知識面,培養學生利用數學知識解決實際問題的能力,增強學生的知識拓展能力、綜合運用能力;還可以豐富學生的想象力,提高抽象思維的簡化能力和創新精神,既有洞察能力和聯想能力,又有開拓能力和創造能力,以及團結協作的攻關能力。
(三)數學建模活動可以促進數學教師的教學能力和科研能力,推動高職數學教學的改革與創新
通過在高職院校中開展數學建模活動,對數學教師本身也是機會和挑戰。教師必須重新組織教學內容,補充自身知識的缺陷與不足,促使教師自身綜合素質的不斷提高。通過數學建模訓練,教師在數學教學中必然會改進教學方法,轉變教學觀念和教學方式,教學水平和科研能力都會逐步提高。通過數學建模訓練,教師也能夠學會一定的科學研究方法,增強實踐教學意識,對于在數學教學中培養學生的創新能力和抽象思維有了明確的認識。通過數學建模訓練,教師更善于在教學過程中激發學生學習的主動性,調動學生學習的積極性,重視教學方法與教學手段的改革,推動教學質量不斷提高。
二、在高職院校實行數學建模培訓的思想與方法
(一)高職院校實行數學建模培訓的必要性
數學教育本質上是一種素質教育。通過數學訓練,可以使學生樹立明確的數量觀念,提高邏輯思維能力,有助于培養認真細致、一絲不茍的作風,形成精益求精的風格,提高運用數學知識處理現實世界中各種復雜問題的意識、信念和能力。高職院校中,作為基礎課程的數學課,不僅要為學生學習專業課提供必要的數學知識,同時還要培養學生的數學思維,培養他們勇于創新、團結協作解決問題的能力。而開設數學實驗課,進行數學建模活動有助于提高學生在數學學習中的興趣與主動性,提高學生利用所學知識解決實際問題的能力,為培養高質量、高層次復合型人才提供有力的幫助。
(二)突出高職特色,滲透數學建模教學思想
高職學生的學習基礎總體比較薄弱,但實踐能力和動手能力又相對較強。這就要求教師在教授數學知識的時候,必須把握“以應用為目的、必需夠用”的原則,揚長避短,體現精簡數學理論,弱化系統性,突出數學應用,強調實用性。在開展數學建模活動中,要從開設數學實驗課入手,普及數學建模思想,強化數學建模在實際當中的應用。
從目前課程設置及課時的統計上,可以看出作為基礎課程的數學課總課時整體呈縮減趨勢。面對這種現狀,我們需要在保證學生夠用的前提下,突出數學的應用性,這就需要我們進行教學內容和教學方法上的改革。開設數學實驗課,引導學生進行數學建模活動,給數學教學改革帶來了新的啟示,使數學教學改革在迷茫中找到了突破口。通過組織學生參加全國大學生數學建模競賽,以及對數學建模和數學實驗的進一步研究,我們提出了在高職院校中開設數學實驗課的構想,利用現有課時使學生盡可能多地了解數學的思想方法,掌握應用軟件解決數學問題的技能。數學實驗課建設的指導思想是以實驗為基礎,以學生為主體,以問題為導向,以培養能力為目標。在數學教學改革中,要堅持貫徹指導思想,努力構建數學實驗課程教學的模式。
(三)數學建模培訓的方法探索
在高職院校的實際數學教學中,可以采取在大一第二個學期,由各系推薦,學生自愿的方式開設數學實驗選修課。這一階段主要給學生補充一些必要的數學知識及軟件應用方法,介紹一些最常用的解決實際問題的數學方法,比如數值計算、最優化方法、數理統計中最基本的原理和算法,同時選擇合適的數學軟件平臺,熟練計算機的操作,掌握工具軟件的使用,基本上能夠實現所講內容的主要計算。組織興趣小組,集體討論,相互促進,共同提高,培養團隊精神。在教授過程中盡量引入實際問題,并落實于解決這些問題,引導學生自己動手操作,通過協作討論,寫出從問題的提出和簡化到解決方案和數學模型的實驗報告,并盡可能給出算法和計算機的實現,得出計算結果。
在期末選出部分比較出色的學生,為參加全國大學生數學建模競賽進行培訓,時間主要集中在暑假期間。這一階段安排學生熟悉數學建模所涉及的各種方法,諸如幾何理論、微積分、組合概率、統計(回歸)分析、優化方法(規劃)、圖論與網絡優化、綜合評價、插值與擬合、差分計算、微分方程、排隊論等方法。學生也要在盡量岔開專業的前提下,依照教師建議及學生自己選擇進行分組,利用歷年一些典型的競賽題目模擬訓練,對于每道題目要求各組按比賽要求給出模型論文。教師引導學生及時總結題目中所用的方法,找出各自的長處與不足,為后面的訓練與比賽積累知識與經驗。
三、如何在高職院校中開展數學建模培訓
(一)高職院校數學建模培訓的總體規劃
確定對于高職學生實行數學建模培訓的思想與方法后,重點就是要組織教學內容。目前關于數學建模的書籍及參考資料多種多樣,其中大多是面向本科學生的,近幾年也有不少針對專科學生的數學建模材料。前期數學實驗課的選修過程中,建議高職院校不要局限于某一本教材,而是參考各種資料,選擇一些比較典型又易于上手的數學模型,讓學生既在學中做,又在做中學。而在針對全國大學生數學建模競賽的集中訓練中,要優化數學建模競賽隊員的組合,強調三人各有專長,有的數學建模能力較強,有的計算機軟件應用能力較強,還有的擅長文字表達。這一階段要擴展學生知識面,打牢基礎,強調“廣、淺、新”。強化訓練歷年競賽真題,使學生多接觸實際問題的簡化與抽象方法,應用數學知識解決實際問題。同時要對一些比賽常用的基本技能進行強化訓練,如數學軟件的應用、數學公式編輯器的使用,以及論文格式的編排等。
(二)高職院校數學建模培訓的基礎內容
初期的數學實驗課,應先從初等模型入手,引導學生應用中學所學的數學知識解決一些實際問題。教師有意識引導學生發散思維,讓他們沿著問題分析―建立模型―求解模型―模型分析與檢驗的過程解決問題。由于初等模型不需要補充多少知識,學生用原有的知識能夠解決模型問題,使得學生對數學實驗與數學建模充滿了興趣與信心。
接著可以引入一元函數及多元函數的微分模型,以求最值問題為主。高職院校各專業學生基本都在第一學期學過了一元函數的導數及應用,對于這類模型也比較容易接受。在此期間應穿插數學軟件的學習與練習,重點是Mathematica和Matlab的使用,利用數學軟件幫助求解模型。
再來就是微分方程模型,這時由于不同專業學生學習情況不同,所以要先適當補充微分方程的基本知識,才能由易到難,由簡單到復雜地帶領學生建立微分方程模型,然后借助數學軟件求解模型。在第二學期,有些專業的學生會開設線性代數或概率論與數理統計,所以后半學期會在線性代數基礎上講解規劃模型,以及概率統計的模型。
這樣通過一個學期的數學實驗與數學建模課程,多數參加數學建模培訓的學生分析問題、解決問題的能力都能顯著改善,還可以擴充知識面,學習新理論和新方法,自身的能力、水平和綜合素質都有很大的提高。
(三)高職院校數學建模培訓的強化內容
暑假期間,篩選部分優秀的學生進入數學建模競賽培訓階段,學習時間可以比較集中。這一時期應利用典型模型,結合實際問題,穿插講解數據擬合及綜合評價等數學建模中常用到的方法,讓學生在具體模型中體會學習機理分析、數據處理、綜合評價、微分方程、差分方程、概率統計、插值與擬合及優化等方法。同時深入學習Mathematica和Matlab等數學軟件,掌握它的強大功能,還要求部分擅長計算機軟件的學生能夠熟練使用Lingo軟件,這幾種軟件的應用為求解數學模型提供了方便快捷的手段和方法。最后,在歷年的數學建模競賽題目中選取部分題目,分別涉及不同的建模方法,讓學生做賽前的強化練習,模擬比賽環境與要求,各組在規定時間內拿出符合比賽要求的建模論文。
在高職院校開展數學建模活動,有助于促進教師知識結構的更新與擴展,為數學教學的改革與創新提供了切入點和發展方向。同時,高職院校的學生通過參加數學建模競賽,可以用事實來證明自己的實力和價值,更有利于自身綜合能力和素質的提高,增強了未來的就業競爭力。
[參考文獻]
[1]陳艷.數學建模對實現高職高專數學素質教育之分析[J].學理論,2011(12).
[2]姜啟源,謝金星,葉俊.數學模型[M].3版.北京:高等教育出版社,2003.
數學是研究現實世界中數量關系和空間形式的科學。
數學以抽象的形式,追求高度精確、可靠的知識。抽象并非數學獨有的特性,但數學的抽象卻是最為典型的。數學的抽象舍棄了事物的其他一切方面而僅僅保留某種關系或結構,同時,數學的概念和方法也是抽象的。
數學是在對宇宙世界和人類社會的探索中追求最大限度的一般性模式,特別是一般性算法的傾向。這種追求使數學具有廣泛的適用性。同一組偏微分程,在流體力學中用來描寫流體動態,在彈性科學實驗中用來描寫振動方程,在聲學中用來描寫聲音傳播等等。
數學作為一種創造性活動,具有藝術的特征,具有幽美性。英國數學家和哲學家羅素對數學的幽美性有過一段精僻的話:“數學不僅擁有真理,而且擁有至高無尚的美――一種冷峻嚴肅的美,就像是一種雕塑……這種美沒有繪畫或音樂那樣華麗的裝飾,它可以純潔到崇高的程度,能夠達到嚴格的只有最偉大的藝術才能顯示的完美境界。”
最近幾十年來,由于計算機技術的高速發展,數學的地位更是發生了巨大的變化。科學的本質是數學,現代科學的一個重要特征就是數學化,高技術從本質上就是數學技術,現代數學已不再僅僅是其他科學的基礎,而是直接發揮著第一生產力的作用。
當前工科的高等數學教學的現狀
工科數學的教學,尤其是高等數學教學,就其內容而言是比較完備與定型的。高等數學是以討論函數微積分為主要內容的一門學科,主要內容是函數、極限、連續、導數、微分、積分、向量代數與空間解析幾何、微分方程等。這些內容不僅是工科各專業課的理論基礎及數學表達語言和工具,也是學生從基礎教育思想向高等教育思想過渡,從有限的、形象的思維形式向無限的思維形式過渡的一門承上啟下的基礎理論課程。但是,過分強調這一點,導致在數學計劃中加入越來越多和越來越細的內容。通常是,老的內容不減,新的內容又必須插入,學生的負擔越來越重。然而卻有不少學生帶著數學到底有什么用的困惑,在沉重的學習負擔下感到數學難懂又枯燥,學習興趣日下。一部分學生上課不聽,作業抄抄,考試臨時抱佛腳。考試抑或沒通過,即使撓幸通過,也是學得快忘得更快。雖然有的學生嚴格按照老師的要求好好學習了,考試也許得個滿分,但一旦碰到以數學為工具解決各種實際問題時,也會束手無策,不知從哪兒下手。
數學建模和數學建模競賽
鑒于以上現狀,我校從1998年開始嘗試搞數學建摸。其實剛開始時,不是為了參賽,而是想提高學生學習的積極性。1999年開始了數學建模選修課,2000年領導要我們組隊參加建模。當時,抱著摸石頭過河的心態組織5個隊參加,獲得1個省一等獎,1個省二等獎,2個省三等獎,1個成功參賽獎。2001年,9個隊參加并全部得獎:1個國家一等獎,2個國家二等獎,3個省一等獎,另外均為省二等獎。2002年,我們組織了10個隊參加,又一次全部得獎:1個國家一等獎,3個國家二等獎。2003年組織13個隊參賽,又是滿堂紅:4個隊獲國家大專組二等獎,6個浙江省一等獎,3個省二等獎。通過這幾年的組隊比賽,我們摸索出了這樣一條比較適合高職高專的方法。
(1)講高等數學時滲透建模思想
我校根據專業特點,采用了兩套教材:
理科:《高等數學》(上、下)主編:盛祥耀
高等教育出版社
《概率論與數理統計》第二版常柏林等編
高等教育出版社
《線性代數》彭玉芳等編高等教育出版社
三本書總學時:130課時。
文科:財經類專科試用教材
《微積分》李志照等編高等教育出版社
《線性代數》張政修等編高等教育出版社
《概率論與數理統計》何蘊理等編高等教育出版社
三本書總學時:110課時。
抱著專科學校會用為主的目的,1998年我們在全校的文理科班中,嘗試在上課時放棄一些繁瑣的證明,見縫插針的插入一些簡單的小型建模案例。在講完函數這一節時,怎樣建立函數關系式即俗稱的應用題多講多練;在講述完連續函數的性質后,向同學們介紹了“椅子能在不平的地面上放穩嗎?”等小模型;導數的定義、導數的思想方法在建模時經常用到,插入“如何預報人口的增長” 模型,介紹Malthus模型及Logistic模型;導數的最值講完后,插入“不允許缺貨的存貯模型和允許缺貨的存貯模型”“森林救火模型”;定積分的概念,講完書上的引例后,以我們學生的參賽論文“飛越北極”“橫渡長江”為例子,講解定積分的分割、近似、求和、極限思想在建模中的應用。結合“報童的訣竅”講授積分上限函數。而微分方程這一章,更是滲透建模思想的好地方:“正規戰與游擊戰”、食餌――捕食者模型等均可以在此處介紹。提高學習興趣的同時,對學有余力的同學則起到了拋磚引玉的作用。在講授《線性代數》、《概率論與數理統計》時,我們也作了同等的嘗試。讓學生從小問題入手去體會,學習應用數學的技巧。一年下來,不管是我們上課的教師還是學生,明顯覺得數學有趣了,學習積極性提高了。
關鍵詞:汽輪機控制系統;建模方法;仿真技術
中國分類號:TP273
汽輪機控制系統從直接控制系統到間接調節系統,由模擬式電液控制系統發展到數字式電液控制系統,再到集散控制系統以及現場總線控制系統,技術發展越來越成熟的同時,控制系統也越來越受到人們的重視。仿真技術的飛速發展及計算機控制技術的廣泛應用,極大地促進了汽輪機控制系統的仿真研究。本文將對汽輪機控制系統仿真的意義、發展歷程、方法等方面進行探討。
1 汽輪機控制系統仿真的意義
首先,可以確保研究人員和機組運行的安全。研究人員只有在仿真平臺上對控制方案進行研究,才能避免危險性,同時也保證了設備的正常運行。其次,為研究更好的控制方案提供了平臺。通過建立數學模型,對不同的控制算法的進行仿真研究,找出合適的算法和先進的控制策略,優化控制系統的設計,改善系統控制性能。最后,為控制參數的優化整定提供了條件。通過利用控制系統仿真參數的監測,尋找系統最優控制參數,提高系統的調節品質。
2 汽輪機控制系統仿真發展
汽輪機控制系統是汽輪機重要的組成部分。根據我國汽輪機控制系統的發展歷程以及對其系統建模與仿真研究出現的先后,可以分為以下幾個階段:
(1)物理仿真,即采用物理模擬的方法模擬汽輪機發電機組和調節裝置。但是采用物理仿真的方法來模擬中間再熱汽輪機,模擬部件做得都非常繁復,對于模擬汽輪機發電機組并網運用以及改變參數都比較困難[1]。
(2)模擬計算機仿真。20世紀60年代,隨著計算機的問世,利用電子模擬計算機來研究和解決汽輪機自動調節系統中存在的問題,成為一種趨勢。文獻[1]針對上海汽輪機廠生產的AK-25型汽輪機負荷擾動、哈爾濱汽輪機廠20萬瓦汽輪機調節系統參數整定以及動態模擬試驗等問題,采用電子模擬計算機基本解決了上述問題,并取得了良好的效果。
(3)數模混合仿真。在計算機技術水平還比較低下時,為了盡量縮短機組的啟動調整時間,快速投入運行,世界各國汽輪機制造業都建立了試驗基地,對汽輪機調節系統動態模擬試驗進行研究。文獻[2]概述了試驗基地的主要內容,其中通過數模混合仿真計算求得調節系統的動態特性,雖不能完全反映調節系統的實際情況,但也有助于調節系統的現場調整。
(4)數字計算機仿真。20世紀80年代,隨著計算機技術不斷發展,汽輪機數字電液控制系統成為了電廠使用的主流,而仿真技術的發展也逐漸趨于成熟。我國第一臺火電站全仿真機于1982年從美國引進。同年,我國自主研發的大型火電機組仿真系統也成功問世。文獻[3]介紹了基于STAR-90仿真系統對300MW數字式電液調節進行仿真研究。結果表明利用STAR-90仿真建模技術,可以很方便地實現系統的建模、仿真、修改及調試工作。數字計算機仿真具有劃時代的的意義,它使得汽輪機控制系統的研究呈現多元化、多樣化。
3 汽輪機控制系統仿真方法
汽輪機控制系統仿真的基本任務是建立模型,編制仿真程序,進行模型的調試和控制參數的整定。汽輪機控制系統建模與仿真方法主要有:
3.1 機理分析法
汽輪機控制系統最常用的數學建模方法是機理分析方法。采用機理建模必須要對實際系統進行深入地分析,提取本質因素,忽略不確定影響因素,并在一定假設或簡化條件下得出的,所以機理分析模型的精度不是很高。但是其定性結論卻比較合理,對于太過復雜的系統采用機理建模就很難奏效。因此,機理分析方法應用于中小型的汽輪機控制系統的模型建立。
3.2 系統辨識法
系統辨識法常應用于大型復雜的汽輪機非線性控制系統,用來驗證近似得到的控制系統數學模型的參數。機理分析法確定模型的結構形式,系統辨識法確定模型中的參數值,兩者結合適用于機理明確而參數未知的系統。近年來,基于智能技術如遺傳算法、神經網絡等的建模仿真方法發展十分迅速,并在具有不確定性、非線性等特性的系統建模方面,得到了廣泛應用。其中遺傳算法常應用于汽輪機非線性調節系統參數辨識的研究或汽輪機PID調節器參數的優化整定。文獻[4]介紹了遺傳算法應用于參數辨識的基本思想,對汽輪機非線性調節系統的進行參數辨識。結果表明采用遺傳算法可準確地辨識系統中死區、限幅等非線性發生部位和參數,辨識結果準確可靠。
3.3 圖形化建模
對于控制系統仿真使用圖形化建模,其實是提供一個自動建模平臺。例如MATLAB、LabVIEW、BLINK等仿真支撐軟件里都封裝有很多的功能模塊。在進行系統建模時,只要把封裝的模塊找出,采用模塊搭接的方式實現系統建模,這樣使建模人員集中精力于控制回路組態、控制參數優化、仿真系統調試等基本內容,而省去編程的煩惱[5]。文獻[6-8]分別是基于MATLAB、LabVIEW、BLINK軟件對汽輪機控制系統進行的建模仿真。仿真表明:仿真支撐軟件對高效建立控制系統的仿真模型具有良好的效果。
4 展望
隨著集散控制系統的普及,基于Web分布交互式仿真成為研究熱點。分布交互仿真的分布性和交互性特點可使處在不同地理位置的各個部門利用網絡連接起來,實現資源共享,達到節省人力、物力、財力的目的。同時,虛擬仿真技術將成為仿真技術發展的一個趨勢。虛擬仿真技術是仿真技術與虛擬現實技術相結合的產物,是一種更高級的仿真技術。在測控領域中,采用先進高等控制策略在汽輪機控制系統中嘗試,而這樣的嘗試在實際的汽輪機上是無法進行的,只有在汽輪機控制系統的虛擬現實仿真環境中進行反復試驗,通過對不同控制算法的仿真與比較,選擇最優控制,大大節約了時間和經費,避免了危險性。
5 結束語
隨著我國電力工業的迅速發展和我國多年來從事的控制系統研究,汽輪機控制系統日益引起電廠的認識和重視。通過對汽輪機控制系統建模與仿真技術及應用情況的了解和認識,提出控制系統仿真技術的發展方向:基于Web分布交互式仿真成為當下的研究熱點。在不久的將來,虛擬仿真技術將會成在汽輪機控制系統仿真中發揮重要的作用。
參考文獻:
[1]上海汽輪機研究所.電子模擬計算機在汽輪機調節系統中的應用[J].電子技術應用,1976(03):12-21.
[2]楊煥義.模擬技術在汽輪機控制中的應用[J].中國電機工程學報,1988(07):14-15.
[3]段新會.3OOMW機組數字式電液調節(DEH)仿真系統的研究[D].華北電力學院,1995(06):8-11.
[4]戴義平,劉炯,劉朝.基于遺傳算法的汽輪機非線性調節系統的參數辨識研究[J].動力工程,2003(02):2215-2218.
[5]呂崇德,任挺進,姜學智.大型火電機組系統仿真與建模[M].北京:清華大學出版社,2002.
[6]孫玉芬,王再英.汽輪機DEH系統建模及仿真研究[J].計算機仿真,2013(09):126-127.
[7]王浩.基于LabVIEW的汽輪機仿真控制系統簡介[J].南鋼科技與管理,2008(04):30-32.
[8]降愛琴,張學軍,赫秀芳.基于BLINK的DEH控制系統仿真[J].微計算機應用,2007(06):640-643.
作者簡介:韓芹(1982-),女,湖南永州人,實驗教師,助教,碩士,研究方向:計算機智能控制。
關鍵詞:MATLAB AM 調制 仿真 FPGA DSP
中圖分類號:TN402 文獻標識碼:A 文章編號:1672-3791(2014)04(b)-0002-03
AM Modulation Method in Engineering Analysis and MATLAB Simulation
Zhang Ke1 Pu Juan2
(1.Chengdu Aeronautic Polytechnic, Chengdu Sichuan,610100,China; 2.Suining city first middle school, Suining Sichuan,629000,China)
Abstract:Article using the mathematical model for the simulation tool of MATLAB in communication engineering one of the most widely used AM modulation demodulation method, has carried on the simulation analysis on the background of an engineering example, adopted the undersampling method is commonly used in engineering simulation of digital modulation demodulation, for the establishment of simulation model, the simulation of the parameter selection are analyzed, and finally concluded that the simulation results with the simulation, verify the feasibility of digital algorithm in communication engineering, design to lay the foundation for later FPGA or DSP.
Key Words:MATLAB;AM;Modulation;The Simulation;FPGA;DSP
目前通信系統實現方式朝著數字化方向轉變,同時也面臨多種調制解調方式的整合。作為傳統的調制解調方式AM也需要從模擬的方式轉換成數字調制解調的方式,有助于實現通信系統不同調制解調方式的整合,同時也便于利用數字技術進行加密,能進一步提高AM調制解調系統的抗干擾性和可靠性。
MATLAB(矩陣實驗室)是MATrix LABoratory的縮寫,是一款由美國The MathWorks公司出品的商業數學軟件。MATLAB是一種用于算法開發、數據可視化、數據分析以及數值計算的高級技術計算語言和交互式環境。除了矩陣運算、繪制函數、數據圖像等常用功能外,MATLAB還可以用來創建用戶界面及與調用其它語言(包括C,C++和FORTRAN)編寫的程序。MATLAB主要用于數值運算,但利用為數眾多的附加工具箱(Toolbox)它也適合不同領域的應用,例如控制系統設計與分析、圖像處理、信號處理與通訊、金融建模和分析等。
文章用數學建模的方法先設計出了數學算法,然后考慮到實際通信系統的應用場合做了相應的數學修正,然后用MATLAB給出了源代碼和仿真波形,以此驗證數學模型的合理性。
1 數學建模及仿真分析
1.1 AM調制過程的數學建模
AM(調幅)是最常用的調制方式之一,也是短波通信的主要工作模式。下面介紹AM的數字化實現方法,AM調制信號圖例如圖1所示。
其數學模型如下:
f(t)=(A+m(t)).cos(Wct+θ)
其中A為直流電平,m(t)為調制單音頻,Wc為載頻,θ為初相。
1.2 AM調制MATLAB仿真程序設計與分析
首先需要確定AM調制所用的場合,文章中所用AM調制主要應用于電臺的通信,所以調制頻率的范圍就是語音頻率的范圍,所以這里,選擇了1 K的中心頻率作為仿真的頻率是合適的。即:
而調制頻率的初相選擇為:
??
信號的采樣頻率選擇為:
×
所以采樣時間間隔即為頻率的倒數:
那么采樣的時間設置為
?
音頻調制信號的表達式即為
在matlab中畫圖命令如下:
由此可以在MALAB中畫出調制信號的波形如圖2所示。
在matlab中畫圖命令如圖3所示。
?
做出頻域波形如下:
上面是音頻調制信號的MATLAB時域和頻域仿真波形,接下來文章需要仿真加入載波以后的波形。
首先我們需要確定載波信號的頻率:
?
請讀者注意,文章的載波頻率設定為?,依據奈奎斯特定理,選擇的采樣頻率應該大于等于信號頻率的2倍,但考慮到工程中高頻率信號的電路板設計難度相對較大,調試難度也會相應增加,而且會增加整個工程的成本,所以在這里我們采用了一種在工程中常使用的欠采樣方法進行采樣,經驗證這同樣可以在解調的時候還原出原始調制信號。這里作者選取采樣頻率為32.000?106Hz。載波頻率的初相設置為:
?? (1)
另外在工程設計中還需要考慮通信設備的使用場合,為了考慮設備的通用性,需要考慮高速通信設備與低速通信設備。如果作為航空器的通信,作者在仿真中還需要引入多普勒頻移這一參數,才能使仿真更加貼近真實情況,設置多普勒頻移參數如下:
作者根據上面設置的參數,可得出載波信號的表達式如下:
???
做出載波信號的時域仿真波形如圖4所示。
同時信號在頻域的情況也很重要,作者在MATLAB中編寫作圖命令如下:
?
這里為了便于觀察,作者采用了歸一化的方法,既是上面的公式所示,作出載波信號的頻域仿真波形如圖5所示。
從頻域波形看出,欠采樣后的載波信號會在頻域中產生兩個頻點的,這也為后面的解調提供了一個方法,作者另文再述。
在實際的工程中,還需要考慮AM的調制深度,這里作者引入了一個調制度參數:
由此作者可以得到真實工程系統中AM調制后的時域信號:
??
同時MATLAB中頻域波形表達式如下:
下面是調制后AM的時域波形(見圖6)
作者還仿真了AM調制信號在頻域中的波形如圖7所示。
?
讀者也看到,作者在這里為了便于觀察結果,同樣采用了歸一化的表達方式。
2 結語
AM調制是短波通信中應用最為廣泛的一種調制方法,實際工程實現中也有模擬調制和數字調制等方法,隨著現代數字器件的普及,有必要將多種調制方式集成在一塊數字芯片上,所以需要以借助于MATLAB將調制算法進行仿真驗證,為后期工作打下基礎。文章在MATLAB中采用的算法目前已經應用到機載超短波通信電臺中。
參考文獻
[1] 江濤.醫用生物電信號放大器的設計與應用[J].檢驗醫學與臨床,2010,7(2).
[2] 張科.一種基于LDO帶隙基準電壓源的設計與實現[D].成都:西南交通大學,2006.
[3] 梁廷貴,周浩淼.集成運放線性應用電路分析方法的研究[J].唐山學院學報,2009,22(6):86-89.
[4] 張科,馮全源.一種帶軟啟動電路的帶隙基準電壓源的實現[J].微電子學與計算機,2006,12.
關鍵詞:數據挖掘;供應商畫像;信用風險
0引言
在供應商信用風險管理過程中,充分利用好大數據是企業占領市場、獲取利潤的捷徑。將供應商數據化,即構建供應商畫像是企業對供應商信用進行有效管理的重要手段,其目的是供應商信用的全數據描述,根據價值細分供應商,了解供應商信用情況,制定精準的供應商管理方案,為供應商信用管理提供支持。本文基于對供應商的評價分析管理,通過對供應商信息風險管理中大數據的挖掘、分析,提出供應商畫像的概念,并以此為依據實現不同供應商信用分級管理,同時提出業務和系統的改進策略,以優化供應商之間及供應商與電網企業之間的關系。在保證服務質量的前提下,降低供應鏈運行成本,幫助電網企業建立競爭優勢,獲得更多的客戶滿意度。
1國內外數據挖掘技術的研究現狀
數據挖掘技術是一種對電力企業信用管理決策提供支持的技術,它主要是基于機器學習、人工智能、統計學等技術對大量的數據進行處理,從而做出歸納性的推理,挖掘出數據中的潛在模式,并對供應商的信用風險進行預測,從而幫助企業的決策者們及時調整市場策略以減少可能存在的風險,做出盡可能少的錯誤決策。從商業層面上來說,數據挖掘還可以描述為:按照企業既定的業務目標,對海量的業務數據進行探索和分析,從而揭示隱藏的、未知的或者驗證已知的數據的規律性,并進一步將其模型化,用戶興趣模型也就應運而生。根據已有的數據對用戶信用風險進行建模,并進行規則抽取與提煉,得到用戶的畫像。國內將數據挖掘的技術應用在電信領域的成果案例也不少。比如李軍利用數據挖掘的算法對電信行業的客戶流失模型進行建立與分析,針對不同種類的客戶分別進行了不同模型的流失分析;段云峰、吳唯寧、李劍威等在數據倉庫及電信領域的應用中,運用數據倉庫的方法對電信行業的服務客戶進行存儲管理;吳愛華在數據挖掘在客戶關系管理中的應用研究中,應用了數據挖掘的相關知識來研究數據挖掘算法在用戶關系管理中的應用;葉松云在我國電信行業客戶流失管理的建模分析及應用研究中,通過對電信行業的流失客戶進行模型建構,通過管理這個流失模型來有效控制客戶的流失。目前南方電網企業和供應商的信息交換處在一種繁雜的狀態,電網企業可以對單個供應商信用情況進行信息的查詢,反饋,但很難通過獲得的信息對多個供應商信用進行有序、有效的管理。供應商的管理缺乏直觀、可視化的手段和方法。通過建立供應商模型可以將紛亂的數據進行清洗和建模,提供進一步的分析決策。
2基于大數據分析的電力企業供應商信用風險管理
根據以上分析,在電力企業供應商信用風險管理過程中,需要對收集到的供應商數據進行處理,進行行為建模,以抽象出供應商的標簽,這個階段注重的是大概率事件,通過數學算法模型來排除供應商的偶然行為,故需要運用機器對供應商的行為、偏好進行猜測,根據供應商的關注點或投標意向、投標歷史、中標情況等因素來判斷供應商的忠誠度、履約能力、信用等級等,并對供應商行為進行建模。簡單來說,供應商畫像就是通過算法計算等方式,用統一的標準衡量供應商的表現,并對未來發展進行預測,這是一種把單個分析集成化,把平面分析立體化的過程。可見,在供應商信用風險管理過程中,應結合供應商屬性、行為、評價標簽體系,充分研究數學算法模型,并應用Python、R等工具建模推演,構建供應商評價模型,全面刻畫供應商畫像。
2.1畫像構建與數據分析
供應商畫像模型旨在幫助管理供應商、優化投標決策,因此畫像構建的關鍵過程在于結合實際業務情況定性地選取投標決策關心的供應商評價指標,定量化評價指標,最后選取合適的評價維度給供應商貼上標簽,通過不同維度的標簽還原供應商的“畫像”。因此,數據處理和分析建模的過程應該基于上述關鍵過程的指標數據特征以及業務分析邏輯。現在針對供應商畫像的研究還不算特別多,我們以流行的“用戶畫像”分析進行對比,從而可以發現供應商畫像和用戶畫像有何異同,從用戶畫像當中又能尋找到什么可行的分析思路。圖1是用戶畫像的一般流程。可以發現供應商畫像與用戶畫像的建模過程本質上都是數據收集-建模-畫像成型的過程,區別只是在于:首先,畫像構建的目的不同,用戶畫像的目的是進行精準營銷,而精準營銷的建模工作是要對用戶分類后對不同類別用戶的消費行為進行預測。而供應商畫像的目的是為了精準管理、精準招標,建模工作是要對供應商分類后對不同類別的供應商進行評級。其次,畫像的標簽維度不同,標簽維度的構建同樣是從畫像構建的目的出發,用戶畫像關心的是用戶的購買能力、行為特征、社交網絡等,供應商畫像關心的是供應商的商務狀況、產品質量、信用狀況。(1)數據收集。通過訪談和調研搜集數據,確定供應商指標的打分邏輯和統計口徑。(2)數據預處理。對收集到的數據進行清洗,目前收集到的數據量非常小,且需要進行整合、預處理,包括缺失值和異常值的處理、數據數量級的統一、后續分析所要進行的標準化處理。在構建供應商畫像的現有數據中,資格評審涉及的商務與技術兩大維度的數據已經根據權重進行了打分,分數的數量級為10以內,因此部分數據只需要剔除不滿足資格評審的數據(表現為所有維度都為0值)以及數值超出權重的分值。履約評價的數據有物資合同簽訂及時率(0-100%)、一次性試驗通過率(0-100%)、到貨及時率(0-100%)和不良行為記錄(分值范圍0.1-12)。對于這部分數據需要根據權值進行標準化,由于權值需要根據評價標準進一步確定,因此目前只需要將不良行為記錄的量化數值壓縮到與0-100%相同的范圍。(3)數據降維。目前的供應商信用風險評級指標過多,不能滿足供應商畫像的特征提取與分類要求,需要進行降維處理。擬采用關聯性分析和主成分分析降低指標維度,同時最大化保留原有數據的信息。在資格評審中,商務基本面信息的數據涉及15個指標,技術能力更是高達10余個,這些指標反映的意義具有較強的關聯性(共線性)且在有限的數據量的情況下變量過多將會大大降低模型的自由度從而影響精確度,因此為了滿足后續的分類和擬合要求,必須要剔除冗余變量,對指標進行降維處理。(4)特征分類。結合業務理解初步確定分類個數(供應商不同特征維度的級別個數),利用聚類分析算法對供應商不同特征維度進行分類,后續根據分類情況和數據特征適當調整分類個數。在構建標簽之前,需要對供應商進行分類,由于目前的數據是不具有分類結果標簽(y值),因此這是一個無監督的分類問題,無法采用決策樹、神經網絡等學習類模型;又因為目前數據集的數據量非常少,需要大量訓練數據的無監督深度學習模型也不適用,因此,針對無監督和小樣本的特點,選用聚類分析解決分類問題。聚類試圖將數據集中的樣本劃分為若干個通常是不相交的子集,每個子集稱為一個“簇”。通過這樣的劃分,每個簇可能對應一些潛在的概念(類別),如“財務狀況良好”、“技術能力強”等。不過,這些概念對于聚類算法而言事先是未知的,聚類過程僅僅能自動形成簇結構,簇對應的概念語義需要結合業務來把握和命名。常用的聚類算法有K均值算法、層次聚類算法等非常多,而針對現有的數據,K-means算法適用的情景是:簇數確定(同維度標簽評級個數確定)且較少、數據量較大;而Hierarchicalclustering適用簇數不確定(可能有一定范圍)、數據量相對大的情況。具體采用哪一種分類算法要根據數據情況以及業務分類要求和可視化要求而定。(5)分類結果檢驗。通過計算該特征維度不同類別的供應商的加權總分對分類后不同簇的供應商的總分進行統計上的顯著性檢驗。(6)構建畫像標簽。結合對供應商管理評級的業務理解,從數據層面分析該特征維度下不同簇的供應商的區別,并增加語義內容。
2.2設計供應商畫像
根據行業經驗及領先實踐,通過對南網供應商各類行為數據及外部數據進行數據采集、數據挖掘,結合公司戰略、未來發展愿景還有指標構建的一般原則,將供應商的綜合畫像構建為六大一級指標,分別為供應商資質評價、供應商履約運行評價、企業風險信用評價、社會行為與責任、供應商生態與供應商創新。其中最重要的企業風險信用評價指標包括企業基本風險(如企業人員變更頻率)、司法風險(開庭公告次數、法律訴訟次數)、經營風險(稅務評級等級、股權質押比率、動產抵押比率、司法拍賣事件次數、欠稅信息次數、行政處罰次數、抽檢檢查合格比率)。
關鍵詞 數學建模課程教學 數模競賽 創新能力培養 改革舉措
中圖分類號:G642 文獻標識碼:A DOI:10.16400/ki.kjdkz.2015.05.015
Exploration and Practice of Mathematical Modeling Activities
in the Innovation Educational Background
WANG Wenfa[1], WU Zhongyuan[2], XU Chun[1]
([1] College of Mathematics and Computer Science, Yan'an University, Yan'an, Shaanxi 716000;
[2] Office of Academic Affairs, Yan'an University, Yan'an, Shaanxi 716000)
Abstract Under the innovative education based on university personnel training requirements and problems of traditional mathematics education, the importance of mathematical modeling of students' innovative ability to Yan'an University, for example, according to "sub-level, sub-module" model of teaching and organization contest guidance, teaching and assessment in accordance with academic competitions, math majors and computer majors, two contests with a thesis project and Daiso, boutique website and digital-analog Association and second class "four convergence" approach to student innovation and innovative ability, and made remarkable achievements in personnel training, curriculum development, team building, professional building.
Key words mathematical modeling teaching; mathematical modeling contest; innovative ability training; reform measures
高等學校的大學生是國家科技發展的主力軍,大學生的創新能力決定著國家未來的科技創新能力。數學建模課程教學與競賽的廣泛開展對高等學校大學生的創新能力培養具有十分重要的作用。如何在數學建模課程教學與實踐中,既能增強大學生的數學應用意識,又能提高大學生運用數學知識和計算機技術分析和解決問題的能力,從而達到提高大學生綜合素質和創新能力的目的,這個問題是近年來眾多高校關注的問題。延安大學作為一所地方高校,在近幾年數學建模課程教學與實踐過程中,進行了一系列卓有成效的探索和改革,學生的創新意識和創新能力得到大幅度提升。
1 更新教育理念,充分認識數學建模對學生綜合素質和創新能力培養的重要性
數學作為一門基礎學科,它涉及的領域相當廣泛,如經濟、計算機及軟件、管理、國防等,雖然數學在高校教育教學中的地位不斷提高,人們對其認識也不斷加深。但是,人們對數學類課程、數學學科在創新型人才培養中的重要性仍認識不夠深入,在教學內容、教學方法、教學手段、評價措施等諸多方面,仍然沿用傳統數學類課程的教學模式和思維方式,導致高校人才培養與創新教育背景下的人才培養需求完全脫節。正如著名的數學家王梓坤院士所說“今天的數學科學兼有科學和技術兩種品質,數學科學是授人以能力的技術。”面向21世紀,高等教育在高度信息化的時代培養具有創新能力的高科技技術人才,數學作為一門技術,現已成為一門普遍實施的技術,也是未來高素質人才必須具備的一門技術。因此,在數學建模課程教學與實踐過程中,必須轉變傳統數學類課程的教育教學理念,不能將其簡單地當作工具和方法,而要將其當作是一門技術,而且是一門普遍適用的高新技術,在保證打牢基礎的同時,力求培養學生的應用意識與應用能力、創新意識與創新能力,真正實現培養高素質創新人才的目的。
2 數學建模課程教學的改革與實踐
2.1 分層次、分模塊實施數學建模課程教學和競賽指導
一是在數學建模專業課、專業選修課、公共選修課教學中按照知識點及教師研究方向,將課程內容分為兩個層次九個模塊。第一層次包括數學軟件、初等模型、優化模型、數學規劃模型、微分方程模型等五個模塊;第二層次包括離散模型、概率模型、統計回歸模型、數值計算與算法設計等四個模塊。第一層次針對公共選修課教學,第一層次+第二層次針對專業課和專業選修課教學。具體措施是:由數學建模課程教學團隊集體制定課程教學大綱和實施計劃,每位教師按照課程教學大綱和實施計劃主講自己所從事的方向模塊,在保證課程教學內容完整性和系統性的同時,根據學生知識層次,充分發揮每位教師專業優勢,有效地提升了課程教學質量;二是在大學數學課程教學中,按知識點將數學建模思想融入其中,在激發學生學習數學興趣的同時,強化學生的數學應用能力培養;三是在校內數學建模競賽中,按照“建模知識+專題講座+模擬+競賽”的模式組織校內建模競賽,主要以數學建模的基本思路、基本方法、基本技能為內容,使學生對數學建模有更加深入的感知和認識,在激發學生學習數學興趣和積極性的同時,培養學生的科研意識和創新意識;四是在全國數學建模競賽中,按照“集訓+軟件應用+舊題新做+模擬選拔+強化訓練”的模式組織全國建模競賽,主要以培養學生的洞察力、聯想力、創新能力、團隊協作精神和吃苦精神為內容,使學生的創新意識、團隊協作精神得到良好培養。
2.2 建立數學建模精品課程網站,為數學建模愛好者搭建學習交流平臺
網站將數學建模課程教學與數模競賽有機地融合,為學生全方位了解、學習和掌握數學建模的相關知識、相關技能開辟第二條通道。網站包括:課程介紹【課程描述、教學內容、教學大綱、建設規劃】、教學團隊【整體情況、課程負責人、主講教師】、教學資源【教學安排、多媒體課件、授課錄像、電子教案、課程作業、課程習題、模擬試卷、參考資源】、實驗教學【實驗任務、實驗大綱、實驗指導、課程設計、實驗作品、實驗報告】、教學研究【教學方法、教學改革、教學課題、教學論文、學生評教】、教學成果【教學成果獎、獲教學獎項、人才培養成果、教材建設】、在線學習【在線交流、在線自測】、成績考核【平時成績、作業成績、實驗成績】、下載專區【教學軟件、常用工具】、數模協會【協會簡介、協會章程、通知公告、新聞動態、競賽獲獎、優秀論文、往屆賽題、模擬賽題、校內競賽、新手入門】等,這些內容幾乎囊括了數學建模教育教學活動的所有內容,學生可以通過網絡資料學習就可以全面了解數學建模的相關知識與技能。
2.3 專業相互融合,取長補短,充分發揮學生各自專業優勢
數學與計算機科學學院現有數學與應用數學、信息與計算科學、計算機科學與技術、軟件工程四個專業,其中兩個為數學類專業、兩個為計算機類專業。在課程教學中針對兩專業的長處和不足,按照專業結隊子、學生結隊子的模式組織教學和小組討論,強化計算機類專業學生的數學應用能力培養,強化數學類專業學生的計算機軟件應用能力培養;在競賽組隊中,每隊均配備至少1名計算機類專業學生和1名數學類專業學生。充分發揮各自的優勢,取長補短,使學生的綜合能力得到提升。
2.4 延伸數學建模競賽效能,不斷提高學生的創新能力
每年全國大學生數學建模競賽和校內數學建模競賽試題都是從實際生活中提取出的實際問題。因此,指導教師在指導學生畢業論文(設計)和大學生創新訓練項目時,從往屆賽題或模擬試題中選擇一些題目,將其進行適當的延伸作為學生畢業論文(設計)和大學生創新訓練項目選題。通過這一方式,進一步培養學生的創新思維和創新意識,為學生今后從事科學研究奠定了堅實的基礎。
3 數學建模課程教學改革取得的成效
3.1 我校全國大學生數學建模競賽成績居全省同類院校前列
我校參加全國大學生數學建模競賽共獲得國家一等獎4項、國家二等獎6項、陜西省一等獎33項、二等獎71項,4次被評為優秀組織獎,1名指導教師獲陜西省數學建模競賽陜西賽區優秀指導教師,600多名學生參與大創項目,公開發表科研論文30余篇,學生的就業率和就業質量得到明顯提高。該賽事因此也成為了延安大學學科競賽品牌和亮點。
3.2 我校數學建模教育獲得多項教學成果獎、質量工程項目及教改項目
教學成果獎:“理工類大學生數學素質與創新能力培養的研究與實踐”榮獲2009年陜西省教學成果二等獎;“地方性院校開展數學建模教學的實踐與探索” 榮獲2003年延安大學教學成果一等獎;“計算機專業高素質應用型人才培養模式的改革與實踐” 榮獲2012年延安大學教學成果一等獎;“厚基礎、重實踐、強化工程素質和創新的人才培養模式的研究與實踐”榮獲2011年延安大學教學成果二等獎;“數學建模課程改革及數學建模競賽的研究與實踐”榮獲2007年延安大學教學成果二等獎。
質量工程項目:“數學與應用數學專業”為2010年省級特色專業;“數學建模教學團隊”為2011年省級教學團隊;“數學建模精品課程”為2012年校級精品課程;2014年“數學建模”課程獲批為省級精品資源共享課程;2014年“數學與應用數學”專業獲批為省級專業綜合試點項目。
教改項目:“大學生數學應用能力創新能力培養的改革與實踐”為2009年省級重點教改項目;“地方高校青年教師教學能力提升途徑的研究與實踐”為2013年省級重點;“青年教師教學能力提升的研究與實踐”為2011年校級重點;“計算機相關專業校企合作人才培養模式改革的研究與實踐”為2013年校級重點。
3.3 依托數學建模教育平臺,推動指導教師教學科研能力和綜合素質提升
數學建模教育不僅提高了學生的創新能力,同時也為指導教師的教學、科研及綜合素質的提升起到了推動作用。數學建模課程是一門面向全校理、工、經、管、教各學科專業大學生開設的理論與實踐相結合的基礎課程,主要以學生的洞察能力、創新能力、數學語言翻譯能力、抽象能力、文字表達能力、綜合分析能力、思辨能力、使用當代科技最新成果的能力、計算機編程能力、數學軟件應用能力、團隊協作精神和組織協調能力等綜合素質培養為目標,以數學建模課程教學、數學建模競賽、第二課堂、畢業論文(設計)、大學生創新訓練項目等為手段,通過“分層次、分模塊、四融合”的教學模式的有效實施,在提高我校學生解決在理、工、經、管、教等學科專業領域遇到的數學建模問題的能力的同時,為我校高素質、應用型人才培養做出貢獻。
基金項目:2013 “地方高校青年教師教學能力提升途徑的研究與實踐”(項目編號:13BZ37);2014年陜西本科高等學校“精品資源共享課程建設”項目“數學建模”課程建設階段性成果
參考文獻
關鍵詞:BP神經網絡;成本估算;武器裝備
一、我國常用的軍品成本估算方法
針對武器系統的成本估算,國內外常用的一般方法有四種:參數估算法、工程估算法、類推估算法和專家判斷估算法。
1.參數估算法,又稱經驗公式法。這種方法實際上是使武器系統的費用與武器系統的特點或重要參數之間建立起費用估算關系。而這些費用變量都有一個數學值范圍,并不只是一個值。它的函數形式就是成本估算關系式。簡言之,它是利用類似系統的歷史費用數據去推導新型武器系統的費用。
2.工程估算法,又可稱之為單價法或直接法。它的主要做法是根據工作分解結構在對各個獨立部分和系統零部件的料、工、費進行詳細估算的基礎上,再將各單項估算值綜合為總的成本費用。所以,該方法有時又被稱為“自下而上”的成本估算法。
3.類推估算法實際上是將擬議中的產品、裝備、系統功能與以前的某個系統的可比部分或類似部分進行直接比較。這種方法既可用于直接與具有同樣操作或工作特性的類似系統進行比較,也可將被估系統直接與具有許多相同費用特性的不同系統進行比較。
4.專家判斷法類似于專家推測法。它要求估算者擁有關于系統或系統部件的綜合知識。在經驗數據不足或沒有足夠統計資料的情況下,往往需要用這種方法。
除以上常用的4種方法之外,目前討論的比較多的方法還包括以下3種:
1.灰色系統方法。通過對主導因素建立GM(1,1)模型,對關聯因素建立GM(1,N)模型,最后得到系統的狀態方程模型,按狀態模型對系統進行預測。通常采用GM(1,1)和GM(1,N)相結合的方式。大致步驟為:一是確定系統的主導因素和關聯因素;二是建立GM模型群,對主導因素建立GM(1,1)模型,其余因素建立GM(1,N)模型,組成線性方程組;三是根據GM模型組得出狀態方程矩陣求解狀態方程。灰色系統能夠適應樣本數較少的情況。如孫本海(2002)在他的碩士論文中使用灰色系統理論中的殘差模型和改進的G-N迭代法構建了炮兵武器裝備費用的參數模型。郭繼周等人(2004)用灰色系統理論進行費用預測的方法,建立了GM(1,1)模型及GM(1,1)預測模型。陳尚東等人(2008)針對地空導彈維修費用數據量有限規律性不同的特點,選用灰色理論進行維修保障費用預測:首先,簡要分析了GM(1,1)模型,討論了維修費用數據的處理;然后,以某新型地空導彈武器系統為例,具體探討了灰色預測模型的應用,并對比分析了老信息灰色預測、新信息灰色預測和新陳代謝預測模型的精度。
2.模糊綜合評價方法。模糊綜合評價方法(FCE)是一種應用非常廣泛和有效的模糊數學方法。它應用模糊數學的有關方法和理論,通過建立隸屬度函數,考慮不可量化因素的影響,進行綜合分析和評價。如郭建華等人(2004)利用模糊綜合評價模型對武器裝備項目的研制費用進行了估算。
3.人工神經網絡(ArtificialNeuralNetwork,ANN)方法。目前采用較多的是BP(BackPropagation)神經網絡預測模型法,具體步驟:一是選取學習樣本,對權值進行初始化;二是訓練學習樣本;三是用測試樣本進行數據仿真。可以證明,對于任何一個在閉區間內的連續函數都可以用帶一個隱層的3層BP網絡來逼近。如劉銘等人(2000)提出了一種基于BP神經網絡的防空導彈采購費估算模型,并對典型的防空導彈采購費進行了估算。劉國利等人(2003)根據導彈武器系統研制的特點,分析并確定了影響導彈武器系統研制費用的主要因素,提出了基于人工神經網絡的費用預測模型。
軍品的費用估算是一項持續性的工作,貫穿于軍品研制的全過程,隨著研制工作的進展,采用的估算方法應越來越詳細、精確。以上介紹的7種方法各有各的特點,在不同的條件下都具有特定的使用價值,具體對比情況見表1。
二、ANN方法和BP網絡的優點
神經網絡的建模能力也是由參數決定的,但它有別于回歸分析方法,它只限制所包含多項式的整體個數,不限制它們的階數,即在參數一定的情況下,可以通過學習(即各分量的競爭)來合理選擇任意階數的項。這體現了神經網絡的非線性特性,因而在總體上其精度由于傳統的回歸分析方法。
運用神經網絡方法建模的另一個原因是,在實踐中,我們雖然可能擁有已研制軍品的相關費用數據,但這些信息常常是不完整的,而且往往含有傷殘結構及錯誤成分,且具有不確定性,這些問題給以往的處理方式造成很大的困難。而神經網絡可以通過不斷地學習,從典型型號研制相關費用數據中學會處理這些問題,且能補全不完整的信息,并根據已學會的知識和經驗對復雜問題做出合理的判斷,以做出有效的預測和估計。
運用神經網絡方法建模的一般過程包括確定系統需求描述、選擇神經網絡模型(包括神經網絡結構、訓練方法等)、數據預處理、確定神經網絡的可執行代碼、訓練和測試等過程,具體情況見圖1。
這里需要特別說明的是神經網絡模型的選擇問題。目前,在數于種網絡結構、上百種訓練學習算法中,應用最廣泛、技術最成熟的是多層前向式網絡結構,應用誤差反向傳播算法(ErrorBackPropagationLearningAlgorithm),簡稱為BP網絡。這主要歸結于基于BP算法的多層感知器具有以下一些重要能力。
1.非線性映射能力。BP網絡學習能學習和存儲大量輸入-輸出模式映射關系,而無須事先了解這種映射關系的數學方程。
2.泛化能力。BP網絡訓練后將所提取的樣本對中的非線性映射關系存儲在權值矩陣中,在其后的工作階段,當向網絡輸入訓練時未曾見過的非樣本數據時,網絡也能完成有輸入空間向輸出空間的正確映射。
3.容錯能力。BP網絡允許輸入樣本中帶有較大的誤差甚至個別錯誤。因為對權矩陣的調整過程也是從大量的樣本對中提取統計特性的過程,反映正確規律的只是來自全體樣本,個別樣本中的誤差不能左右對權矩陣的調整。
三、某型號無人機成本估算的BP模型
1.確定樣本集。為了驗證前文所說的BP神經網絡在成本估算中的準確性,本文選擇了八中型號的無人機來進行模擬運算。具體的數據見下表(表2)。
由表2可知,本文選擇了與最后的整機價格有主要關系的6個性能指標,分別是導航定位精度、飛行高度、控制半徑、最大平飛速度、續航時間和任務載荷。這六個性能指標是作為BP神經網絡模型的輸入項(in)存在的,而最后一項整機價格則是作為模型的輸出項(out)。需要說明的是,根據前文的思路,本部分使用BP神經網絡估算的應該是軍品的成本,而不是軍品的整機價格。在表5中之所以使用整機價格,主要是因為表中的價格是按照目前的軍品定價模式計算出來的,即只要在整機價格的基礎上除以(1+5%)就是飛機的成本。根據神經網絡和本文研究的特點,此處使用整機價格并不影響最終結論的正確性。另外,為了保證結果的真實性,表中的整機價格在軍方審價完成之后,承制方與軍方最終的成交價格。還需要說明的是,有兩個因素可能會影響本案例研究的精確性:一是為了搞好保密工作,本表格提供的數據是經過了脫密處理的。二是本文樣本的數量不大,只有用來供神經網絡學習的樣本只有6個(前面6個型號),用來測試的只有2個(最后的2個型號),這必然會影響結果的精度。但是只要誤差在本文認為的可接受的范圍內(≤20%),本文就認為研究結果有效。
2.確定網絡結構和算法。本案例的BP神經網絡結構如圖2。
由上圖可知,該BP神經網絡的結構由6個性能指標構成輸入層,輸出層只有一個節點即整機價格。中間的隱層包含7個神經元節點。
本文采用的是MATLAB的BP神經網絡工具箱中的Trainlm函數建立的模型,它采用的是L-M算法。
3.數據標準化、訓練和測試。本文采用的MATLAB版本是MATLAB7.70(R2008b),該版本的功能比較強大,對數據的要求不像以前的那么嚴格(以前版本的MATLAB要求節點輸入和輸出值的大小在[0,1]),所以筆者在并不需要對數據進行標準化。這樣不僅能夠減少模型的計算量,而且還有利于提高最終結果的精確度。
4.結果。根據前文構建的軍品成本估算BP模型,以及上文確定的算法和過程,在經過了5次迭代后得到結果見表3。
由上面的結果可知,對高速無人機1和高速無人機2測試的誤差都在20%以內,是在前文限定的范圍內,因而筆者認為這個結果是可以接受的。并且,測試結果表明目前的定價還是略高于計算值。
四、存在的問題
在將BP神經網絡模型應用于無人機的過程中,筆者認為以下幾個方面的問題是比較難把握的。
1.輸入層節點個數的控制。就本案例來說,輸入層有6個節點,也就是6個性能指標。正如前文所言,選擇的這6個性能指標是因為它們與最后的整機價格有主要關系。這個判斷主要是根據專家的判斷和實際的做法得出來的,所以其中的主觀性很大。如果選擇的尺度或標準稍微有所變化,那么指標的個數就會發生變化。而且我們如果要判斷到底需要幾個指標才能達到最好的預測效果。
2.隱層節點數的控制。這里包括兩個問題:一是包括幾個隱層?二是隱層中包括幾個節點。一般來說一個隱層的BP神經網絡就能很好的學習和測試,就筆者看到的文獻而言,也主要是一個隱層。關于隱層中節點的個數,沒有具體的規則,只能根據結果調整,這就對研究者使用MATLAB進行BP神經網絡建模的經驗和技術提出了挑戰。
【摘要】 采集了來自全國20種單植物源和其它多植物源的101份的蜂蜜樣品,分別運用傅立葉型近紅外光譜儀采用光纖透反射(800~2500 nm,2 mm光程)和透射(800~1370 nm,20 mm光程)采集方式獲得近紅外光譜,來預測蜂蜜中結構和含量都很相近的果糖和葡萄糖含量。結果發現,兩種測量方式下果糖、葡萄糖的預測準確度存在著較大的差異。為了分析這種差異產生的原因,采用支持向量機分析其非線性信息,采用遺傳算法分析其特征波長,結果表明: 這種差異主要來自兩種糖分特征波長分布不同所導致。通過對兩種糖分的檢測方案進行優化,得出在利用近紅外光譜技術檢測蜂蜜中葡萄糖成分含量時應盡量采集短波區、長光程的光譜,或者對全譜區、短光程的光譜,進行特征波長的提取,避開水分的干擾,從而提高其預測精度;而對于果糖,則應盡量采集全譜區、短光程的光譜;采用常用線性定量建模方法PLSR就可以得到很好的預測模型,非線性的支持向量機模型未能明顯提升模型性能。
【關鍵詞】 蜂蜜; 近紅外; 果糖; 葡萄糖; 特征波長
Abstract A total of 101 honey samples that originated from 20 different unifloral honey and other multifloral honey samples were collected from China.FT-NIR spectrometer were applied to determinate the content of fructose and glucose of honey with two different modes:transflectance (800-2500 nm,2 mm optical path length) and transmittance (800-1370 nm,20 mm optical path length).It was found that the prediction accuracy of fructose and glucose had significant difference with the two modes.In order to analyze the reason of this difference,support vector machine (SVM) was used to analyze the non-linear information,and genetic algorithm (GA) was used to analyze the characteristic wavelengths.The result indicated that the detection difference of fructose and glucose was originated from their different characteristic wavelengths.Through the optimization of detection method,it was found that for the determination of glucose,short wavelength and long optical path length should be used,on the other side,the whole wavelength region and short wavelength,with selecting the characteristic wavelength to avoid the disturb of water can also be used.For the determination of fructose,whole wavelength region and short optical path length should be used.Linear regression methods such as PLSR could obtain good results,and non-linear methods such as SVM did not improve the model performance.
Keywords Honey; Near infrared spectrometry; Fructose; Glucose; Characteristic wavelengths
1 引言
蜂蜜中含有糖類、水分、礦物質、維生素、蛋白質、氨基酸乙酰膽堿、生物類黃酮等180余種不同物質成分。糖類物質是蜂蜜的基本成分,占70%~80%。其中,主要成分是葡萄糖和果糖,約占總糖分的85%~95%;其次是蔗糖,一般不超過5%。除此之外,蜂蜜中還含有少量如麥芽糖、乳糖、棉子糖、松三糖等20余種雙糖和多糖。果糖和葡萄糖的含量最高,分別約占蜂蜜質量的38%和31%〖1〗。
近紅外光譜技術〖2〗具有快速、簡便、無樣品預處理、無損傷等特點,并結合化學計量學方法提取光譜有效信息進行樣品定性或定量分析被應用到很多領域。文獻〖3,4〗研究了近紅外透反射法對于蜂蜜中果糖、葡萄糖含量檢測的可行性,并取得了較好的效果,可以有效解決現有高效液相色譜法檢測中耗時、繁瑣的問題。對于果糖、葡萄糖這兩種在蜂蜜中含量最高、化學結構相似的單糖類物質,不同學者研究采用了不同光譜區間、光程等采集參數來探索其快速檢測的可行性。Qiu等〖3〗利用1 mm光程、400~2500 nm波段近紅外光譜建立果糖和葡萄糖PLS模型,預測集決定系數(R2)分別為0.97和0.91。Garcra等〖4〗利用2 mm光程、400~2500 nm波段近紅外光譜建立果糖和葡萄糖PLS模型,預測集決定系數(R2)分別為0.98和0.95。上述研究結果表明, 運用近紅外光譜技術可以對蜂蜜中的果糖和葡萄糖含量進行快速檢測,但僅集中于某種采集方式下線性定量模型的研究,尚未見對其非線性問題的研究。同時對于由于不同采集方式和參數下這兩種單糖預測精度的差異性問題及其預測條件的優化問題也缺乏深入研究。本研究通過比較光譜區間、光程等采集參數,采用偏最小二乘回歸線性建模支持向量機非線性建模、采用遺傳算法分析蜂蜜中果糖和葡萄糖的特征波長等分析近紅外光譜法檢測蜂蜜中果糖和葡萄糖含量的差異性問題,優化其最佳檢測方案,以提高近紅外光譜法檢測蜂蜜中果糖和葡萄糖含量的預測精度,并為其在不同實際運用條件下提供可行的檢測方案。
2 實驗部分
2.1 蜂蜜樣品的采集
本研究分別采集了四川、江蘇、山西、山東、浙江、福建、河南、吉林、河北、安徽、河北、廣西、陜西、遼寧、天津、北京等蜂蜜著名產地的蜂蜜樣品,不僅充分代表國內樣品品種和產地的特性,也代表了我國蜂蜜的主要出口品種的特征。
本研究的蜂蜜品種也具有很好的代表性,共收集洋槐、琵琶、棗花、五味子、益母草、紫云英、荊條、黨參、荔枝、椴樹、枸杞、、桂花、玫瑰花、山茶、油菜、柑橘、白刺花、羅布麻、丹參20種單植物源蜂蜜(Unifloral honey),以及混合植物源蜂蜜(Multifloral honey)共101個蜂蜜樣品。
2.2 光譜采集儀器及方法
本實驗采用了常見的傅立葉型近紅外光譜儀的兩種不同采集方式(樣品池透射、光纖透反射)來采集蜂蜜的近紅外光譜。
光譜采集在環境溫度可控的實驗室內(溫度控制為26 ℃)進行。每次測試前都必須先預熱儀器30 min。同時,由于部分蜂蜜存在結晶現象,在實驗前對結晶蜂蜜樣品采用40 ℃水浴中加熱,直至結晶完全溶化,再降至室溫(26 ℃)。
光譜采集均采用BRUKER ISF/28N型傅立葉型近紅外光譜儀(BRUKER公司),具體采集方法如下:蜂蜜的傅立葉透射光譜采集,附件:石英透射樣品池,光程:20 mm,掃描譜區:3600~12500 cm-1,分辨率:8 cm-1,掃描次數:32次;蜂蜜的傅立葉光纖透反射光譜。附件:石英液體透反射光纖探頭;光程:2 mm(間距為1 mm);掃描譜區:3600~12500 cm-1;分辨率: 8 cm-1;掃描次數:32次。均采集空氣為背景。
2.3 蜂蜜果糖和葡萄糖含量的測定
果糖的結構簡式CH2OH(CHOH)3(CO)CH2OH,其水溶液又稱“左旋糖”;葡萄糖的結構簡式CH2OH(CHOH)4CHO,其水溶液又稱“右旋糖”。葡萄糖與果糖互為同分異構體,葡萄糖是多羥基醛(醛糖),果糖是多羥基酮(酮糖)。國家標準中規定,蜂蜜中果糖和葡萄糖的含量必須≥60%〖5〗*
本實驗中蜂蜜的果糖和葡萄糖含量按照國標GB/T 18932.22-2003(蜂蜜中果糖、葡萄糖、蔗糖、麥芽糖含量的測定方法-液相色譜示差折光檢測法)測定。
2.4 支持向量機及特征波長選擇算法
支持向量機(Support vector machines,SVM)是一種新型的非線性近紅外建模方法,SVM是建立在結構風險最小化(Structural risk minimization)原則基礎上的,因而從理論上保證了其在小樣本擬合時也能具有較好的泛化能力。最小二乘支持向量機(LS-SVM)是一種經典SVM的改進方法,以求解一組線性方程代替經典SVM中較復雜的二次優化問題,降低了計算復雜性,加快了求解速度。構建LS-SVM模型需確定兩個重要模型參數:γ和核函數參數(本實驗采用徑向基核函數,模型參數為σ2),采用二步格點搜索法(Grid searching technique)和留一法交叉驗證法(Leave one-out cross validation)相結合,對這兩個模型參數進行全局尋優〖6〗匝盜芳徊嫜櫓の蟛罹礁RMSECV)為參數選擇指標。
針對近紅外光譜采樣點數較多的特點,為防止發生過擬合現象,本研究采用反復遺傳算法(Iterative GA-PLS)〖7~9〗 選擇特征波長。對包含2205個波長點的波長段,去除最后5個點,將每11個連續波長點取平均值作為一個新變量,總計200個新變量,經過5次重復遺傳算法后,將原始波長點挑選出來再進行遺傳算法。其算法的具體參數設定為:初始群體大小為30,最大繁殖代數100,交叉概率0.5,變異概率0.01。
2.5 回歸模型評價指標
由于每次測量的蜂蜜光譜總體能量不同,光譜間差異較大。為了消除由于儀器每次測量所帶來的能量差異,本研究在數據分析和數學建模前,分別對校正集和預測集光譜進行標準化(Auto-scaling)處理,然后利用偏最小二乘回歸法(PLSR)對數據進行多元統計分析。應用非線性迭代偏最小二乘(NIPALS)算法求取偏最小二乘因子。校正模型的最佳因子個數(#LV)由舍一交互驗證法(LOOCV)的預測殘差平方和(PRESS)來確定。數據預處理和建模過程中的所有計算均由自編的MATLAB 7.0程序完成。校正模型的性能通過相關系數(r)評價其相關性,校正誤差均方根(RMSEC)作為校正集的評估標準,預測誤差均方根(RMSEP)反映模型對未知樣本的預測效果。
相對標準偏差RSD反映模型對某一組分的總體測定效果,即測定精度。它包括校正相對標準偏差RSDc和預測相對標準偏差RSDp,具體表示分別為:
RSDC(%)=100×RMSEC/ymc(1)
RSDP(%)=100×RMSEP/ymp(2)
式中: ymc,ymp分別為樣品校正集和預測集真值的平均數。一般來說,r 越接近1,RSD越小,表明校正模型的校正精度和測定精度越高,而小的RSD比大的r 更為重要。
3 結果與討論
3.1 蜂蜜果糖和葡萄糖的PLS模型差異
本實驗采集了近紅外譜區譜區3600~12500 cm-1的信息。對于傅立葉2 mm透反射光譜,由于檢測器檢測范圍的原因,在3600~4000 cm-1波段的光譜噪聲較大,因此在下面的研究中截取了波段為4000~12500 cm-1(800~2500nm)波段的光譜為研究對象。而傅立葉20 mm透射光譜圖譜在1370 nm后光譜嚴重溢出,因此采用800~1370 nm波段的光譜為使用光譜。圖1分別為波段截取后的101個蜂蜜樣本采用傅立葉光譜儀采集的光程為2 mm光纖透反射光譜及光程為20 mm透射光譜。
圖1 蜂蜜的傅立葉光纖透反射光譜圖(a)和傅立葉透射光譜圖(b)(略)
Fig.1 Fourier transform(FT) transflectance spectra(a) and FT transmittance spectra(b) of honey samples
首先,對測得的101個樣品的果糖、葡萄糖含量進行異常值篩選,先剔除8個果糖異常的樣品和1個葡萄糖異常的樣品,然后利用外在學生化殘差-杠桿值圖〖10〗剔除剩余樣品中的異常樣本。為了更好地體現模型的穩定性,本實驗首先根據蜂蜜各成分的分布,按照校驗集與預測集之比為2∶1,3∶1,7∶3,4∶1和5∶3的5種比例,采用K-S法〖11〗進行了樣品集的選擇,然后分別建立模型。研究結果表明,不同比例分組后模型表現了較好的穩定性。〖JP2〗挑選出所建立的果糖和葡萄糖模型中較有代表性的分組方式,作為不同采集方式的模型效果比較時的代表,被挑選出的代表性分組后的樣品統計數據見表1。
表1 蜂蜜樣品參考值的統計特征(略)
Table 1 Statistic major components of calibration and prediction sets of honey
為檢測蜂蜜中果糖和葡萄糖含量,建立了800~2500 nm波段、光程為2 mm透反射光譜和800~1370 nm波段、光程為20 mm透射光譜的PLS模型,模型結果見表2。通過PLS建模結果可以看出,在800~2500 mm這個近紅外全譜區建立的線性定量模型,果糖相關系數(r)為0.9311,預測相對誤差(RSDp)為5.45%;葡萄糖相關系數(r)為0.8291,預測相對誤差(RSDp)為8.81%。同時,在800~1370 nm這個近紅外短波區建立的定量PLS模型,果糖相關系數(r)為0.9297,預測相對誤差(RSDp)為6.38%;葡萄糖相關系數(r)為0.8907,預測相對誤差(RSDp)為7.87%。由此可見,采用全譜區、短光程光譜建模葡萄糖的預測精度低于果糖,而在短波區利用長光程光譜建立的模型相對于全譜區葡萄糖的預測精度有一定提高,而果糖預測精度反而有一定下降。因此,在利用近紅外光譜技術檢測蜂蜜中葡萄糖成分含量時應盡量采集短波區、長光程的光譜; 而對于果糖,則應盡量采集全譜區、短光程的光譜。
表2 蜂蜜近紅外模型結果(略)
Table 2 Results of the NIR spectra of honey
MSEC:root mean square error of calibration; RMSER:root mean square error of prediction.
3.2 基于LS-SVM的果糖和葡萄糖模型優化研究
在比較不采集方式對蜂蜜中果糖和葡萄糖建立近紅外線性定量預測模型效果后,采用LS-SVM建立蜂蜜中果糖和葡萄糖的非線性模型。本研究中,果糖γ和σ2的搜索范圍分別為1~500和0.1~1000,尋優過程與結果:最優γ和σ2分別為124.7491和237.5784。葡萄糖γ和σ2的搜索范圍分別為1~500和0.1~1000,尋優過程與結果:最優γ和σ2分別為320.9671和170.5475。由表2可見,利用LS-SVM建立800~2500 mm譜區建立果糖的非線性定量模型的預測結果為:果糖相關系數(r)為0.9264,預測相對誤差(RSDp)為5.5%;葡萄糖相關系數(r)為0.8364,預測相對誤差(RSDp)為9.11%。這與用PLS線性定量模的效果基本相同。可見,果糖和葡萄糖在蜂蜜中含量較高,其信息受背景影響較小。因此,采用常用線性定量建模方法PLSR就可以得到其很好的預測模型。
3.3 蜂蜜中果糖和葡萄糖特征波長的提取及近紅外檢測差異性分析
利用反復的遺傳算法(Iterative GA-PLS)在全譜范圍內選取了蜂蜜中果糖和葡萄糖的特征波長。經過遺傳算法的計算,得到蜂蜜中果糖的特征波長集中在1845~1846 nm,1892~1893 nm,1949~1951 nm,1964~1967 nm和2225~2230 nm這幾個波段; 葡萄糖的特征波長集中在832~833 nm,878~879 nm,1209~1211 nm,1234~1236 nm,1245 nm,1634~1639 nm,1790 nm,1854~1858 nm和2184~2190 nm這些波段。經過遺傳算法后用PLS建模的模型結果見表2。從表2可以看到,經過特征波長選擇后果糖模型的預測精度較原始波長基本沒有變化。模型預測相對誤差(RSDp)由5.45%上升到5.57%,r由0.9311下降到0.9300。而葡萄糖的的預測精度較原始波長下有較大程度的提高,模型預測相對誤差(RSDp)由8.81%下降到6.59%,r由0.8231提高到0.9041。
從圖1a所示的蜂蜜光譜圖可見,蜂蜜在近紅外譜區的光譜圖主要吸收峰位于1450, 1940, 2100, 2280和2350 nm,這些吸收峰中1450和1940 nm主要是由于水的吸收所導致。其中1450 nm為OH的伸縮振動的一級倍頻〖12〗,而940 nm為OH的伸縮振動的二級倍頻〖12〗。這2個波長點是水的吸收峰,由于水的吸收很強(特別是蜂蜜中含水量約為17%),因此蜂蜜光譜圖吸收蜂很大。而同樣作為水的吸收峰的1190 nm處,由于本研究采用的透反射光程較短(2 mm),因此在短波區吸收不強烈。
葡萄糖和果糖的分子式相同,不同之處在于兩者分子結構中羥基的位置不同,這個差異可能導致兩者在近紅外區的吸收特性不同。從遺傳算法挑選出的特征波長可以看出,果糖的特征波長大多分布在1800 nm 以上的波段,而葡萄糖在1100 nm以下也有明顯的特征波長。比較表2中透反射模型和透射模型可以發現,在采用傅立葉透反射方式采集全譜(800~2500 nm)建立模型時,由于采用光程較短(2 mm),因此在短波區得到的信息較弱,易被水等背景干擾因素影響,使得模型的預測精度受到影響,但對果糖和葡萄糖模型的影響程度不同。其中果糖的預測效果較好,RSDp為5.45%;而葡萄糖預測誤差較大,RSDp為8.81%。當采用傅立葉透射方式采集800~1370 nm范圍內較長光程的光譜時,葡萄糖模型的預測精度明顯提高(RSDp為7.87%),并且與果糖模型的差異變小(果糖的RSDp為6.38%)。因此,對于蜂蜜中成分、結構都非常相似的兩種糖分,在利用近紅外光譜技術檢測時應采用不同的技術方案。對于蜂蜜中的葡萄糖,應盡量采集短波區、長光程的光譜,或者對全譜區、短光程的光譜,進行特征波長的優化提取,從而改善其預測精度;而對于果糖,則應盡量采集全譜區、短光程的光譜。
對于蜂蜜中成分、結構都非常相似的葡萄糖和果糖,在利用近紅外光譜技術檢測時應該采用不同的技術方案。對于蜂蜜中的葡萄糖,應盡量采集短波區、長光程的光譜,或者對全譜區、短光程的光譜,進行特征波長的優化提取,從而改善其預測精度;而對于果糖,則應盡量采集全譜區、短光程的光譜。同時,通過對各種檢測方案及建模算法的優化,預測結果仍然是果糖優于葡萄糖。除了特征波段分布不同外,可能還存在著更深層次的原因,有待于進一步研究。
參考文獻
1 White J W,Riethof M L,Subers M H,Kushnir I.Technical Bulletin 1261,U.S.Department of Agrioulture Washington D C,1962,1261:1~42
2 Dull G,Birth G S,Smittle D A,Leffler R G.Journal of Food Science, 1989,54(2):393~395
3 Qiu P Y,Ding H B,Tang Y K,Xu R J.Journal of Agricultural and Food Chemistry,1999,47(7):2760~2765
4 Garcia-Alvarez J F,Huidobro M H,Rodriguez-Otero J L.Journal of Agricultural and Food Chemistry, 2000,48(11):5154~5158
5 GB 18796-2005, Honey(蜂蜜).National Standards of the People’s Republic of China(中華人民共和國國家標準)
6 YU Ke(虞科), CHENG Yi-Yu(程翼宇).Chinese J.Anal.Chem.(分析化學), 2006, 34(4):561~564
7 Leardi R.Journal of Chemometrics, 1994,8(1):65~79
8 Leardi R,González A L.Chemometrics and Intellingent Laboratory Systems, 1998,41(2):195~207
9 Nrgaard L,Saudland A,Wagner J,Nielsen J P,Munck L,Engelsen S B.Applied Spectroscopy, 2000,54(3):413~419
10 Otto M. Translated by SHAO Xue-Guang(邵學廣),CAI Wen-Sheng(蔡文生),XU Xiao-Jie(徐筱杰). Chemometrics:Statistics and Computer Application in Analytical Chemistry(化學計量學:統計學與計算機在分析化學中的應用). Beijing(北京):Scientific Publishing Company(科學出版社),2003:39