前言:想要寫出一篇引人入勝的文章?我們特意為您整理了農業病害預測人工神經網絡的應用范文,希望能給你帶來靈感和參考,敬請閱讀。
我國是一個傳統農業大國,在農業種植和病害綜合防治方面積累了大量經驗。我國耕地面積占世界耕地面積的7%,農作物病害是我國的主要自然災害之一,具有突發性、普遍性和危害性3個顯著特點[1]。每年全世界范圍內因為農業病害所導致的糧食減產達到了總產量的10%[2],造成了巨大的經濟損失。因此,加強農業病害綜合防治工作,對農業經濟發展具有重要意義。農業病害預測是一種非常有效的手段,對降低農業病害的危害具有重要作用。進入21世紀后,人工神經網絡不斷發展,其在現代農業應用方面取得了非常好的效果,特別是在“智慧農業”發展方面提供了一種強有力的支持。馬麗麗等[3]建立BP(BackPropagation)神經網絡,對發生在黃瓜上的4種常見病害發生情況進行了預測。張映梅等[4]利用BP神經網絡對小麥吸漿蟲的發生程度進行預測,也取得了理想的效果。由此可見,利用人工神經網絡對農業病害進行預測是一種非常有力的手段。
1病害預測方法概述
在農業病害防治工作中,為實現最好的防治效果,往往在病害大面積發生前對病害的發生面積、發生程度、發展方向等先進行全面的預測。這樣一來,在病害發生前便可以采取相應的措施,使病害發生的泛濫程度大幅度減小,從而降低病害的危害程度。病害的預測方法主要分為四大類:專家評估法、類推法、數理統計模型法和系統模擬模型法[5]。一是專家評估法。此方法是一種人為的預測方式,即通過本領域的專家們利用他們所掌握的農業病害知識對病害的發生進行分析總結,最后再得出預測結果。二是類推法。通過對以往的病害發生程度進行一種經驗上的預測。但此類方法不適合復雜環境下的病害預測,預測方式單一,往往只能在本地區病害類型不多的情況下達到預測的效果。三是數理統計模型法。通過記錄并分析病害發生前各項可能導致病害發生的環境因素,建立數理模型并進行預測。模型可以根據調查取得的影響病害發生的因子直接得出病害發生程度。如劉方等[6]利用數理統計模型中的馬爾科夫鏈模型對未來降水量進行預測。四是系統模擬模型法。此方法也屬于數理模型法,只是針對模型計算采用計算機。利用計算機高速運算能力可以很好地對模型進行計算并很快得到結果。但是,這種預測方法的模型構建比較復雜且不易擴展。根據農業病害發生的特點[7],可將農業病害預測分為3種類型,即病害發生期預測、病害發生量預測和病害發生分布預測[8]。通過這幾種方式的預測,就可大致掌握農業病害發展趨勢。病害發生期預測又可分為短期預測、中期預測、中長期預測、長期預測。針對不同的病害可以采用不同的預測方式,通過預測發生期可以實時掌握病害的發生趨勢。
2農業病害預測研究
農業病害的發生不僅由外部因素導致,還有內部因素的原因。外部因素具體表現為環境氣候,如溫度、降水量、日照時長、昆蟲攜帶病菌導致的感染。除此之外,土壤中微生物也會導致病害發生。如劉德飛等[9]通過分析發現,土壤中大量菌群對病害微生物的生長有益。內部因素常表現為作物本身早已攜帶了病菌,導致作物一開始就已經被病害感染。我國早在20世紀50年代就開展了病害預防預測工作,在農業病害預測技術上積累了大量經驗。在經歷了傳統的經驗預測、試驗預測、統計預測和信息預測[10]后,直到20世紀80年代,人工神經網絡與非線性理論的引入,為病害的預測方式方法開辟了一條新道路,使農業病害預測方式更加多樣化。
2.1傳統病害預測方法
傳統病害預測方法主要是通過專家評估和數理統計模型進行預測,類推法和系統模擬法分別屬于這2種模型中的一種分支。專家預測法是由各個學科的專家們根據病害的發生類別、病原、狀態特點、發生規律、診斷方法、無公害防治等內容[11]建立知識庫。通過專家對知識庫的數據進行分析處理,再創建專家決策系統對病害的發生做預測;數理統計模型是通過對引起病害發生的各種外部條件進行大量統計并建立模型,得出一種綜合預測結果。這在一定條件下是有效的,但預測結果不穩定[12]。傳統病害預測方法在病害預測上能起到一定的效果,病害發生是一種根據時間線發生的行為,也是一種動態行為,以上的預測方法為靜態(預測模型為靜態),隨著時間的推移,病害綜合防治方法也會導致病害防治效果下降。如果長期使用這些方式進行預測,預測精度會大幅下降。為了解決這種問題,常用方法是定期重新評估模型并改進。這樣雖然能達到最終目的,但必然會使預測工作量增加,人工神經網絡的出現恰好能解決這個問題。
2.2基于人工神經網絡的病害預測
2.2.1人工神經網絡概述。人工神經網絡是為了使計算機模擬人腦思維方式進行學習的一種網絡模型,最早由20世紀40年代的心理學家McCulloch以及數學家Pitts提出[13]。人工神經網絡是由若干個網絡最基本單位“神經元”構成,不同層的神經元與神經元之間相互連接,2個神經元之間的連線叫作權值,是前一個神經元的加權值,后一個神經元中存儲的就是上一個神經元和權值共同計算后的結果。權值可以理解為人工神經網絡的記憶,人工神經網絡需要進行的訓練過程就是網絡通過對數據樣本的學習,通過不斷調整網絡中的權值,讓人工神經網絡記住數據樣本分布情況,從而完成人工神經網絡的訓練過程。人工神經網絡一經提出就引起了學術界的大規模研究,但是由于當時的計算機計算速度慢和理論不夠健全等原因,其曾經被認為人工神經網絡只停留在理論研究階段,是不能夠在實際中去實現的模擬人腦學習[14-15],直到J.J.Hopfield提出了Hopfield神經網格模型以及計算機在計算速度上取得了突破,使人工神經網絡的研究工作重新得到科學家的認可,并開展相關研究。人工神經網絡具有強大的非線性逼近能力[16]和自適應能力,能夠感知環境變化,從而自動調節網絡結構。人工神經網絡具有強大的容錯能力,個別樣本的誤差對整體誤差的影響非常渺小。上述這些特性使人工神經網絡在解決預測問題和分類問題時能夠比很多傳統方法處理的效果要好,例如文字翻譯、語言識別、圖像識別、氣象預測、人機對話等。
2.2.2基于人工神經網絡的病害預測。研究表明,排除人為因素,農作物病害發生與當季的氣候因子和土壤微生物有巨大的關系,主要是各類微生物在溫度、濕度、陽光、降雨等氣候條件適宜其生存時,真菌孢子就會大量繁殖并侵害作物,使作物發生病變[17]。風是病害傳播的一個重要途徑,真菌孢子很輕,只需有一些很微弱的風吹過,便能將真菌孢子帶到下一個待傳染的地區(昆蟲也能成為病害傳播的另一個媒介)。根據病害特點,可以把需要預測的各種類型(病害發生期預測、病害發生量預測、病害發生分布預測)的發生程度,與對應其病害發生的因子和影響結果分別記錄,用作人工神經網絡的學習樣本。當人工神經網絡從樣本學習完畢后,即建立了最終預測模型。此時就可以對病害的發生期、發生量、發生分布進行預測。例如,用人工神經網絡對病害發生量進行預測,通常需要將病害發生量分為5個等級,分別是輕、中偏輕、中、中偏重、重。將影響病害發生的因子和導致的病害結果作為網絡模型訓練樣本。訓練過程的大致原理表現為對數據樣本和標簽數據進行歸類,并劃出各類別的分布。當網絡訓練完畢之后,即各個類別的分布已規劃好,再把待預測數據錄入網絡中,即可計算出待預測數據與哪種分布最接近,分布最近的類別即為最終預測結果。
2.2.3常用于預測的神經網絡模型。①BP神經網絡模型。BP神經網絡是一種應用鏈式求導法則的誤差反向傳播的前饋神經網絡,是目前神經網絡模型中應用最廣泛的網絡。整個網絡由輸入層、隱藏層和輸出層組成[18],屬于機器學習中的監督學習網絡。BP神經網絡是人工神經網絡家族中最基本的網絡。BP神經網絡有非常好的非線性逼近能力,一個具有3層的神經網絡可以無線逼近任何一個非線性連續函數。但是一個未經優化的BP神經網絡也存在一些不足,例如在網絡訓練時容易陷入局部最小值問題,最終導致模型訓練失敗。基于BP神經網絡自身的特性導致在解決問題時很少完全采用BP神經網絡的思想,更多的做法是在更復雜的神經網絡上面再加一個BP神經網絡用作整體功能的一部分,又或使用改進的BP網絡[19]。BP神經網絡結構如圖1所示。②LSTM(LongShortTermMemory)神經網絡模型。LSTM網絡是循環神經網絡(RecurrentNeuralNetwork)衍生出來的一種改進的網絡模型。在前面介紹的BP神經網絡或者其他神經網絡模型中幾乎沒有考慮過樣本與樣本之間的聯系,只是簡單地把樣本送交模型訓練,以減少模型結果與真實結果的誤差。RNN網絡模型的出現改變了這種原始做法,對樣本與樣本之間是否具有某些聯系進行了考慮,特別是有時間順序的樣本集。模型在訓練的時候每一個樣本的輸出值都會受到前面樣本輸出值的影響,樣本之間的聯系就得到了很好的利用。這種模型的出現使神經網絡在解決問題的時候不僅能從數據的“量”里面獲取信息,還能夠從數據與數據間的“邏輯”中更精確地分析信息。雖然RNN神經網絡相較傳統的神經網絡來說具有特殊的記憶能力,但是RNN神經網絡也有明顯的缺點,即在模型訓練時對前面樣本信息的記憶不長久,只能夠保留短期記憶,在某些問題上這種短期記憶所達到的效果欠佳。LSTM網絡模型提出的目的即是為了解決RNN神經網絡不能擁有長期記憶力和梯度消失以及梯度爆炸等一系列問題[20]。LSTM神經網絡也是前饋型神經網絡,繼承了RNN網絡模型的特性并具有更強的記憶力。LSTM主要解決與時序有關的問題,網絡模型訓練時會把當前的樣本數據與以往的樣本數據計算后的結果共同參與計算,并留作與下個數據樣本共同計算。因此,每次得到的計算結果都與之前的數據有關系,是一種具有長期記憶力的神經網絡。由于其長期的記憶功能,LSTM神經網絡常用于解決在時序方面的預測問題,比如股票預測[21]、天氣預測、語言識別等[22]。沈皓俊等[23]利用LSTM網絡對氣候降水量進行預測,陳艷平等[24]利用LSTM網絡對自然語言中的句法要素進行識別,兩者都達到了非常高的精度,相對于使用其他不考慮時間序列的網絡來說效果更加明顯。LSTM網絡展開后的結構如圖2所示。以上2種神經網絡都可用于農業病害發展趨勢預測,且2種神經網絡都是通過對歷史病害發生情況和與之對應的環境因子作為樣本訓練,是深度學習里面的有監督學習。訓練過程其實是利用神經網絡強大的非線性逼近能力確定函數(神經網絡的學習過程可以理解為一種確定函數具體形式的過程)的具體形式。當神經網絡訓練完畢之后就可以利用模型對未來的病害發生情況進行預測。利用一個已經訓練好的神經網絡對當下的病害進行預測的過程非常簡單。可以把人工神經網絡模型理解為一個“黑盒”,只需把當前的天氣數據輸入到模型中就可以直接得出預測結果,無須知道模型是如何計算得到的。利用人工神經網絡病害預測在神經網絡模型訓練階段時會花一些時間訓練,模型訓練完畢之后便能很快得出預測結果,相較于傳統病害預測模型來說,人工神經網絡幫助人類減少了對數據樣本分析的過程,只需關注模型構建的本身。
2.2.4人工神經網絡應用到病害預測中可能出現的問題。沒有任何一種模型和方法是完美的,人工神經網絡也存在著一些缺點。一是人工神經網絡的固有缺點,即訓練速度過慢。在人工神經網絡模擬人類學習的過程中,即在人工神經網絡進行訓練階段時(減少訓練得到的結果與真實結果的誤差過程),可能會花費大量時間。這不僅取決于樣本數量,也取決于硬件設備的計算速度。但農業病害的樣本數據相較于語音、視頻等各種非結構化的數據來說非常小,因而訓練時的速度問題幾乎不存在。二是在人工神經網絡非線性逼近(模型訓練)時有可能出現不能逼近真實結果的情況,雖然可以通過對數據樣本進行再處理來解決,但同時也會增加預測工作量和構建模型的難度,使人工神經網絡難以找到一種通用的學習算法[25]。因此,在人工神經網絡學習時,往往需要對學習的數據樣本進行再次處理才能達到目的。三是人工神經網絡的訓練需要充足的訓練樣本數據。當訓練樣本不足時,會導致預測精度低,不能達到預測的目的。農業病害的預測發展歷經多年,積累了大量農業數據,并且可以利用遷移學習技術[26]從類似且已經訓練好的模型中擴展,因而數據不足的問題能夠很好地解決。總體來看,從在人工神經網絡所能處理問題的領域來說,農業病害預測屬于一種相對輕量級的問題,人工神經網絡自身存在的各種缺點對農業病害預測方面的影響都很小。
3農業病害預測研究面臨的挑戰與展望
3.1我國農業病害預測研究面臨的挑戰
農業病害預測研究雖已取得了巨大進步,但是農業病害預測的最終目的是防治,如果僅對農業病害發展進行預測,而不做好病害防治工作,那么病害預測工作在整個農業病害防治工作中會很無力。我國農業病害綜合防治工作取得了巨大進步,特別是在生物技術病害綜合防治方面,利用病害的天敵昆蟲對病害進行防治[27],取得了不錯的效果。資料顯示,我國每年在農業病害防治方面使用的化學農藥高達25萬t[28]。使用農藥雖然解決了當下的病害問題,但是這種做法嚴重破壞了土壤結構。化學防治導致的污染問題已成為影響我國農業發展的一個因素。此外,農業病害預測研究面臨的另一個問題是我國農業現代化建設進程仍不完善,農業病害預測所需的硬件設備和其他硬件設備并不多,究其原因是所需設備價格昂貴,從事農業的人們不愿意使用昂貴的產品。綜合來看,我國病害預防工作不僅需要技術,更需要一種全面、現代、完備的農業病害解決體系。
3.2農業病害預測的展望
在加速建設農業現代化進程中,我國增加了許多對農業病害預測有巨大幫助的工具。智慧農業概念提出后,對農業病害研究工作提供了理論指導,特別是在實時數據獲取方面有了更加精確快速獲取數據的設備。對于農業病害預測來說,有了這些實時數據,就能夠時刻監測農作物動態。當設備從當前獲取的數據中分析發現環境因素可能導致病害的發生,就可以使設備自動做出對應的措施,減少人工的工作量。不僅可以實現農業全智能化,而且能夠減少人工成本。
4結語
綜上所述,傳統農業病害預測方法雖然能夠對病害發生起到預測的效果,但是一般傳統的農業病害預測方法是一種靜態的預測方法,很難做到實時預測,很難根據新增的數據快速重新構建和優化模型。隨著時間的增加,傳統預測模型的病害預測效果也會減弱。人工神經網絡對農業病害的預測是一種非常有效的手段,人工神經網絡模型是一種動態而不需要人為修改的模型,一旦網絡模型搭建完畢,模型就可以根據得到的數據進行訓練,然后完成預測工作,并且可以動態更新模型(利用最新數據對模型再次訓練),在這一過程中不需要任何人為干預。因此,農業自動化將是未來農業的發展趨勢。
作者:陳民 胡雪瓊 魯韋坤 周文文 陳亞平 李曉君 曹志勇 單位:云南農業大學大數據學院