公務員期刊網 精選范文 生物信息學分析方法范文

    生物信息學分析方法精選(九篇)

    前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的生物信息學分析方法主題范文,僅供參考,歡迎閱讀并收藏。

    生物信息學分析方法

    第1篇:生物信息學分析方法范文

    Bioinformatics prediction strategy for Mycobacterium tuberculosis (H37Rv) secreted proteins

    【Abstract】 AIM: To establish a prediction strategy for Mycobacterium tuberculosis (H37Rv) secreted proteins to pave the way for further research. METHODS: The whole protome of H37Rv was scanned by SignalP and TMHMM. The protein date analysis system based on Visual FoxPro was established to process the output of SignalP and TMHMM and identify the secreted proteins. The sequences of the secreted proteins were aligned by BLASTp. RESULTS: One hundred and seventynine secreted proteins were identified, where 12 of them were found to be unique in H37Rv. CONCLUSION: Bioinformatics approaches can be used as an assistant tool in secreted protein research.

    【Keywords】 Mycobacterium tuberculosis;secreted protein;signal peptide;bioinformatics

    【摘要】 目的:建立一種結核分枝桿菌(H37Rv)分泌性蛋白的預測方法,為后續研究提供參考依據. 方法:以SignalP和TMHMM兩個軟件對結核分枝桿菌蛋白組進行掃描,基于Visual FoxPro構建“蛋白質數據分析處理系統”對掃描原始數據進行分析處理以識別分泌性蛋白,再經BLASTp完成相似性比對. 結果:預測出了179種分泌性蛋白,其中12種為H37Rv所特有. 結論:生物信息學方法可作為一種研究分泌性蛋白的輔助工具,用于指導實驗.

    【關鍵詞】 結核分枝桿菌;分泌蛋白;信號肽;生物信息學

    0引言

    結核分枝桿菌(Mycobacterium tuberculosis, MTB)的分泌蛋白不但在豚鼠實驗中可以引發遲發性超敏反應,在結核病患者體內也可誘導抗體的產生[1],對結核病的預防和診斷具有重要意義. 目前有兩種實驗生物學方法用于MTB分泌蛋白的研究,一種是通過二維凝膠電泳的方法分離MTB早期培養濾液蛋白(CFP),再通過N端測序[2]或免疫學方法加以確定[3]. 另一種是通過基因融合的方法將MTB的基因與報告基因融合后進行表達,再對報告基因的表達產物進行定位,以確定是否為分泌表達[4]. 已有30多種MTB分泌蛋白通過實驗方法得以確認,但MTB分泌蛋白遠不止這30多種,尚有很多未被發現. MTB蛋白分泌的主要途徑是sec-依賴性的分泌途徑也稱為II型分泌途徑,該類分泌蛋白的結構特點是新生肽鏈的N末端具有典型的信號肽特征,主要分為N區、H區、C區三個部分. N區位于信號肽N端,含有1~3個帶正電荷的氨基酸殘基;H區位于信號肽中間,由10~15個疏水氨基酸殘基組成;C區位于信號肽C端,富含親水氨基酸,能被信號肽酶識別. 信號肽所具備的這些數量化特點為計算機自動化分析預測提供了可能.

    分泌蛋白和膜蛋白都含有信號肽序列,所不同的是分泌蛋白在信號肽之外不再有疏水的跨膜區,信號肽引導分泌蛋白跨膜穿梭之后,信號肽酶在相應位點將信號肽切除,以此完成成熟分泌性蛋白的分泌過程;而膜蛋白在信號肽之外還有一個以上的疏水跨膜區,信號肽在引導膜蛋白跨膜時,由于疏水跨膜區的存在使得膜蛋白停留在細胞膜中. 本文預測MTB分泌性蛋白的方法主要涉及到兩方面內容:一方面是對信號肽序列的識別,另一方面是對蛋白疏水跨膜區的識別. 首先通過對信號肽的識別將分泌性蛋白和膜蛋白從其他蛋白質組中區分出來,然后從中尋找疏水跨膜螺旋以區分分泌性蛋白和膜蛋白,最后利用NCBI提供的MTB蛋白序列相似性搜索(BLASTp)發現有12條預測出的分泌性蛋白為MTB所特有.

    1預測方法

    預測方法如圖1所示.

    1.1搜集結核桿菌H37Rv基因組和蛋白組信息在美國國家生物技術信息中心(ncbi.nlm.nih.gov)的核酸數據庫Nucleotid中查尋關鍵詞“H37Rv complete genome”. 從搜索結果中查找H37Rv全基因組,并以FASTA格式下載. 從英國基因組研究中心Sanger center的數據庫(ftp://ftp.sanger.ac.uk/pub/tb/sequences/)下載全蛋白質組信息.

    1.2分析數據分別向SignalP和TMHMM提交H37Rv蛋白組數據. 由于SignalP服務器對單次提交數據量有數量限制,因此將H37Rv蛋白組數據分為8次提交(Rv0001Rv0500,Rv0501Rv1000,……Rv3501Rv3924). 另由于Rv2048單數據量過大,超過SignalP服務器對單數據的處理范圍,因此將Rv2048 C端部分氨基酸殘基除去(不影響N端信號肽分析). 由于TMHMM服務器對提交數據量沒有限制,可一次全部提交. 返回數據一次保存.

    1.3建立數據庫根據本課題的實際需求,依據SignalP和TMHMM分析結果的數據特點,使用VFP6.0開發了“蛋白質數據分析處理系統”用來存儲和處理SignalP和TMHMM的原始分析結果(圖2).

    1.4獲得分泌性蛋白和膜蛋白通過上述數據分析系統自動完成分泌性蛋白和膜蛋白的識別和查詢.

    1.5BLASTp分析將預測出的所有H37Rv分泌性蛋白通過NCBI的BLASTp服務器與所有已知的蛋白序列進行相似性比對,以獲得結核桿菌H37Rv特有的分泌性蛋白.

    2結果

    2.1H37Rv基因組和蛋白組信息搜集從美國國家生物技術信息中心ncbi.nlm.nih.gov的核酸數據庫Nucleotid中查尋到編號為NC_000962的記錄,其中包含了H37Rv的全部基因組信息共4 411 529 bp,從Sanger的數據庫獲得蛋白組信息,共3924條蛋白序列數據.

    2.2H37Rv蛋白組信號肽和跨膜區分析將SignalP和TMHMM的原始分析結果通過“蛋白質數據分析處理系統”自動識別N端具有N區、H區和C區等典型信號肽特征的蛋白質和具有典型跨膜螺旋特征的蛋白質,通過數據庫的自動查詢功能共發現了179個分泌性蛋白(其中有12個已得到相關文獻的證實,表1)和150個膜蛋白.表1H37Rv蛋白組信號肽和跨膜區分析結果(略)

    2.3BLASTp分析對179條分泌性蛋白經BLASTp分析發現有12條蛋白為H37Rv特有,在其他物種已發表的蛋白質序列中無任何相似區域(表2).表2BLASTp分析結果(略)

    3討論

    在對結核桿菌H37Rv的3924條蛋白質分析過程中SignalP共預測出了573條蛋白質含有信號肽;TMHMM預測出了786條蛋白質含有疏水跨膜螺旋,其中623條蛋白質含有信號肽. SignalP和TMHMM對信號肽預測結果的交集為329條,其中150條含有信號肽外疏水跨膜區被列為膜蛋白,其余179條蛋白不含信號肽外疏水跨膜區因而被列為分泌性蛋白.

    SignalP和TMHMM的原始分析結果數據量非常大,每條蛋白質包含了“蛋白編號”、 “可信度”以及“酶切位點”等11項不同信息,因此H37Rv的分析結果中信息量多達43 164條. 若要對4萬多條信息進行人工比較將是一項費時、費力的工作,且人工比較的準確性也難得到保證. 我們開發出基于Visual FoxPro的“蛋白質數據分析處理系統”,不僅能將SignalP和TMHMM的原始分析結果自動導入數據庫,而且可對數據庫中的各項數據進行比較,實現了將分泌性蛋白和膜蛋白的識別工作完全交給計算機來完成. 以前用人工方法可能要花費數周時間的工作,現在利用這套系統僅需數秒鐘即可完成,同時排除了人為可能造成的錯誤.

    蛋白質的功能由其特定的空間結構決定,而這種空間結構又由蛋白質的氨基酸順序決定. 如果兩個蛋白質的一級序列相似,尤其是活性位點的一級序列相似,便很可能預示著這兩種蛋白質具有相似的功能. 因此,對未知功能的蛋白質進行序列比對是生物信息學中的一項重要工作. 本研究通過對預測出的179種分泌性蛋白進行序列相似性比對(BLASTp)發現其中有12種為結核桿菌所特有且功能未知. 可以設想,這12種蛋白質或許對結核桿菌的臨床診斷具有一定的潛在應用價值. 作為分泌性蛋白,它們也可能是具有保護性作用的抗原,在治療結核病的疫苗研究中成為新的靶點[14].

    綜上所述,利用該體系可實現對結核桿菌H37Rv分泌性蛋白和膜蛋白的快速預測. 我們開發的“蛋白質數據分析處理系統”可以處理所有SignalP和TMHMM的分析結果,因而該系統不僅能用于結核桿菌的分泌性蛋白和膜蛋白的預測,而且還可用于其他原核細胞或真核細胞的分泌性蛋白和膜蛋白的預測. 作為嘗試性的研究,本課題還存在很多不足之處. 例如:該預測體系建立在GSP(General secretory pathway)理論基礎之上,雖然大多數蛋白質的分泌途徑遵守GSP理論,但是蛋白質的分泌過程卻不止這一種途徑,有些蛋白質的分泌并不需要信號肽的存在[15],這類蛋白質無法被該系統檢測出來. 另外,膜蛋白的疏水跨膜區有些是以β桶型結構存在[16],而非α螺旋結構,因此在預測過程中有可能將這類膜蛋白誤認為是分泌性蛋白.

    參考文獻

    [1] 柏銀蘭,薛瑩,李元,等.結核分枝桿菌分泌蛋白MPT64的免疫學特性[J]. 第四軍醫大學學報,2004,25(13):1182-1184.

    [2] Sonnenberg MG,Belisle JT. Definition of Mycobacterium tuberculosis culture filtrate proteins by twodimensional polyacrylamide gel electrophoresis, Nterminal amino acid sequencing, and electrospray mass spectrometry[J]. Infect Immun, 1997,65(11):4515-4524.

    [3] Weldingh K,Rosenkrands I,Jacobsen S,et al. Twodimensional electrophoresis for analysis of Mycobacterium tuberculosis culture filtrate and purification and characterization of six novel proteins[J]. Infect Immun, 1998,66(8):3492-3500.

    [4] Braunstein M,Griffin TJ IV,Kriakov JI,et al. Identification of genes encoding exported Mycobacterium tuberculosis proteins using a Tn5529phoA in vitro transposition system[J]. J Bacteriol, 2000,182(10):2732-2740.

    [5] Kamath AT,Feng CG,Macdonald M,et al. Differential protective efficacy of DNA vaccines expressing secreted proteins of Mycobacterium tuberculosis[J]. Infect Immun, 1999,67(4):1702-1707.

    [6] Morris S,Kelley C,Howard A,et al. The immunogenicity of single and combination DNA vaccines against tuberculosis[J]. Vaccine,2000,18(20):2155-2163.

    [7] Baldwin SL,DSouza CD,Orme IM,et al. Immunogenicity and protective efficacy of DNA vaccines encoding secreted and nonsecreted forms of Mycobacterium tuberculosis Ag85A[J]. Tuber Lung Dis, 1999,79(4):251-259.

    [8] Lozes E,Huygen K,Content J,et al. Immunogenicity and efficacy of a tuberculosis DNA vaccine encoding the components of the secreted antigen 85 complex[J]. Vaccine, 1997,15(8):830-833.

    [9] Samanich K,Belisle J,Sonnenberg M,et al. Delineation of human antibody responses to culture filtrate antigens of Mycobacterium tuberculosis[J]. J Infect Dis, 1998,178(5):1534-1538.

    [10] Manca C,Lyashchenko K,Colangeli R,et al. MTC28, a novel 28kilodalton prolinerich secreted antigen specific for the Mycobacterium tuberculosis complex[J]. Infect Immun, 1997,65 (12):4951-4957.

    [11] Freer G,Florio W,Dalla B,et al. Identification and molecular cloning of a novel secretion antigen from Mycobacterium tuberculosis and Mycobacterium bovis BCG[J]. Res Microbiol,1998,149(4):265-275.

    [12] Webb J,Vedvick T,Alderson M,et al. Molecular cloning, expression, and immunogenicity of MTB12, a novel lowmolecularweight antigen secreted by Mycobacterium tuberculosis[J]. Infect Immun, 1998,66(9):4208-4214.

    [13] Johnson S,Brusasca P,Lyashchenko K,et al. Characterization of the secreted MPT53 antigen of Mycobacterium tuberculosis[J]. Infect Immun, 2001,69(9):5936-5939.

    [14] 師長宏,范雄林,柏銀蘭,等. 結核分枝桿菌Ag85BESAT6融合蛋白在小鼠體內誘導的免疫應答及其保護力[J]. 第四軍醫大學學報,2004,25(18):1633-1636.

    [15] Sargent F,Stanley NR,Berks BC,et al.Secindependent protein translocation in Escherichia coli. A distinct and pivotal role for the TatB protein[J]. J Biol Chem, 1999,274(51):36073-36082.

    第2篇:生物信息學分析方法范文

    >> 人組蛋白去乙酰化酶11的克隆表達與生物信息學分析 FZ6基因及其蛋白的生物信息學分析 擬南芥和大白菜YABBY蛋白家族的生物信息學分析 斑馬魚TATA結合蛋白的生物信息學分析 黃瓜DVR基因的生物信息學分析 金鐵鎖糖基轉移酶PtT1的克隆與生物信息學分析 黃芩葡萄糖醛酸水解酶基因的克隆、生物信息學分析及表達 蓖麻油體固醇蛋白質的鑒定與生物信息學分析 結核分枝桿菌38kDa蛋白結構與功能的生物信息學分析 新疆細粒棘球絳蟲EgAgB8/3蛋白的生物信息學分析及意義 棉鈴蟲的巧防技術 太子參分解代謝關鍵酶8′羥化酶基因的克隆及生物信息學分析 紅白忍冬SABATH甲基轉移酶基因克隆及其生物信息學分析 希金斯炭疽菌腺苷酸環化酶生物信息學分析 丹參類貝殼杉烯氧化酶(SmKOL)基因全長克隆及其生物信息學分析 唇形科植物腳6基腳6基焦磷酸合酶編碼基因及其氨基酸序列的生物信息學分析 人ALK-1近端啟動子的生物信息學分析 酵母轉錄因子結合位點保守性的生物信息學分析 玉米谷胱甘肽過氧化物酶的生物信息學分析 歐文氏桿菌鐵代謝相關基因的生物信息學分析 常見問題解答 當前所在位置:l)分析棉鈴蟲類胰蛋白酶氨基酸序列的理化性質;運用DNAMAN軟件比對分析氨基酸序列同源性;運用MEGA 5.0中的Fhylogenetic Tree方法構建分子系統發育樹;運用在線工具ProtScale ()進行親、疏水性的分析;運用Psort在線工具()進行蛋白質二級結構的分析預測;運用NCBI數據庫中CDD在線工具(http://ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進行功能結構域的分析。

    2 結果與分析

    2.1 棉鈴蟲類胰蛋白酶氨基酸序列理化性質分析

    運用ProtParam在線軟件分析棉鈴蟲7種類胰蛋白酶氨基酸序列理化性質,結果見表1。由表1可知,棉鈴蟲7種類胰蛋白酶在理論等電點、脂溶指數以及氨基酸組成等方面均表現出相似性。其相對分子質量約為70 000,等電點約為5.00,氨基酸數目為253~256,Ala、Cys、Gly和Thr殘基含量較高。7種類胰蛋白酶的不穩定系數均較高,其中類胰蛋白酶Ⅲ的不穩定指數最低,為52.08,表明類胰蛋白酶在棉鈴蟲細胞內的穩定性較差,推測類胰蛋白酶代謝較為活躍,代謝周轉的速度較快。棉鈴蟲7種類胰蛋白酶的脂溶指數均較低,屬于親水性蛋白質。

    2.2 棉鈴蟲類胰蛋白酶氨基酸序列磷酸化位點預測分析

    使用NetPhosk 2.0 Server在線工具對棉鈴蟲7種類胰蛋白酶的氨基酸序列分別進行預測Ser、Thr與Tyr位點處發生磷酸化的概率結果見表2。從表2可見,在氨基酸磷酸化位點中Ser的預測分值最高,表明Ser發生磷酸化的概率最高,并且發現類胰蛋白酶Ⅲ中不具有Thr磷酸化位點;只有類胰蛋白酶Ⅴ具有Tyr磷酸化位點。以類胰蛋白酶Ⅲ為例進行說明:其氨基酸序列在第83位、243位、246位、247位這4個Ser位點處都有可能發生磷酸化,但第247位Ser發生磷酸化的概率最大,為M3=0.973。

    2.3 棉鈴蟲類胰蛋白酶氨基酸序列分子進化樹分析

    使用MEGA 5.0中的Fhylogenetic Tree方法構建分子系統發育樹結果見圖1。由圖1可知,7種類胰蛋白酶分為兩個分支,類胰蛋白酶Ⅰ、Ⅱ、Ⅶ與Ⅴ處于一個分支,類胰蛋白酶Ⅳ、Ⅲ與Ⅵ處于另一個分支。其中,類胰蛋白酶Ⅰ和類胰蛋白酶Ⅱ進化關系較近,類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進化關系較近。

    2.4 棉鈴蟲類胰蛋白酶的氨基酸序列分析

    1)使用TMHMM 2.0在線工具對7種類胰蛋白酶的氨基酸序列跨膜結構進行預測分析,均不存在跨膜結構域。

    2)使用ProtScale工具對7種蛋白酶的親、疏水性進行分析。7種類胰蛋白酶的總平均親水性為0.860~0.960,均表現為親水性。其中,多肽鏈靠近N末端區域親水性最強,最低分值為-0.500到-0.600,而C末端區域疏水性最強,最高分值為2.100到2.300。

    3)用DNAMAN軟件比對分析7種類胰蛋白酶的氨基酸序列同源性(圖2)。在這7種蛋白酶氨基酸序列中,有較多保守的區域(如圖2中深顏色區域所示)。經過分析發現,7種類胰蛋白酶氨基酸序列結構相似,同源性最高為85.71%。7種類胰蛋白酶中均含有高度保守的必需氨基酸殘基,參與維持蛋白酶的空間結構及行使催化功能。比如第10、54、70、179、196、207與231位的Cys殘基,它們之間能夠形成二硫鍵以穩定蛋白酶的空間結構。第205位的Asp殘基與228、238位的Gly殘基能夠與底物形成離子鍵、氫鍵,參與類胰蛋白酶對底物的識別與結合。第69位的His殘基、114位的Asp殘基與211位的Ser殘基組成了類胰蛋白酶的催化基團,通過電子的傳遞,與底物分子中的Arg和(或)Lys殘基羧基端肽鍵發生親核反應,實現催化功能(氨基酸殘基位置以類胰蛋白酶Ⅲ為準)。

    2.5 棉鈴蟲類胰蛋白酶的功能結構域分析

    使用NCBI數據庫中CDD在線工具對類胰蛋白酶Ⅲ進行功能結構域分析(圖3)。結果表明,類胰蛋白酶Ⅲ屬于胰蛋白酶超家族,具有該家族特有的功能區域。類胰蛋白酶Ⅲ的16位(Ala)與17位(Arg)氨基酸殘基之間含有一個自剪切位點(Cleavage site),該位點與酶翻譯后的活化及轉運有關;69(His)位、114(Asp)位、211(Ser)位氨基酸殘基構成酶的催化位點(Active site);205(Asp)位、228(Gly)位、238(Gly)位氨基酸殘基形成3個底物結合位點(Substrate binding sites),參與酶對底物的識別與結合,其他類胰蛋白酶的分析也得到相似的結果。

    2.6 棉鈴蟲類胰蛋白酶的亞細胞定位分析

    亞細胞定位預測結果見表3。由表3可以看出,類胰蛋白酶Ⅰ、Ⅱ主要位于內質網中,類胰蛋白酶Ⅲ主要位于內質網、液泡及細胞外基質中,而類胰白酶Ⅳ、Ⅴ、Ⅵ與Ⅶ主要位于細胞外基質中。亞細胞定位的多樣性體現了類胰蛋白酶在棉鈴蟲生命活動過程中具有多樣性的生物學功能,其中類胰白酶Ⅲ、Ⅳ、Ⅴ、Ⅵ與Ⅶ主要發揮消化作用,因為棉鈴蟲對食物的消化場所主要位于中腸(細胞外)。而類胰蛋白酶Ⅰ、Ⅱ與Ⅲ可能主要行使免疫保護作用,參與棉鈴蟲對外界環境的免疫應答。

    2.7 棉鈴蟲類胰蛋白酶的二級結構分析預測

    利用NPSA在線工具預測類胰蛋白酶的二級結構(表4)。由表4可知,無規卷曲是該類胰蛋白酶整體結構中的主要組成結構元件,β轉角出現概率相對較小。α螺旋主要分布于氨基酸序列兩側,而無規卷曲、延伸鏈則主要分布在多肽鏈中間區段。

    3 小結與討論

    本研究以棉鈴蟲腸道內7種類胰蛋白酶為研究對象,運用在線工具對其進行生物信息學分析。結果表明,7種類胰蛋白酶理化性質較為相似,為親水性蛋白酶。Ser是類胰蛋白酶序列中磷酸化概率最大的氨基酸殘基。分子系統發育樹結果顯示類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進化關系較近,而類胰蛋白酶I和類胰蛋白酶Ⅱ在進化關系上更為接近。類胰蛋白酶不存在跨膜結構域,屬于基質類蛋白,這與其親水性的特點吻合。功能結構域分析發現類胰蛋白酶屬于胰蛋白酶超家族,其氨基酸序列中含有自切割位點、若干催化殘基與結合殘基。類胰蛋白酶的亞細胞定位具有多樣性,主要分布在細胞外與內質網中,這體現了類胰蛋白酶在棉鈴蟲生命活動過程中具有多樣性的生物學功能。二級結構分析預測表明無規卷曲在該類胰蛋白酶整體結構中所占比例最大,是其主要的結構元件。氨基酸序列同源性分析,7種類胰蛋白酶氨基酸序列的同源性較高,達到了85.71%,并且含有高度保守的必需殘基,參與維持蛋白酶的空間結構及行使催化功能,包括維持高級結構的Cys殘基,形成底物結合口袋的結合殘基及參與催化作用的催化殘基。依據此研究結果,能夠設計出與類胰蛋白酶活性中心特異性結合的抑制劑,抑制其活性,從而擾亂棉鈴蟲的正常消化,實現抗蟲目的。

    參考文獻:

    [1] 常團結,陳 蕾,路子顯,等. 棉鈴蟲幼蟲中腸類胰蛋白酶基因的克隆及在大腸桿菌中的表達[J]. 動物學報,2002,48(6):790-796.

    [2] 任曉霞,韓召軍,王蔭長. 棉鈴蟲乙酰膽堿酯酶cDN段的克隆和序列分析[J]. 動物學報,2002,48(1):121-124.

    [3] 郭線茹,蔣金煒,羅梅浩,等. 轉基因抗蟲煙草研究進展[J]. 昆蟲知識,2005,42(4):358-363.

    [4] CHOUGULE N P, GIRI A P,SAINANI M N, et al. Gene expression patterns of Helicoverpa armigera gut proteases[J]. Insect Biochemistry and Molecular Biology,2005,35(4):355-367.

    [5] KANG Z, JIANG J H, WANG D, et al. Kunitz-type trypsin inhibitor with high stability from Spinacia oleracea L. seeds[J]. Biochemistry (Moscow),2009,74(1):102-109.

    [6] TELANG M A, GIRI A P, SAINANI M N, et al. Characterization of two midgut proteinases of Helicoverpa armigera and their interaction with proteinase inhibitors[J]. Journal of Insect Physiology,2005,51(5):513-522.

    [7] TAMHANE V A, CHOUGULE N P, GIRI A P, et al. In vivo and in vitro effect of Capsicum annum proteinase inhibitors on Helicoverpa armigera gut proteinases[J]. Biochim Biophys Acta,2005,1772(2):156-167.

    [8] BOWN D P, GATEHOUSE J A. Characterization of a digestive carboxypeptidase from the insect pest corn earworm (Helicoverpa armigera) with novel specificity towards C-terminal glutamate residues[J]. European Journal of Biochemistry,2004, 271(10):2000-2011.

    第3篇:生物信息學分析方法范文

    [關鍵詞]婦科腫瘤學;研究生教育;生物信息學;交叉學科;現代醫學

    [中圖分類號]G642[文獻標識碼]A[文章編號]1673-7210(2020)09(a)-0069-04

    傳統的婦科腫瘤學研究生教育重視的是單一學科的知識傳授,忽略了學科之間的交叉影響,教育理念陳舊,教學內容繁雜,傳授方法老套,學生們在接收和學習知識的過程中往往處于被動的位置,難以突破傳統思維的桎梏,這點顯然不符合現代醫學復合型人才的教育要求。婦科腫瘤學是大數據背景下知識更新迅速的學科之一,迫切需要全新的研究生教育理念進行知識的傳授。生物信息學理念剛好為這一過程搭建橋梁。

    生物信息學是20世紀90年代逐漸興起的一門交叉學科,它以生物作為主要研究對象,借助計算機技術、信息科學技術、分子生物學技術和應用數學等手段,對大量復雜的生物數據進行處理、存儲、分析和闡述,旨在深入挖掘和揭示潛在的生物學意義。隨著精準醫療時代的到來,生物信息學的作用日益凸顯,它已經滲透到生命科學研究領域的各個方面,并成為了最有活力的前沿領域之一[1]。當前,國內不少高等醫學院校陸續開設生物信息學這門課程。對于醫學研究生而言,生物信息學不僅僅是一門課程,它還教會了學生從海量生物數據中挖掘有意義的生物信息,因此,從某種意義而言,它更是一種思維方式的體現。廣西醫科大學附屬腫瘤醫院(以下簡稱“我院”)婦科從1985年開始招收研究生,在學校開設生物信息學課程之初,即重視研究生生物信息學思維的培養,并且使他們學會將這種思維方式更好地應用于婦科腫瘤學研究領域,為社會輸送一批又一批具有生物信息學理念的現代醫師。

    1將生物信息學核心理念應用于婦科腫瘤學研究生的教學實踐

    生物信息學的核心理念是海量數據的管理和挖掘,注重學生自主學習能力的培養,而自主學習是一種新型教學理念,同時也是高等院校教學改革的主要方向之一[2]。生物信息學除了能教會學生使用大量的相關數據庫和在線分析工具進行科學研究以外,還能教會他們掌握主動學習的方法和途徑,學會利用現有的數據庫和在線分析工具進行深度挖掘,旨在幫助他們解決臨床實踐過程針對疑難病癥的診療問題,最終服務患者[3]。在婦科腫瘤學研究生教學實踐中引入生物信息學理念有如下幾個方面的具體表現:

    1.1建立生物信息學的概念和意識

    在婦科腫瘤學領域培養出具有生物信息學知識背景的研究生,這種跨學科創新型研究生培養模式,突破了傳統的單一學科研究生培養模式的桎梏,順應了新時代研究生教育的發展潮流。在日常研究生培養中,我院著重幫助學生建立起生物信息學的意識和思維方式。首先,在課程設置方面,我院動員婦科腫瘤學研究生自覺將生物信息學這門課程列為其研究生生涯的必修課程。通過課程的學習,學生將意識到,生物信息學是一門由生命科學和計算機科學交叉形成的新興學科,先后經歷了前基因組時代、基因組時代和后基因組時代三個階段,涵蓋了生物信息的獲取、處理、存儲、傳播、分析和闡述等方面[4]。其次,我院定期組織學生進行小組學習,通過線上線下混合式教學手段引導學生對生物信息學的深度學習。同時,我院也重視婦科腫瘤學教師自身的生物信息學通識教育,不定期邀請生物信息學教研室教師答疑解惑。最后,我院引導學生將生物信息學知識應用到研究生課題研究中,進一步加深學生對生物信息學和婦科腫瘤學知識的理解。

    1.2學會使用生物醫學數據庫和在線分析工具

    生物信息學發展至今,產生許多生物醫學數據庫和在線分析工具,如基因表達(geneexpressionomnibus,GEO)數據庫、蛋白質相互作用數據庫、微小RNA(microRNAs,miRNA)靶標數據庫、癌癥基因組圖譜(thecancergenomeatlas,TCGA)數據庫和用于注釋、可視化和集成發現(thedatabaseforannotation,visualizationandintegrateddiscovery,DAVID)的數據庫等常用數據庫和GEO2R在線工具、GeneMANIA在線工具和醫學本體信息檢索(CoremineMedical)平臺等常用在線分析平臺[5]。對于婦科腫瘤學研究生而言,無論是專業型研究生還是學術型研究生,掌握生物信息學知識并不在于如何進行復雜算法的開發、原始數據的處理或數據庫的構建,而是如何使用這些數據庫和在線工具進行數據挖掘和分析,并用于指導科學研究和臨床實踐。在婦科腫瘤學研究生教學實踐中,我院著重強調“以實踐為中心”。比如,Wei等[6]在其研究生課題中巧妙應用了GEO數據庫中的3個獨立基因芯片數據(GSE25191、GSE28799和GSE33874),進行基因差異表達分析和基因通路富集分析,并通過實時定量聚合酶鏈反應和TCGA數據庫驗證,發現整合素α6亞單位(integrinα6subunit,ITGA6)是卵巢癌腫瘤干細胞核心基因,該基因的高表達與卵巢癌化療的耐藥和預后差密切相關。研究生唯有親身實踐,將理論知識融入實踐中,才有可能熟練掌握這些生物醫學數據庫和在線分析軟件的使用方法和數理基礎。

    1.3將數據挖掘理念融入科學研究和臨床實踐中

    在生物醫學大數據時代背景下,生物醫學研究正發生著重大變革,從基因組學、蛋白質組學、代謝組學、轉錄組學和表觀遺傳學等多學科研究到基于海量臨床信息數據的真實世界研究,它們所產生的大量高維復雜的研究數據互相交匯,共同構成生物醫學大數據[7]。對研究生而言,如何將多層次臨床和研究數據進行深度挖掘和有機整合,從而轉化為新知識,既是機遇,又是挑戰。在婦科腫瘤學研究生教育中,我院將數據挖掘理念滲透到各個教學環節中,旨在讓研究生掌握主動學習的方法和途徑,培養其創新思維,為今后的科學研究和臨床實踐打下扎實的基礎。在科學研究方面,尤其是在課題選題和設計階段,組織學生利用互聯網查找學科領域的前沿問題或熱點問題,對自己感興趣的方向各自提出一個具體的科學假設。然后通過查找文獻和充分利用數據庫進行深入的數據挖掘,構建生物信息學分析網絡來回答具體科學問題。最后,組織學生進行分子實驗或利用臨床資料來驗證科學假設。在臨床實踐方面,引導學生將臨床上遇到的問題轉化成具體的科學問題,然后應用簡單的臨床生物信息學方法對具體的科學問題進行淺層次的數據挖掘,從而充分地為后續臨床研究做好準備。這種將數據挖掘理念融入科學研究和臨床實踐的教學方法,充分鍛煉了研究生的科研和臨床思維。比如,吳文娟等[8]進行卵巢上皮性癌鉑類耐藥相關差異表達蛋白質篩選時,結合了生物信息學方法分析,篩選出62個鉑類耐藥相關的差異表達蛋白質,然后通過正選擇分析時發現,蛋白C6、CNTN1在亞洲人群中均存在正選擇作用(P<0.05),而蛋白BCHE在歐洲人群中存在正選擇作用(P<0.05),基于CoremineMedical平臺的文獻挖掘及TCGA數據庫中的芯片數據交集分析進一步印證,12個差異蛋白(CRP、FN1、S100A9、TF、ALB、VWF、APOC2、APOE、CD44、F2、GPX3和ACTB)與卵巢癌鉑類耐藥相關。Wei等[9]在探討卵巢癌多藥耐藥的分子研究中,充分利用CoremineMedical平臺進行文獻數據挖掘,并結合分子生物學實驗發現,ITGA6可能在卵巢癌細胞中起到調節基因的作用,參與卵巢癌的多藥耐藥過程。蔣燕明等[10]在回答與宮頸上皮內瘤變進展相關的差異基因和信號通路這一問題上,通過對GEO數據庫中獲得的2套芯片數據(GSE63514和GSE51993)進行深入挖掘和綜合的生物信息學分析,篩選出與宮頸上皮內瘤變進展相關的14個差異表達基因和3條信號通路。

    2生物信息學理念對婦科腫瘤學研究生教育的影響

    傳統醫學與互聯網、大數據、人工智能等技術的深度融合催生了新醫科這一全新的現代醫學形態[11],它借助了計算機科學和人工智能的爆發式發展,實質上也是多學科交叉融合的產物。這種順應時展的產物,顛覆了傳統醫學模式,深深地影響了醫學教育領域。在新醫科背景下,高等醫學教育更應該注重教育理念和培養模式的改革,滿足“健康中國”的戰略需求,培養出能夠運用學科交叉知識來解決醫學領域前沿問題并引領未來醫學發展的高層次醫學領軍人才[11]。研究生教育是我國教育體系中最高層次的教育,以培養拔尖創新人才作為主要任務和核心內容,建立以教學為基礎、以科研為主導、臨床和科研相結合的研究生培養模式,這是培養拔尖創新人才的根本方法[12]。在婦科腫瘤學研究生教育中引入生物信息學理念,恰好符合了新醫科背景下研究生拔尖創新人才培養模式,將對婦科腫瘤學研究生教育改革產生深遠影響。

    2.1對傳統醫學教育模式的沖擊

    傳統醫學教育模式重視學科教育的系統性,強調以學科為中心,忽視了學科間知識的滲透和交流,顯然不符合現代醫學教育的宗旨[13]。在傳統醫學教育模式下,學科的課程體系教學依舊采用灌輸理念,這種填鴨式的知識傳授過程容易磨滅學生主動探索知識的求知欲。在大數據時代,高等教育改革重點圍繞學生創新能力的培養展開,并積極引入現代化教育理念,強調以學生為中心、以實踐為主進行教學內容的更新[14-15]。最近十年,在《教育信息化“十三五”規劃》和《教育信息化十年發展規劃(2011-2020年)》等文件的引領下,國內教育信息化得到了迅猛的發展,包括大數據、云計算和人工智能等現代化信息技術已經進入現代教育系統,在這一歷史背景下,國家相繼出臺《中國教育現代化2035》和《教育信息化2.0行動計劃》等政策文件,為我國教育信息化建設道路指明了方向[16]。

    作為一門交叉學科,生物信息學知識和理念早已滲透到各個醫學學科領域,并衍生出多個分支學科。臨床生物信息學是其中一個分支學科,也是一座搭建在基礎研究和臨床診療之間的橋梁,更是解決臨床腫瘤相關診治因素的新手段。因此,在精準醫學時代,很有必要引入腫瘤生物信息學特異性研究方法或全新高級的研究工具,來回答與腫瘤相關的關鍵問題[17],對于腫瘤學的研究生教育亦是如此。婦科腫瘤學研究生教育不應該局限于講授單一學科的知識、基礎研究和臨床實踐,引入生物信息學理念,不僅對傳統醫學教育模式產生沖擊,還能培養研究生從多角度思考問題的能力,從而產生獨特的研究方法和形成創新性思維,更能培養研究生從不同的專業角度發現問題、分析問題和解決問題的能力[18]。

    2.2提高教師教學理論素養和教學反思自覺性

    在教學醫院,臨床醫師不但要從事臨床診療工作,還要承擔科研工作和教學任務。他們的日常臨床工作繁重枯燥,科研方法往往單調乏味,教學理念陳舊乏新。醫學教師作為醫學教育的實踐者,只有在先進教育理念的引領下,才有可能真正做到以學生為中心,使學生受益,從而提高人才培養的質量[19]。因此,醫學教師應該以更加開闊的視野主動投入到各類前沿的教學改革與研究中,重視有助于醫學生自主學習的教學手段開發和應用。臨床醫師學習先進的生物信息學知識和理念,并將之應用于臨床和教學實踐中,有助于他們對實踐中出現的難以解決的醫學問題進行合理解釋,同時滿足現代醫學研究和教育的發展需求,為提高自身教學理論素養和教學反思的自覺性提供了新途徑。

    2.3拓寬研究生知識的深度和廣度

    婦科腫瘤學是一門特殊的學科,不同于傳統意義的婦產科學,從某種程度上來說,也是一門婦產科學和腫瘤學的交叉學科,因而,更適合采用生物信息學教育理念。婦科腫瘤學主要研究女性生殖系統腫瘤,目前積累了大量基礎研究和臨床研究數據,同時也產生了許多學科前沿問題。研究生在基礎理論知識學習的同時,眼界不應僅限于病房的臨床實踐,更應該放眼于學科研究前沿技術的發展,敢于批判反思,大膽假設和小心求證,并且提出臨床新觀念[11]。生物信息學剛好為研究生自主學習搭建了這樣一座橋梁。我院婦科教研室非常重視研究生科研創新思維的培養,并充分利用生物信息學服務性和多樣性的特點,將生物信息學與婦科腫瘤學進行知識的深度融合。婦科腫瘤學研究生在進行跨學科生物信息學知識和技能培訓的同時,有望避免學科知識結構單一的缺點,還能打破學科專業之間的界限,從而拓寬知識的深度和廣度。

    第4篇:生物信息學分析方法范文

    關鍵詞:生物信息學 創新實踐能力 教學改革

    中圖分類號:G642.0 文獻標識碼:A 文章編號:1674-098X(2014)10(c)-0143-02

    2013年三位美國科學家以“為復雜化學體系設計了多尺度模型”而獲得了諾貝爾化學獎,從此生物信息學(Bioinformatics)真正走到了自然科學的前臺,成為未來發展的重要方向和熱點。生物信息學是以生物學為核心和靈魂,以數學和計算機為基本工具的一門交叉學科,綜合運用數學、計算機科學和生物學的各種工具,獲取、處理、存儲、分發、分析和解釋生物信息,進而揭示大量數據所蘊含的生物學意義。生物信息學已經成為生物醫學、農學、遺傳學、細胞生物學、分子生物學等學科發展的強大推動力量,目前已經成為高等院校生命科學相關專業學生必須掌握的主要專業課程。要實現中華民族偉大復興的中國夢,離不開科學技術的創新驅動,創新人才的培養自然成為高等院校的主要責任,高等院校教師需要根據培養學生創新實踐能力的要求不斷的開展教學改革。鑒于生物信息學的重要作用,最近幾年各高等院校都相繼開設了生物信息學課程,但是由于生物信息學是一門廣泛的交叉學科,需要學生具有較扎實的多學科基礎知識,且生物信息學自身發展迅速,新概念、新算法、新數據庫等層出不窮,需要教師不斷跟進,因此生物信息學的教學與其他學科顯示出明顯的不同,舊的教學方法不能適應生物信息學課程的發展。生物信息學教學改革的內容應該著重于提高學生的創新實踐能力。該文將生物信息學教學改革中總結的經驗,從教學理念、教學方法、教學內容和考試改革等方面,對在生物信息學課程的教學中如何培養學生創新實踐能力進行了討論。

    1 教學理念上強調學生的實踐能力和自主創新思維的培養

    生物信息學是一門實踐性非常強的學科,同時具有多學科交叉的特點。對于非生物信息學專業的生命科學相關專業學生,主要課堂目標是熟練應用各種軟件、數據庫解決實際的生物學問題,而不是研究新算法、開發新程序。非生物信息學專業的學生一般具有較好的生物學基礎,對于核酸、蛋白質等相關知識已經較為熟悉,在教學中不必過多重復,而對于生物信息學中的數學模型,程序原理等內容具有較大的學習障礙,經過我們的教學發現,學生對于這些內容的不理解并不會顯著影響其應用軟件的實踐能力。因此,對于非生物信息學專業的生物信息學本科課程,應當簡化復雜難懂的理論知識,注重培養學生的實踐能力,使學生可以應用生物信息學工具對生物數據進行分析,解決實際問題,在使用生物信息學工具解決實際問題的時候對生物信息學產生興趣,增強創新實踐能力。

    2 采用啟蒙式、研討式、運用式等生動形象的教學方法

    為了強調學生的實踐動手能力,采用啟蒙式、研討式、運用式等生動形象的教學方法。(1)將授課地點定在計算機網絡教室,接駁互聯網的計算機安裝有課堂管理系統,實時演示教師的操作。教師在授課過程中結合具體實例邊講解邊示范操作,學生邊聽課邊練習。(2)對課件增加圖片、視頻、音頻等多媒體素材,使抽象的、靜態的生物信息學知識以具體的、動態的形式演示,提高學生的學習興趣,加深學生對知識的掌握程度。例如在講解蛋白質三維結構相關知識時,教師需準備好各種蛋白質的三維結構素材,并使用(同時教會學生使用)專業蛋白質三維結構看圖軟件進行演示操作,這樣可以顯著提高學生的實際操作興趣。(3)進行課程錄像,記錄課堂上老師的講課現場和計算機操作屏幕的錄像,將視頻放到網絡教學平臺上,供學生課后觀看,降低生物信息學學習難度。(4)進行隨堂在線操作練習,以教師和學生分別自設題目的方式開展創新實踐練習,促進學生創新性思維方式,注重提高理論用于實踐的綜合能力,同時更有效地提高學生計算機應用能力。(5)采用雙語授課,提高學生專業英語能力。生物信息學的實際操作離不開數據庫和軟件,而目前國際上通用的生物信息學在線數據庫和常用軟件的界面都是英文,因此學生必須能看懂生物信息學相關概念的英文說法。我們采用雙語授課,對課程中的關鍵信息再使用中文重點講解一遍。教學中發現大多數學生對英文授課及英文軟件有懼怕和惰性心理,對此我們采用循序漸進多次重復的方式幫助學生克服最初的懼怕建立信心,在英語授課前一周,教師將多媒體課件通過網絡教學平臺發送給學生,并列出來關鍵名詞,供學生提前預習,減少課堂上直接聽英文的難度,在數據庫和軟件中,安排學生多次使用同一個軟件,同一個數據庫,對常用的詞語進行重點說明,從而減小學習壓力,增強學習信心。本方法增強了學生主動學習生物信息學自主能力,同時提高了學生英文聽、說、讀、寫等能力。(6)發揮網絡教學的優勢,教師可根據教學內容從網上下載教學輔助資料,充分利用網絡的現有資源,并通過網絡教學平臺為學生提供教學資源,將制作的教學課件、教學大綱、教學錄像、參考文獻、思考題、自測題等上傳到教學平臺上,使學生隨時隨地在教學平臺里面進行下載教學課件、回答問題、提出問題,老師或者同學可以對所提問題進行網上解答、探討。教師還可以通過網上論壇、聊天室、QQ、E-mail等對學生學習和生活進行指導和關心,可以及時了解掌握學生的學習情況,有利于教師不斷調整教學方案,達到更好的教學效果。

    3 教學內容上增強課程應用性

    生物信息學的課程內容很多,具有很強的跨專業性,由于課時和學生專業的限制,我們應選擇性地進行授課,教學內容主要強調課程實踐應用性。(1)要在課程的第一節課明確生物信息學在生物學中的作用,講解幾個有趣而又簡單的生物信息學應用,提高學生的學習興趣。(2)對于理論知識只講解其中最為基礎而不可缺少的,并結合實際操作使學生形象化、具體化。授課中穿插講解有趣而簡單的生物信息學應用實例,提高學生的學習興趣。(3)增加實驗課學時,增強學生動手操作實踐能力。生物信息學主要是通過計算機軟件完成對生物數據的分析,分析過程中易出現各種錯誤,需要在多次操作實踐中不斷總結經驗才能熟悉。因此增加實驗課學時會明顯增加學生的實踐能力。我們每一節課分為兩部分,理論講解和實驗操作,在理論講解完成后,馬上開展實驗操作,這樣可以讓學生理解軟件中應用的原理,不會出現在實驗課時理論與實驗脫節的現象。(4)生物信息學發展迅速,需不斷把握國際最新進展,更新知識庫,使學生學到最新的技術,更好的應用到實踐中。因此我們密切關注學科發展動態,掌握最新研究成果,每學期的教學隨時進行知識更新,及時將國內外及教師的新知識、新成果作為教學內容的一部分傳遞給學生。同時我們使用雙語授課,并保證授課內容緊跟生物信息學的前沿,保證學生學到的都是最新的知識,刺激學生探索與實踐的欲望。

    4 考試改革上促進學生實踐能力和創新思維

    考試改革的目的是強化實踐教學,注重創新能力的培養;發揮教學中的積極性、主動性、創新性;在加強素質教育的基礎上擴寬專業教育;培養“寬厚型、復合型、創新型、外向型”人才??荚嚳煞譃槠谀┛荚?、平時練習和上機考試等三部分。期末考試使用傳統的考試方式。平時練習為教學中的課堂練習題的評分。對于上機考試,我們引入無紙化考核,通過上機實踐操作,重點考核學生在互聯網環境下的隨堂在線操作,隨堂在線測試的內容主要是使用各種軟件和數據庫分析生物數據的操作實踐,增強學生理論應用實踐的綜合能力。例如給出一個蛋白質的名稱,讓學生查詢此蛋白質的序列、理化性質、翻譯后修飾等信息,預測蛋白質二級結構,三維結構等操作。學生使用計算機在線完成指定的生物信息學分析內容,考查學生掌握實踐操作的程度,促進學生注重提高理論用于實踐的綜合能力,同時更有效地提高學生計算機應用能力。這種考試模式可以顯著的提高學生實踐的積極性。

    5 結語

    總之,生物信息學教學需要培養學生自主創新學習的能力和在實踐中自主創新獲取知識的技能,使學生知識、能力、素質協調發展。為了提高學生創新性思維和實踐操作能力,生物信息學教學改革應從以下幾方面進行:在教學理念上,強調學生的實踐動手能力、創新思維的培養;在教學方法上,采用啟蒙式、研討式、運用式等生動形象的教學方法;在教學內容上,增加實驗學時,增強課程應用性,理論為實踐服務;在考試改革上,采用多種考查考核方式促進學生實踐能力、創新思維。在今后的教學工作中,我們將繼續探索行之有效的教學方法、教學手段和教學模式,啟發學生的創新實踐意識,培養學生的創新思維和實踐能力,以滿足現代社會對創新型人才的需求。

    參考文獻

    [1] 張紀陽,劉偉,謝紅衛.生物信息學課程研究性教學的實踐與思考[J].高等教育研究學報,2011(4):51-53.

    [2] 張幸果,丁俊強,朱偉,等.關于如何提高生物信息學教學質量的探討[J].江西農業學報,2010(3):194-195.

    [3] 石生林,韓艷君,劉彥群,等.非專業研究生生物信息學課程教學中存在的問題及對策[J].生物信息學,2009(2):125-127.

    第5篇:生物信息學分析方法范文

    關鍵詞:中醫大數據;生物信息學;高校教學

    中圖分類號:G642 文獻標識碼:A 文章編號:1009-3044(2016)27-0123-03

    Abstract: Analyzed the developing status of Bioinformatics combined with Chinese Medicine, proposed the education directions for the combinations of Chinese Medicine and Bioinformatics, discussed the using of Bioinformatics techniques in Chinese Medicine big data with teaching and researching area by three common method in Bioinformatics.

    Key words: chinese medicine big data; bioinformatics; education in university

    1 引言

    生物信息學是一門新興學科,在各大高等院校醫學或生物學相關專業都有與之相關的課程或專業開設。與我們常見的物理、數學、法學等學科不同,生物信息學更像是一個學科領域,它不僅僅局限于某個科學研究,而是綜合運用數學、計算機學和生物學的各種工具及方法來分析和理解在大數據背景下的生物學意義[1]。經過20余年的發展,生物信息學已在分子進化、基因測序、遺傳及變異研究等領域取得了突破和成果,是21世紀人類三大計劃之一“人類基因組計劃(Human Gene Project HGP)”的核心支撐學科。在美國,早于1988年便成立國家生物技術信息中心(NCBI),隨后歐洲和日本在1993年和1995年分別建立了歐洲生物信息學研究所(EBI)和信息生物學中心(CIB)用來對數以萬計的核酸及蛋白質等數據進行維護并發展至今日趨成熟[2]。生物信息學于上世紀90年代初開始逐漸引起國內科學工作者的重視,經過20多年的發展也已初具規模。筆者通過對近20年公開發表的有關生物信息學關鍵字的文章進行搜索,運用Excel制圖繪制了自1996年至今每年發表文章數量的散點圖。從圖1可以發現,關于生物信息學學科的研究數量在2014年達到頂峰,并逐漸開始下滑。同時,由于搜索結果包含雜質數據(如被動截取“信息學”為關鍵詞),為了使圖表信息量有度可量,筆者繼續對在認知上與生物信息學相關的科學領域進行關鍵詞搜索,分別為“數據挖掘”和“人工智能”,并繪制圖2。由該圖可直觀地看出,人工智能的研究一直穩步發展,符合21世紀科技高度發展的大趨勢,而數據挖掘技術的相關研究自2005年以來迅猛增長并趕超人工智能。綜合分析其主要原因是由于中國人口眾多,自2005年以來互聯網用戶不斷增加,全民聯網的時代逐漸構成,互聯網信息產業的急劇擴大以及電子商務、云技術等網絡相關產業的發展帶來的信息膨脹,使越來越多的人意識到大數據的作用和研究數據挖掘對經濟發展、社會進步的重要影響,進而推動數據挖掘的學科發展。

    2 中醫大數據背景下的生物信息學課程教學

    從圖2的對比可以看出,生物信息學的研究數量與其他兩個學科對比,則顯得相形見絀。也就是說,生物信息學在我國的發展仍較為緩慢,使之與其對人類社會的貢獻度不成正比。進一步對圖1的搜索結果進行高級檢索,對已有的生物信息學研究進行劃分,將”中醫”關鍵詞加入其中,結果發現將中醫與生物信息學相結合進行研究的文獻少之又少,每年文獻不過20左右。生物信息學的作用就是利用計算機等技術對海量的生物數據進行分析并洞察隱藏在其中的規律,而中醫數據經歷數代中醫名師的記錄和數十年來信息存儲技術的發展已經儼然呈現出高緯度、高階度的大數據結構。因此,生物信息學在中醫數據的研究中一定具有其特殊的價值和意義,是從微觀層面描述中醫整體結構的重要手段。本文將以中醫證侯、病證和中醫復雜性為切入點,結合研究生物信息學在其中的應用價值,并討論在教育教學過程中如何使中醫和生物信息學有機結合,做到融會貫通。

    2.1從“定性”和“定量”學習角度看基因組學學習中醫“證”本質

    在中醫學中,“證”是立方立法的基礎,醫者通過四診獲取的信息進行綜合分析和判斷,從病癥體征等表現集合入手,得出相應的證候,有針對性的用藥治療。中醫與西醫不同,講究以整體論看待人體以及病變,“辨證論治”思想也是千百年來各名中醫學者通過反復探索得出的實踐經驗,對中醫遣方用藥具有決定性的指導意義。而西醫認為,疾病的發生與發展是與人體某段特異的基因的改變有關,HGP的研究目的也正是為了揭示人體的構成奧秘從而從本質上研究疾病的產生和發展規律[3]。因此,中醫與西醫在指導醫者診療的哲學思想上是有很大不同,甚至可以說是截然相反的。然而中醫與西醫的內在關聯卻無處不在,結合點之一正是基因與證候的關聯。對于基因組學和中醫證候的學習方法是不同的,一個是定量學習,另一個則是定性學習,定量學習有助于學生更加客觀的研究生物體的發展規律,并結合現代計算機技術做到多學科交叉學習與實驗,而不足之處在于缺乏主觀思考、學習方式較為分散缺乏整體思維把控;而定性學習則以某一指導思想為主線,通過對某些案例及知識長時間的觀察和分析,從中得出結論。定量學習如基因組學更重視量化計算及工具的使用,而定性學習如中醫證候則更重視理論與實踐結合,整體到局部學習。在學習的過程中,無論基因組學還是中醫證候,都會以疾病為具體的研究對象。從西醫上說,基因是決定人是否患病的內部原因,通過遺傳或基因狀態的改變都可能導致疾病的產生,從中醫上說,證候是疾病狀態下的臨床類型,反映了機體在疾病發展過程中的病理特征[4]。因此,將證候與基因組學統一學習,實則是將定量與定性學習相結合以實際疾病案例和數據著手從而多方面運用計算機、西醫學、證候學、數學等學科知識對生物大數據進行分析的綜合學習方法。

    2.2 基于蛋白質組學學習中醫病證相關性

    證侯是人體生命活動的一種表現,而生命活動的主要執行者是蛋白質,兩者之間必然會有隱秘且細致的聯系,我們也應以此為出發點,培養學生的發散學習方法,綜合學科進行學習。自HGP的完成宣告了后基因組時代的到來后,研究生命科學的重心也由基因組學向蛋白質組學逐漸轉變,作為教育者也應跟上科學發展的潮流,把生物科學研究和相關教學模式從基因水平向蛋白質水平轉變。與此同時,蛋白質組學是從整體角度分析細胞內的動態變化以及蛋白質組成成分、表達水平等,它的研究方法學內容與中醫的整體觀和辯證論治觀有著許多相同之處。蛋白質組學在分子水平上的DNA修飾和基因調控反應生命體的整體狀態(即陰平陽秘),中醫理論強調從整體觀對疾病進行認知,認為疾病的發生是人體整體功能的失調所致(即陰陽失調),重點在于辯證論治[5]。在教育教學過程中,將基因或蛋白質方面的研究從結構研究向功能研究轉變,使研究更具體,透過相關功能性測試實驗,發現基因之間的相互聯系及相互作用,在定量學習的過程中培養學生的定性思維,使學生善于發現問題及對象之間的關聯。正如數據庫實體關系模型中的E-R圖一樣,在進行蛋白質組學和中醫病癥相關性研究教育的過程中,中醫病證和蛋白組學可以看做是兩個看似毫無關聯的實體,而通過“疾病”將兩者相連,透過此種關系可以衍射出兩個學科方面的深入學習。

    2.3 運用復雜系統性方法學習中醫藥復雜系統

    中醫藥的復雜性相比西醫有過之而無不及,原因主要在于相對于“結構決定功能”的西方醫學思想,中醫更側重于“關系決定功能”,在這種情況下,無論是辨證論治還是癥狀體征變化,有關中醫診斷和治療的信息都是已高度離散和非線性的方式存儲,使得中醫稱為典型的“復雜自組織系統”[6]。尤其在信息離散度和復雜度較高的中醫證侯系統中,癥狀變量與證侯信息混雜在一起,想辨別兩者的區別和聯系是非常困難的事情,單純的研究數據往往缺乏正確的方向,而單純的研究理論則往往枯燥乏味。因此,在教學過程中,可以將復雜系統方法學引入中醫系統學習,通過復雜系統中的熵分劃方法將證侯系統的離散變量加工轉化為線性關聯集合,即將癥狀變量通過關聯度集合成多個癥狀集合,并將癥狀集合與關聯度較高的證侯要素進行聯結。以此方法既可以激發學生對理論學習的興趣,又能以理論指導實踐,對中醫證侯大數據進行信息提取,達到全面學習。

    3 結束語

    中醫信息學已經作為一門新興學科在我國各大高校開設,相關師生深入研究和學習,主要目的就是發掘蘊含在中醫幾千年發展結晶中的奧秘。關于中醫藥數據的數據挖掘技術和研究也在近年日益增長,這都表明人們已經愈來愈關注國粹,關注健康,關注未來。這也表明與之相關的學習和研究對未來的人生發展和機遇都有著深遠的影響。然而,數據挖掘的技術并不完全適用于中醫藥復雜系統中的信息發掘,若單純地將兩者進行結合教學,學生可能缺少知識銜接,缺乏過渡。這時若將生物信息學引入二者其中并結合生物信息學相關智能科技手段和技術,則可以從宏觀和微觀兩個方面去看待生命體:宏觀上面對復雜的中醫系統不需感到困惑,而是以“復雜系統方法論去解決復雜系統”,使學生不要總想著從每一個局部都能分析到問題的本質,而是接受復雜性,從復雜系統的角度去解釋生命體的自組織現象,對生命體的宏觀表現進行研究;微觀即是在分子水平上去分析中醫證侯的本質,方劑的復雜體系,去了解生命體內部的調控機制等,以此加深學生對中醫理論的理解以及對生物信息學工具和技術運用的融會貫通。

    參考文獻:

    [1] 鐘濤.基于復雜系統方法的慢性胃炎中醫問診證侯建模研究[D].上海:華東理工大學,2014.

    [2] 譚從娥,王米渠,馮文哲等. 生物信息學分析寒癥海量數據的探索[J].中華中醫藥學刊,2008,26(12):2569-2570.

    [3] 李方玲,梁嶸.對中醫證侯規范化研究的探討[J].遼寧中醫雜志,2006,33(4):386-387.

    [4] 西廣成.復雜系統方法學與中醫證侯建模[M].北京:科學出版社,2010:91-95

    第6篇:生物信息學分析方法范文

    >> 唇形科植物腳6基腳6基焦磷酸合酶編碼基因及其氨基酸序列的生物信息學分析 雷公藤腳6基焦磷酸合酶基因TwGPPS克隆與表達分析 FZ6基因及其蛋白的生物信息學分析 睡前泡腳的好處多 6個事項要注意 6招助你開發腳部健康潛能 冬日里,6種方法暖手腳 一天從腳“High”6次?這是??! 杜仲法尼烯基焦磷酸合酶基因cDNA全長的克隆與序列分析 腳 牯牛降國家地質公園唇形科藥用植物資源及其利用 腿與腳的外開在芭蕾基訓中的作用 分級債基6天暴漲34% 債市“小?!背掷m 32只債基回報超6% 債基賺錢效應發散 做好6件事冬季手腳不再冰涼 基TPICl6F690單片機的溫濕度測量裝置設計 腳的保健 我的“再生腳” 寶貝你的腳 媽媽的腳 月亮的腳在哪 常見問題解答 當前所在位置:l)進行亞細胞定位分析。用SOPMA()觀測其二級結構,功能域的預測用Pfam 27.0(http:///)和SMART (http://smart.embl-heidelberg.de/)[20]進行;用SWISS-MODEL(http://)完成GGPS 蛋白高級結構同源建模;MEGA7.0 軟件構建系統進化樹。

    3 結果與分析

    3.1 唇形科植物腳6基腳6基焦磷酸合酶核苷酸序列的結構及其氨基酸序列的理化性質

    利用ORF Finder和ProtParam在線工具對唇形科9種植物GGPS氨基酸序列進行理化性質分析(表2)。可知其核苷酸序列的起始密碼子均為ATG,終止密碼子均為TGA。氨基酸殘基(amino acids,aa)數在346~379 aa;各蛋白序列的相對分子質量為37 424.3~41 299.7 kDa,中位值為39 408.66 kDa;理論等電點均在6 PI左右,平均6.33 PI,提示GGPS蛋白為酸性蛋白。從GGPS氨基酸組成中可以看到,9種植物的GGPS蛋白除SmGGPS3外,所含酸性氨基酸殘基比例均高于所含堿性氨基酸殘基比例,進一步提示GGPS蛋白為酸性蛋白。各種植物GGPS蛋白中,含量最豐富的氨基酸殘基主要集中在亮氨酸(Leu)、丙氨酸(Ala)、纈氨酸(Val),均不含硒半胱氨酸(Sec)、吡咯賴氨酸(Pyl)??傇訑?,消光系數,基本一致。除SmGGPS1,PbGGPS,LcGGPS1的不穩定系數小于40,為穩定蛋白,其他均為不穩定蛋白。

    3.2 腳6基腳6基焦磷酸合酶的信號肽、導肽,跨膜結構域,疏水性/親水性和亞細胞定位特征

    3.2.1 信號肽、導肽的預測和分析 信號肽(signal peptide)是分泌蛋白和膜蛋白以前體形式合成時在N端的15~30個氨基酸序列[21]。導肽(leader peptide)是一段引導新合成的肽鏈進入細胞器的識別序列[22],導肽的預測與分析對蛋白質的功能分析、作用機制和作用途徑等具有重要意義[23]。信號肽屬于導肽的一部分,位于靠近N端的一段氨基酸序列,導肽功能的發揮需要信號肽的存在[24]。利用在線工具SignalP 4.1 Server的神經網絡算法對9種唇形科植物的GGPS蛋白進行信號肽的預測,結果表明丹參GGPS氨基酸序列中不存在信號肽,毛喉鞘蕊花和米團花GGPS氨基酸序列進行信號肽預測也得到相類似的結果。通過在線預測工具TargetP 1.1Server,對唇形科植物GGPS氨基酸序列進行了預測。以SmGGPS1為例,預測可能性是4,即可能含有低相似度的N端葉綠體轉運肽(chloroplast transit peptide)。轉運肽序列長52個氨基酸,剪切位點位于Ser52~Ala53。無法確定SmGGPS1是否具有導肽,也未發現其導肽分裂位點。其他8種唇形科植物的GGPS預測分析結果顯示,SmGGPS2的可靠性為5級,其余都在4級以上。LcGGPS4,LcGGPS5具有導肽分裂位點,具有導肽性,且它們的導肽很可能都是葉綠體轉運肽,提示這些米團花中的GGPS蛋白合成后,可能轉運到葉綠體中發揮作用。剩下與SmGGPS1相似,都不存在導肽分裂位點,不能確定具有何種導肽。

    3.2.2 跨膜結構域特征 跨膜結構域一般由20個左右的疏水性氨基酸殘基組成,主要形成α-螺旋,常由跨膜蛋白的效應區域所展F。利用在線工具TMHMM Server v.2.0對SmGGPS1蛋白進行跨膜結構進行預測,分析可知,其整條肽鏈都位于細胞膜之外,不存在跨膜結構。毛喉鞘蕊花和米團花GGPS蛋白跨膜結構域分析結果與丹參一致,提示本實驗中的GGPS蛋白均不具跨膜結構域。信號肽是指導靶標蛋白質跨膜定位到膜上的N端氨基酸序列[25-26],所以不含信號肽,理應無跨膜結構域,說明預測結果的合理性。

    3.2.3 蛋白疏水性/親水性的預測 蛋白質親疏水性氨基酸組成是蛋白質折疊的主要驅動力[27],用Protscale在線工具預測親疏水性,結果表明,SmGGPS1的多肽鏈中第167位氨基酸有最低的親水性分值-2.911。位于260位氨基酸疏水性最強,其分值為2.544。其中,親水性氨基酸占65%,疏水性氨基酸占35%。兩端多親水性氨基酸,中間多疏水性氨基酸,推測折疊的蛋白為親水性蛋白。其余8種GGPS合酶的疏水性/吸水性都與SmGGPS1類似,這也與跨膜結構預測的結果相吻合。

    3.2.4 亞細胞定位特征 細胞中蛋白質在合成后被轉運到特定的細胞器中,蛋白質的亞細胞定位分析及預測能極大的加速了蛋白質結構和功能的研究[28]。對9種唇形科植物的GGPS基因編碼的氨基酸采用PSORT Prediction在線生物學工具進行亞細胞定位。結果表明(表3),SmGGPS1,PbGGPS,LcGGPS1,LcGGPS4,LcGGPS5位于膜結構上的可能性大于0.4;SmGGPS2,SmGGPS3位于線粒體基質上的可能性大于0.5;LcGGPS2,LcGGPS3位于細胞質的可能性大于0.4。

    3.3 二級結構預測

    蛋白質二級結構是指蛋白質多肽鏈氨基酸殘基借助氫鍵折疊和盤繞形成的α-螺旋、β-折疊、無規則卷曲以及模體等組件,其中,α-螺旋和β-折疊是最常見的蛋白質二級結構。利用SOPMA對9種唇形科植物的GGPS合酶序列進行二級結構預測(表4),結果顯示,唇形科GGPS合酶中均有α-螺旋、β-折疊、無規則卷曲和延伸鏈。以SmGGPS1為例,其主要結構元件是α-螺旋(45.33%)和無規則卷曲(30.22%),其次是延伸鏈(18.13%)和β-折疊(6.32%)。余下蛋白二級結構的主要結構元件與SmGGPS1完全一致。

    3.4 蛋白質功能域的預測和分析

    功能域(functional domain)又稱結構域,是蛋白質分子中介于二級與三級結構之間的一種獨立結構和功能單位,具有特定的生物學功能[29-30]。利用Smart在線軟件對SmGGPS1蛋白的氨基酸序列進行功能域的預測和分析,結果表明(圖1),SmGGPS1蛋白含有多聚異戊二烯基合成酶的活性結構域、2個天冬氨酸富集區結構域、活性位點殘基蓋結構域和鎂離子結合位點結構域,其屬于Isoprenoid_Biosyn_C1超家族,為類異戊二烯生物合成酶。對其他植物也進行了功能域的預測和分析,除SmGGPS3只有多聚異戊二烯基合成酶的活性結構域和底物結合位點外,其余唇形科植物的GGPS蛋白均存在上述結構域,這可能是由于SmGGPS3開放閱讀框全長明顯短于其他植物。

    3.5 GGPS蛋白三級結構的預測和分析

    蛋白質的三級結構是指蛋白質在其二級結構的基礎上依靠氨基酸側鏈之間的疏水相互作用、氫鍵、范德華力和靜電作用等進一步盤繞、折疊所形成的天然構象。蛋白質的功能與其三級結構密切相關,對蛋白質高級結構的預測和分析,有助于理解蛋白質結構與功能之間的相關性[31-32]。利用同源建模工具SWISS-MODEL(http://)完成蛋白質三級結構的預測和分析工作,找到了模板蛋白(ACCESSION:5E8L_A;Sequence Idenity:76.87%;GMQE:0.73),再用Swiss Pdb-Viewer工具顯示丹參GGPS1結構域的3D結構[33-35]。結果顯示:SmGGPS1蛋白由12個α-螺旋和一些不規則卷曲組成,與二級結構的預測結果一致-SmGGPS1主要結構單元為螺旋結構(圖2)。

    3.6 GGPS合酶的系統進化樹分析

    來源于同一祖先的不同植物在進化過程中的關系可以通過進化樹來描述,通過構建植物進化樹,可以了解一種植物在進化過程中的地位[36]。用MEGA 7.0軟件對唇形科在內的25種有代表性的GGPS合酶蛋白序列進行系統進化樹構建(圖3)。結果顯示,來源于植物,細菌,真菌,動物的GGPS合酶按照不同類群分為4群,在進化遺傳學上親緣越近的物種,在GGPS合酶的分子系統進化樹上距離較近,依據氨基酸序列所得出的系統演化關系雖不能真實的反映植物在漫長歷史長河中的自然進化關系,其結果對判斷不同植物之間的親緣關系仍具有一定的借鑒意義[37]。

    4 討論

    GGPP是合成赤霉素類、二萜類、胡蘿卜素類物質的起始前體物,而GGPS則是合成GGPP的關鍵酶,在植物的次生代謝中,調控處于代謝分支點前體的代謝方向。一般認為二萜類化合物以質體來源GGPP為前體,已證明,在擬南芥中,質體定位的GGPS蛋白可為赤霉素、類胡蘿卜素、脫落酸和葉綠素等物質的合成提供GGPP前體[38];在辣椒中,GGPS被證明分別在果實成熟期和花發育過程中提供類胡蘿卜素的合成前體[39-40],在煙草中,GGPS則為煙草抗蟲(煙草天蛾)物質 HGL-DTGs(17-hydroxygeranyllinalool diterpenoid glycosides)的合成提供前體[41]。此外,茉莉酸甲酯(MJ),已經驗證其在曼地亞紅豆杉、加拿大紅豆杉和番茄等植物中可上調GGPS合酶的基因表達,對二萜類物質的產生具有促進作用。

    蛋白一級結構預測分析結構表明,GGPS蛋白為酸性,親水性,多為不穩定蛋白,具有明顯的疏水區和親水區,不具有信號肽,可推測出GGPS可能不是分泌性蛋白,這與其都沒有跨膜結構相對應。通過導肽分析發現,GGPS蛋白在細胞中的分布多樣,說明其在細胞中廣泛參與生物合成,參與的次生代謝是多樣的。結合信號肽預測結果,可推知GGPS蛋白在游離核糖體上合成后,可能通過2種途徑發揮作用,一是通過導肽進入葉綠體發揮作用;二是不進行蛋白轉運,保留在細胞質基質中產生催化作用。GGPS蛋白的二級結構均以α-螺旋為主要結構,無規則卷曲、延伸鏈和β-折疊分布于整個肽鏈結構中。所有唇形科GGPS蛋白氨基酸序列中都含有多聚異戊二烯基合成酶的活性結構域和底物結合位點結構域,其屬于Isoprenoid_Biosyn_C1超家族,為類異戊二烯生物合成酶。

    利用生物信息學的方法對唇形科GGPS氨基酸序列的生理生化特性進行預測和分析,可以為GGPS蛋白及其編碼基因的克隆提供可靠的依據;對其序列結構的預測和分析,可為其蛋白表達與修飾提供指導;并為更多物種GGPS蛋白及其編碼基因的克隆提供可靠的依據。對其二級及高級結構的A測和分析有利于深入探討該酶結構和功能之間的關系、作用機制和代謝過程。

    [參考文獻]

    [1]張利平, 程克棣, 朱平. 紫杉烷類化合物的生物轉化[J]. 藥學學報, 2004, 39(2):153.

    [2]Du G H, Zhang J T. The general situation and progress of the modern research of red sage root (Radix Salviae miltiorrhizae)[J]. Herald Med, 2004,23(7):358.

    [3]張國華,張艷潔,叢日晨,等.赤霉素作用機制研究進展[J].西北植物學報,2009,29(2):417.

    [4]Laskaris G, Bounkhay M, Theodoridis G, et al. Induction of geranylgeranyl diphosphate synthase activity and taxane accumulation in Taxus baccata, cell cultures after elicitation by methyl jasmonate[J]. Plant Sci, 1999, 147(1):1.

    [5]Laskaris G, Jong C F D, Jaziri M, et al. Geranylgeranyl diphosphate synthase activity and taxane production in Taxus baccata cells[J]. Phytochemistry, 1999, 50(6):939.

    [6]Aharoni A, Giri A P, Deuerlein S, et al. Terpenoid metabolism in wild-type and transgenic Arabidopsis plants[J]. Plant Cell, 2004, 15(12):2866.

    [7]張蕾. 丹參腳6基腳6基焦磷酸含酶基因的克隆與功能研究[D]. 北京:中國人民軍事醫學科學院, 2009:3.

    [8]何春年, 彭勇, 肖偉,等. 中國黃芩屬植物傳統藥物學初步整理[J]. 中國現代中藥, 2012, 14(1):16.

    [9]劉佳. 鞘蕊蘇有效成分合成酶基因克隆及其含量與生態環境相關性研究[D]. 武漢:湖北中醫藥大學, 2015.

    [10]龔海群. 中藥金沸草和益母草化學成分的研究[D]. 蘭州:蘭州大學, 2011.

    [11]Hua W, Song J, Li C, et al. Molecular cloning and characterization of the promoter of SmGGPPs and its expression pattern in Salvia miltiorrhiza[J]. Mol Biol Rep, 2012, 39(5):5775.

    [12]Andersen-Ranberg J, Kongstad K T, Nielsen M T, et al. Expanding the landscape of diterpene structural diversity through stereochemically controlled combinatorial biosynthesis[J]. Angew Chem, 2016, 55(6):2142.

    [13]Liu Y, Luo S H, Schmidt A, et al. A geranylfarnesyl diphosphate synthase provides the precursor for sesterterpenoid (C25) formation in the glandular trichomes of Leucosceptrum canum[J]. Plant Cell, 2016,28(3): 804.

    [14]巴克沃尼什. 生物信息學基因和蛋白質分析的實用指南[M]. 北京:清華大學出版社, 2000:16.

    [15]Mount D M. Bioinformatics: sequence and genome analysis[M]. Second Edition. New York:Cold Spring Harbor Laboratory Press, 2004:301.

    [16]Bendtsen J D, Nielsen H, Von H G, et al. Improved prediction of signal peptides: SignalP 3.0[J]. J Mol Biol, 2004, 340(4):783.

    [17]Ehrbar K, Hapfelmeier S, Stecher B, et al. InvB is required for type Ⅲ-dependent secretion of SopA in Salmonella enterica serovar. typhimurium[J]. J Bacteriol, 2004, 186(4):1215.

    [18]Ikeda M, Arai M, Lao D M, et al. Transmembrane topology prediction methods: a re-assessment and improvement by a consensus method using a dataset of experimentally-characterized transmembrane topologies[J]. Silico Biol, 2002, 2(1):19.

    [19]Emanuelsson O, Nielsen H, Brunak S, et al. Predicting subcellular localization of proteins based on their N-terminal amino acid sequence.[J]. J Mol Biol, 2000, 300(4):1005.

    [20]Letunic I, Doerks T, Bork A P. SMART 7: recent updates to the protein domain annotation resource.[J]. Nucl Acid Res, 2012, 40(Databaseissue):302.

    [21]Von H G. Protein targeting signals[J]. Curr Opin Cell Biol, 1990, 2(4):604.

    [22]董桑 周軍, 辛培堯,等. 不同植物LDOX/ANS基因的生物信息學分析[J]. 基因組學與應用生物學, 2010, 29(5): 815.

    [23]龍芳, 李紹鵬, 李茂富. 7種植物ALAD基因的生物信息學分析[J]. 基因組學與應用生物學, 2013(6):802.

    [24]翟中和,王喜忠,丁明孝.細胞生物學[M]. 北京:高等教育出版社,2000: 79.

    [25]Petersen T N, Brunak S, Von H G, et al. SignalP 4.0: discriminating signal peptides from transmembrane regions[J]. Nat Methods, 2010, 8(10):785.

    [26]Seitz C, Eder C, Deiml B, et al. Cloning, functional identification and sequence analysis of flavonoid 3′-hydroxylase and flavonoid 3′,5′-hydroxylase cDNAs reveals independent evolution of flavonoid 3′,5′-hydroxylase in the Asteraceae family[J]. Plant Mol Biol, 2006, 61(3):365.

    [27]張|. 不同植物查爾酮合成酶CHS基因的生物信息學分析[J]. 江西農業學報, 2012, 24(6):5.

    [28]Herr D. Secretion of cellulase and beta-glucosidase by Trichoderma viride ITCC-1433 in submerged culture on different substrates[J]. Biotechnol Bioeng, 1979, 21(8):1361.

    [29]薛永常, 聶會忠, 劉長斌. 木質素合成酶C3H基因的生物信息學分析[J]. 生物信息學, 2009, 7(1):13.

    [30]王鏡巖, 朱圣庚, 徐長法.生物化學[M]. 北京:高等教育出版社, 2002:533.

    [31]蔡娜娜, 陳月輝, 李偉. 基于神經網絡的蛋白質三級結構預測[J]. 計算機工程, 2010, 36(9): 176.

    [32]陳克克, 武雪. 植物查耳酮異構酶生物信息學分析[J]. 生物信息學, 2009, 7(3): 163.

    [33]Arnold K, Bordoli L, Kopp J, et al. The SWISS-MODEL workspace: a web-based environment for protein structure homology modelling[J]. Bioinformatics, 2006, 22(2):195.

    [34]Schwede T, Kopp J, Guex N, et al. SWISS-MODEL: an automated protein homology-modeling server[J]. Nucl Acid Res, 2003, 31(13):3381.

    [35]Guex N, Peitsch M C. SWISS-MODEL and the Swiss-PdbViewer: an environment for comparative protein modeling[J]. Electrophoresis, 1997, 18(15):2714.

    [36]李卿, 邸鵬, 陸文銓,等. 丹參柯巴基焦磷酸合酶的生物信息學分析[J]. 中草藥, 2015, 46(6):887.

    [37]化文平. 丹參GGPP合酶基因的克隆及表_分析[D]. 西安:陜西師范大學, 2008:42.

    [38]Okada K, Saito T, Nakagawa T, et al. Five geranylgeranyl diphosphate synthases expressed in different organs are localized into three subcellular compartments in Arabidopsis[J]. Plant Physiol, 2000, 122(4):1045.

    [39]Kuntz M, Rmer S, Suire C, et al. Identification of a cDNA for the plastid-located geranylgeranyl pyrophosphate synthase from Capsicum annuum: correlative increase in enzyme activity and transcript level during fruit ripening[J]. Plant J, 1992, 2(1):25.

    第7篇:生物信息學分析方法范文

    【關鍵字】網絡課件;生物信息學;交互操作;Linux

    【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009―8097 (2009) 02―0100―04

    引言

    隨著計算機技術和教育信息化建設的發展,多媒體網絡課件在教學活動中開始發揮重要作用。多媒體課件通常包含傳統課本中的文字和圖片,以及動畫、音頻、視頻等數字化信息,展示能力很強。新發展的虛擬現實技術、流媒體技術等,為各類信息的展示提供了更豐富的效果和途徑。網絡課件還能夠發揮網頁的程序分析能力,從而開發出具有很強交互能力的應用。

    利用網絡課件,可以達到隨時學習和自主學習的效果,實現多通道的知識傳播。交互式功能的實現能夠提高學生學習的興趣,從而加深對一些知識的理解和掌握,促使自主學習過程的形成。此外,利用網絡平臺,構建大范圍的協作關系,可以實現關聯學習過程。因此開發高水平、內容豐富、具有交互特性的網絡課件是教學改革和創新的重要內容。

    一 網絡課件設計的主要技術

    許多傳統技術已經被應用于設計多媒體課件[1]。動畫GIF是一個非常簡單、顯示動態信息的方法,瀏覽器不需要額外的軟件支持,本身就能夠顯示動畫,許多課件用它實現了運動展示、過程模擬等功能。與此相類似的還有全景圖像,它首先對物體進行360全景攝像,然后將圖像進行拼接、視角變形等技術處理,借助插件,給瀏覽者展現虛擬物體的三維全貌。RM格式流媒體能夠顯示視頻、音頻信息,適合網絡的傳輸。利用這些技術制作出的課件功能豐富,但缺乏交互性。近些年,一些新的交互方法的使用,增強了網頁和網絡課件的展示效果。

    1 FLASH技術

    FLASH是一種交互式矢量多媒體技術,可以將聲音、動畫以及交互式響應融合在一起,能制作出高品質的顯示效果。它使用的矢量圖形可任意縮放尺寸而不影響圖形的質量,通過使用關鍵幀和圖符使生成的動畫文件非常小,流式播放技術使動畫可以邊播放邊下載,適合網絡傳輸的現實狀況。聲音格式支持MP3等高度壓縮的格式,使包含音樂的動畫文件也能保持小文件體積。此外,通過ActionScript和FSCommand的交互性,使Flash更加靈活,成為新的多媒體課件支持技術。

    2 JavaScript動態網頁編程

    目前的WEB網頁含有或多或少的JavaScript程序。它能對網頁中的信息進行處理,實現許多應用程序才能夠完成的功能。除了增強顯示的效果之外,它還可以用于實現簡單的數據分析。用于生物序列處理在線工具包(the Sequence Manipulation Suite,SMS)[2]就是利用JavaScript實現了數個生物信息學的應用的一個例子,它是DNA與蛋白序列分析的線工具集合,其功能涉及就是密碼子使用、CpG島識別、ORF查找、限制酶切位點識別等。

    3 VRML、X3D技術

    虛擬現實語言(VRML)能夠描述三維場景中對象的尺寸、形狀、色彩、材質、紋理、燈光等屬性,通過對簡單形狀的組合,可以構建復雜的幾何形狀,描述三維物體,同時它也支持交互功能。通過程序接口和使用JavaScript編程,可以由外界程序實現對VRML場景的完全控制,完成VRML語言本身不能實現的轉折、分支、循環等基本過程控制。在遠程教育系統中,利用虛擬現實語言,結合Java、數據庫技術可以建立基于Web 的交互型虛擬實驗室[3],學生不必親臨實驗室,卻能達到同樣的效果。在課件的設計和制作方面也有廣泛的應用[4][5]。許多生物分子的三維顯示是通過該方法實現的[6][7]。

    4 Java Applet技術

    Java Applet是一種在網頁中運行的Java小應用程序, 直接嵌入到Html語言中,通過網頁。運行時需要在計算機上安裝Java運行環境??梢詣摻淖?、聲音和動畫于一體的多媒體WEB頁面。許多算法的示教也是通過該方法實現。例如,蛋白質相互作用網絡使用Applet表現,有很好的顯示效果[8]。由于能顯示較好的三維效果,常用于醫學圖像的示教網頁[9]和相互作用組學的顯示[10]。

    5 具有較強交互功能的技術

    通過使用服務端編程,可以實現更加復雜、功能強大的交互。當用戶執行一些操作后,信息會返回到服務器端的程序,執行下一步的指令,實現真正的用戶-服務器之間的交互,這些方法包括JSP技術和ASP技術等。JSP由Sun公司,ASP由Microsoft公司開發,兩者技術非常相似,都提供了在Html代碼中混合程序代碼、并由語言引擎執行的能力。此時,Html代碼負責描述信息的顯示,而程序代碼則用來執行相應操作。

    二 通過網頁實現多服務器的交互-組件方法

    在生物信息學的教學中,許多算法對應有源程序,而且大多都是基于Linux系統的程序,對這些軟件的安裝、運行和使用能加深對算法的理解。這些軟件中許多是命令行程序,可以通過Telnet的方式運行。網絡課件所展示的信息都位于Web服務器上,而當需要更多交互式應用時,完全依賴Web服務器本身就比較困難。通過在網絡服務器上添加網絡通訊的服務,連接到其它計算機執行交互式操作,再把結果返回給用戶,就能夠減輕服務器的負擔,并實現一些在此之前不可能實現的功能。

    為了更為有效的實現“算法學習”――“測試運行”的結合,可以通過服務器端編程,在網頁上實現Telnet的功能,把程序測試和算法介紹融合在一起。本文的一個目的就是實現這樣的功能:在網頁上實現Telnet,遠程登錄到安裝有生物信息學算法軟件的Linux主機上,主機上的生物信息學資源就可以在B/S環境中得到更加充分的利用。要實現這樣的功能,一些組件可以使用,它們包括:Webtelnet,XceedSoft,TeraTerm、PowerTCP Telnet Tool,ActiveSocket等,這里對它們做一簡單介紹。

    1 TeraTerm

    是一個開源的終端模擬通訊軟件,能夠實現和其它計算機的通訊功能。當運行在服務器上,可以通過調用URL傳遞的參數,執行通訊功能。它的最新版本是TeraTerm Professional 4.58,對應的下載地址是 ttssh2.sourceforge.jp

    2 PowerTCP Telnet Tool

    是美國Dart Communications公司開發的ActiveX控件。支持Visual Studio、ASP、C++Builder、Delphi等開發環境,提供了建立、使用和終止會話的方法,使用者不必關心協議實現細節,極大的簡化了使用這些協議的編程難度??丶梢院蚒nix主機、路由器、終端服務器等設備直接進行Telnet通信,并支持間接的Telnet訪問。通過ASP中的ActiveX控件編程,可以使用Telnet協議訪問Unix主機,從而實現網頁中的Telnet功能。

    3 ActiveSocket

    是ActiveXperts公司(省略)開發的網絡通訊組件。把各種網絡通訊的協議進行了封裝,使普通編程人員也能夠利用網絡實現通訊,而不需要特別的專業知識。能夠實現Http,Ftp,UDP,DNS,ICMP等應用,當然,也能夠實現Telnet的功能。ActiveSocket控件使用簡單,使用方法是利用程序創建一個針對具體通訊協議的對象,如需要Telnet時,創建一個Telnet對象,就可以使用一些專門針對Telnet定制的一些屬性和方法,進而利用這些屬性和方法,在程序中的有目的的調用,實現通訊的工作。

    (1) 組件的主要屬性:

    ConnectionState:表明當前的連接狀態,通過該屬性可以了解組件和網絡的連接狀態。

    RemoteAddress:表示當前連接的IP地址。

    LastError:返回最后一次方法調用時的出錯信息,用于判斷方法調用是否成功,可以用來獲取控件執行每個指令的結果。

    (2) 組件的主要方法:

    Connect:建立一個連接,格式為:Object.Connect Host,Port。其中Host為要連接的主機地址,Port為需要連接的端口,對于Telnet服務Port缺省為23。

    Disconnect:關閉一個已經打開的網絡連接,格式為 Object.Disconnect。

    SendString:當網絡連接已經建立好后,向服務器發送數據,實現通訊過程中的數據傳輸。

    ReceiveString:通過網絡連接接收字符串,即從服務器獲取數據。

    Sleep:控件等待服務器響應的時間,以便服務器所進行的操作執行完畢并返回結果,用于處理網絡延遲。

    三 生物信息學算法實時交互網絡課件的開發

    在生物信息學課程的教學中,對基本算法的理解和掌握非常重要。這些算法屬于多個領域,如序列比對、系統發生分析、蛋白質二級結構預測、數據庫查詢、格式轉換等。在生物數據的信息學分析過程中,基本的算法會經常用到,熟悉每個算法的參數,掌握軟件的使用技巧尤為重要。對于BLAST程序,這些參數包括WordSize、打分矩陣名稱、空位罰分等。這些參數對算法的結果影響很大,通過使用不同的參數運行這些程序,并比較結果之間的差異,可以達到對算法的較好掌握。

    對于Linux環境下的生物學相關軟件和算法,因為涉及到Linux系統的一些專門知識,安裝、運行和試用并不容易。同時,由于學生的課程較多,配置一個可以進行生物學軟件的運行環境需要耗費大量的精力,對于本科生來說幾乎不現實。此外,許多軟件還涉及生物數據庫的配置,也增加了安裝和調試的困難。借助互聯網,把配置好的計算機提供給用戶使用,可以避免學生學習過多的Linux系統專門知識,使他們的注意力集中在算法本身上,因此具有很好的應用價值。

    1 系統規劃

    一臺網絡服務器,在其上可以安裝網絡課件。一臺Linux的服務器,安裝多個生物信息學的軟件、生物數據庫,網絡服務器能夠訪問Linux服務器。用戶通過網絡服務器瀏覽網絡課件,當瀏覽到包含一些算法的時候,網頁中就會出現一個專門開發的頁面區域,也就是連接到Linux服務器的區域,由服務器端的程序控制。在該區域可以輸入Linux的命令,這些命令會傳遞到網絡服務中的程序,程序調用控件中的方法連接到指定的Linux服務器,并進行數據的雙向傳輸工作,如圖2:

    2 服務器軟硬件配置

    (1) Linux服務

    Linux服務器主要安裝生物信息軟件。在生物信息的應用中,Blast是最為常見的一個程序,有著廣泛的用途,具有一定的代表性。雖然許多網站有WEB格式的Blast程序,但這些程序大多是WEB服務器調用命令行版Blast程序,并處理其結果。為了更好的了解其程序的功能,需要熟悉其中的若干參數,而作為Web服務的Blast,許多參數都是用的是默認值,以至于不被注意。

    命令行的Blast可以自由設置這些參數,通過使用不同參數運行程序,并比較其結果,可以加深對該程序的理解。在這里,我們利用一臺計算機配置了一個Linux服務器,并在其上安裝了Blast軟件和Emboss軟件包,配置了Telnet服務。安裝的數據庫包括:swissprot、ecoli等。Emboss生物信息軟件包有多個類別的生物信息學程序,每一個都可以單獨執行。其中的許多軟件對應于非常簡潔、明確的算法,如GOR程序和Smith-waterman程序。

    (2)Web服務器

    Web服務器安裝Telnet控件ActiveSocket、IIS、網絡課件和服務器端Asp程序,包含有調用ActiveSocket組件的代碼。生物信息學算法介紹、程序的使用方法等也都位于該服務器上。

    (3)硬件

    Web服務器:Dell Precision T5400工作站:Intel Xeon E5410,4G內存,250G硬盤。

    Linux服務器:Dell PowerEdge 1300服務器:Intel pentium III,733MHz(主頻),256M內存,18G硬盤

    3 使用方法和界面

    在瀏覽器地址欄輸入192.168.0.1/webcourse/ testpage.asp后,就可以進入測試頁面,同普通的網頁一樣,包含有算法的文字介紹、對應軟件、運行參數、測試數據等信息。

    頁面的左邊是一個樹形的節點列表,每個都對應一個知識點,中間是每部分的內容介紹。當需要進行測試的時候,在頁面右邊有一個類似窗口的區域,在該區域能夠實現Telnet的功能??梢酝ㄟ^該區域向Linux服務器發送各種命令,執行該服務器上的生物信息學程序,等同于連接到真正的Linux服務器。程序的返回結果也在該區域能夠查看。若結果較多時,也可以通過提供的鏈接下載文本格式的結果文件到本地計算機進行查看。

    4 系統的測試運行

    Blast程序:

    登陸到頁面,填好IP地址,用戶名,執行連接,顯示連接成功,在命令文本框輸入:

    blastall -p blastn -d ecoli.nt -i test.txt

    在命令結果文本框就會出現Blast的結果。

    由于在調用Blast程序的時候,沒有使用-o 參數,若使用通用的Telnet 軟件執行該命令后,結果會顯示在Telnet軟件的終端,而不會輸出到文件。當通過ActiveSocket執行該命令時候,ActiveSocket會模擬一個Telnet的終端,獲得執行結果的數據,這些數據最終被服務器端ASP腳本語言接收,并顯示在命令結果區域,出現圖4所示的結果。

    實際上,對于任何一個安裝在Linux服務器上的生物信息軟件,都可以通過網頁調用Telnet的方法運行,并在結果區域查看運行結果,了解算法對應的參數、使用技巧等知識。通過把Telnet功能和WEB頁面集成在一起,可以非常方便地實現算法介紹、測試運行、分析結果的一套完整方案,多目標段學習內容都能夠通過一個網頁實現,達到隨時學習、隨時測試的目的,比傳統的網絡課件功能廣泛而強大。

    四 結論

    網絡新技術由于有更出色的表現力和功能,逐漸增強并取代著傳統的技術。不斷發掘和應用這些新的技術,使網絡課程的設計和建設能達到高效、快捷、多功能的目標,它們的應用能使網絡課件獲得更加出色的表現形式。

    本文通過使用網絡組件提供的計算機間通訊,實現網絡課件的交互功能。利用ASP程序開發了動態頁面,在頁面中加入了訪問運行生物信息軟件的局域網其它計算機的功能,由WEB Server端的ASP程序登錄到Linux主機,完成指定操作,運行相關生物信息學軟件。以Blast程序為例,介紹了系統構架和使用方法。實際上,只需要在Linux服務器上配置更多的算法和軟件,它們也都可按照類似的方法運行,即通過WEB頁面顯示算法的信息,并實現通過WEB的測試運行。在學習過程中,學生只需要訪問網絡課件所在的服務器,根據課件教程,在網頁實現相關算法的運行測試,提升了教學效果。

    參考文獻

    [1] 徐雷.網絡課件若干關鍵技術實現研究及其具體應用[D].杭州:浙江大學,2003.

    [2] 序列處理在線工具包(SMS)生物軟件網翻譯版[EB/OL].

    [3] 陸峰,李新.基于Web 的交互型虛擬實驗室[J].忻州師范學院學報,2006,22(2):54-57.

    [4] 林浩.基于X3D的交互式三維課件設計[J].中國科技信息,

    2005,24:190.

    [5] 胡奇光.VRML在網絡課件中的應用[J].計算機時代,

    2005,3:38-39.

    [6] 何敏,謝桂榮,周家駒.VRML在分子模型中的應用[J].計算機與應用化學,2000,17(2):133-134.

    [7] 劉瑋,胡歡,徐士進,等.VRML和JAVA融合機制用于晶體結構建模[J].計算機與應用化學2007,24(10):1329-1332.

    [8] Ralf Mrowka. A Java Applet for Visualizing protein-protein interaction[J].Bioinformatics. 2001, 17 (7):669-671.

    第8篇:生物信息學分析方法范文

    關鍵詞:基因表達譜;順鉑耐藥卵巢癌;差異表達基因;Enrichr;Cmap

    卵巢癌是女性生殖系統常見的惡性腫瘤之一,在女性生殖系統惡性腫瘤中排名第二,但其死亡率卻位居婦科腫瘤之首[1] ,化療耐藥是影響患者預后的主要原因之一。腫瘤耐藥是一個多因素、多水平、多基因參與的復雜過程,涉及藥物動力學等多層次的各種生物學事件[2],而這些事件最終大多與基因的差異表達有關[3]。因此研究與卵巢癌耐藥相關的基因及其相關潛在治療藥物對提高耐藥卵巢癌的治療效果具有非常重要的意義。本研究通過對順鉑耐藥卵巢癌基因芯片數據的差異表達基因的篩選,并對差異表達基因進行生物信息學分析,進而發現耐藥卵巢癌的潛在治療藥物。

    1資料與方法

    1.1獲取數據集 在NCBI(National Center for Biotechnology)的共享數據庫GEO數據庫(http://ncbi.nlm.nih.gov/geo/,Gene Expression Ombinus)中輸入關鍵詞Ovarian Cancer And cisplatin resisitant 獲得順鉑卵巢癌耐藥基因表達譜數據集GSE15372,包括5個順鉑藥物敏感型樣本,5個順鉑藥物耐藥型樣本。

    1.2順鉑耐藥卵巢癌差異表達基因分析 應用R與Bioconductor軟件對芯片數據進行預處理,分三個步驟:背景處理方法為rma法,歸一化處理使用分位數法,匯總方法使用medianpolish,對每張芯片中變異系數等于或大于10%的部分進行過濾,處理后的基因芯片進行差異基因表達分析。

    1.3順鉑耐藥卵巢癌潛在治療藥物的篩選 我們應用Enrichr在線分析軟件進行順鉑耐藥卵巢癌治療藥物的篩選。通過Enrichr中CMap平臺篩選耐藥卵巢癌治療藥物。將差異表達基因載入到Enrichr輸入菜單中,再應用Enrichr數據庫中的Connectivity Map平臺進行藥物篩選分析。

    2結果

    2.1 GEO數據集信息 GSE15372采用GPL570芯片平臺([HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array),隸屬于美國Affymetrix公司,來源于美國印第安納大學藥物科學學院,由Li M,Nephew KP等人完成并提交到GEO數據庫,共包括10個樣本,其中包括5個順鉑藥物敏感型樣本(GSM385721-GSM385725),5個順鉑藥物耐藥型樣本(GSM385726-GSM385730)。

    2.2差異表達基因 應用R與Bioconductor軟件進行分析,使用Bioconductor中limma軟件包的經驗貝葉斯方法分析GSE15372數據集的差異表達基因,差異倍數在2倍以上、P小于0.01的基因被認為是差異表達基因。通過分析,GSE15372數據集獲得差異表達基因共211個,其中包括上調基因120個,下調基因91個,見表1,表2。

    2.3 順鉑耐藥卵巢癌治療藥物的篩選結果 將差異表達基因載入到Enrichr輸入菜單中,應用Enrichr中的Connectivity Map平臺進行藥物分析,得到P

    3討論

    卵巢癌在所有引起婦女死亡的惡性腫瘤中排名第五位,而在婦科腫瘤當中,是最主要的導致患者死亡的惡性腫瘤。我們從NCBI的GEO數據庫篩選出順鉑耐藥卵巢基因芯片GES15372,并通過R與Bioconductor軟件對基因芯片進行差異表達基因分析,篩選出211個差異表達基因,包括120個上調表達基因及91個下調表達基因。再通過生物信息學方法對差異表達基因進行Enrichr的CMap分析,以挖掘順鉑耐藥卵巢癌潛在治療藥物。對篩選出的藥物進行整合分析,利用PubMed 醫學文獻數據庫對篩選出來的藥物進行調研,確定對順鉑耐藥有作用的候選藥物有血根堿,近幾年有研究發現血根堿在多種腫瘤中均有抗腫瘤作用,但目前國內外均未見血根堿對卵巢癌、耐藥卵巢癌的作用及相關機制研究的報道,因此選擇血根堿作為研究藥物繼續研究。

    血根堿(Sanguinarine)是從博落回中分離出來的異喹啉類生物堿中的苯并菲啶類生物堿,主要存在于白屈菜的全草,紫堇的塊、根等,是我國歷史悠久的傳統藥物之一。目前已發現血根堿的抗腫瘤作用,Tsukamoto H、Le JS分別報道血根堿通過激活caspase誘導口腔鱗癌細胞及HT-29人結腸癌細胞發生凋亡。sun等則報道血根堿通過抑制信號轉導與轉錄激活因子3(Signal transducer and activator of transcription3,Stat3)在酪氨酸705(Tyr705)和絲氨酸727(Ser727) 位點的磷酸化而抑制前列腺癌細胞的生長、遷移和侵潤。同時Pica等報道血根堿有抑制小鼠結腸腫瘤生長及血管生成的作用。上述研究顯示血根堿在多種腫瘤中有抗腫瘤的效應,但國內外均未見血根堿對卵巢癌、耐藥卵巢癌的作用及相關機制研究的報道。因此,我們選擇血根堿為研究藥物,接下來的研究將繼續血根堿對順鉑耐藥的卵巢癌的抗腫瘤作用及期可能的作用機制研究,為血根堿在耐藥卵巢癌中的臨床應用提供理論及實驗依據。

    基于生物信息學技術的基因表達譜分析,我們得到了順鉑耐藥卵巢癌的差異表達基因,并挖掘出了順鉑耐藥卵巢癌的潛在治療藥物。本研究對進一步深入研究順鉑耐藥卵巢癌的治療等具有重要意義。然而,本研究僅從生物信息學角度挖掘了順鉑耐藥卵巢癌的潛在治療藥物,仍需更深入的研究并通過進一步的實驗驗證。

    參考文獻:

    [1]Siegel R, Ma J,Zou Z,et al.Cancer statistics[J].CA Cancer J Clin,2014,64(1):9-29.

    第9篇:生物信息學分析方法范文

    關鍵詞:蛋白質工程 教材 科研 實踐教學

    中圖分類號:G642.0

    文獻標識碼:C

    DOI: 1().3969/j.issn.1672-8181.2015.03.040

    蛋白質工程是指通過對蛋白質進行修飾,改造和拼接以生產出能滿足人類需要的新型蛋白質的技術,是現代生物工程技術的重要內容。而《蛋白質工程》課程,已成為高校生物技術和生物工程類專業的一門重要專業課程。

    蛋白質工程是在基因重組技術、生物化學、分子生物學、分子遺傳學等學科的基礎之上,融合了蛋白質化學、結構生物學、生物物理學、生物信息學和計算機輔助設計等多學科而發展起來的新興研究領域,也是一種是綜合性生物工程。這決定了《蛋白質工程》是一門綜合性很強,對基礎知識要求高,且內容繁雜,并不斷發展的課程,教學難度較大。由于自身條件所限,地方醫學院校在理工類課程,尤其在高等數學、有機化學、物理化學和計算機軟件等課程方面的教學力量比較薄弱,課程設置的深度和廣度不夠,這些給《蛋白質工程》的教學,帶來了難題。

    桂林醫學院生物技術專業已開設《蛋白質工程》課程,為適應醫學院校特點,揚長避短,從培養應用型和創新型人才的目的出發,探討《蛋白質工程》教學內容和教學策略。

    1 教學內容

    參考國內《蛋白質工程》主要教材和生物技術專業相關專業課程教學大綱,教學內容安排如下:

    除緒論外,《蛋白質工程》包括以下六部分內容:①蛋白質分子基礎;②蛋白質物理化學性質;③蛋白質分子設計、化學修飾及表達;④生物信息學和蛋白質組學;⑤蛋白質工程技術在現代生物技術中的應用;⑥蛋白質工程相關的現代生物技術。

    以下就教學內容做具體說明。

    1.1 蛋白質分子基礎

    在復習和鞏固《生物化學》課程“蛋白質結構和功能”相關內容的基礎上,提升“蛋白質分子基礎”的深度和廣度,加深對蛋白質結構和功能的關系的理解,熟悉蛋白質結構測定的方法,并了解蛋白質結構的預測。這部分內容雖然和《生物化學》內容有部分重疊,但不可輕視,它是這門課程的基礎。具兄弟院校相關教師反映,不少學生對這部分基礎內容的掌握確實不夠扎實,從氨基酸的英文縮寫,氨基酸和多肽在溶液中的帶電性質,到二十種氨基酸對二級結構的貢獻等,都需要強化記憶。這部分內容中,蛋白質結構測定的方法和蛋白質結構的預測是重點,尤其是前者,需詳細講解。其它部分,老師講解為輔,學生復習和鞏固為主。

    1.2 蛋白質物理化學性質

    這部分內容的學習需要一定的物理化學基礎,而這可能是學生們的薄弱環節,應該在復習鞏固化學熱力學和動力學的基礎上,以蛋白質折疊為核心,展開教學內容。

    1.3 蛋白質分子設計、化學修飾及表達

    這部分是本課程最主要的內容,也最能體現蛋白質工程的特色。通過講授和學習,要求學生掌握蛋白質分子設計的原理,熟悉蛋白質分子設計和白質化學修飾的內容與方法,并熟悉蛋白質基因工程改造及重組蛋白表達,這些均需要詳細講授。

    1.4 生物信息學和蛋白質組學

    生物信息學和組學,是目前生命科學研究和生物醫藥研究開發的“利器”,因此,本課程為生物信息學和蛋白質組學單獨設立一個章節。這部分內容,要求熟悉生物信息學和蛋白質組學的概念、基本方法及應用,了解生物信息學與蛋白質組學的關系,熟悉蛋白質數據庫并了解其在蛋白質結構預測方面的應用。

    1.5 蛋白質工程技術在現代生物技術中的應用

    這部分內容主要由學生自主授課,由老師擬定大概的內容和范圍,主要圍繞組織工程、蛋白質芯片、生物傳感器和生物制藥等內容展開,也可不拘泥于這些內容。

    1.6 蛋白質工程相關的現代生物技術

    主要講授近年來興起的現代生物技術,例如蛋白表面展示技術、蛋白分子印跡技術、原子力顯微鏡技術等,可根據生物技術發展和更新做出調整。

    2 教學策略

    2.1 教材的選擇

    蛋白質工程是一門新興的課程,并且發展速度很快,與其他科目相比,存在可選擇范圍小,更新速度不夠快等問題。在現有的教材中,單獨選擇一本是不夠現實的。我們選用汪世華教授主編的《蛋白質工程》(科學出版社,2008年出版),作為本課程的主要參考教材,該教材知識面廣、難度適中,內容也較新。另外選擇李維平主編的《蛋白質工程》(科學出版社2013年出版),和梅樂和主編的《蛋白質化學與蛋白質工程基礎》(化學工業出版社,2011年)為參考資料。如果條件成熟,我們將自行組織編寫更適合醫學院校的教材。

    2.2 體現以學生為主體的教學思想,著重學生自主學習能力的培養

    在教學過程中,充分體現以學生為主體的教學思想,通過課堂內講授和課堂外輔導相結合,增加師生溝通交流,積極了解學生對專業知識的自我要求,對教學內容和教學方法的意見和建議。要積極應對學生的反饋,必要時調整授課內容和方法。

    在課堂講授中,盡可能地介紹最新進展,并鼓勵同學通過主動學習,了解自己感興趣或老師布置的關于蛋白質工程的新內容、新技術、新進展。騰出一定的課時,讓學生自行選擇題目,制作多媒體課件,進行授課,讓學生組織開展課堂討論,由教師進行講評和總結。另外,通過安排學生獨立完成專題論文的撰寫,進一步提高自主學習能力。

    2.3 將科研工作引入教學,激發學生科研興趣

    在教學過程中,任課老師可將自己的科研成果或其他老師的科研成果,引入到相關教學內容中,通過自己的科研經歷,講述通過蛋白質工程和蛋白質化學相關技術,去解決科研問題,并取得創造性成果的過程。筆者承擔過組織工程支架材料的制備和改性、蛋白質組學和生物信息學方面的研究,制備過小腸粘膜下層支架材料、膠原蛋白膜等生物材料,開展過蛋白二維電泳、質譜分析和生物信息學分析等實驗。通過這些科研材料的展示,讓學生了解到利用蛋白質技術,可開展生物村料和蛋白組學等應用和基礎研究,從而加深對課堂講授內容的認識,激發科研和開發興趣。

    2.4 加強實踐教學,培養學生解決實際問題的能力

    蛋白質工程的實踐性很強,必須加強實踐教學。我們安排實驗課的學時和理論課的學時之比為1:1,安排了蛋白質分離純化和活性鑒定、蛋白質改性和修飾、蛋白質的固定化和標記等實驗內容,均為綜合性實驗,需要學生自主設計。這些實驗課程,引導學生獨立開展實驗,利用所學理論和技術,解決將來可能遇到的實際問題。另外,我們安排學生到桂林的相關高新技術企業和實驗室參觀見學,有條件的可進行產品研發和科研實習,進一步拓展實踐教學。

    教學是一門技術,更是一門藝術,教師要不斷加強理論學習,并在實踐中摸索經驗,不斷改進自己的教學方式和方法,以提高自身的業務水平。筆者初步探討了《蛋白質工程》教學內容和教學策略。希望這些教學內容和教學策略,能激發學生學習興趣,培養學生的實踐能力和創新能力,圓滿完成教學任務,提高教學質量奠定基礎;同時也將教學中的這些嘗試和其他師生一起探討和分享,互相學習和提高。

    參考文獻:

    【1】汪世華.蛋白質工程【M】.科學出版社,2008.

    【2】李維平.蛋白質工程【M】.科學出版社,2013.

    【3】梅樂和.蛋白質化學與蛋白質工程基礎【M】.化學工業出版社,2011.

    【4】查錫良,藥立波.生物化學與分子生物學【M】.人民衛生出版社,2008.

    【5】尤曉顏,韓靜.淺談《蛋白質工程》教學體會【J】.中國科教創新導刊,2012,(32):139-140.

    主站蜘蛛池模板: 亚洲国产成人九九综合| 国产成人免费午夜在线观看| 成人精品一区二区户外勾搭野战| 亚洲免费成人网| 久久成人无码国产免费播放| 欧美成人性视频播放| 成人最新午夜免费视频| 麻豆亚洲AV成人无码久久精品| 欧美国产成人精品一区二区三区 | 成人字幕网视频在线观看| 日韩成人一区ftp在线播放| 国产成人综合久久综合| 亚洲成人第一页| 成人午夜福利视频镇东影视| 亚洲成人午夜电影| 国产成人啪精品午夜在线播放| 成人欧美一区二区三区小说 | 成人综合国产乱在线| 国产欧美日韩成人| 18岁日韩内射颜射午夜久久成人| 成人免费观看视频高清视频 | 国产成人免费a在线资源| www成人免费观看网站| 四虎国产精品成人免费久久| 成人动漫在线免费观看| 亚洲成人黄色在线观看| 国产成人精品久久综合| 成人欧美一区二区三区在线观看 | 国产成人久久精品二区三区| 久久成人国产精品| 免费视频成人片在线观看| 在线观看亚洲成人| 成人欧美一区二区三区的电影| 成人黄色在线观看| 中文国产成人精品少久久| 四虎精品成人免费影视| 国产成人午夜高潮毛片| 国产成人精品AA毛片| 国产成人精品久久亚洲高清不卡| 日本娇小xxxⅹhd成人用品| 色窝窝无码一区二区三区成人网站|