前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的統計學的標準差主題范文,僅供參考,歡迎閱讀并收藏。
選股不如選時,可見股市中買入股票時間的重要性。要選擇買入股票的時間就必須準確的把握股票運行的趨勢,尤其是中長期趨勢。雖然目前常采用一些股票技術分析方法對股票的趨勢進行預測,但是這些方法也常被莊家采用,通過人為的做市成為迷惑投資者的工具,從而導致有些技術分析方法的效果往往適得其反。因此,尋找一些新的分析方法往往會取得較好的效果。文章在高中數學知識的基礎上引入加權標準差方法,通過對權值的修正達到預測股市趨勢的目的。
股市技術分析方法概述
股市的分析通常包括基本面分析和技術分析方法。股市基本面分析是從國家的政策和公司的發展等角度對股市運行的趨勢進行預測。投資者通過深入分析這些基本面信息能有效的把握股市的長期趨勢并選擇相應的股票買入和賣出。股市技術分析則是以股票價格作為主要研究對象,以預測股價波動趨勢為主要目的,通過數學中的統計學理論計算和分析相應的股市評測指標并通過這些指標及其相應的圖表對股市及其單個的股票價格趨勢進行預測的方法。投資者通過對股市進行深入的技術分析能較有效的確定股市的趨勢以及買入和賣出股票的時間。股市技術分析的重點是分析股票的價格、成交量、時間以及股票價格波動的幅度。 股市技術分析中最經典的方法是道氏理論、江恩理論和波浪理論。
道氏理論最初由美國人查爾斯?道提出,通過實踐的檢驗它成為預測市場趨勢的晴雨表,同時成為股市技術分析方法的開創者。道氏理論是一種技術理論,它是根據價格模式的研究,推測未來價格行為的一種方法。道氏理論認為股票會隨市場的趨勢同向變化以反映市場趨勢和狀況。股票的變化表現為三種趨勢:主要趨勢、中期趨勢及短期趨勢[1]。由于其對股市運用趨勢良好的把握,因此,今天道氏理論仍然運用在股市分析中。道氏理論由于認為對數據的統計與前期數據存在較大的偏差才能對趨勢的變化進行確定,因而其預測的結果存在滯后性。
江恩理論最初由投資大師威廉?江恩提出,它通過對數學、幾何學、宗教、天文學的綜合運用,建立起獨特分析方法和測市理論并結合其在股票和期貨市場上的驕人成績和寶貴經驗總結而來。江恩理論主要包括江恩時間法則,江恩價格法則和江恩線等。江恩理論認為股票、期貨市場里也存在著宇宙中的自然規則,市場的價格運行趨勢不是雜亂的,而是可通過數學方法預測的。它的實質就是在看似無序的市場中建立嚴格的交易秩序,并以此來發現何時價格會發生回調和將回調到什么價位[2]。
美國證券分析家拉爾夫?.納爾遜?.艾略特通過對股市指標描述的技術圖形的分析發現股市存在13種形態和波浪,并認為其在股市上會重復出現,以此為依據通過技術圖形中波浪數量和結構的研究實現對股市運行趨勢的預測。他認為股市運行的過程呈現一種周期性的變化,每一周期包含5個上升浪和3個下跌浪。艾略特波浪理論認為股市運行的周期有長短之分,長的達到上百年,短的僅僅以小時計,同時其將股市運行的周期按時間長短分為九大類,九大類結構中不論周期的長短每一周期均由8個波浪構成。
目前的股市技術分析方法被大多數投資者采用,成為買入和賣出股票的重要參考依據。但一旦大多數投資者都采用這些相同的方法時,結果往往適得其反。并且機構投資者往往通過這些技術分析方法逆向操作,迷惑和欺騙投資者。因此,如果避開這些傳統的方法分析股市的趨勢效果往往更好。
標準差是整個測量數據標準值與其平均數離差平方的算術平均數的平方根。它反映的是測量的數據中偏離平均值的個體多少的離散程度。標準差越大說明數據偏離平均值越多。標準差越大也可以認為數據越不穩定。一個較大的標準差,代表大部分的數值和其平均值之間差異較大;一個較小的標準差,代表這些數值較接均值。
基于標準差的股市趨勢分析
標準差表示的是數據集中的個體偏離標準差的多少,標準差越大說明偏離平均值的數據越多。當股市發生趨勢性變化時,將有越來越多的指標所代表的數據偏離原來數據集合的平均值,因此,采用標準差能對股市趨勢進行預測。在采用標準差預測股市趨勢前有兩個問題要解決。首先,股市每一天的指標數據對預測股市的貢獻是不一樣的,越是近期的指標數據越能代表當時股市的趨勢。其次,指標數據尤其是股票的價格包括每天的最高價,最低價,開盤價和收盤價莊家是可以操縱的,如果直接拿來分析結果往往會存在較大的誤差。與股價相比成交量往往更接近真實的情況,因此要結合成交量來分析股價。第一個問題可以對指標數據施以權重來解決,根據指標數據不同的時間給予不同的權重,越是近期的數據權重越大,從而能對趨勢的預測有指引作用。股市中的各種價格常常帶有欺騙性,因此可以把成交量作為權重計算一個帶有權重的價格,為更加真實的反映實際情況,每天成交量的計算時間不可太長,如可取10分鐘,15分鐘,30分鐘等。
采用標準差的股市趨勢分析方法具體步驟如下:
(1)設10分鐘內的某股票成交的最高價為 ,成交的最低價為 ,則認為這10分鐘內股票的價格為 。
設這1 0分鐘內的該股票成交量 為,則這10分鐘內該股票的價格為
(2)設該股票全天成交量為M,以10分鐘為一個時間段全天的交易分為p個時間段,該股票全天的價格為 ,則
(3)對N天的股票價格進行分析,設每天股票價格的權重為 ,越是近期的價格權重的值越大,N天的股票平均價格為μ,則該股票的標準差為σ
。
(4)對股市中股票的標準差進行分析,確定標準差σ的閾值,當標準差σ超過閾值時可確定股票的趨勢正發生變化。
實驗分析
為確定本方法的有效性,本文采用了深萬科股票作為研究對象,時間區間為2015年11月至2016年8月,下圖1為深萬科的股價走勢,圖2為萬科股票日標準差。
從圖2看出當股價日標準差數值發生突變時對應的股價這時剛好發生趨勢性改變,兩者的變化是同步的,沒有滯后效應,因此,采用標準差的方法預測股價的走勢具有可行性。
【關鍵詞】統計學原理;應用
一、《統計學原理》簡介
《統計學原理》是一門集搜集、整理和分析統計數據于一身的方法論科學,它主要用來研究數據的內在數量的規律性。進行統計分析的基礎是獲得統計的數據,而數據的收集與分析之間有一個必不可少的環節就是對統計數據的整理,統計學的核心內容就是統計數據的分析。
《統計學原理》的基礎是統計學科在各個領域中的普遍應用,它的出發點是要解決實際的問題,統計方法論的實際效用是它的側重點,把定量分析與定性分析有機的結合起來。它把理論和實踐相聯系,這樣對學生在實際工作中的實際操作能力有促進作用。
《統計學原理》主要包括:統計學的研究對象和方法、統計學的基本范疇、統計調查的意義、統計調查的方法、統計整理的內容、統計分組、統計分布、統計表、總量指標、相對指標、變異指標、綜合指標的應用、樣本和總體、抽樣估計的方法、假設檢驗方法、相關圖表和相關系數、回歸分析、綜合指數和平均指數、指數數列等等。
二、《統計學原理》與計算機科學相結合的必然趨勢
在科技高速發展的現今社會,信息化是主要的趨勢,自然而然信息化的需求也就越來越突出,對于人們來說,通常都要對大量的數據進行收集,并且還要對所收集的數據進行仔細的分析,分析過后還要對一些有價值的數據進行提取,提取過后再做出正確的決策?!督y計學原理》就是一門對怎樣合理的進行數據收集、整理以及分析并進行研究的學科,在人們制定一些決策時,都要把它作為主要的依據。那么,對于現代統計方法來說,它和現代信息處理技術是分不開的,隨著計算機運行能力的不斷提高,對于大規模統計調查的數據的處理來說,就會顯得更加的精確以及方便快捷。所以,《統計學原理》越來越不可能脫離計算機技術,當然,計算機技術的應用的深入,也同樣不能離開《統計學原理》的發展以及完善。對計算機技術進行充分利用,并通過計算機軟件將統計方法中比較復雜的計算構成進行簡便化,統計輸出的結果就一目了然了,這樣,統計方法的普及就會顯得非常容易了。所以,在對這門學科進行學習時,不但要把統計方法學好,還要會對商品化統計軟件進行充分的利用,對計算機信息系統開發的一些基本思想以及計算機基本程序的設計要進行掌握,除此之外,還要學會通過編程來把具體單位的統計模型進行實現,從而把統計決策支持系統建立起來。
總的來說,把《統計學原理》和計算機以及信息相結合起來這是一個時展的產物,是一個必然的趨勢。只有正確的把《統計學原理》與計算機有機結合起來,才能使統計擺脫傳統的復雜計算,從而變得越來越簡便,越來越科學化。
三、《統計學原理》在教學過程中的應用--以相關系數的計算為例
(一)利用基本公式計算相關系數促進理解推導過程
對于相關系數的基本公式來說,就是要把方差標準化消除具體單位,從而轉化為統一量綱的相對數,這樣,對不同單位的資料進行對比就方便了許多。在利用基本公式計算相關系數時,需要對兩個變量的標準分進行計算,手工計算繁瑣費事,在excel中可以輕松實現。
那么,在Excel中能夠實現數據標準化的就是STANDARDIZE函數,它是返回平均值是mean,標準差是standard-dev的分布的正態化數值,計算標準分是以平均數和標準差為基礎的。對于STANDARDIZE函數來說,它需要對平均數和標準差進行輸入,可以利用AVERAGE函數來對平均數進行求解,求標準差是用STDEVP來實現的。下面以某省近幾年的城鎮居民家庭可支配收入和消費性支出為例,來對操作過程進行演示。在Excel表格中點B10單元格,輸入AVERAGE(B3:B9),這樣就求出了可支配收入的平均數為9966。點B11,輸入STDEVP(B3:B9),這樣就求出了標準差為2404。選擇與原始數據同樣數目的單元格(D3:D9),用STANDARDIZE函數,根據具體要求對參數進行輸入,x輸入(B3:B9),mean參數就是要求輸入平均數,直接點擊B10引用即可,standar_dev參數是要求輸入標準差,則點擊B11進行引用。按F2進行數組操作,然后按shift+ctrl+enter,就對可支配收入進行了標準化,數據顯示在(D3:D9)。對消費性支出做同樣的操作,在(E3:E9)輸出標準化數據。對兩個變量進行標準化后,需要計算兩個變量標準分的乘積。選擇F3單元格,輸入“=D3*E3”,點擊回車鍵就得到了第一個乘積,然后下拉單元格并進行復制,就在(F3:F9)得到了所有的乘積。最后對這些乘積的平均數進行計算,選擇F10,利用AVERAGE函數求出平均數為0.999615,這個就是遵循基本公式,按照步驟求出的積差相關系數r。
按照上面的這些步驟對相關系數進行求解后,為保險起見,最好利用excel中的其他方法再次計算相關系數,是各種方法進行相互的驗證,這樣也方便對各種計算公式的推導過程進行理解??梢灾苯釉诠ぞ卟藛蜗碌臄祿治龉δ苤羞x擇相關系數項進行計算,這種方法也就是大多數統計實驗課程采用的方法。excel中的correl函數是直接利用計算相關系數,而與correl函數不同的是,pearson函數直接用簡捷公式求相關系數。這三種計算方法與上面利用基本公式的計算出的結果是相同的。
在利用實際數據計算相關系數之前,要先讓學生對經濟學中消費和收入的相關理論進行回顧;計算后再加以總結,宏觀經濟學認為消費支出與可支配收入存在函數關系,上面的計算的相關系數近似等于1,這就說明了兩者存在線形相關的密切程度是十分大的,也就是對這一理論的成立進行了證明。這一步驟有助于引導學生利用統計學驗證經濟理論,也對統計學的實用性進行了充分的證明。
(二)驗證回歸直線斜率與相關系數的關系促進理解幾何意義
對可支配收入和消費性支出兩個變量的原始數據進行標準化,這樣就得到兩組消除了量綱的數據,那么根據這兩組數據來畫出最優擬合直線,那么,表示相關系數的就是直線的斜率,這也就是相關系數的幾何意義?;貧w直線可以按照最小二乘法,通過原始數據來得出,直線斜率b就表示了消費性支出隨支配性支出的變化程度。相關系數r作為標準化數據的斜率,只要乘以一個數字就可以還原為原始數據的斜率b。我們同樣可以用excel函數SLOPE來對兩個斜率進行求解,然后加以驗證。對于上面的計算,我們還可以繼續,就是點擊G3,輸入函數SLOPE(E3:E9,D3:D9),得到標準化數據的斜率0.999615,這得到的就是相關系數。點擊G4,輸入函數SLOPE(C3:C9,B3:B9),得到原始數據的斜率0.617952,此斜率表示可支配性收入每增加一元則消費性支出就增加0.62元。在G5輸入“=C11/B11”,得到的數值0.61819??梢栽贕7單元格輸入“=G3*G5”驗證b和r之間的推算關系是成立的。
四、結語
總之,學習《統計學原理》不單單能使人們的思維方式從主觀向客觀進行改變,而且對于提高人的綜合分析能力也有十分重要的幫助,并且具體行為也能變得客觀正確。所以,對于人們來說,學好這門課程是十分重要的,只有學好了這門課程,才能在眾多領域進行更好更正確的應用。
參考文獻
[1]高敏雪.經濟社會統計[J].中國人民大學出版社,2005
關鍵詞:替米沙坦 高血壓 變異性 氫氯噻嗪
中圖分類號:R544.1 文獻標識碼:A 文章編號:1672-3791(2015)03(b)-0232-01
高血壓屬于很多心腦血管疾病的一個重要原因以及一個非常重要的危險因素,在高血壓患者血壓升高的過程中,也升高了有關方面的血壓變異性特點,而變異發生的程度和心腦血管疾病發生的概率有著一定的相關聯系。所以說對于高血壓患者進行血壓降低的時候,也應當注重進行血壓變異性的降低。替米沙坦氫氯噻嗪膠囊可以說是一種復方制劑,也是一種對于高血壓來說非常有效的藥物,其聯合用藥的過程中能夠產生與劑量有著明顯關系的作用,而且沒有比較大的不良反應。在2012年6月~2013年6月之間,該研究者通過有關資料觀察了替米沙坦氫氯噻嗪對于血壓變異性所產生的一系列的影響,現報道如下。
1 資料與方法
1.1 臨床資料
對于門診原發性的高血壓患者資料進行收集,都符合有關防治指南之中的收縮壓標準以及舒張壓標準。在排除繼發性高血壓、嚴重心腦血管病、甲狀腺功能亢進以及惡性腫瘤等疾病之后。一切患者都停止服用藥物,并在接受洗脫之后進入到試驗當中。實驗有著相應的入選標準。
其中有158位病人納入到了研究的過程中,包括93位男性,65位女性,年齡在42~70歲之間,這些人都經過了相應的安慰藥治療,也就是洗脫的過程,在之前通過血壓監測儀對于其血壓進行檢測,并依照夜間收縮率的下降進行分配。
1.2 治療方法
所有患者都進行ABPM治療,在進行洗脫階段之后,清晨空腹進行替米沙坦氫氯噻嗪膠囊的服用,如果說DBP的含量小于某種標準的話,則維持原劑量,不然的話則增加一倍劑量,服藥時間一共有8周左右。
1.3 觀察指標
對于全部患者的性別、年齡以及吸煙、冠心病、糖尿病等病史進行一定的了解,并對一切患者進行生物化學常規檢查,對于空腹血糖以及腎功能和肝功能等方面進行一系列的檢查,并對于數據進行記錄。
在治療前后進行ABPM的檢測:患者全部不準喝酒,每天吸煙的數量控制在5支以內,每天服用的食鹽少于6g,對于脂肪攝入進行控制。在治療之前以及之后8周的時間之中進行ABPM的檢測,并采用美國的進口血壓監測儀進行動態的監測。監測方法為,在患者左上臂處綁上袖帶,以24小時為周期進行檢測,白天每半小時進行一次測量,有效檢測次數應當占據測試次數的80%以上,如果說指標超越某個值的話,也就判定為無效數據,需要重新進行測量,統計項目是:第一,在24小時之內的平均舒張壓以及收縮壓;第二,在白天平均的收縮壓和舒張壓;第三,在夜間平均的收縮壓以及舒張壓;第四,在24小時內收縮壓以及舒張壓的標準差;第五,在白天收縮壓以及舒張壓的標準差;第六,在夜晚收縮壓以及舒張壓的標準差。依照上述時段的參數能夠得到很多重要的信息內容。
1.4 統計方法
利用正規的統計軟件展開相應的數據分析,所有的數據表示方法都是比較規范的,在組間進行的比較都采用t進行檢驗,兩組治療前后利用配對t展開相應的檢驗,其數據有著相應的統計學意義。
2 結果
2.1 比較兩組患者全身因素
相對于勺形高血壓組來說,另一組的患者有著較高的缺血性腦血管病以及冠心病的歷史,但是高血壓的疾病歷程相對來說比較長,不過在吸煙以及糖尿病史等方面來說,兩組之間的差異并不具有統計學方面的意義,對于一些數據分析來看,兩組之間的血脂以及血糖水平也沒有相應的統計學意義。
2.2 比較兩組患者血壓變異性
相對于非勺形高血壓組來說,另一組在治療前24小時,白天以及夜間DBP以及SBP的標準差都出現了降低的情況。相對于治療之前來說,兩組治療之后24小時,白天以及夜間的DBP以及SBP標準差出現降低,不過兩組之間的差異并不具有統計學方面的意義。
3 討論
在這些年來,國內外對于流行病學的研究以及討論結果表示,高血壓患者之中,心腦血管疾病發展以及發生的一項非常重要的因素就是血壓的變異性,其所具有的預測作用比平均血壓要大得多。血壓變異性指的就是在某個時間段之內,血壓展開波動的范圍,反映了血壓跟隨血管的節律以及反應性展開的變化,通常有一定的表示方法,也是在均值之外一個獨立的指標。所以說,治療高血壓,并不需要將24小時之內的血壓值降低,還應當在這段時間之中,平穩持久的進行降低,這樣一來才可以更好地防止高血壓傷害心臟和大腦等器官,并且能夠進一步減少心腦血管事件的出現,避免給人體造成各種各樣的危害或者說其他方面的危險情況。
參考文獻
一、平均分數體現整體水平
1、某班某學科的平均分數
x1=
2、求N個班某學科的平均分數應“加權”
x=
其中x表示加權平均數,ki表示第i班總人數,xi表第i班平均分數。
二、標準差反映平衡程度
除了解體現整體水平的平均分數外,還應了解每個人的分數離班平均分數的偏差大小。因此可以利用數理統計中的標準差計算公式
δ=
(其中x為卷面分數,x為平均分數,N為全班總人數)。例如,甲乙兩班同一科的平均分數都是81.5分,標準差依次為9.2和10.3,從而知甲班比乙班要穩定些,發展平衡些。
三、“標準分”取代卷面分來評估每個學生學習成績的總體水平
在評先、評優和獎學金中,常要比較學生成績的優劣。例如:某班數學卷面平均分數為:x1=69.4,標準差為δ1=8.5。語文卷面平均分數為:x2=87.6,標準差為δ2=10.5。學生張某數學60分,語文94分。王某數學83分,語文68分,按傳統的方法認為:張總分154比王151分多,因此張優先于王。這種評估是不合理的,原因是各科之間的卷面分數的參照點(零點)與單位都不同,不能相加求和來互相比較。
在現代的體育統計和有關統計文獻中,都采用“標準分”(符號意義同上),即學生的成績與班平均分之差比標準差。這樣能統一尺度,具有合理的可比性。如張和王的成績可以合理的評估如下(表1):
表1
(注:習慣用正分,故一般取T=10Z+50,T分大約在20至80之間。它是把Z分擴大10倍,又往后平移50,消除了負數。)結果張兩科總標準分95次于王97.3,與卷面分數結論相反,標準分反映學生在全體考分中的相對位置,故又稱相對分。至于不同班級、不同學科的總分,由于試卷有難易之分等因素,更應采用標準分。
四、考試分數合理分布的評估依據
怎樣評價一班的考試分數的分布是否合理,依據是什么?以前有關文獻都認為:卷面分X是正態隨機變量X~N(x,δ2),標準分Z服從標準正態分布Z~N(0,1)。但都沒有加以論證或進行實際的統計分析。因此有些提法不盡妥當:因為樣本平均分數x與樣本標準差δ均為統計量,是隨機變量,而正態分布的兩個參數都是常數;如果X是隨機變量,X~N(μ,δ12),X1,X2,∧XN是來自總體X的樣本,則x是μ的無偏估計。δ是δ1的極大似然估計,一般地其觀察值x≠μ,δ≠δ1,所以X~N(x,δ2)的提法不妥。而且也推不出Z~N(0,1)(證略)。
但是,通過多年來對我校各個教學環節情況比較正常的教學班的考試分數的統計分析發現標準分Z是近似服從標準正態分布的(有文獻曾認為或假設Z近似地服從標準正態分布的說法)。由數理統計學可知:隨機過程可以用族中的典型樣本函數來表征。因此我們可以把Z近似地看作服從標準正態分布的隨機變量,從而以標準正態分布作為評估學生考試分數合理分布的依據,根據“3δ”原則換算出標準分的合理分布評估依據:分段比例和累計比例。
(1)分段比例:
T≤20的比例為0.0013
40<T≤60的比例為0.6826
30<T≤70的比例為0.9544
20<T≤80的比例為0.9974
T>80的比例為0.0013
(2)累計比例:
T≤30的比例為0.0228
T≤40的比例為0.1587
T≤50的比例為0.5000
T≤60的比例為0.8413
T≤70的比例為0.9772
T≤80的比例為0.9987
記:│(取T≤20的人數/總人數)-0.0013│=A1
│(取T>80的人數/總人數)-0.0013│=A2
│(取40<T≤80的人數/總人數)-0.6826│=A3
│(取30<T≤70的人數/總人數)-0.9544│=A4
│(取20<T≤80的人數/總人數)-0.9774│=A5
則ΣAi=A1+A2+A3+A4+A5的值越小說明說明分布越合理。并在記分冊中增加“平均分”,“標準差”,“標準分T”三欄,以方便教學管理部門進行評估。
五、統計分析實例
以我校2005級會計一班數學成績為例見表得知(見表2,表3),是基本符合標準正態分布的。同時發現,越是成績好的學生,各科卷面總分和標準總分排名基本相同,且各科成績越平衡;越是各科成績不平衡的,卷面總分與標準總分排名就相差較大(如第3,24,26學號),由此說明由標準分來評估學生學習成績的總體水平是合理的科學的。
六、總結
通過以上討論和計算,可以得出以下結論:
1、在沒轉換成標準分之前,各科的分數是不能比較的。
2、用原始分高出平均分多少來衡量各科,也是很不科學的。
3、一旦轉換成標準分,不但上述比較變得科學易行,而且各次考試之間也是應該比較的。如Z后次–Z前次=進步幅度。
4、平均分反映整體水平;標準差反映班級整體發展平衡程度;標準分反映學生個體各科發展的平衡程度。
4、分段比例和累計比例是學生成績合理分布的評估依據。
5、統計數據與理論數據之差A1,A2,A3,A4,A5之和ΣAi是刻劃合理分布程度的依據。
6、任何一次大型考試,不但要公布“平均分”,而且要公布“標準差”。這兩個參數都是十分重要的。這樣,各校,各班,個人在這個大系統中的地位都可以很容易的算出。
關鍵詞:正態分布 綜合測評 標準分
1 引言
如何對學生進行綜合測評,一直是教育界研究的課題。目前在大學里,需要對學生進行綜合測評以決定學生的綜合排名,進而決定了學生的獎學金分配。綜合測評的依據自然是學生各門課程的分數。一般來說,通過測驗所直接得到的分數,叫原始分數。由于各個測驗的難度不同,各原始分數的價值也不相同,不同測驗的原始分數不能進行直接比較。因為僅從個別學生的原始分數,我們無法了解他學習成績的好壞,知識能力的高低,也無法與其他學生相互比較。為了使原始分數本身具有意義,使不同測驗的原始分數可以相互比較,就必須把它們轉換成導出分數。所謂導出分數就是經過統計處理過的,具有一定參照點和單位的、可以比較的分數。在教育測驗中常用的導出分數有百分等級分數和標準分數。
大量研究表明,凡符合教學規律的考試。其總體成績應服從或接近服從正態分布,即成績呈現中間多、兩頭少的態勢。根據這一特點,許多教育工作者也對此進行了很多有益的嘗試,提出了許多有用的方法。文獻[3]給出了一種給出了一種修正成績為正態分布的一種算法。筆者認為,雖然該方法對成績的修正沒有改變學生的排名順序,但是這樣的修正至少改變了老師原始打分的初衷。況且對于樣本量不是很大的情況,這樣的修改也不是很合理的。文獻[4,5]則是給出了學生考試成績分布的擬合,不同的班級的成績有不同的擬合參數。他們的方法對成績分析是有益的,但是對于成績的綜合評價沒有給出相應的方法。我們在原始分數正態分布假設基礎上,采用了把原始分數轉換為標準分的方法。并以此為基礎,在EXECEL環境下實現了各門課的原始分向標準分的轉換,并對綜合成績進行了測評。我們認為該方法的可操作性強,轉換理論可信[1],對于多門課程的綜合測評有著很大借鑒意義。
2 轉換原理
定義1 設原始分數ξ~ N (μ,σ2) ,其中μ是數學期望,它刻畫了ξ的統計平均值,σ2 是方差,它刻畫了ξ取值關于其數學期望的偏離程度,則稱ξ的標準化。
(1)
以這個為標準分數。其中,μ為平均分,σ為標準差。此時有η~ N (0,1)。
實質上標準分數是以平均分數為參照點,以標準差為統一單位的導出分數。這里既考慮了每門學科不同分值與其各自平均分數的差異,又用其標準差作為統一單位。故用標準分數來衡量學生成績的相對地位是科學的,具有可比性。由于η的數學期望E (η) =0,方差D(η) =1,每門學科之標準分數的數學期望和方差都一樣,表明各門課程所處的相對地位是平行的,因而可對標準分數用代數方法處理,得出科學的結論。標準分數是原始分數的線性變換,對于原始分數在整體中所處的位置具有“保序性”。根據正態分布N (μ,σ2 ) 所具有的“3σ原則”性質,標準分數η滿足P ( - 3
定義2在教育統計學中,若記X 為應試者在被試科目中的原始分數,X為該被試科目原始分數的平均分數,S 為該科目試卷的標準差,則稱標準分數:
(2)
由上式可見,標準分數是一個以平均值為參照點,以標準差為單位,測量原始分數與其平均分數的距離的量數,可以表示一個原始分數在團體中所處的相對位置。不管原始分數的平均分、標準差如何,相同的標準分表示在分布中處于同樣的相對位置。
平均分數和標準差的計算公式如下:
(3)
(4)
另外,為了使標準分更符合我們平時的記分習慣,可將標準分Z轉化為另一種標準分T??紤]到Z 分數會出現負值以及常帶有多位小數這些不自然的情況,為了消除負值,并盡可能使標準分數與原始分數相近,特對標準分數Z 進行線性變換T=αZ+β,這里取α=10、β=50,其計算公式是:
T = 10Z+50(5)
3 應用與分析
由于整個轉換工作比較簡單,在EXECEL中簡單完成這些操作時可行的。表1給出了1個班級1門課程的分數轉換求解的過程。
表1 EXECEL計算標準分示意圖
表2 綜合測評原始分和標準分的排名對比
在表1中,“A1:A31”給出的是學生姓名;“B2:B31”給出的是課程的原始分;“B32”給出的是原始平均分,由公式“=AVERAGE(B2:B31)”求得;“C2:C31”是個原始分與平均分的差的平方,其中“C2”由公式“=(B2-B$32)^2”求得,其他“C3:C31”求法類似;“C33”給出的是標準差,可以由公式“=SQRT(AVERAGE(C2:C31))”求得;“D2:D31”給出的是標準分Z,其中“D2”由公式“=(B2-B$32)/C$33”求出,其他“D3:D31”求法類似;“E2:E31”給出的是另一種標準分T,其中“E2”由公式“=10*D2+50”求出,其他“E3:E31”求法類似。
表2給出的是5門課30位同學的原始總分和標準分的對比。
從表2中可以看出,綜合測評情況下標準分的排名與原始分排名發生了一些變化。究其原因就是強調了各門課程的相對地位是平行性。例如,原排名第2的“學生11”原總分422,現在卻排在第4,而原排名第3的“學生15”總分同樣是422,現在排在第2。我們可以看到,“學生15”的各門課成績是:“95、90、93、76、68”,而“學生11”的各門課成績為“82、80、82、82、96”。相比之下,盡管兩個學生的總分相同,但前者有3門課處于90以上,后者只有1門90以上,所以現在的排名應該更加合理。
4 結論
本文給出一種利用正態分布規律對每門課的成績進行標準化處理得到標準分,進而求得標準分總分的方法。從理論和實際效果分析看,這種方法得到的結果比原始分數更加公正合理。當然,教育評價的公平公正總是相對的,絕對公正也是難以做到的。本文給出的只是向著更加公正所做的一種嘗試而已。
本文的方法也存在一些缺陷,還可以作進一步的擴展與修正。例如,沒有考慮各門課程之間差別,也沒有考慮成績處于60分以下時不僅分數低,還有“不及格”這個特殊因素對總評價的影響等。
參考文獻:
[1]劉新平,劉存俠.教育統計與測評導論[M].科學出版社,2003.177-190.
[2]谷存昌,池自英.學生成績分布規律問題研究[J].安陽工學院學報.2010,(4):88-90.
[3]鄭月鋒,邢春波.修正成績為正態分布的一種新算法,統計與決策[J].2008,(13):142-144.
【摘要】 目的:測定冠心病患者與健康對照者血漿中MBL含量,分析其變化情況,從固有免疫的角度探討冠心病的可能致病機制。方法:采集100例冠心?。–HD)患者空腹靜脈血,健康對照者60例,采用ELISA法對血漿中MBL含量進行檢測。結果:100例冠心病人血漿MBL含量的平均值為3900μg/L,標準差為3209;60例健康對照組血漿MBL含量的平均值為2056μg/L,標準差為1824。冠心病組血漿MBL含量高于健康對照組,經t檢驗,t=4071,P<001,差別有統計學意義。結論:冠心病組血漿MBL水平高于健康對照組,二者均值比較差別有統計學意義,血漿MBL參與了冠心病的發生、發展過程。
【關鍵詞】 冠心病;MBL;ELISA;含量
【ABSTRACT】 Objective:The main purpose of this study is to measure the MBL level in plasma with coronary heart disease and try to analyze the possible mechanism of CHDs development from the view of innate immune.Methods:100 blood samples of CHD patients and 60 that of health controls were collected and tested by ELISA.Results:The plasma level of MBL were 3900μg/L, SD 3209 in cases, while 2056μg/L,SD 1824 in controls. The plasma level of MBL in cases is higher than that of controls (t=4071, P<001).Conclusion:The plasma level of MBL is higher in CHD patients than that in controls.
【KEY WORDS】 CHD; MBL;ELISA;Plasma level
冠心病(coronary heart disease,CHD)是一種嚴重危害人類健康的疾病,其發病率和死亡率居首位,尤其在發達國家更為嚴重,而在我國也呈逐年上升趨勢[1]。其病因和發病機制尚未完全闡明,近年來,冠心病發病的炎癥學說越來越得到重視[2],對一些炎性因子和急性期蛋白的研究也越來越深入。甘露聚糖結合凝集素(mannan binding lectin,MBL)是一種兼有調理素和直接激活補體功能的免疫分子,參與構成抗感染的第一道防線[3]。國外有些學者報道MBL與動脈粥樣硬化發生、發展有關[4~7],但國內尚無報道,因此本研究主要測定冠心病患者血漿中MBL含量,并對其變化進行分析,從天然免疫的角度探討冠心病的可能致病機制,為其輔助診斷和治療提供資料。
1 材料與方法
11 實驗材料
主要設備:低溫冰柜(thermo,美國);酶標儀(Star fax 2100,美國);普通高速離心機(TGL168,上海)
主要試劑:MBL ELISA試劑盒(北京現代高達生物技術有限責任公司)
12 實驗方法
121 標本的收集:空腹靜脈血標本用EDTAK2抗凝管(2ml)收集。
冠心病(CHD)組:共100例,為河北北方學院附屬第一醫院20049~200510月住院的冠心病患者,男51例,女49例;年齡45~70歲,平均(6041±9443)歲。病例均經心電圖、心肌酶譜和臨床癥狀等綜合診斷,符合WHO冠心病診斷標準。
健康對照組:60例,為來院進行健康體檢者,男性32例,女28例,年齡43~71歲,平均(6027±7198)歲,病例無冠心病癥狀、體征,超聲心動圖及心電圖均正常。冠心病組與健康對照組組間年齡無統計學差異。
122 標本的處理
取1ml全血放入15ml離心管中,5000轉/min離心5min,分離血漿,-86℃保存,供測定血漿MBL含量。
123 血漿中MBL含量測定
按MBL ELISA試劑盒說明書,基本操作如下:
標本及試劑準備:冠心病、健康對照血漿標本從低溫冰柜(-86℃)中取出,溶解并恢復至室溫,離心(3500轉/min 5min)。取上清2μl,用標本稀釋液對標本進行200倍稀釋(加入398μl標本稀釋液[PBS+005%BSA]),混勻。所有實驗用試劑均在室溫平衡后使用。
操作步驟:
①取100μl稀釋標本加入酶標板中,同時做對照,第一孔加100μl稀釋液作空白,第二孔向后依次加含MBL不同濃度(0,1,2,5,10,25,50,100ng/ml)的標準液各100μl,標準孔均作復空;
②置37℃水浴1h;
③將板中的液體棄去,每孔加入150μl洗板液進行清洗,室溫靜置3min,棄去洗板液,反復3遍;
④清洗后,每孔加入100μl酶標記的MBL抗體,37℃ 1h,使酶標抗體與標本充分結合。
⑤清洗,操作同③ ;
⑥清洗后,每孔加入底物A、B各50μl,室溫避光15min。每孔加入終止液50μl,輕輕混勻20s;
⑦用酶標儀比色 測定波長為450nm,參考波長為620nm。在20min內完成。
2 結果
用SPSS 130軟件進行統計分析,冠心病組、健康對照組血漿MBL含量的比較,采用兩樣本均數比較的t檢驗。
100例冠心病人血漿MBL含量的平均值為3900μg/L,標準差為3209;60例健康對照組血漿MBL含量的平均值為2056μg/L,標準差為1824。冠心病組血漿MBL含量高于健康對照組,經t檢驗,t=4071,P<001,差別有統計學意義,見表1。表1 冠心病組與對照組MBL含量水平比較
3 討論
人類血清MBL濃度主要受結構基因外顯子1密碼子點突變的影響和啟動子區多態性的調控[8~11]。國外已有一些MBL基因與冠心病的相關性研究[4~6],但對血漿MBL濃度與冠心病的相關性研究很少,只有冰島的一份前瞻性研究報告[7]:高濃度的血漿MBL者,尤其是糖尿病病人、高血脂、血沉升高人群患心肌梗死的概率較低,提示MBL可能與清除動脈粥樣硬化因素有關。雷克雅未克Landspitali大學的瓦爾迪馬森(Helgi Valdimarsson)和同事分析了當地的研究資料,共納入了1967年以后的近2萬參試者。在對其中987名70歲參試者的橫斷面研究中,作者發現,MBL水平高(>1000mg/L)與水平低相比,心肌梗塞風險下降36%(P<0001)。為證實此結論,研究者對另一個有1309名中年人的人群進行了前瞻性分析。結果發現MBL水平高和心肌梗塞風險減弱有關聯的跡象,但不如前一橫斷面分析中的那樣強烈,對總人群、吸煙者或高血壓病人也沒達到統計學意義。但這次分析證實,高水平MBL對糖尿病人(P=002)或高膽固醇血癥病人(P=0004)與心肌梗塞風險大為減小有關。鑒于上述在糖尿病人中的結論“測量MBL可用于心性風險的輔助評估,也可能幫助評估預防治療的需要”,本研究發現,100例冠心病人血漿MBL含量的平均值為3900μg/L;60例健康對照組血漿MBL含量的平均值為2056μg/L。經t檢驗,t=4071,P<001,二者均值比較差別有統計學意義,說明血漿MBL可能參與冠心病的發生、發展,但具體作用及機制還有待進一步研究。
參考文獻
1 楊功煥,王俊芳,萬霞,等.影響中國人群疾病死亡因素的定量分析[J].中華流行病學雜志,2005,26(12):934938
2 Gran K.Inflammation,Atherosclerosis,and Coronary Artery DiseaseN[J].Engl J Med,2005,352:16851695
3 Takahashi K,Ezekowitz RA. The role of the mannose binding lectin in innate immunity[J].Clin Infect Dis,2005,41(7):440444
4 Aittoniemi J,Fan YM,Laaksonen R,et al.The effect of mannanbinding lectin variant alleles on coronary artery reactivity in healthy young men[J].Int J Cardiol.,2004,97(2):317318
5 Robert A,Hegele C.Mannosebinding Lectin Gene Variation and Cardiovascular Disease in Canadian Inuit[J].Clin Chem,1999,45:1283
6 Fiane AE,Ueland T,Simonsen S,et al.Low mannosebinding lectin and increased complement activation correlate to allograft vasculopathy,ischaemia,and rejection after human heart transplantation[J].Eur Heart J,2005,26(16):16601665
7 Saedis S,Oskar O O,Thor A,et al.Mannan binding lectin as an adjunct to risk assessment for myocardial infarction in inpiduals with enhanced risk[J].J Exp Med,2005,201:117125
8 賈天軍,李萍,張庶民,等.漢、蒙古族人MBL基因ExonI 54位密碼子點突變頻率及其血漿含量相關性研究[J].中華微生物學和免疫學雜志,2004,24(2):115119
9 Kilpatrick DC.Mannanbinding lectin and its role in innate immunity[J].Transfus Med,2002,12(6):335352
針對“生物統計學”課程的特點和現狀,近年來,我們在教學過程中,圍繞教學內容、教學方法、課程建設、考核方式等多方面進行了實踐和探索,取得了較為理想的效果。
1.合理編排教學內容,提高教學效率。我校本科教學計劃調整后,“生物統計學”課程安排在第三學期,周學時為2,共36學時。學生在之前已學習了“高等數學”等公共課程,“植物學”、“動物學”等專業基礎課程,與本學期同時學習的還有“生物化學”。為適應生命科學的發展和對生物學人才的培養,我們按照“強化基礎、突出重點、注重應用、通俗易懂”的原則合理設計安排教學內容[1]。在課堂講授時,我們盡可能把抽象的統計學原理與生命科學的前沿或學生們感興趣的事例進行結合,并引導學生從專業知識的角度對統計分析的結果做出科學的判斷和合理的解釋,這樣一方面使學生感受到生物統計學與生命科學的各專業都是緊密聯系的,另一方面學到的統計分析方法和試驗設計原則也可以指導學生后續專業課程的學習。作為應用性極強的課程,我們在課堂授課時一般不過多討論數學原理,而主要偏重于統計原理的介紹和具體分析方法的應用。在有限的課堂教學時數內,對涉及到的數理統計知識多是“拿來主義”,對于一些公式,通常只進行概念上的介紹和公式上的簡單推導,對有些較復雜的統計公式則只給出公式,并不要求學生掌握具體的推算過程,其目的是讓學生對統計學原理和統計分析方法有較全面的了解。在章節內容上,根據具體情況進行適當刪減,做到重點突出、主次分明。比如講授方差分析一章時,以單因素數據資料的分析為例,重點介紹方差分析的基本原理、數學模型和分析步驟,對于二因素數據資料的分析則啟發學生根據其基本原理和數學模型進行推理,多因素數據資料的方差分析則只介紹基本原理,其目的是培養學生對所學理論知識的應用能力,實現以素質教育為基礎,以能力培養為本位的教學理念。
2.靈活運用多種教學方法。在教學過程中,我們根據教學內容,采用多種教學方法并重,對學生“授之以漁”而不是“授之以魚”[3],充分調動學生學習的積極性和主動性,使教學相融。問題導入法。在課堂講授時,我們注重問題的創設。提供氛圍,啟發學生發現問題并思考如何解決問題[4],使學生成為學習的主人,教師則成為學生的協作者。例如,在方差分析一章講述時,以單因素數據資料為例[1],讓學生思考如何進行多組平均數之間的比較。有的學生會提出,可以采用之前學習過的兩個樣本平均數假設檢驗的分析方法對多組數據進行兩兩的比較,而這又引發了一些新的問題。如何解決這些問題呢?這時,我們引導啟發學生將所有的數據資料作為一個整體來考慮,將數據的總變異按照其變異來源剖分成處理引發的變異(組間變異)和試驗誤差引發的變異(組內變異),并利用反映變異特性的方差這一統計量來表示組間變異和組內變異的大小,進而采用檢驗對其二者的差異進行顯著性檢驗,由此和學生共同推導出方差分析的基本思想和分析步驟。這樣,既讓學生理解了方差分析的原理和應用,也培養了學生分析問題和解決問題的能力。對比法?!吧锝y計學”中有很多概念都是成對出現的,其相應的公式也有著許多形式上的共同點,這就為我們進行對比法講解提供了很好的素材。例如標準差與標準誤、直線回歸系數與直線相關系數、樣本平均數假設檢驗的檢驗及檢驗等[1]。對比法講授,既可以幫助學生記憶公式,也便于學生更好地理解公式的含義和具體應用,做到舉一反三。演繹法?!吧锝y計學”中有很多公式是前后聯系的,存在公式的變形,運用演繹法教學可以讓學生更好地理解公式的來源和內涵。例如變量的標準化公式,對于服從正態分布的變量進行標準化轉換的公式(u=x-μxσx)是核心,在理解這個公式含義的基礎上,對于各統計數(平均數、平均數差數、頻率、頻率差數、成對數據差數等)進行標準化轉換的公式自然也就推導出來了,從而避免了對這些公式的死記硬背。板書與多媒體課件并行。隨著電子技術、計算機技術和網絡技術的發展,在教學實踐中多采用多媒體課件進行授課。多體媒體課件集文字、公式編輯、圖形、色彩、動畫于一體,既可以插入圖片和例證,也可以實現公式推導的逐步展現,圖文并茂,色彩豐富,省去了板書所占的時間,可以在有限的課堂教學時間內增加教學內容,增強師生之間的互動[4]。同時,傳統的板書不能完全放棄,在講授過程中,適時穿插板書內容,可以幫助學生更好地聯系已學知識。因此,在教學過程中,我們以多媒體教學為主,板書為輔,注重將這兩種教學方法進行有機的結合。
3.加強實驗教學,注重理論與實踐的結合?!吧锝y計學”是一門應用學科。我們在理論教學的同時,安排了18個學時的實驗課,主要目的是讓學生將課堂理論知識加以應用并學會常用統計學軟件的使用。生物統計學實驗課在生命科學學院信息學實驗室利用電子教室系統進行,教師在主控機上邊講解邊操作,學生可以在自己的計算機上觀察到具體的執行過程,之后可以自己進行相應的操作,然后以電子文檔的形式提交實驗課作業。通過實驗課教學,一方面使理論知識密切聯系實踐,真正提高了學生的應用能力;另一方面增強了學生的興趣,在實驗課中學生不僅鞏固了統計分析知識,而且利用計算機來分析數據也為相關專業課實驗數據的分析奠定了基礎。在運用計算機統計軟件進行數據分析時,學生們也深刻意識到,盡管統計學軟件功能強大,但必須對相關的統計學知識有一定的認知和理解,才能更好地使用這些軟件,由此也進一步激發了學生課堂學習的動力。
4.課程資源的立體化建設。在教學過程中,我們注重加強課程資源的立體化建設。以教材為中心,我們編寫了與科學出版社《生物統計學》(第四版)配套的《生物統計學學習指導》,對每一章的內容都配套了目的要求、內容提要、難點評析、例題解析、習題解答和自我測驗[5],以供學生在課下進行學習和知識的擴充。同時,“生物統計學”是河南師范大學校級網絡課程,學生可以通過瀏覽網頁進行課程內容學習。在網絡課程中,每章均示出了重點、難點,便于學生自學或復習掌握;同時,網絡課程中豐富生動的圖表資料及實例分析也有助于學生對知識點的理解。
[關鍵詞]生物統計學;本科教學;Excel軟件;統計功能
[中圖分類號] G642 [文獻標識碼] A [文章編號] 2095-3437(2017)03-0066-03
統計學是生物學領域進行科學研究不可或缺的工具,目前大多數高校已把生物統計學列為生物學相關專業的必修課。通過該課程的學習,有利于培養學生正確分析試驗數據的能力,對于進一步學習專業課程和日后進行科研也有著非常重要的作用。近年來,統計分析軟件的應用越來越普及,應用統計軟件來輔助生物統計學的理論教學變得尤為重要。[1][2]
Excel作為常用辦公軟件,除具備較強的圖表和計算功能外,還提供了大量的統計函數和數據分析工具。利用Excel的統計功能,可快速、簡便地進行描述性統計、t檢驗、方差分析、回歸、相關等多種統計分析,從而為生物統計學的教學提供了極大便利,強化了教學效果。Excel的統計功能雖不如SPSS、SAS等專業統計軟件強大,但具有易學易用的優勢,適用于統計學的初學者,可基本滿足本科生的教學需要。[3][4]
一、Excel統計函數簡介
(一)統計函數的插入
Excel軟件提供了豐富的數學和統計函數,將這些函數結合起來應用,可顯示出Excel的統計分析功能。[3][4]在Excel 2003菜單中的“插入”項,選擇“函數”。或在2007及以上版本中,在“公式”菜單項選“插入函數”命令,之后在“選擇類別”欄選擇“統計”,即顯示大量統計函數。
(二)常用統計函數介紹
1.統計學參數或特征數的計算
數據的標準差、平均數等特征數均可由統計函數計算得到。反映集中性的函數包括AVERAGE(均值)、GEOMEAN(幾何平均數)、HARMEAN(調和平均數)、MEDIAN(中位數)等;反映離散性的函數有:DEVSQ(離差平方和)、STDEV(樣本標準差)、VAR(樣本方差)、KURT(峰度系擔┑取
2.數據分類
FREQUENCY函數可對大量數據進行分類和統計,表達式為:FREQUENCY(Data array,Bins array)。該函數為數組公式形式,運行顯示出一個分組的頻數后,還需選中所有結果的顯示區域,按F2鍵,再按“Ctrl+Shift+En?鄄ter”組合鍵,方可求出所有分組的頻數。[5]FREQUENCY的操作步驟因分類資料的性狀而有所差異。A. 質量性狀資料:在函數對話框中,“Data array”一欄輸入分類數據所在的單元格地址,“Bins array”一欄輸入分類標志值所在單元格。B. 數量性狀資料:確定好分類的組數、組距和組限后,將各組的上限按升序輸入工作表,在“Data array”和“Bins array”分別輸入相應的單元格地址。
例:現有350名學生的英語成績,需按優秀、良好、一般和不及格進行分類,并統計各等級人數。考試成績為數量性狀資料,首先按升序將各組上限按升序輸入工作表(60、74、90)形成一列,插入FREQUENCY函數,在“Data array”輸入成績所在單元格區域,在“Bins array”輸入各上限所在的單元格區域,確認后即可計算出不及格的人數(
3.概率函數
概率函數可直接計算出給定參數條件下各理論分布的概率值(P)。[6]常用函數有BINOMDIST(二項分布)、POISSON(泊松分布)、NORMDIST(正態分布)、NORMSDIST(標準正態分布)、TDIST(t分布),FDIST(F分布)等。
例如,BINOMDIST函數的功能為計算給定參數條件下二項分布的概率值。函數表達式:BINOMDIST(number_s,trials,probability_s,cumulative),其中num?鄄ber_s為試驗成功的次數,trials為獨立試驗的次數,prob?鄄ability_s為試驗成功的概率;cumulative為一邏輯值,用于確定函數的形式,取值為1和0。Cumulative如果取1,結果顯示至多n次成功的概率;如為0,則返回恰好為n次成功的概率。
4.t 檢驗
TTEST函數功能為返回t檢驗的概率,以此來判斷假設檢驗的顯著性。函數表達式:TTEST(array1,array2,tails,type),其中array1為第一組數據所在的單元格區域,array2為第二組數據的區域,tails為分布曲線的尾數(雙尾或單尾),type表示t檢驗的類型。函數運行后得到t檢驗的概率值(P),如P
5.相關和回歸系數計算
CORREL函數功能為計算兩變量間的相關系數,以此來判斷兩變量間的相關程度和性質,表達式為COR?鄄REL(array1,array2),array1和array2代表進行相關分析的兩組數據。利用INTERCEPT和SLOPE兩函數可計算線性回歸系數,函數表達式分別為INTERCEPT(known_x′?鄄s,known_y′s),SLOPE(known_x′s,known_y′s),其中known_x′s、known_y′s為自變量和因變量的數據集合。INTERCEPT函數可計算線性回歸的截距(a),SLOPE函數可計算線性回歸的斜率(b),從而得到線性回歸方程:=a+bx。
二、數據分析工具的應用
(一)分析工具庫加載
Excel的分析工具庫具有較強的統計分析功能,但此功能通常未默認安裝,需加載后使用。
1.在Excel 2003中,在“工具”菜單中單擊“加載宏”,在彈出對話框中選中“分析工具庫”即可,之后“工具”菜單中即出現“數據分析”條目。
2.在Excel 2007或更高版本中,單擊左上角的“Office按鈕”,選擇“Excel 選項”,在彈出對話框中單擊“加載項”,然后在“管理”欄中選擇“Excel加載項”,單擊“轉到”,最后在“加載宏”窗口中選中“分析工具庫”,之后在“數據”菜單中即出現“數據分析”條目。
(二)常用統計方法介紹
分析工具庫包括描述性統計、t檢驗、方差分析、回歸、相關、F檢驗等多種統計方法。[3][5]每次使用時,按照各統計方法的格式要求輸入原始數據,單擊“數據分析”選項,在彈出對話框中選擇所需統計方法即可。
1.數據分類
將各組的分類標志值(質量性狀資料)或上限值(數量性狀資料)輸入工作表,在“數據分析”中選擇“直方圖”;彈出對話框后,在“輸入區域”選擇分類數據的單元格地址,“接收區域”選擇分類標志所在的單元格,運行即可。
2.描述統計
輸入數據資料,在“數據分析”中選擇“描述統計”,運行后即可得到最小值、最大值、平均數、標準差、方差、峰度、偏度等常用統計量。
3.t檢驗
t檢驗包括平均值的成對二樣本分析,雙樣本等方差假設,雙樣本異方差假設檢驗。如進行平均值的成對二樣本分析,彈出對話框后,分別在“變量1區域”、“變量2區域”輸入兩組數據所在的單元格地址,之后在“輸出區域”選擇某空白區域,確定即可。運行結果包括平均數、t值、df、單尾和雙尾概率(P)、臨界t值等信息。若P
如進行成組設計的兩樣本均值檢驗,需先進行F檢驗:雙樣本等方差假設,判斷兩樣本所在總體方差是否同質。步驟:分別在變量1、變量2輸出區域選擇相應單元格區域,運行結果包括方差、F值、單尾概率(P)、臨界F值等。如P
4.方差分析
方差分析包括單因素、無重復雙因素、有重復雙因素三種類型。如進行單因素方差分析,彈出對話框中,在輸入區域、分組方式、輸出區域分別輸入相應信息后,單擊“確定”即可。輸出結果包括平方和(SS)、df(自由度)、MS(均方)、F值、F crit(F臨界值)、P值等信息(表1)。如P>0.05(或F
5.回歸與相關分析
線性回歸分析:在“數據分析” 菜單選擇“回歸”, 在彈出對話框中輸入Y值、X值、置信度、輸出區域等信息后,運行即可得到回歸截距(Intercept,a)和回歸系數(b)(表2),從而寫出回歸方程。根據回歸系數的t檢驗結果或方差分析的F檢驗結果,可判斷兩個變量間的線性回歸關系是否有效。[7]由表2可知,a(Intercept)=-1.382,b=5.503,回歸方程為:=5.503x-1.382。由回歸系數的t檢驗可知,P=0.00004
三、結語
Excel軟件提供的統計功能基本涵蓋了統計學的教學內容,且對于生物統計學的初學者而言,具有易學易用的優勢,可作為本科教學的有效輔助工具。在每章理論知識講解完畢,應緊接著介紹Excel的統計功能、操作步驟和結果解釋,把課程理論教學、實際案例分析和軟件應用有機結合,可取得較好的教學效果。教學實踐表明,運用Excel的統計功能來輔助理論教學,不僅能夠加深學生對統計學原理的理解,還可以提高學生運用理論知識來分析數據的能力,從而使得生物統計學的學習變得輕松。在今后的生物統計學教學實踐中,應緊密加強Excel軟件應用與理論教學的融合,并考慮將 SPSS等專業軟件逐步引入教學中,以期進一步提升學生分析處理復雜數據、解決實際問題的能力。
[ 參 考 文 獻 ]
[1] 張丹,呂海燕,張幸果,等.應用Excel軟件有效提高《生物統計學》課程的教學效果[J].河北農業科學,2012(8):93-95,99.
[2] 魏興民,任真,代婷.Excel在中醫藥統計學教學中的應用[J].高等數學研究,2013(1):93-95.
[3] 張聯鋒,蔣敏杰,張鵬龍,等.Excel統計分析與應用[M].北京:電子工業出版社,2011.
[4] 楊景峰.EXCEL的計算功能在生物統計學教學中的應用[J].內蒙古民族大學學報(自然科學),2012(6):738-741.
[5] 王錕.Excel 在統計學中的應用[J].湖南科技學院學報,2013(12):9-11.
《財富》世界500強排行榜被譽為“終極榜單”,由《財富》雜志每年一次。2014年,世界500強的入圍門檻再次提高5億美元,達到237億美元;財富中文網于北京時間2014年7月7日晚與全球同步了最新的《財富》世界500強排行版,零售業老大沃爾瑪重回榜首。中國上榜公司數量創記錄的達到了100家。然而我國上榜的公司的平均實力與美國等同是GDP大國的發達國家的上榜公司的平均實力有沒有差距呢?我國上榜企業與美國的先進企業的發展中有沒有平均水平和穩定程度的差異?本文將對這幾個問題進行探討。
二、方法選擇
本文選用非參數統計方法進行分析。非參數統計是統計學的一個重要分支,它與總體究竟是怎樣的分布幾乎沒有什么關系,僅需要一些非常一般性的假設,因為假設各國公司的年營業收入服從正態分布并不嚴格,用一般的參數統計方法,如t―檢驗,F―檢驗等可能會引起誤差。因此選擇用非參數統計方法。
三、世界500強企業發展水平的統計描述
2014年世界500強企業中,中國的上榜企業為100家,美國為128家,中國上榜企業中排名在300―400名之間的企業最多,達到了35家。而美國上榜企業在0―100名這個區間的最多,占上榜企業總數的25%,為32家。從我國上榜企業的排名相對靠后,而美國上榜企業的排名相對靠前。
從平均數上看,我國上榜企業的營業收入和利潤都低于500強企業的平均水平,而美國則高于500強企業的平均水平。
從標準差來看,中美上榜企業營業收入的標準差均高于500強企業,說明我國與美國上榜的企業之間的營業收入差異較大。我國上榜企業利潤的標準差低于500強企業,而美國則高于。這樣的對比表明,我國100家上榜企業間利潤的差異較小,小于世界500強的平均水平。美國128家上榜企業間利潤的差異較大。
四、中國和美國上榜企業的比較分析
(一)兩樣本位置參數Mann―Whitney檢驗法下中國與美國公司的年營業收入比較分析
原假設:中國和美國兩國進入世界500強的公司年營業收入沒有差異。
備擇假設:美國進入世界500強的公司年營業收入比中國的高。
在excel中通過隨機數表,抽取10個美國公司和10個中國公司,R軟件運行得到的結果如下:
Wilcoxon rank sum test
data:sr.usa and sr.china
W=51,p-value=0.6607
alternative hypothesis:true location shift is not equal to 0
p=0.6607>0.05,表明沒有充分的理由拒絕原假設,即表明中國和美國兩國進入世界500強的公司年營業收入沒有顯著差異。
(二)兩樣本尺度參數―Mood檢驗法下的美國和中國公司年營業收入分散程度的比較分析。
原假設:美國公司之間年營業收入分散程度與中國的分散程度一樣大;
備擇假設:美國公司之間年營業收入分散程度比中國的分散程度小。
由于位置參數檢驗中,美國和中國位置參數相等,因此在尺度參數檢驗中我們可以使用Mood方差檢驗。Mood檢驗結果顯示P=0.036
(三)兩樣本位置參數Mann―Whitney檢驗法下中國與美國公司的利潤比較分析
原假設:中國和美國兩國進入世界500強的公司利潤沒有差異。
備擇假設:美國進入世界500強的公司利潤比中國的高。
在excel中通過隨機數表,抽取10個美國公司和10個中國公司,R軟件運行得到的結果如下所示:
Wilcoxon rank sum test
data:lr.usa and lr.china
W=90,p-value=0.001505
alternative hypothesis:true location shift is not equal to 0
p=0.001505
(四)兩樣本尺度參數的秩檢驗方法下的美國和中國公司利潤分散程度的比較分析
原假設:美國公司之間年營業收入分散程度與中國的分散程度一樣大;
備擇假設:美國公司之間年營業收入分散程度比中國的分散程度小。
由于位置參數檢驗中,美國和中國位置參數相等,因此在尺度參數檢驗中我們可以使用Mood方差檢驗。Mood檢驗結果顯示P=0.44>0.05,沒有充分的理由拒絕原假設,表明美國公司利潤的分散程度與中國的分散程度沒有顯著差異。
五、結論和建議
(一)結論
在營業收入方面,美國和中國上榜企業年營業收入的平均水平沒有顯著差異,但是兩國營業收入的分散程度存在顯著差異,美國上榜企業營業收入的分散程度小于中國。
在利潤方面,美國和中國上榜企業利潤的平均水平存在顯著差異,美國企業利潤高于中國,但兩國利潤的分散程度沒有顯著差異。