大學生統計學數據分析案例「統計基礎知識點總結」

1.「樣本」

樣本實質上就是數據,但是,統計學中涉及的數據往往是具有隨機性的。還是回到「學生的身高」這個問題上來。在抽樣之前,我們並不可能知道具體數據的大小,這些數據對於我們是隨機的;為了討論出一個好的方法,我們假想能夠得到這些數據,並且假想這些數據的出現是依據某種規律的,這種規律就是數據出現的可能性的大小,我們稱之為「概率」。比如,高年級學生出現大數據(高個子)的可能性要大於低年級學生,就是說,出現大數據的概率要大。但是,只有當抽樣之後,我們才能得到真實的數據,才能進行實質的計算與分析。這樣,我們所要研究的數據既具有隨機性又具有真實性。為了方便起見,我們稱這樣的數據為樣本。

  1. 統計學中哲學式的思考

傳統數學可以根據假設和規定的原則進行計算或者推理,但是統計學往往要問你所採用的方法是不是有道理,是不是還有更為合理的方法。

3.判斷統計方法的好壞很大程度上也是依賴傳統數學

假如我們得到了數據,由於數據看起來是雜亂無章的,就需要進行必要的整理,整理的實質是對大量的數據進行「壓縮」。根據問題的不同,壓縮的方法也有所不同。比如,希望知道學生的平均身高,稱之為「總體均值」。我們可以計算樣本的平均數,然後用樣本的平均數去估計總體均值。樣本平均數就是對於數據的一種壓縮方法。當然還可以用其他的方法,比如計算中位數,或者計算最大數和最小數的平均數。那麼,哪一個方法要好一些呢?雖然我剛才談了平均數和中位數的使用條件,但這僅僅是一種描述性的。對於數據壓縮也有一個原則,就是不能失去我們所要研究問題的信息,滿足這個條件的壓縮後的值被稱為「充分統計量」。因此,統計學需要哲學的思考,也需要嚴格的數學推理。事實上,對於總體均值,上面的三個壓縮後的量中只有樣本平均數是充分統計量。直觀地想,樣本平均數以局部的特徵估計總體的特徵,可能要好一些。

這是因為,雖然樣本平均數依賴樣本的選取也是隨機的,但是我們可以想像,當我們反覆取樣本計算時,這些樣本平均數應當在總體均值附近擺動。當然,我們還可以建立其他的準則來判別方法的好壞,只要這個準則是合理的。比如,我們可以驗證,樣本平均數是使「與所有數據差的平方的和達到最小」的數;樣本中位數是使「與所有數據差的絕對值的和達到最小」的數。這兩個準則都是有道理的。

作為教師,在統計課程實施的過程中,不僅僅需要知道如何去計算,還需要知道之所以這樣計算的道理。只有這樣,在講課的時候才可能心裏更有底,才可能根據學生的反應隨時調節教學策略。再比如統計圖表,是為了更直觀地表達數據,這也是數據整理的一種形式。根據我們所要研究問題的不同,表達方式也可以有所不同。

4.

統計學研究方法的本質

(嚴士健)統計學的研究方法是基於歸納,而傳統數學是基於演繹。

(史寧中)推理分為演繹和歸納。傳統數學在本質上研究的問題是確定性的,基礎是定義和假設,遵循約定原則進行嚴格的計算或者推理,因此更多的是演繹;統計學在本質上研究的問題是隨機的,是非確定性的,通過較多的數據進行推斷,也就是通過許多的個別來推斷一般,可以認為是一種歸納。但是,正如我在上面也談到過的那樣,在許多情況下,哲學思考後的數學表達也是嚴格依賴於演繹的。

統計學的基本思路是,根據所關心的問題尋求好的方法,對數據進行分析和判斷,得到必要的信息去解釋實際背景。

小學階段,統計學的教育價值:

第一,養成通過數據來分析問題的習慣。其實質是通過事實來分析問題,當遇到問題時,應當去調查研究,應當去收集數據,在此基礎上進行的推斷才可能客觀地反映實際背景。

第二,建立隨機的概念。有些事情可能發生,有些事情可能不發生,這在日常生活中是大量存在的。即便如此,只要我們掌握的信息多了,也能夠合理地推斷實際背景。

第三,學習如何去判斷事情的主要因素。

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/249982.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
投稿專員的頭像投稿專員
上一篇 2024-12-13 13:28
下一篇 2024-12-13 13:28

相關推薦

發表回復

登錄後才能評論