转跳到内容

[統計學] 马尔可夫不等式、大数定律及中心极限定理的一點理解


只显示该作者

只有该作者的内容显示中。 返回到主题

推荐贴

最近在學習一點基礎的統計學,歡迎各位批評指正。

-------------------------

設一次採樣(Sampling) 中包含n項的結果(experiment outcomes). 為本次採樣的平均值。現考慮 的平均值及標準差(又稱標準誤)。

qPAVJo.png

 

马尔可夫不等式( Markov’s Inequality)

24iJgr.png

(隱形前提: X,Ɛ為正)

直觀例子:不超过1/n的人会有超过平均工资的n倍的工资

Markov 的本質是運用了平均值本身的性質。設工資平均值為k, 總人數為10人。那麼總體的財富就是10k。設為10k, 那麼P(X> 10k) = 0.1, 說明最多只有1個人能夠拿到10k的工資。在這種情況下,其他人的工資必為0。如果有另一人獲得非0的工資,或者10k工資者加薪,本來的平均數就必須上調。

 

故,不等式右邊等於左邊的情況是: 右邊的人已佔據了全樣本所有的財富,他們的工資全部為Ɛ

 

切比雪夫不等式(Chebyshev’s inequality):

exEp6g.png

直觀思考: 切比雪夫不等式與上面Markov 一樣,都是"部分數據佔用了所有限額"的情況,只不過這次例子由工資換成了距離值。

同樣,設σ為10,n為10。 那麼整個sample的"距離值平方"上限是10^2*100 = 10000.  那麼假設有一個data point的"距離值平方" 是10000(即|X-μ|=100), 那麼這一項就已經將所有"距離值平方"上限都佔光了,任何其他資源點都必須在平均值上,否則標準差就需要調高。

 

大數定律(Law of large number):

6R70fv.png當一次sampling中的結果數n增至無限時,標準誤依概率收敛于0。按切比雪夫不等式, 不等於平均值的概率收敛于0。

 

中央極限定理 (Central Limit Theorem):

注意增加"一次採樣中的結果數"與"採樣次數"的分別。

當"採樣次數"增加至無限時,的分佈接近於常態分佈。然而這個性質只是來寫程序驗證CLT本身,沒有什麼用途。

"一次採樣中的結果數(n)"增加至無限(實用要求至少30)時,x̅的分佈接近於常態分佈。此分佈的標準差= s5mhtw.png, 隨n增加而接近於0。DPaqi0.png則接近mean = 0, variance = σ的常態分佈。本項特質即為中央極限定理。

 

---------------------------------------------------------------------------------

嗚嗚....好難好難.......CLT 我弄了好久還不懂確定是不是真懂了。"一次採樣中的結果數"與"採樣次數"兩個方向實在很容易混淆呢。

 

歡迎各位一起討論。有其他統計學方面的學習參考之類也歡迎。

,由NierPod042修改
多發幾份
注释
苍雨瞬 苍雨瞬 100.00节操 研究辛苦了...(但咱看不明白...)
ZERC ZERC 1.00节操 希望同盟能支持Latex。。。
链接到点评
2 小时前, 苍云静岳 说道:

你说的n是样本容量,我说的n是抽样次数。

而中心极限定理的n,指的就是抽样次数...

等一下,混亂了:NEKOMIMI_PARADISE_28:

中心极限定理的n, 是不是標準誤差s5mhtw.png中的n, 也就是說, "一次抽樣抽出n個樣本, 合為一項x̅"那一個n?

我最搞不懂就是這一點: 中心极限定理是在描述"一次取樣得出x̅這件事做n次", 還是"一次的樣本量是n"?

,由NierPod042修改
链接到点评
×
×
  • 新建...

重要消息

为使您更好地使用该站点,请仔细阅读以下内容: 使用条款