苍云静岳 发布于三月 7, 2020 分享 发布于三月 7, 2020 13 小时前, NierPod042 说道: 中央極限定理 (Central Limit Theorem): 注意增加"一次採樣中的結果數"與"採樣次數"的分別。 當"採樣次數"增加至無限時,x̅的分佈接近於常態分佈。然而這個性質只是來寫程序驗證CLT本身,沒有什麼用途。 當"一次採樣中的結果數(n)"增加至無限(實用要求至少30)時,x̅的分佈接近於常態分佈。此分佈的標準差= , 隨n增加而接近於0。則接近mean = 0, variance = σ2 的常態分佈。本項特質即為中央極限定理。 马尔可夫不等式规定均值资源占用上限 切比雪夫不等式规定方差资源占用上限 大数定理,指样本量摧毁标准误差。 中心极限定理,指抽样次数抹平样本均值分布差别。 中心极限定理表明,所研究的随机变量如果是有大量独立的而且均匀的随机变量相加而成,那么它的分布将近似于正态分布。 所以其实这四条想导出的结果很简单,就是: “如果你样本足够大,抽样次数足够多,就可以用正态分布近似完美的模拟一切(大量独立的而且均匀的随机变量相加而成)分布。” 这也是很多应用统计分析的理论基础。 11 小时前, 可洛 说道: 采样次数增加到无限这个x_bar不是趋近于正态分布吧。举个例子,一枚骰子(sample size=1),当采样次数无限的时候x_bar的分布是uniform distribution而不是正态分布。简单的说,当采样次数接近无穷时,得到的分布应该是结果本身的概率分布。(比如一个正常骰子从1到6是均匀分布的) 当样本数(sample size)n增大时,比如说你一次丢100个骰子,丢很多次之后得到的x_bar们会是正态分布(就是丢一次记录一次x_bar,丢个几千次) 还有,variance是方差,standard deviation是标准差,(sigma∧2)/n是方差不是标准差,整体开根号后才是标准差。 有一说一,“一枚骰子(sample size=1),当采样次数无限的时候x_bar的分布”还真不是uniform distribution。 你想想n=1的时候的x_bar,和n=2的时候的x_bar就知道了。 是求和啊,求和~~~ 求和不是纵向叠加... 苍云静岳 获得了红包 10节操 注释 NierPod042 2.00节操 站長由專八到統計,什麼都懂.jpg 1 链接到点评
苍云静岳 发布于三月 7, 2020 分享 发布于三月 7, 2020 7 小时前, 可洛 说道: 这我不能同意,一枚骰子和两枚的情况完全不一样,一枚是单纯的从1到6,没有求和的过程,两枚的情况就不一样了,会变成【2 3 3 4 4 4 5 5 5 5 6 6 6 6 6 7 7 7 7 7 7 8 8 8 8 8 9 9 9 9 10 10 10 11 11 12】(卧槽打这个累死我了)所以分布情况就不一样了(倾向于正态分布),所以实质上当样本数量从1到2的时候平均值本身就出现了正态分布的情况, 所以这里只讨论n=1,不考虑增加样本数量对样本均值正态分布的影响 (所以才说是采样次数无限,不增加样本数量嘛) 就是说,你搞错了中心极限定理的定义。 中心极限定理说的就是n个独立同分布的随机变量之和服从正态分布... 7 小时前, 可洛 说道: 所以这里只讨论n=1,不考虑增加样本数量对样本均值正态分布的影响 所以,你说的n,和我说的这个n不是同一个n~【笑】 你说的n是样本容量,我说的n是抽样次数。 而中心极限定理的n,指的就是抽样次数... ——当然,有可能你认为的x_bar的含义和我认为的x_bar的含义也不一样【笑】 链接到点评
苍云静岳 发布于三月 7, 2020 分享 发布于三月 7, 2020 1 小时前, NierPod042 说道: 中心极限定理是在描述"一次取樣得出x̅這件事做n次" 是指这个。 而且指的是x_bar之和是趋于正态分布的。 所以说啦,n这个字母用太多次就会引起误会的w 你可以这么理解,和一次的样本量越来越大相关的,是大数定理;和抽取次数越来越多相关的,是中心极限定理。 苍云静岳收和谐资源时被小萝莉围观良心发现失去-3节操 1 链接到点评
推荐贴