一文通俗易懂講解伯努利分布、幾何分布、超幾何分布、二項(xiàng)分布、泊松分布...
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
1. 兩大類(lèi)分布的總體概述概率分布是指用于表述隨機(jī)變量取值的概率規(guī)律,總體包括離散概率分布和連續(xù)概率分布。 離散概率分布包括:
連續(xù)概率分布包括:
2. 什么是期望?在了解這些分布之前,需要先理解一個(gè)名詞——期望。 期望和均值類(lèi)似,就連計(jì)算方法也類(lèi)似,但是均值是對(duì)數(shù)據(jù)本身進(jìn)行描述,但期望描述的是概率分布。 所以,變量X的期望通常寫(xiě)作E(X),E(X)的計(jì)算公式為: 3. 離散概率分布3.1 伯努利分布
舉例:拋一次硬幣,正反面各自的概率。 公式: 其中,x代表隨機(jī)變量可能的結(jié)果,即正反面或者實(shí)驗(yàn)的陽(yáng)性陰性結(jié)果。 期望: 方差: 3.2二項(xiàng)分布,多項(xiàng)式分布3.2.1二項(xiàng)分布
舉例: 為了區(qū)分概率,不再以硬幣舉例,這次以答題正確概率為例,隨機(jī)答題正確性為1/4,即答對(duì)可能性為0.25,計(jì)算3道題目答對(duì)1題的概率為:3 x 0.25^1^ x 0.75^2^ 公式為: , 其中 (也就是組合的公式) p是每一次試驗(yàn)的成功概率,n是試驗(yàn)次數(shù),又寫(xiě)作:, 根據(jù)n與p的不同數(shù)值,二項(xiàng)分布的概率分布形狀會(huì)發(fā)生變化,p越接近0.5,圖形越對(duì)稱(chēng),p<0.5,圖形右偏,p>0.5,圖形左偏。圖形可見(jiàn):二項(xiàng)分布概率直方圖 二項(xiàng)分布單次試驗(yàn)的期望為 , 方差為 重復(fù)n次試驗(yàn)的期望為 , 方差為 3.2.2多項(xiàng)式分布
公式, 另一種形式(emmm真優(yōu)雅): 3.3幾何分布和負(fù)二項(xiàng)分布幾何分布和負(fù)二項(xiàng)分布與二項(xiàng)分布恰恰相反,求的是在結(jié)果發(fā)生概率和發(fā)生次數(shù)已知的情況下,達(dá)成這一條件所需的事件總數(shù)的概率。 3.3.1幾何分布
每道題目答對(duì)概率都為0.25(p),答錯(cuò)概率都為0.75(q),則當(dāng)?shù)?題才答對(duì)第一道題就為:0.25 x 0.75^3^ 則,公式為:
其中,p為成功概率,q=1-p 為失敗概率,為了在第r次試驗(yàn)時(shí)取得成功,首先要失敗(r-1)次。 期望為 , 公式推導(dǎo)見(jiàn)幾何分布的期望公式的推導(dǎo) 方差為 3.3.2負(fù)二項(xiàng)分布與幾何分布相比較,負(fù)二項(xiàng)分布多出了一個(gè)結(jié)果發(fā)生次數(shù)的參數(shù)。 繼續(xù)以答題為例,答對(duì)3道題需要做題多少? 公式: 其中, p為答對(duì)概率,k為所要成功(答對(duì))次數(shù),因?yàn)榈趓個(gè)失敗是最后發(fā)生的,所以需要k+r-1次重復(fù)實(shí)驗(yàn)中有k次成功的。 期望為 3.4 超幾何分布
公式為: 3.5 泊松分布
若X符合泊松分布,且每個(gè)區(qū)間內(nèi)平均發(fā)生λ次,則為 X~ P~o~(λ) 發(fā)生r次事件的概率公式為: 其中,r為給定區(qū)間發(fā)生目的事件次數(shù),e為數(shù)學(xué)常數(shù)2.718。 舉例和公式推導(dǎo),網(wǎng)上有個(gè)例子解釋得很好,見(jiàn)用一個(gè)”栗子“講清楚泊松分布 因?yàn)閄~ P~o~(λ),則E(X)為給定區(qū)間內(nèi)能夠期望的事件發(fā)生數(shù)目,也就是求解區(qū)間內(nèi)發(fā)生的平均發(fā)生次數(shù),則期望,即E(X)等于λ,方差也為λ(泊松分布的參數(shù)本身就是期望和方差)。 泊松分布的概率形狀為:λ小,則分布向右偏斜,隨著λ變大,分布逐漸變得對(duì)稱(chēng)(為什么會(huì)這樣?參考見(jiàn)如何深刻理解二項(xiàng)式分布到泊松分布
已知,二項(xiàng)分布公式為: , 當(dāng)n過(guò)大時(shí),計(jì)算變得繁瑣,而又知道重復(fù)n次試驗(yàn)的期望為 , 方差為 所以當(dāng)λ≈np,λ≈npq ,即np≈npq時(shí)候,也就是q近似為1且n足夠大時(shí),我們可以用泊松分布替代二項(xiàng)分布,則條件為
4. 連續(xù)概率分布4.1 均勻分布相等區(qū)間(時(shí)間,空間,長(zhǎng)度等等)分布概率相等,較為簡(jiǎn)單不予過(guò)多描述 均勻分布由兩個(gè)參數(shù)a和b定義,它們是數(shù)軸上的最小值和最大值,通常縮寫(xiě)為U(a,b) 密度函數(shù)公式為: 期望, 方差為 4.2正態(tài)分布若隨機(jī)連續(xù)變量X符合期望為μ、標(biāo)準(zhǔn)差為σ的正態(tài)分布,則通常寫(xiě)作X~N(μ, σ2)。其概率密度函數(shù)為正態(tài)分布的期望值μ決定了其位置,其標(biāo)準(zhǔn)差σ決定了分布的幅度。當(dāng)μ = 0,σ = 1時(shí)的正態(tài)分布是標(biāo)準(zhǔn)正態(tài)分布。 其公式為 這個(gè)公式第一眼有點(diǎn)繁瑣,但其實(shí)當(dāng)進(jìn)行拆分后并不復(fù)雜,推導(dǎo)之前先了解一個(gè)公式標(biāo)準(zhǔn)分計(jì)算, 其中,μ表示均值,σ為標(biāo)準(zhǔn)差,Z值為某個(gè)值x偏離均數(shù)μ的標(biāo)準(zhǔn)差倍數(shù)。 公式中前半部分 只是一個(gè)系數(shù),為固定值,而后半部分 可以簡(jiǎn)化為,當(dāng)Z為0時(shí),最大,也最大,而當(dāng)x=μ也就是均值時(shí),整個(gè)密度函數(shù)達(dá)到最大值,而當(dāng)x越偏離μ時(shí),密度函數(shù)越小,當(dāng)無(wú)限遠(yuǎn)的時(shí)候,就趨近于0。現(xiàn)在看前半部分, 由于π固定,值的變化由σ標(biāo)準(zhǔn)差決定,sigma越大,值越小,整個(gè)分布越會(huì)呈低矮形狀。 期望與方差計(jì)算為: 4.3 Beta分布以下參考自,鏈接
公式為 $$f(x \mid a, b)=\frac{1}{B(a, b)} x^{a-1}(1-x)^{b-1}, 0<x<1(a, b="" data-tool="mdnice編輯器">0) $$期望與方差計(jì)算: 4.4 卡方分布
其公式為: 期望與方差計(jì)算為: 5. 補(bǔ)充
二項(xiàng)分布和幾何分布的應(yīng)用條件很類(lèi)似,兩者的前兩個(gè)條件(①獨(dú)立試驗(yàn);②每一次試驗(yàn)的成功概率相同),差別在于實(shí)際上要求的結(jié)果。如果試驗(yàn)次數(shù)固定,求成功一定次數(shù)的概率,則需要使用二項(xiàng)分布;使用二項(xiàng)分布還可以求出在n次試驗(yàn)中能夠期望得到的成功次數(shù)。如果要求第一次成功之前需要試驗(yàn)多少次,則需要使用幾何分布。
參考鏈接: 伯努利分布、二項(xiàng)分布以及多項(xiàng)分布 https://zhuanlan.zhihu.com/p/50462601 https://blog.csdn.net/qq_37960402/article/details/88953500 https://www.cnblogs.com/Renyi-Fan/p/13909553.html https://zhuanlan.zhihu.com/p/24711669 https://blog.csdn.net/zlbflying/article/details/47777943 https://zhidao.baidu.com/question/431881117.html 書(shū)籍:統(tǒng)計(jì)學(xué)的世界 書(shū)籍:深入淺出統(tǒng)計(jì)學(xué) 該文章在 2023/3/10 16:44:33 編輯過(guò) |
相關(guān)文章
正在查詢(xún)... |