91极品哺乳期女神挤奶在线,精品一区heyzo在线播放,中文字字幕乱码视频高清

一文通俗易懂講解伯努利分布、幾何分布、超幾何分布、二項(xiàng)分布、泊松分布...

當(dāng)前位置：點(diǎn)晴教程→知識(shí)管理交流 →『技術(shù)文檔交流』

admin

2023年3月10日 16:44 本文熱度 1169

1. 兩大類(lèi)分布的總體概述
2. 什么是期望？
3. 離散概率分布

3.1 伯努利分布
3.2二項(xiàng)分布，多項(xiàng)式分布
3.3幾何分布和負(fù)二項(xiàng)分布
3.4 超幾何分布
3.5 泊松分布

4. 連續(xù)概率分布

4.1 均勻分布
4.2正態(tài)分布
4.3 Beta分布
4.4 卡方分布

5. 補(bǔ)充

1. 兩大類(lèi)分布的總體概述

概率分布是指用于表述隨機(jī)變量取值的概率規(guī)律，總體包括離散概率分布和連續(xù)概率分布。

離散概率分布包括：

伯努利分布，又稱(chēng)為 “0-1 分布” 或 “兩點(diǎn)分布”；
二項(xiàng)分布，多項(xiàng)式分布（二項(xiàng)式分布的延伸）；
幾何分布和負(fù)二項(xiàng)分布
超幾何分布
泊松分布

連續(xù)概率分布包括：

均勻分布
正態(tài)分布（常態(tài)分布，高斯分布）
Beta-分布
卡方分布

2. 什么是期望？

在了解這些分布之前，需要先理解一個(gè)名詞——期望。

期望和均值類(lèi)似，就連計(jì)算方法也類(lèi)似，但是均值是對(duì)數(shù)據(jù)本身進(jìn)行描述，但期望描述的是概率分布。

所以，變量X的期望通常寫(xiě)作E(X)，E(X)的計(jì)算公式為：

3. 離散概率分布

3.1 伯努利分布

是假設(shè)一個(gè)事件只有發(fā)生或者不發(fā)生兩種可能，這兩種可能是相互獨(dú)立卻對(duì)立，并且這兩種可能是固定不變的。那么，如果假設(shè)它發(fā)生的概率是p，那么它不發(fā)生的概率就是1-p。這就是伯努利分布。

伯努利實(shí)驗(yàn)就是做一次服從伯努利概率分布的事件，它發(fā)生的可能性是p，不發(fā)生的可能性是q(1-p)。

舉例：拋一次硬幣，正反面各自的概率。

公式:

其中，x代表隨機(jī)變量可能的結(jié)果，即正反面或者實(shí)驗(yàn)的陽(yáng)性陰性結(jié)果。

期望:

方差：

3.2二項(xiàng)分布，多項(xiàng)式分布

3.2.1二項(xiàng)分布

二項(xiàng)分布是多次伯努利分布實(shí)驗(yàn)的概率分布。

其條件為：
獨(dú)立試驗(yàn)；
每次試驗(yàn)都存在成功和失敗的可能，每一次試驗(yàn)的成功概率相同；
試驗(yàn)次數(shù)有限（注意這個(gè)條件）

舉例: 為了區(qū)分概率，不再以硬幣舉例，這次以答題正確概率為例，隨機(jī)答題正確性為1/4，即答對(duì)可能性為0.25，計(jì)算3道題目答對(duì)1題的概率為：3 x 0.25^1^ x 0.75^2^

公式為：

, 其中 (也就是組合的公式)

p是每一次試驗(yàn)的成功概率，n是試驗(yàn)次數(shù)，又寫(xiě)作：，

根據(jù)n與p的不同數(shù)值，二項(xiàng)分布的概率分布形狀會(huì)發(fā)生變化，p越接近0.5，圖形越對(duì)稱(chēng)，p<0.5，圖形右偏，p>0.5，圖形左偏。圖形可見(jiàn)：二項(xiàng)分布概率直方圖

二項(xiàng)分布單次試驗(yàn)的期望為 , 方差為

重復(fù)n次試驗(yàn)的期望為 , 方差為

3.2.2多項(xiàng)式分布

多項(xiàng)分布是在二項(xiàng)分布的基礎(chǔ)上進(jìn)一步的拓展。

也就是由計(jì)算只有兩種結(jié)果變成計(jì)算兩種以上結(jié)果的概率分布，

公式，

另一種形式(emmm真優(yōu)雅)：

3.3幾何分布和負(fù)二項(xiàng)分布

幾何分布和負(fù)二項(xiàng)分布與二項(xiàng)分布恰恰相反，求的是在結(jié)果發(fā)生概率和發(fā)生次數(shù)已知的情況下，達(dá)成這一條件所需的事件總數(shù)的概率。

3.3.1幾何分布

幾何分布和二項(xiàng)分布極為相像，繼續(xù)以隨機(jī)答題為例，假定我們有一套題，在答對(duì)第一道題前要答多少題？這里的求解概率分布就是一種幾何分布。

其條件為：
獨(dú)立試驗(yàn)；
每次試驗(yàn)都存在成功和失敗的可能，每一次試驗(yàn)的成功概率相同；
為了取得第一次成功前需要進(jìn)行多少次試驗(yàn)？

每道題目答對(duì)概率都為0.25（p），答錯(cuò)概率都為0.75（q），則當(dāng)?shù)?題才答對(duì)第一道題就為：0.25 x 0.75^3^

則，公式為：

其中，p為成功概率，q=1-p 為失敗概率，為了在第r次試驗(yàn)時(shí)取得成功，首先要失敗（r-1）次。

期望為 , 公式推導(dǎo)見(jiàn)幾何分布的期望公式的推導(dǎo)

方差為

3.3.2負(fù)二項(xiàng)分布

與幾何分布相比較，負(fù)二項(xiàng)分布多出了一個(gè)結(jié)果發(fā)生次數(shù)的參數(shù)。

繼續(xù)以答題為例，答對(duì)3道題需要做題多少？

公式：

其中，

p為答對(duì)概率，k為所要成功（答對(duì)）次數(shù)，因?yàn)榈趓個(gè)失敗是最后發(fā)生的，所以需要k+r-1次重復(fù)實(shí)驗(yàn)中有k次成功的。

期望為

3.4 超幾何分布

從a個(gè)白球和b個(gè)黑球中抽取n個(gè)球，那么以X表示抽取出的白球的數(shù)目，這個(gè)求解概率則為超幾何分布

其條件為：

不放回抽樣

公式為：

3.5 泊松分布

泊松分布的本質(zhì)還是二項(xiàng)分布，泊松分布只是用來(lái)簡(jiǎn)化二項(xiàng)分布計(jì)算的。

一個(gè)簡(jiǎn)單例子，每天下雨概率是12%，上個(gè)月下了5次雨，下個(gè)月下雨8次概率是多大？這個(gè)求解概率情況即為泊松分布。

泊松分布應(yīng)用條件：
單獨(dú)事情在給定區(qū)間（時(shí)間或者空間）內(nèi)隨機(jī)、獨(dú)立發(fā)生；
已知該區(qū)間平均發(fā)生次數(shù)（發(fā)生率），且為有限數(shù)值（通常以λ表示）。

若X符合泊松分布，且每個(gè)區(qū)間內(nèi)平均發(fā)生λ次，則為

X~ P~o~(λ)

發(fā)生r次事件的概率公式為：

其中，r為給定區(qū)間發(fā)生目的事件次數(shù)，e為數(shù)學(xué)常數(shù)2.718。

舉例和公式推導(dǎo)，網(wǎng)上有個(gè)例子解釋得很好，見(jiàn)用一個(gè)”栗子“講清楚泊松分布

因?yàn)閄~ P~o~(λ)，則E(X)為給定區(qū)間內(nèi)能夠期望的事件發(fā)生數(shù)目，也就是求解區(qū)間內(nèi)發(fā)生的平均發(fā)生次數(shù)，則期望，即E(X)等于λ，方差也為λ（泊松分布的參數(shù)本身就是期望和方差）。

泊松分布的概率形狀為：λ小，則分布向右偏斜，隨著λ變大，分布逐漸變得對(duì)稱(chēng)（為什么會(huì)這樣？參考見(jiàn)如何深刻理解二項(xiàng)式分布到泊松分布

另外，泊松分布在特定條件下可以用來(lái)近似代替二項(xiàng)分布。

已知，二項(xiàng)分布公式為：，

當(dāng)n過(guò)大時(shí)，計(jì)算變得繁瑣，而又知道重復(fù)n次試驗(yàn)的期望為 , 方差為

所以當(dāng)λ≈np，λ≈npq ，即np≈npq時(shí)候，也就是q近似為1且n足夠大時(shí)，我們可以用泊松分布替代二項(xiàng)分布，則條件為

n次數(shù)足夠大，默認(rèn)>50;
p足夠小，默認(rèn)<0.1;

4. 連續(xù)概率分布

4.1 均勻分布

相等區(qū)間（時(shí)間，空間，長(zhǎng)度等等）分布概率相等，較為簡(jiǎn)單不予過(guò)多描述

均勻分布由兩個(gè)參數(shù)a和b定義，它們是數(shù)軸上的最小值和最大值，通常縮寫(xiě)為U（a，b）密度函數(shù)公式為：

期望,

方差為

4.2正態(tài)分布

若隨機(jī)連續(xù)變量X符合期望為μ、標(biāo)準(zhǔn)差為σ的正態(tài)分布，則通常寫(xiě)作X~N(μ， σ2)。其概率密度函數(shù)為正態(tài)分布的期望值μ決定了其位置，其標(biāo)準(zhǔn)差σ決定了分布的幅度。當(dāng)μ = 0,σ = 1時(shí)的正態(tài)分布是標(biāo)準(zhǔn)正態(tài)分布。

其公式為

這個(gè)公式第一眼有點(diǎn)繁瑣，但其實(shí)當(dāng)進(jìn)行拆分后并不復(fù)雜，推導(dǎo)之前先了解一個(gè)公式標(biāo)準(zhǔn)分計(jì)算，

其中，μ表示均值，σ為標(biāo)準(zhǔn)差，Z值為某個(gè)值x偏離均數(shù)μ的標(biāo)準(zhǔn)差倍數(shù)。

公式中前半部分只是一個(gè)系數(shù)，為固定值，而后半部分可以簡(jiǎn)化為，當(dāng)Z為0時(shí)，最大，也最大，而當(dāng)x=μ也就是均值時(shí)，整個(gè)密度函數(shù)達(dá)到最大值，而當(dāng)x越偏離μ時(shí)，密度函數(shù)越小，當(dāng)無(wú)限遠(yuǎn)的時(shí)候，就趨近于0。現(xiàn)在看前半部分，由于π固定，值的變化由σ標(biāo)準(zhǔn)差決定，sigma越大，值越小，整個(gè)分布越會(huì)呈低矮形狀。

期望與方差計(jì)算為:

4.3 Beta分布

以下參考自，鏈接

一個(gè)袋子里面有很多球，我們不知道球的個(gè)數(shù)只知道球的顏色（紅，白），我們現(xiàn)在從中取出一個(gè)球（二次實(shí)驗(yàn)），根據(jù)先驗(yàn)經(jīng)驗(yàn)我們猜測(cè)紅白概率為（0.5，0.5），服從兩點(diǎn)分布。那么我們開(kāi)始有放回地從中抽取100次（多次二項(xiàng)試驗(yàn)），得到紅球?yàn)?0次，黃球?yàn)?0次，這時(shí)候我們又重新猜測(cè)紅白概率（0.7，0.3）。那么如果我們?cè)賹⑸厦嬖囼?yàn)做150次，即重復(fù)150次的多次二次實(shí)驗(yàn)，最后得到紅白概率為{0.7,0.3}這樣概率為多少？這就是Beta分布。

公式為

$$f(x \mid a, b)=\frac{1}{B(a, b)} x^{a-1}(1-x)^{b-1}, 0<x<1(a, b="" data-tool="mdnice編輯器">0) $$

期望與方差計(jì)算：

4.4 卡方分布

若n個(gè)相互獨(dú)立的隨機(jī)變量ξ₁、ξ₂、……、ξn ，均服從標(biāo)準(zhǔn)正態(tài)分布（也稱(chēng)獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布），則這n個(gè)服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量的平方和構(gòu)成一新的隨機(jī)變量，其卡方分布規(guī)律稱(chēng)為x^2,分布（chi-square distribution），其中參數(shù)n稱(chēng)為自由度，正如正態(tài)分布中均值或方差不同就是另一個(gè)x2正態(tài)分布一樣，自由度不同就是另一個(gè)分布。記為 Q~x^2(k). 卡方分布是由正態(tài)分布構(gòu)造而成的一個(gè)新的分布，當(dāng)自由度n很大時(shí)，X^2分布近似為正態(tài)分布。對(duì)于任意正整數(shù)k，自由度為 k的卡方分布是一個(gè)隨機(jī)變量X的機(jī)率分布。

其公式為：

期望與方差計(jì)算為：

5. 補(bǔ)充

二項(xiàng)分布和幾何分布的區(qū)別是什么？各自應(yīng)該在什么時(shí)候用？

二項(xiàng)分布和幾何分布的應(yīng)用條件很類(lèi)似，兩者的前兩個(gè)條件（①獨(dú)立試驗(yàn)；②每一次試驗(yàn)的成功概率相同），差別在于實(shí)際上要求的結(jié)果。如果試驗(yàn)次數(shù)固定，求成功一定次數(shù)的概率，則需要使用二項(xiàng)分布；使用二項(xiàng)分布還可以求出在n次試驗(yàn)中能夠期望得到的成功次數(shù)。如果要求第一次成功之前需要試驗(yàn)多少次，則需要使用幾何分布。