如下所示:
interval=stats.t.interval(a,b,mean,std)
a:置信水平
b:檢驗(yàn)量的自由度
mean:樣本均值
std:樣本標(biāo)準(zhǔn)差
from scipy import stats import numpy as np x=[10.1,10,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9] x1=np.array(x) mean=x1.mean() std=x1.std() interval=stats.t.interval(0.95,len(x)-1,mean,std)
interval Out[9]: (9.531674678392644, 10.568325321607357)
補(bǔ)充:用Python學(xué)分析 - t分布
1. t分布形狀類似于標(biāo)準(zhǔn)正態(tài)分布
2. t分布是對稱分布,較正態(tài)分布離散度強(qiáng),密度曲線較標(biāo)準(zhǔn)正態(tài)分布密度曲線更扁平
3. 對于大型樣本,t-值與z-值之間的差別很小
- t分布糾正了未知的真實(shí)標(biāo)準(zhǔn)差的不確定性
- t分布明確解釋了估計(jì)總體方差時(shí)樣本容量的影響,是適合任何樣本容量都可以使用的合適分布
- 根據(jù)小樣本來估計(jì)呈正態(tài)分布且方差未知的總體的均值
- 對于任何一種樣本容量,真正的平均值抽樣分布是t分布,因此,當(dāng)存在疑問時(shí),應(yīng)使用t分布
- 當(dāng)樣本容量在 30-35之間時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布難以區(qū)分
- 當(dāng)樣本容量達(dá)到120時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布實(shí)際上完全相同了
- 樣本方差使用一個估計(jì)的參數(shù)(平均值),所以計(jì)算置信區(qū)間時(shí)使用的t分布的自由度為 n - 1
- 由于引入額外的參數(shù)(自由度df),t分布比標(biāo)準(zhǔn)正態(tài)分布的方差更大(置信區(qū)間更寬)
- 與標(biāo)準(zhǔn)正態(tài)分布曲線相比,自由度df越小,t分布曲線愈平坦,曲線中間愈低,曲線雙側(cè)尾部翹得愈高
- 自由度df愈大,t分布曲線愈接近正態(tài)分布曲線,當(dāng)自由度df= ∞ 時(shí),t分布曲線為標(biāo)準(zhǔn)正態(tài)分布曲線
代碼:
# 不同自由度的學(xué)生t分布與標(biāo)準(zhǔn)正態(tài)分布 import numpy as np from scipy.stats import norm from scipy.stats import t import matplotlib.pyplot as plt print('比較t-分布與標(biāo)準(zhǔn)正態(tài)分布') x = np.linspace( -3, 3, 100) plt.plot(x, t.pdf(x,1), label='df=1') plt.plot(x, t.pdf(x,2), label='df=20') plt.plot(x, t.pdf(x,100), label = 'df=100') plt.plot( x[::5], norm.pdf(x[::5]),'kx', label='normal') plt.legend() plt.show()
運(yùn)行結(jié)果:
以上為個人經(jīng)驗(yàn),希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
標(biāo)簽:臨汾 雙鴨山 赤峰 陽泉 克拉瑪依 日照 貴州 金華
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python 計(jì)算t分布的雙側(cè)置信區(qū)間》,本文關(guān)鍵詞 python,計(jì)算,分布,的,雙側(cè),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。