正态分布(normal distribution)是一个统计学术语,是一个在数学、物理及工程等领域都非常重要的概率分布,是自然科学与行为科学中的定量现象的一个方便模型,在统计学的许多方面有着重大的影响力。作为应用者,我们不一定要把它想得很复杂。这是自然界普遍存在的一种现象,一个随机群体的身高、一棵树上所有树叶的重量、批量生产的某一产品的尺寸、各种各样的心理学测试分数、某些物理现象比如光子计数都被发现近似地服从正态分布。
下面的正态分布钟形曲线可以帮助您对正态分布有一个感性的了解:
上图是一个身高的例子:假设某校学生的身高近似服从正态分布,平均身高是172.3cm,其概率密度分布状况可以模拟为上图的钟形曲线。横轴为身高的刻度,纵轴为身高等于此刻度的学生人数的概率;从图中可以看出,身高为平均值的学生人数是最多的,从平均值向两边延伸,人数逐渐减少,身高为140cm或 200cm的学生人数几乎就为0了。该例子描述了正态分布的一个特性:其的概率密度有向平均值集中的趋势,且概率密度曲线关于平均值对称。
正态分布的另一个特性是变异,变异表示分布的离散程度。变异越大,数据分布越分散,曲线越扁平;变异越小,数据分布越集中,曲线越瘦高。举个极端的例子,若所有人的身高都是172.3cm,则变异=0,变异最小,身高全部集中在平均值处,分布的集中性最好。
正态分布由其两个特性平均值、变异完全决定,记作:
其中为均值,(读sigma)为标准差,代表变异的大小。 以下有四个不同的正态分布曲线,帮助您理解和:
正态分布的概率密度函数为:
该函数的曲线就是上面的钟形曲线。对该函数积分,可以得到正态分布的一些特点:
区间 概率
[-,+] 68.27%
[-2,+2] 95.45%
[-3,+3] 99.73%
[-,+] 100%
举例:若身高服从正态分布,=172.3,=3.2,则有99.73%的人身高在区间[ 172.3-3*3.2,172.3+3*3.2 ]内。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。