正态分布概率密度函数(Normal Distribution Probability Density Function)对应于多变量正态分布。它是描述数据在多维空间中的分布的概率密度函数。
正态分布概率密度函数可以用一个或多个变量来描述它的参数,包括均值、方差、数量、方差矩阵等。均值可以表示为\mu,标准差可以表示为\sigma,协方差矩阵可以表示为Σ,数量可以表示为N。
正态分布概率密度函数的表达式如下:
f(x)=\frac{1}{\sqrt{2\pi}\sigma}exp\left[-\frac{1}{2}(\frac{x-\mu}{\sigma})^2\right]
其中,x表示变量,μ表示均值,\sigma表示标准差。
正态分布概率密度函数的意义是描述一个随机变量的属性,即描述这个随机变量取不同值时的相对概率大小。这个概率密度函数满足可靠性:所有不同取值的概率之和等于1。正态分布概率密度函数非常重要,因为很多统计技术和统计模型都建立在正态分布概率密度函数基础上。
经典的正态分布概率密度函数产生的分布为双峰型分布,其中,左右两端各有一个山,而在山顶的位置刚好是变量的均值,而两岱中间有一个坝,其高度相等,表示在均值附近变量的概率较大。
$x$在均值$μ$ 左右$\sigma$都有相同的概率,$x$偏离均值$μ$越远,概率就越小,在$x$左右$2\sigma$时,概率约为$95\%$。由正态分布概率密度函数可知,各变量之间的相关性,可以通过协方差矩阵来测量,即有:
Σ=E[(x-\mu)(x-\mu)^T]
其中,x表示随机变量,μ表示变量的均值,Σ表示协方差矩阵,E[(X-\mu)(X-\mu)^T]表示期望值。
根据定义,正态分布概率密度函数描述的是数据在多维空间中的分布,以及变量取不同值时的相对概率大小。借助此函数,可以对数据中是否存在某种分布关系施加确定的假设,从而推出更多的深入结论。