先说结论,特征函数是随机变量的分布的不同表示形式。
一般而言,对于随机变量
的分布,大家习惯用概率密度函数来描述。
比如说:
意思就是
服从正态分布,对应的概率密度函数如下:
虽然概率密度函数理解起来很直观,但是确实随机变量
的分布还有另外的描述方式,比如特征函数。
1.1 剪影
下面是两个剪影:
是同一个人吗?不知道,看不清楚,不过如果知道这两个剪影的特征,比如:
以上特征如果都一样,那么:
1.2 泰勒级数
根据泰勒级数可知,两个函数
的各阶导数相等的越多,那么这两个函数越相似:
也即是:
关于泰勒级数请查看这两篇文章:
上
、
下
。
那么,随机变量分布的特征有吗?
随机变量的特征有如下:
这些特征具体是什么含义就不解释了,说来话长。不过这些特征都跟随机变量的“矩”有关系(什么是“矩”请参考
此文
)。
比如期望:
方差:
偏态:
可见这些特征都和可以由各阶矩算出来。
直觉上可以有以下推论(
其实还是有条件的,这里先忽略这些严格性,在实际应用中如下思考问题不大)
:
随机变量
的特征函数定义为:
为什么这么定义呢?首先,
的泰勒级数为:
代入可以推出:
原来特征函数包含了分布函数的所有矩,也就是包含了分布函数的所有特征啊。
有数学家是这么形容特征函数(特征函数是下面文中的生成函数的一种):
A generating function is a clothesline on which we hang up a sequence of numbers for display.
特征函数
看上去确实像把各阶矩串在绳子上:
所以我们可以进一步完善刚才的结论:
所以,特征函数其实是随机变量
的分布的另外一种描述方式。
关于傅立叶变换可以参考以下文章:
傅立叶级数、傅立叶变换通过线性代数更容易理解。如果有兴趣学习线代基础,可以参加我们的“线代基础课程”(点击最下方的“
阅读原文
”报名参加)。
4.1 特征函数是共轭傅立叶变换
假设某连续随机变量
的概率密度函数为
,那么可知:
特征函数是:
而
的傅立叶变换为:
可见两者是共轭的关系:
也就是说,特征函数是
的共轭傅立叶变化,共轭在这里影响不大,下面把特征函数当作傅立叶变换来理解。
4.2 特征函数相当于换了一个坐标系
傅立叶变换是什么?就好比在直角坐标系下,圆的方程为:
图示如下:
在极坐标系下,同样的圆的方程为:
坐标系下的图像为:
同一个数学对象,在不同坐标系中,有不同的表达形式: