专栏名称: 超智能体
分享如何大脑学习、机器学习
目录
相关文章推荐
阑夕  ·  ? 阑夕的微博视频 -20250312200932 ·  10 小时前  
纯银V  ·  我 2019 ... ·  16 小时前  
界面新闻  ·  盘中大涨超15%!老铺黄金总市值突破1300亿港元 ·  20 小时前  
界面新闻  ·  DeepSeek R2发布?回应来了 ·  昨天  
槽边往事  ·  彩虹的教授 ·  2 天前  
51好读  ›  专栏  ›  超智能体

函数、概率、信息的基础串讲

超智能体  · 知乎专栏  ·  · 2019-06-20 07:05

正文

以前被删除的视频(本打算修改,但因停更了,故发出来)。

文章里还有未做成视频的内容。

视频(av55733298)

函数、概率、信息的基础串讲 https://www.zhihu.com/video/1124933477908439040

一、函数(映射)

这是一个发生在信使、农民、猎人、学者、商人之间的故事。
为了在恶劣环境下增加生存几率,信使编造了一个故事:
大家都是象神的子民,需一起生活,用自己的劳动所得去换取别人的劳动所得。

一次,猎人用一块猪肉与农民交换了一个土豆。
但第二次交换时,肉块比较大,猎人觉得自己换的不如之前的多。
为确保每次交换的公平,他们向学者求助。

学者需要确保的不是具体一次交换的公平,而是以后每次交换的公平。
但每次交换时,肉块重量都可以变化,并不确定。

所以学者把肉块每次交换的重量叫做 变量 (variable) x
具体一次交换的重量叫做 常量 (constant) x_2 ,下角标的 2 表示第 2 次。
同理土豆每次交换的重量叫做 变量 (variable) y

接下来学者需要确定的是重量(变量)可以有哪些值。

于是他把所有可能猪肉重量想象成一个整体,叫做 集合 (set) X= {所有可能猪肉重量}。
所有土豆重量的整体叫做集合 Y= {所有可能土豆重量}。
集合内所 包含 的每个重量都叫做 元素 (element)

由于变量 x 与长宽高一样,所描述的重量是一种 状态 (state)
因此包含状态这种物理意义的集合 X 也叫 空间 (space) X

那么学者需要确保的就是:
猪肉空间 X 里任意重量 x 都可以换得土豆空间 Y 里一个公平重量 y
也就是确定从 xy 变换关系

他把输入 x 这种变换前的状态叫做 自变量 (independent variable)
把输出 y 这种变换后的状态叫做 因变量 (dependent variables)
把从 xy 这种单向变换的关系叫做函数或映射 (transformation or function or map) f: x \rightarrow y (二者不一定非是因果关系,只是想根据自变量获得因变量的值而已)。

由于肉的获取较为困难,所以大家同意每次交换的土豆重量 y 是猪肉重量 x 的 2 倍,也就是 y = f(x) = 2x


集合 set(空间 space):个体组成的整体。
元素 element(常量 constant):整体内部的个体 。
变量 variable(宏观态 macro state):集合的任意(某个)元素。
自变量:变化前的任意状态。
因变量:变化后的任意状态。
常量 constant(微观态 micro state):集合的具体(一个)元素。
函数 transformation(变换):某集合任意元素变成另个集合对应元素的方式(关系)。


但此时学者遇到了一个困难,怎么测量重量呢?

学者想到的办法是用其它物体的重量作为 参照重量 进行对比。
这个物体需要易保存,且尽量不随时间变化而改变,因此肉和土豆都不行。


最后学者选择了一块金属,恰好与我们今日所选择的千克等重,并把它的重量称为常量 k 。 他又选了一块小金属,重量是千克的一半,并把它的重量称为常量 b

学者做了一个天枰。每次测量时就去看最少用多少 ( n ) 个参照重量 k 可以翘起 m 重量的被测物。
n = m / kn 便是重量,单位是 千克 。若选择小金属, n = m / b ,则单位是


测量:用选定事物的属性来 衡量 要测量事物的属性。


可算出肉的重量后,很难找到相同重量的土豆,且土豆又不易分割。
所以学者又发明了一个 中间交换物 :钱(货币)。

钱,这个中间交换物可以是任何东西,甚至可以是并非实体的口头约定,
关键是如何才能让大家都认可。

聪明的学者从海边找了一堆他们的住处无法见到的贝壳,
又让信使告诉大家:象神托梦说“大家死后可用贝壳跟象神换取任何物品。”
于是大家欣然接受用自己劳动的所得交换贝壳。


货币:构建在公众信用基础上的中间交换量 信用:可由礼德、宗教、法律等提供

二、概率

农民和学者住的近,但和其他人住的都比较远,不过商人的倒卖填补了交换的距离障碍。

根据大家的喜好,鸡、鸭、猪、羊、牛、鹿的肉价分别如下:

鸡肉:2 贝壳/千克
鸭肉:3 贝壳/千克
猪肉:4 贝壳/千克
羊肉:5 贝壳/千克
牛肉:6 贝壳/千克
鹿肉:7 贝壳/千克

可有一次商人要卖肉给农民时,却忘了自己手里的这块肉是哪种肉类。
对肉类有不确定性的商人就问住在隔壁的学者。
可学者也不确定这是什么肉类,
但学者知道猎人每个月都会猎到 5 只鸡、4 只鸭、3 头猪、2 头羊、1 头牛、1 头鹿。

学者把所有可能的猎物想象成另一个 集合 ,称其为 样本空间 S
把 3 头猪想象成一个小集合 C= {猪阿强,猪不屈,猪富贵}
而小集合是由 S 里的部分元素组成的 C\subseteq  S
因此学者在数学上称它为 S 子集 (subset)
在物理上称它为 事件 (event)
一共有 6 个 不相交 的事件。

A = {鸟愤怒,鸟闪电,鸟炸弹,鸟大嘴,鸟抑郁}
B = {可达鸭、哥达鸭、大葱鸭、小黄鸭}
C = {猪阿强,猪不屈,猪富贵}
D = {喜羊羊,懒羊羊}
G = {撼地牛}
K = {鹿大仙}

学者把这块肉具体是哪个猎物的肉叫做 结果 s (outcome)
若结果是事件 A 里的元素 s \in A ,那这块肉就是鸟肉 A (事件 A 发生 )。

学者把事件作为输入,把自己对事件会发生的 确信度 作为输出,
抽象出了一个叫做 概率 的函数 P()

当样本空间内的样本发生几率相同时,确信度与事件的函数关系是:
确信度等于事件元素个数占有样本空间元素个数的比例 P(A) = |A|/|S|
因此确信度所处的区域是 [0,1] ,而 1 表示 必然事件 ,0 表示 不可能事件

于是学者对于 6 个事件的确信度分别是:

P(A) = 5/16\\ P(B) = 4/16\\ P(C) = 3/16\\ P(D) = 2/16\\ P(G) = 1/16\\ P(K) = 1/16\\

结果:可能发生的状态。
样本空间:所有可能发生的结果所组成的集合。
事件:样本空间的子集。
发生:当实际结果 s_{outcome}\in A 时,表示 A 事件发生。
概率:将事件空间变换到概率空间的函数。
朴素概率计算: P_{naive}(A)=|A|/|S||A| 表示集合中元素的 个数)


但每次都输入一个事件非常不方便,而且事件本身无法进行运算。
当某个事件发生后,需要用该类肉的价格来替换事件进行运算。

所以学者干脆想出了另一个函数,叫做 随机变量 X (随机变量不是变量,是函数),
输入是事件,而输出就是对应肉类的价格。

这样 6 个事件经过随机变量 X() 后就被变换成了可运算的数字。

X(A) = 2\\X(B) = 3\\X(C) = 4\\X(D) = 5\\X(G) = 6\\X(K) = 7


随机变量(r.v.):将事件空间变换到实数空间的函数(映射更准确)。


随机变量 X 有 6 可能状态种,
但不管是哪种肉类(鸡肉、鸭肉、猪肉、羊肉、牛肉、鹿肉),它们都是肉,
就如同男人和女人都叫人一样。

学者把 随机变量 X 所代表的肉 叫做 宏观态 (macrostate)
把随机变量 X 的每个具体的可能状态叫做 微观态 (microstate)


宏观态:不考虑内部差异的状态统称(就是变量) 微观态:考虑内部差异的具体状态(就是常量)


学者想知道肉类这个宏观态的各个微观态的概率 分布(distribution) 情况,便将事件随机变量值 X 作为输入,将事件的确信度值 P 作为输出,构造出了 概率质量函数 (PMF)。


概率质量函数 (PMF):将 离散随机变量 的实数空间变换到概率空间的函数。


虽然学者对此肉的种类依然有不确定性,
但他根据概率和对应的随机变量值算出了平均价格,
称之为随机变量 X 期望 (expected value)


E(X) = \sum_i^6{p_ix_i} =5/162+ 4/163+3/164+2/165+1/166+1/167 \approx 3.56


期望:随机变量 X 所有可能状态的加权平均值。


学者提议商人用这个价格卖给农民,但农民只想用正确的价格购买。
由于这是商人自己忘记肉类而造成的,
因此商人不得不求助信使到猎人那里问一下自己上次买的是什么肉,
再用点火把的方式来来通知商人。

他们约定用 3 个火把的状态来通知肉的种类:

不点、不点、不点
不点、不点、点燃:对应鸡
不点、点燃、不点:对应鸭
不点、点燃、点燃:对应猪
点燃、不点、不点:对应羊
点燃、不点、点燃:对应牛
点燃、点燃、不点:对应鹿
点燃、点燃、点燃

信息

可问题来了,商人该付给信使多少个贝壳呢?
信使通知商人肉的种类消除的是不确定性,该如何量化不确定性呢?







请到「今天看啥」查看全文