2022年,
ChatGPT
问世。
一经出现便掀起滔天巨浪。
如果你跟ChatGPT聊过天,一定会震撼于它所
涉猎极广
:
既能创造诗歌,也能修改代码。
可以批改作业,还能撰写论文。
写文案易如反掌,给方案不在话下。
......
有人兴奋,有人恐慌。
有人说,它会带来一次新的“
工业革命
”。
有人说,它会引发21世纪的“
新卢德运动
”。
这其实不是AI第一次向人类展示它的力量。
自动驾驶、MIT主导的人类写字系统、SIRI智能语音助手、AlphaGo......
但这一次,ChatGPT确实惊吓到了人类。
我们能抵挡来势汹汹的AIGC狂潮吗?
人类是不是真的会被ChatGPT取代?
要回答这些问题,让我们先回归数学。
因为ChatGPT背后的核心本质,是“
贝叶斯公式
”。
历史有许多天才,
生前籍籍无名,死后众人崇拜
。
18世纪数学家
托马斯·贝叶斯
也是其中一位。
“贝叶斯”定理源于解决“
逆向概率
”问题时写的论文。
在此之前,人们只会计算“
正向概率
”。
什么是“
正向概率
”呢:
假设袋子里面有P只红球,Q只白球,它们除了颜色之外,其它性状完全一样。你伸手进去摸一把,摸到红球的概率是多少是可以推算出来的
。
但反过来是否也可以计算,我们可以将它视为“
逆向概率
”:
如果我们事先并不知道袋子里面红球和白球的比例,而是闭着眼睛摸出一些球,然后根据手中红球和白球的比例,对袋子里红球和白球的比例作出推测。
这个问题就是
逆向概率问题
。
通俗地讲,就像一个迷信星座的HR,如果碰到一个处女座应聘者,HR会推断那个人多半是一个追求完美的人。
这就是说,当你不能准确知悉某个事物本质时,你可以
依靠经验
去判断其
本质属性
。
这个研究看起来平淡无奇,名不见经传的
贝叶斯
也未引人注意。
他写的论文直到他死后的第二年,才由他的一位朋友在
1763年
发表。
明珠蒙尘,就像画界的梵高,画稿生前无人问津,死后价值连城。
为什么贝叶斯定理200多年来一直被雪藏,不受科学家待见?
因为它与当时的
经典统计学
相悖,甚至是“
不科学
”的。
经典统计学中,数字规律来源于
随机取样
再行计算。
贝叶斯方法则建立在
主观判断基础
上,你可以先估计一个值,然后根据
客观事实
不断修正。
从主观猜测出发,这显然不符合科学精神,所以贝叶斯定理为人诟病。
1774年,法国的大数学家
拉普拉斯
也看到贝叶斯定理的价值。
不过他知道人类的普遍毛病,总是用传统来反对新思想。
他懒得与人争论,直接给出
数学表达
:
贝叶斯定理
简单优雅
、
深刻隽永
。
贝叶斯定理并不好懂,每一个
因子
背后都藏着深意。
它到底是如何“为人民服务”的呢?
对于贝叶斯定理,参照上面的公式,首先要了解各个
概率
所对应的事件。
P(A|B)是在B发生的情况下A发生的概率;
P(A)是A发生的概率;
P(B|A)是在A发生的情况下B发生的概率;
P(B)是B发生的概率。
举个例子。
量子妹约定帅哥去爬梧桐山,希望玩到人约黄昏后占点便宜,然而天公不作美,一大早天空多云。
这可怎么办?
60%的雨天的早上是多云的
。帅哥说,不玩了吧。
量子妹当然不甘心,劝说帅哥:
❶多云不见得会下雨,大约30%日子早上是多云的!
❷深圳天气平均一个月才3天下雨,10%的概率而已。
帅哥并不是绣花枕头,非常科学地用“
贝叶斯公式
”计算:
用“雨”来代表今天下雨,“云”来代表早上多云。
当早上多云时,当天会下雨的可能性是
P(雨|云)
。
P(雨|云) = P(雨)·P(云|雨) /P(云)
P(雨) 是今天下雨的概率 = 10%
P(云|雨) 是在下雨天早上有云的概率 = 60%
P(云) 早上多云的概率 = 30%
那么,贝叶斯定理的答案就出来了
P(雨|云) =0.1×0.6/0.3=0.20
帅哥毫无表情地说:今天下雨的概率是
20%
,确实可以去爬山。
贝叶斯公式取得人类信任
今天的贝叶斯理论开始遍布一切。从
物理学
到
癌症研究
,从
生态学
到
心理学
。
贝叶斯定理几乎像“
热力学第二定律
”一样放之宇宙皆准了。
物理学家提出了量子机器的
贝叶斯解释
,以及贝叶斯捍卫了弦和多重宇宙理论。
哲学家主张作为一个整体的科学可以被视为一个贝叶斯过程。
在IT界,AI大脑的思考和决策过程,被更多工程师设计成一个
贝叶斯程序
。
但贝叶斯诞生以来命途多舛,长期以来因为表面的不科学,并没有得到主流学界认可。
其实在日常生活中,我们也常使用贝叶斯公式进行决策。比如我们到河边钓鱼,根本就看不清楚河里哪里有鱼或者没鱼,似乎只能随机选择,但实际上我们会根据贝叶斯方法,利用以往积累经验找一个回水湾区开始垂钓。