题图由AI生成
书中自有黄金屋的时代正在到来
一、AI解决的核心问题
随着chatGPT爆火以来,AI已经由一个科技话题变成了全民话题。
到现在为止,其实还不到
2年
时间,一会midjourney火了,一会Pika火了,一会Sora火了,一会作曲的AI火了,一会Kimi火了。
这个就把群众搞的很疑惑,到底AI解决了什么问题,能干啥,不能干啥,对我的工作生活有什么帮助,有什么威胁?
这波AI到底解决了什么问题呢?
下面短短几句话,就可以帮你搞明白,不需要你懂什么机器学习,计算机算法,数学理论。
AI并不神秘。
这波AI,简单的说,就是解决了
经验类问题
。
我们的生活中,有很多种问题需要解决,有两大类,是非常明确的。
一类,就是可以套公式的,有套路的,就是公理类的。
这类问题,人类已经搞清楚了,比如
勾股定理,火炮的轨迹,行星的运动,甚至量子力学
等等。
谁来,都是这一套固定的公式,固定的步骤下来,都能得出同样的结论。
小到自动售货机、洗衣机、冰箱,大到工厂的自动化,复杂的操作系统,深奥的数学计算软件,都是这么工作的。
就算是原子弹爆炸,一样是可以算出来的。
此图由AI生成
这一类的问题早就解决了,不就是我们现在用的计算机系统么?
现代电子计算机的起源,最初就是用来计算炮弹的运行轨迹的。
简单的说,就是让程序员把这些固定的套路输入到计算机中,以后就可以长期用了,自动的系统。
再复杂的系统,都是由程序员一行一行代码写出来的。
我们可以把以前传统的编程解决问题的方式叫做:
自动化。
但是,还有一类问题,长期无法得到解决,就是
经验类的
问题。
而现在AI解决这类经验类的问题的方式,我们可以叫:
智能化。
那么什么是
经验类
问题呢?
二、经验类问题
说到经验,这个并不能用几个公式总结,很难说清楚。
比如说写作,你一个新手,你写出来的就是不行。
但是经验丰富的写手,上来给你调整一下段落,增删几个词,感觉马上就不一样了。
你让他说出来,应该一步一步怎么做,就能做到他那样?
他说不出来,就是三个字:“
凭感觉
”。
你再问,他无非就说,要看天赋,
要练,唯手熟尔。
再比如说,认人,不管这个人穿什么衣服,什么发型,做什么动作,千变万化,你都能一样一眼能认出来。
尤其一些女生,这方面能力就过分的强了,别人明星在电影里面化妆成那样,完全看不出原来的样子。
她们都能一眼认出来,你们是孙悟空啊,火眼金睛。
但是,你说让她们总结一些公式、套路,她们也是总结不出来的。
再比如说,搞房子,哪里的房子能涨?
能不能给出一个城市,一个区域,一个小区,楼层,户型,就能算出来,这套房子就能涨?
你做梦。
这个都是要靠你看很多房子,经验丰富,然后到现场去看,前后走一下,就有个基本判断了。
这一类问题,就叫
经验类问题
。
没有公式的。
这个问题怎么解决呢?
当然是靠大量的数据,然后从数据中提取规律。
这个就是当前大语言模型做的事情。
所以,大语言模型,根本就解决不了我们上次说的,
计算三角形面积的问题。
比如说,你用通义千问,它最后算出来了。
其实它还是调用了程序员编写的一个计算程序来算的。
从这个角度,你就知道这波AI能做什么,不能做什么。
比如说,很多人在讨论,AI出现之后,程序员会不会失业?
程序员当然不会失业。
原因很简单啊,原来传统编程那个活,还是得程序员干。
现在又增加了一个活,就是AI,活更多了,程序员怎么会失业呢?
长期来看,不但不会失业,还要多招程序员。
为什么原来传统编程的活,还是程序员干呢?
因为两个字:
成本。
人类已经搞清规律的,你让程序员编写成程序不就完了,而且准确度是可以达到
100%
的。
这是多简单的解决方案。
你让AI去做,是很难达到
100%准确度
的,甚至有些根本就做不了。
你堆
几万张卡
的算力,再加一堆数据收集清洗的工作,花了
几个亿
。
就不如招几个程序员写写代码就搞定了。
各有各的擅长,何必舍近求远?
但是干经验类的活,AI就非常擅长,你就给它数据就可以了。
三、书中自有黄金屋
说到数据,那么问题就来了。
大家看这张图,这是群友画的,你看这幅图有什么问题?
其实并不是他的画法有问题,而是
AI的问题
。
你发现,这个AI画的人,根本就不像中国人,而是老外刻板印象中的中国人,眯眯眼,塌鼻梁、蜡黄的肤色;服饰,也不知道是哪个朝代的。
问题出在哪里呢?
因为在AI大模型中,中国的数据太少了,仅仅就占
1.3%左右
。
大量的都是老外的数据,那么当然会出现大量老外刻板印象中的中国人形象。
既然数据来源都是这样,你让AI画出一个地道的中国人形象,AI当然是画的不行的。
另外,就算中国的数据非常多,但是如果是让老外来
打标
。
他根本分不清中国人、韩国人、日本人的区别,他就瞎打标。
最后AI画出来的中国人,就看起来像韩国人。
什么叫打标呢?
就是打标签,比如给一张图片打上标签,AI才能理解,你这幅图到底描述的是什么。
比如,上面这幅“
火之女
”的图,标签是这样的。
打标打得不对,你AI是不可能画对的。
一说到打标,很多人可能就觉得AI不够智能,还需要人工来打标签。
其实早就有自动化的打标工具了,只是不能全部做对,还是需要人工进行细微的调整。
这个其实是人类和人工智能的概念对齐的工作。
比如说,如果这个世界上全是AI、机器人,它们可能并不管苹果叫苹果,或者apple。
AI骑士团群友用AI绘制
它们可能就是给一个编号,比如叫
00031E52AUY
,AI之间彼此沟通的时候一样用,完全不影响。
但是人类说苹果的时候,AI并不知道是什么,只有人类说这个编号
00031E52AUY
的时候,它才能给你画一个苹果。
你既然要让人工智能接受人类的概念,你当然就要告诉它,苹果和图片的对应关系了。
很多人想学人工智能模型的训练,其实最难的并不是操作的那部分。
操作的那部分,完全是一个技术问题,自然有理工科来解决。
尤其图像那部分,已经非常成熟了。
要保证正确性,难度其实就是在
打标
。
比如,你要做一个古代服饰的模型,请问,明朝的服饰和宋朝的服饰有什么区别,隋朝和唐朝的服饰有什么区别?