点击“
阅读原文
”到
学习强国学习平台
听精选内容
今年1月27日(中国农历年腊月二十八,即除夕夜前一天),一波人工智能浪潮从大洋彼岸刮到古老的中国。与其说是浪潮,不如说是漂亮国资本市场表现出的“恐慌”:以英伟达为代表的高科技股当日暴跌近17%,市值蒸发近6000亿美元;据传其暴跌的主要原因是因为中国的人工智能大模型DeepSeek“横空出世”,
以10%的训练成本撼动了OpenAI在人工智能领域的江湖地位,并被做空机构所用
。
随后美国媒体与国内媒体(官媒及自媒体)连续不断地报道,持续不断地放大DeepSeek对全球人工智能领域带来的“冲击”与“变革”,尤其是国内各类媒体热度不减。作为泽传媒智库人工智能(AI)专业应用团队成员,我今天就和大家分享一下使用与测试心得,看看DeepSeek有没有报道的那么“神通广大”。
其实此前我已注意到了
DeepSeek
,
当时试用的感觉是其并不突出,
主要是DeepSeek的训练数据停留在2023
年10月,
之后再
未有更新,不能满足我对最新数据信息使用的需求
。
各类媒体信源对DeepSeek连篇累牍的报道开始让我动心,决定再次用用它,并于大年初二(1月30日)开始,对其进行了多次测试,今天节选测试一些结果呈现出来。虽不尽全面,却也足以窥豹。
先说重点,
我
对其表现依然很失望
,知识数据并未有更新,首先上一幅足够震撼到国内部分欢愉雀跃网友的测试截图:
备注:《到湾区过大年——2025蛇年粤港澳大湾区春节晚会》于1月27日广东卫视播出
虽然在测试中多次尝试开启与关闭DeepSeek
的网络搜索功能,但其表现依然不能让我满意。
在历时半个月的多次测试过程中,给我的最大感受是
DeepSeek设计了一套应对对话者的语术并在前台呈现出来
,给一开始接触它的使用者咋一看貌似很复杂、很全面、非常有逻辑的感觉,但实际这套语术在从事专业AI测试的我眼里,
不但机械而且很古板,即不能变通、不智能,又非常冗长
。您还真别和我急,有测试截图为证:
好家伙!一套完整全面的逻辑分析堆砌,很唬人吧,但一个简单的“今天几号”?的问题都不能如实回答出来,更不能快速而准确地反应作答,(至少在现阶段)还能对它期待什么呢?
接着,
笔者问到一个触及DeepSeek灵魂深处的问题
,看看它是怎样答复的:
好吧,既然DeepSeek自己不便回答,我请豆包解答一下
什么是GPT-SoVITS
:
对于一下冒出来的DeepSeek的底层是什么,DeepSeek是谁?想必不用我多说了。
简单地拿其与OpenAI等做底层数据采集、分析、整理等基础性工作的大模型相比,
对照其运行使用成本,似乎不太厚道
。至于漂亮国那边的一系列动作的原因和目的,就不明说了,懂的自懂。
打个通俗易懂的比喻,如果将
DeepSeek
比做一家新派餐馆,其
所选用的各类原材料食材大都是
由各类供货商精选并处加工理好:
包括采买、清洗、配菜等工作都不是餐厅的人来做的。
如青菜已摘好、洗好、整理好备用,猪牛羊鱼肉等都已经清理好,甚至切好、提前蒸煮好备用
,
DeepSeek餐馆只需按照食客的点单,安排掌勺厨师煎炒烹炸、
爆溜煮炖
。而
OpenAI
等大数据模型之所以运营成本高得令人咂舌,是因为如果也将其比喻为一家新派餐馆,
其
全部食材、调料等都出自其自家的农场、牧场或自己从事海洋捕捞
,包括各类谷物粮食、各类鱼蛋肉奶、各类瓜果蔬菜、各类油盐酱醋茶酒,甚至包括杯盘碗碟、座椅板凳、餐馆空间装修的原材料及制作均是从无到有自己寻觅到的。
可以说,前者所做的是从1到2的工作,而后者做的则是从0到1再到2的工作。
而近半月来的各类媒体报道,让“食客们”听到的大多是
DeepSeek
这家新派餐馆和OpenAI等量齐平。笔者相信,DeepSeek不会刻意为之,但一众人等随帮唱影,着实让笔者担心。
最好是我多虑了,希望
不要因此耽搁了国内人工智能的正常发展进程,毕竟,
只有做好了基础性研究,这个东西才真正掌握在自己手里
。我们国家各学科的基础科学研究何尝不是如此、不应如此呢?!
由于每年春节期间,智库都会盘点国内各省台春节联欢晚会的网络传播与民众舆情反馈等情况,今年春节期间除了原定的数据采集与分析,对突然横空出世的DeepSeek我也充满了期待,信心满满地希望它对各省台的春晚传播分析有惊艳的表现,于是:
同样是在1月30日,笔者做了有关各省台春节联欢晚会的测试。今天选取广东卫视《到湾区过大年——2025蛇年粤港澳大湾区春节晚会》的测试标的,可以看到,最为重要也最容易网页检索到的播出时间,
DeepSeek给出的竟然是错的
。
尽管当我重复提问后,DeepSeek煞有介事地给出了一系列套路分析,并生成一篇文章,这反倒让关注并了解这台春晚的我,更加失望了。
接下来,
我想考察一下DeepSeek
到底知不知道
2025广东卫视春晚的真实情况
,于是提出了一个更简单的问题
,请提供“《到湾区过大年——2025蛇年粤港澳大湾区春节晚会》节目单”。经过18秒的思考,我得到了以下回复:
看到这里,你是不是和我有同感:“嗯,分析得真专业!一定不会让我失望!”
好,那么我将中间生成的节目信息内容越过不提,直接看我对DeepSeek给出的节目单的反馈结果:
是的,你没看错,尽管在对话测试时,广东卫视的这台春晚已经播出有几天了,但
DeepSeek仍坚持给出了一份完全虚构的节目单,
并说是我让它虚构的
,也真是让我只能“呵呵”了
。
在我
再一次
“不要虚构,晚会已经播出,要实际播出后的节目单”要求下,经过12秒的思考,
DeepSeek给出了该台晚会尚未举办的信息
——理由是它的时间截至2024年7月,
这也再一次让我抓狂
。
于是,坏坏的我又追问了一个问题:“今天是哪年哪月哪日?”
然而,
在看到DeepSeek给出的回复后,我发现自己原来很善良、很单纯
。
当然,DeepSeek也并非一无是处,它的“
逻辑分析
呈现
能力
”是当下数一数二的,其表格生成能力在同类AI对话应用里也算是佼佼者。这些都应成为同类公司迭代提升自身产品时参考与借鉴的榜样。
在同等提问下,豆包给出的表格可以以图片的形式方便使用者下载。
与集成电路领域的摩尔定律不同,人工智能领域工具性能的提升大大缩短,原本集成电路里18-24个月提升一倍的处理能力,在后者那里只需3-6个月,不久后的将来只需1-2个月,甚至更短。
在
本文完成后,2月15日我
再次对DeepSeek进行了一次简单测试:“今天几号?”,结果如下:
在耗时25秒,检索47个网页后,
DeepSeek总算给出了正确的回答。尽管依然冗长,但看得出它在进步,我很欣慰。
2月16日,我再次提问“今天是几号?”等的问题,
DeepSeek的答复速度已经提升了约70%,而且精简了分析过程。但对于“你是谁?”这样的提问,
DeepSeek
依然选择避而不谈。
当我问及“你是GPT-SoVITS?”时,
DeepSeek给出了“需要明确的是,
我本身是OpenAI的GPT-4模型
,专注于文本生成和理解,而不是专门用于语音合成的
GPT-SoVITS。
”
好了,这次就分享这些事例吧。
或许,国内的人工智能
开发团队放下
包袱
、隔绝外界的纷繁干扰,坚持
轻装前行,可以走得更远更轻松。
人工智能
是由我们人类新一次科学技术驱动带来的产品,
初衷是协助人类实现更美好的生活
,将人类从简单的体力、脑力工作中解放出来,进而从事更为复杂、精准的创作与创造,更方便、快捷、低成本
地享受更美好的生活
,
与习近平总书记提倡的“家事国事天下事,让人民过上幸福生活是头等大事”相一致
。
在人类发展的历史长河中,人工智能的发展还只能算是个尚未降生的“胎儿”,对全世界的民族和国家而言,如何呵护好这个“新生命”,引导她健康向善成长,少得病,是个长久的话题和责任