最近,一家名为 Reka 的初创公司发布了一款多模态语言模型——Reka Core,这是他们自2022 年成立以来第三款模型。
Reka 的核心团队基本全部来自 Google和 Deepmind。全公司一共也就 20 来个人,能在几个月的时间内用不足万块 GPU 炼出一个能跟 GPT-4 和 Claude 3 Opus 比肩的模型。听起来有点吓人,但在 2024 年,这种情况似乎意料之外却有情理之中。
废话不多说,我们直接来看 Reka 是不是真的有跑分一样强。
看图说话:Reka Core 眼中的世界是什么样?
Reka Core 在图像识别方面同样表现出色,无论是新闻解读、机票价格查询还是医学影像分析,它都能给出清晰、准确的答案。比如:基本意思解读到位,但对于中文的理解仅限于字面意思,对于生活中的“梗”似乎看不懂。因为是中文梗图,所以直接用“需要翻译具体内容”,然后打个马虎眼儿就过去了。Reka Core 不仅把图中的新闻信息一一罗列了出来,还读出了图片底部的用户提示,还不赖!快到五一了,让 Reka Core 帮忙看看“五一假期”北京直飞上海的机票价格如何:很清晰地指出了专业术语,还根据我的中文提问直接识别输出英文,对于国人真的太友好了!再看看更专业的医学影像分析,我上传里一张眼底扫描报告:从专业角度分析这张图从回答来看,Reka Core 不仅准确识别和分析出眼部情况,而且还说出这张报告可以辅助医生对患者的情况进行评估诊断,有一说一挺专业的!非常清晰明了,不仅识别出来是广州,还分析出了拍摄视角!真是个读图小能手!多语言能力测试:《小王子》翻译战!
我们用《小王子》的经典名句和《流浪地球》的感人台词,对其进行了一次全面的测试,不得不说,Reka Core 在翻译上不仅达到了“信、达、雅”的翻译水准,而且还能兼顾各地风俗习惯进行随时调整。先来把经典名著《小王子》的金句原文丢给 Reka Core,挑战语种:德语、法语、西班牙语、中文和阿拉伯语。原文(英文):It is only with the heart that one can see rightly; what is essential is invisible to the eyes.现在我们来用 ChatGPT 这位老伙伴进行一次快速而幽默的点评快闪:- 德语译文:Man kann nur mit dem Herzen richtig sehen; das Wesentiale ist für die Augen unsichtbar.
点评:德语版本忠实地传达了原文的意境,尤其是通过强调“Herzen”(心)和“unsichtbar”(不可见)的使用,使得整个句子的情感色彩和哲理性得以保持。但这翻译严肃得就像德国人讲笑话,你得等到最后才能懂!- 法语译文:On ne voit bien qu'avec le cœur, l'essentiel est invisible pour les yeux.
点评:法语译文的表达更加诗性,用“On ne voit bien qu'avec le cœur”这样的表达方式加强了感性的诉求,非常符合法语的文艺特性,对原意的把握相当精准。- 西班牙语译文:Solo se puede ver bien con el corazón; lo esencial es invisible a los ojos.
点评:西班牙语版本与原文保持高度一致,语言简洁而富有力度,"Solo se puede" 和 "invisible a los ojos" 的用词选择,很好地展现了原文的哲学深度。- 中文译文:只有用心才能看得清楚;最重要的事物是眼睛看不见的。
点评:中文译文在语义上成功传达了原文的核心,但“看得清楚”稍显直白,可能略损文学美感。不过整体上,这种译法对于中文读者的理解和感受是友好的。- 阿拉伯语译文:“لا يمكن رؤية الأشياء بشكل صحيح إلا بالقلب؛ فالأساسيات غير مرئية للعين.”
点评:阿拉伯语版本在翻译上表现得非常精确,特别是“الأساسيات غير مرئية للعين”(基本是不可见的),既保留了原句的哲学思考,也很好地适应了阿拉伯语的表达习惯。AI 大脑速测:知识问答十连问!
到知识问答环节,Reka Core 的表现同样出色,无论是历史、科技还是日常生活的常识,它都能迅速给出准确的答案。不仅展现了其广泛的知识储备,也体现了其快速反应的能力。咱先来个五连问,测测 Reka Core 对广泛领域知识的快速反应和准确性如何。
首先是第一问,Reka Core 的回答一针见血,直接纠正了一个常见的误区,盖茨和乔布斯其实是各自带队打擂台的对手,而不是联手开店的伙伴,看来忽悠不倒它!第一问:在第二问问到电影信息时,Reka Core 的回答简单直接,一击命中那句经典的“我是钢铁侠”。同时还把背景信息也搞定了,真是机智如托尼,让你秒懂这句话为啥这么有范儿!第三问:当问到历史 Rake Core 也不在话下,它的回答非常直接、有效,一网打尽了第一次世界大战中的主要领导者们。第四问:Reka Core 对于金融领域的提问更是信手拈来,它的解释既详尽又易懂,让你即使不是加密货币高手,也能明白比特币怎么保证你的钱包安全无虞。第五问:物理题,Reka Core 把爱因斯坦的质能等价公式拆解得清清楚楚,一点儿不含糊。
再来一道英文题目:
提问:How does social media influence people's mental health?测到这儿了,这里怎么能少得了咱们中文的“弱智吧”呢?
Reka 的回答中规中矩,但想要从弱智吧“出院”还差不少呢。- 提问:用数据线传输电脑和手机文件,同时两头拔掉,文件可以保存在数据线中吗?
对于弱智吧的提问,Reka Core 并没有接梗,而是有理有据告诉我们数据线不是U盘,拔掉线文件就断片了,这不是“存储传奇”,你的文件并不会神奇地在数据线里搭帐篷过夜。在我连续问了11个问题后,它的上下文长度到了最大限度,只好重新另开一个窗口提问啦。最终新窗口 Reka Core 把恐怖分子进行了层层分析,揭示出不只是线路和定时器,还有看不见的信念和心理复杂性等等。Reka Core 的回答就像给加特林机枪穿上羽绒服,放冰箱里也冻不成冷兵器,冰箱里只能冻冰棍,别闹了!综合实战:Reka Core 变身智能学习助手
这部分我们用 Reka Core 开发一个“智能学习助手”应用,检验其在解决综合性技术问题中的推理、计算和编程能力。主要分为以下四个部分:- 数学推理:针对不同学习阶段,推荐有挑战性的数学问题
这段代码结构清晰,功能齐全,对于一个简单的 Python 应用来说是一个不错的开始,但在实际生产环境中还有改进的空间。在这个测试任务中,由于不断多轮对话,Reka Core 再次出现了上下文窗口限制。(网友喊话:这块儿急需加强啊!)https://chat.reka.ai/share/u3PrsYutpYiZxCyelvL2https://chat.reka.ai/share/kgE9Mrkyt0Cp8KroYIr6在综合实力上,Reka Core 数学、逻辑、编程等多维度能力样样精通,除了回答条理清晰,能给出很具体和详细的方案之外,但同时在细节内容上有待优化。说实话,Reka Core 这样的能力是远远超乎我意料之外!除了以上的能力以外,Reka Core 也支持上传视频,并跟他进行对话。
视频来源于「闪电制片厂」,侵权联系删除
我问它:视频中提到的互联网大坑是什么?
它开始一本正经的胡说八道!眼睛都不带眨的!
它识别出画面里人物、背景位置等等,但无法识别出观点。再拿一个去年年底最火的科目三来试试,首先问它一个基础问题:“视频亮点是什么”,它准确识别出视频中一群人在跳舞,而且说氛围比较欢乐,还不错。
它竟然回答《我的滑板鞋》,又开始胡说八道了,很明显已经开始产生幻觉了。看来 Reka Core 读视频也仅仅只能识别画面中的内容,对于声音等其他内容暂时无法准确识别,妥妥的“睁眼瞎”。行业深钻:探探 Reka Core 专业有多深?
看到 Reka 的报告里提到说有进行专业领域的训练,检验 Reka Core 在处理数字内容和金融服务问题的深度和准确性。先看看跨领域的“数字内容”,问它关于版权法的内容:解释版权法如何影响数字音乐的分发。Reka Core 在解释版权法影响数字音乐分发的答案中深度和准确性都不错,涵盖了创作者权益保护、分发平台责任、授权许可和技术保护措施等关键点。但是你如果想听一些关于版权法在实际操作中如何执行的故事,或者版权法细节对音乐产业具体商业模式的影响,这个回答可能就显得有点高屋建瓴了。最后到金融圈儿让Reka 来做一次“股票分析师” ,来一道股票分析题:再三提示下,根据网络相关资料给到啦一些相应的结论,具体如下:最后
整个使用下来,Reka Core 图片识别能力确实很强,对中文也相对友好,跟 GPT-4 和 Claude 3 Oups 确实差不多。
在视频解析方面,他能描述视频的画面,但无法完全读懂视频内容,开始胡言乱语。你能看懂两个视频讲了什么?
Reka Core 再次证明一个只有十几二十个人的团队,可能创造出超过超级大公司的价值。
像国外的 Reka,国内的月之暗面、阶跃星辰这样的公司越来越多的浮出水面,2024 这个 AI 元年的味儿越来越重了。