专栏名称: 创业最前线
创业有道·创新中国|中国领先的创投新媒体,提供更好的创投故事。
目录
相关文章推荐
格上财富  ·  一文讲透关于DeepSeek的7个核心问题 ·  2 天前  
格上财富  ·  人生建议:先上车,再调整姿势 ·  2 天前  
手游那点事  ·  全年收入804亿,国内“第2”的游戏大厂如何 ... ·  3 天前  
简七读财  ·  过去100年,这类资产更赚钱 ·  2 天前  
51好读  ›  专栏  ›  创业最前线

天工大模型:中国AI搜索巨头如何一骑绝尘?

创业最前线  · 公众号  ·  · 2024-05-30 09:59

正文


5月,全球大模型领域的竞争,或可用“你方唱罢我方登场”来形容。


谷歌、腾讯、阿里、字节跳动等业界巨擘纷纷亮出大招。有的凭借技术底蕴实现全面升级,有的慷慨将大模型开源免费,更有甚者通过价格战掀起狂风巨浪,整个市场一片火热。


而在这硝烟弥漫的战场上,昆仑万维作为中国AI的先驱者,近日正式公布天工AI日活用户(DAU)突破100万,成为极少数进入“DAU百万俱乐部”的消费级AIGC应用。


另根据QuestMobile显示,天工AI月活量已经逼近千万,同时,李榜主AIGCweb端排行榜公布,天工AI4月web端用户增速榜第二名,一系列亮眼的数据,处处涌现着大量用户对天工AI的需求,赫赫战绩之下不难发现其实昆仑万维早已蓄势待发。


早在2023年8月,昆仑万维推出了国内第一个AI搜索引擎——天工AI搜索,成为国内AI搜索领域的领跑者。


随后百度、360、搜狗、秘塔等纷纷入局。此外,谷歌在2024年I/O开发者大会上展现的很多技术,诸如AI搜索、多模态搜索、图文并茂等功能,天工也早已具备。


一个月之前,在「天工」大模型发布一周年之际,昆仑万维果断推出「天工3.0」和「天工SkyMusic」公测,展现出其独特的战略眼光和坚定的决心。


那么,天工大模型在这一年里究竟经历了哪些蜕变?随着AI技术的飞速发展和市场的不断扩张,其战略布局又是如何谋划?更重要的是,其在大模型时代所秉持的先进理念和独特洞察,又将如何引领行业风向?这一切,都值得深入探究。


1

国内300+大模型激战正酣,天工AI如何独领风骚?


国内大模型市场激战正酣。


据相关报道统计,截至今年4月底,国内共推出了约305个大模型,在过去一年推动着语言理解、图像识别等多个领域的技术进步。


大模型的激烈竞争中,数据和算力成为决定胜负的关键要素。然而,这两者都是极其烧钱的投资。 因此,国内众多大模型在尚未积累起可观的日活跃用户数 (DAU) 时,就不得不开始考虑收费,以维持其庞大的运营成本和持续的技术研发。


如今年5月份,kimi就开始向用户收取年费,最高可达399元/年。这样的收费策略无疑会在一定程度上影响用户体验和市场的进一步拓展。


大模型的这场角逐,不仅拼技术与价格,更是实力的巅峰对决!而相较于市面上的大模型,天工则选择了一条不同的道路。 它坚持不向用户收费,而是通过其他方式来实现盈利和可持续发展。这种底气来源于天工对技术和市场的深刻洞察,以及对用户体验的极致追求。


目前,天工大模型已经迭代至3.0版本。


相较上一代,「天工3.0」在模型语义理解、逻辑推理,以及通用性、泛化性、不确定性知识、学习能力等领域有很大的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。


值得一提的是,「天工3.0」也是全球首个多模态“超级模型” (Super Model) ,其集成了多项能力,是大模型时代的“超级应用”。


而且5月27日,昆仑万维宣布天工AI每日活跃用户 (DAU) 超过100万,受到广大用户的热情追捧。


其中,内容创作能力一直是「天工」系列大模型的强项。 不仅能实现AI音乐生成、AI语音、AI对话、AI二次元漫画生成等强大的内容创作,更是通过专项Agent训练实现了在对话中,结合文本需求实时生成图片、结合文本需求实时内容分析及图表构建等能力,成为真正能搜、能写、能读、能聊、能听、能说、能画、能看、能唱的超级模型,带来全新的颠覆式AI体验升级。


而搜索作为互联网用户获取信息的主要方式,其重要性不言而喻。搜索引擎如Google、百度等,每天响应数十亿次搜索请求,显示出其在信息检索中的不可或缺性。


为什么AI搜索能引爆市场?


传统搜索引擎的信息真实性和质量越来越让人难以判断,满屏的广告更是让人眼花缭乱,用户的隐私在这里似乎成了摆设。


更糟糕的是,由于信息壁垒,像小红书、知乎、微博、抖音这些当代UGC的主要信息源,竟然被某些搜索引擎拒之门外。


当然,即使是针对同一问题,如“目前国内大模型应用情况如何?”,在不同的大模型AI搜索工具中,所得到的回答质量和内容结构也可能存在显著差异。 例如笔者在国内主流的三大模型中输入该问题后,发现第一个模型仅提供了基础的文字描述,侧重于概括性的信息;第二个模型提供了详尽的文字内容,还附加了相关的来源信息链接。


图 / 国内其他两款大模型部分内容截图


但最让笔者惊喜的是,在天工AI搜索中提问,领略到一种截然不同的体验。 天工AI的多模态搜索功能在中国内独树一帜。


首先,它在收到指令后进行相关问题的延伸,并实时判断该段落信息是否需要联网搜索,能够实现对某个行业进行细致的拆解分析,总结相关事件、拆解产业链地图等复杂功能,并以结构化或思维导图的形式进行最终展示。


图 / PC端天工AI搜索截图


与此同时,天工大模型在多步骤推理能力方面展现出了较强的实力。在权威推理榜单Benchmark GSM8K的测试中,天工以80%的正确率脱颖而出,这标志着天工的推理能力达到全球领先水平。


以笔者搜索“北京暑假适合亲子游玩的地方”为例,天工AI理解了问题之后,给了三个选项:旅游景点推荐、亲子活动项目、亲子餐厅推荐。笔者点击“亲子活动项目”之后,天工AI展示了一份暑假亲子游的攻略,先是简单介绍了北京,再是推荐了一些景点,如故宫博物馆、天坛公园、北京动物园等,后又推荐了一些活动和亲子餐厅,并且最后还附有进一步深化追问的问题和相关视频,以便笔者更好的了解信息。


图 / 天工AI多步骤推理部分截图(图片左右滑动显示)


此外,笔者在天工AI搜索的研究功能下,搜索“目前国内大模型应用情况如何?”,天工AI如一位贴心的助手,逐步为笔者呈现答案,内容详实、数据丰富,还有清晰的大纲、脑图、图表等辅助理解。 所有信息都经过逻辑归纳整理,甚至页面的右侧还附带了可溯源的信息链接,一目了然。


图 / PC端天工AI搜索部分内容截图(图片左右滑动显示)


通过笔者上述的体验来看,相较于其他大模型的AI搜索,天工AI除了提供文字内容外,还可以实现图文交织和图表生成,实现多模态的搜索体验。


图 / 前两页是天工AI部分内容截图;

后面两页是其他国内两大大模型部分内容截图

(图片左右滑动显示)


其次,天工AI尤为引人注目的是,其在APP端展现出了卓越的时效性。


在数字化时代,用户对于搜索的需求已不再局限于基本信息的查询,他们更渴望能够实时掌握最新的动态信息。尽管市面上AI搜索平台层出不穷,但AI大模型的时效性问题却成了一个难以逾越的障碍,使得AI搜索在用户体验上略显滞后。但这又是AI搜索必须解决的关键问题。


目前,天工AI却成功攻克了这一难题,其是国内唯一能够支持实时搜股票、油价、彩票、金价、快递、天气、日落时间等很多实时性信息查询的AI产品。 从天工AI的体验来看,我们完全可以彻底放弃传统搜索引擎。


图 / APP端天工AI搜索天气、股市等内容截图(图片左右滑动显示)


最后,天工AI还新增了很多实用且有趣的功能。


一是AI PPT功能,可以根据用户提供的信息快速生成专业的PPT演示文稿。


当笔者输入“创建一份全球大模型成本与价格的研究报告PPT”;然后不到1分钟就生成一份文字报告,分为引言、大模型成本分析、大模型价格策略、案例研究、未来趋势与挑战、结论、问答共七大部分;最后点击“生成PPT”-选择模板-生成PPT即可。


笔者选择了深邃模板,不到1分钟就创建完成,共24页PPT。这份PPT不仅包含了详尽的文字描述,更巧妙地融入了多种与主题紧密相关的图表,通过直观的方式展示和强化观点。例如大模型训练阶段图、各大模型训练成本对比图表等等。


图 / 天工AI的AI PPT部分内容截图(图片左右滑动显示)


二是AI视频转绘。 拍摄或上传3S~10S内的小视频,就能帮助用户转成二次元风格,用户还可以制作动漫表情包,模仿名场面等。操作超级简单,总共分为三步:第一步点击“添加视频”,第二步上传视频,第三步选择喜欢的风格,然后等待几分钟即可生成。


例如笔者上传了一个3S摘桑葚的视频,选择动漫风格,虽然显示10分钟生成,但仅用3分钟就已生成。不得不说,这个功能对内容创作者或者AIGC创作者实在是太友好了,免费、不限次,且高效又高质。


靠这个功能可以实现在各个自媒体平台迅速涨粉,每天批量日更,批量做号,还不用付出大量精力。



如果你对「天工3.0」的全新AI功能升级感兴趣,不妨亲自体验一番。只需在PC端访问www.tiangong.cn,即可感受超级模型的强大AI魅力。


昆仑万维董事长兼CEO方汉曾指出,公司之所以发力AI搜索,源于用户的真实需求。在传统搜索引擎的PageRank范式下,用户需要自己从海量网页中提炼信息,这个过程耗时且繁琐。而大模型的出现,将这一时间从3—10分钟大幅压缩至5—10秒,效率显著提升。


2

天工AI:超越功能堆砌,底气来自模型能力


天工AI之所以能独领风骚,绝非一堆功能的简单堆砌,而是源自其深厚的技术积淀、独到的战略视野,以及一系列“人无我有、人有我优”的卓越优势。


尤其在AI搜索方面,昆仑万维开创了中国AI搜索先河。


据了解,2012年,“3SB大战” (360、搜狗、百度) 之后,搜索引擎行业陷入僵局,没有硝烟,没有革命,也没有新故事。


2023年,随着AI的助推,沉寂11年的搜索赛道再次变得热闹起来。


2023年4月,昆仑万维的首个自研大语言模型“天工”上线。有了强大的基座,2023年8月,昆仑万维推出国内第一款AI搜索引擎“天工AI搜索”,成为中国AI搜索鼻祖。


在短短数月乃至半年后,百度、360等科技巨头也竞相涌入这一充满机遇的赛道。


在AI音乐方面,昆仑万维在今年4月17日正式发布,中国首个音乐SOTA模型——“天工SkyMusic”,首次实现中国自研大模型在AIGC垂直领域全球领跑。



“天工SkyMusic”由Large-scale Transformer负责谱曲,学习Music Patches的上下文关系,实现音乐可控性;并由Diffusion Transformer负责演唱,通过LDM将Music Patches还原为高质量音频。目前天工SkyMusic已能够支持生成80秒44,100Hz采样率双声道立体声歌曲。并且在4月17日开放公测之初就公开了自研AI音乐大模型技术架构,这是目前为止行业唯一公开可参考的AI生成音乐模型技术架构。


图 / “天工SkyMusic”自研AI音乐大模型技术架构


专业术语过于复杂和抽象,跟随笔者的体验,感受“天工SkyMusic”的神奇之处。


首先,将李白经典词作《将进酒·君不见》输入「天工SkyMusic」;其次选择曲风和情绪;最后,不到1分钟就生成了三首歌曲,歌曲时长最长为1分50秒。


图 / 天工SkyMusic部分内容截图(图片左右滑动显示)



除了国内,与国际巨头相比,天工AI同样毫不逊色。


例如谷歌在2024年I/O开发者大会上展示的多项技术,如AI搜索、多模态搜索等,天工早已具备。


以AI识图场景为例,谷歌的AI识图功能,即“Ask Photos”功能,计划在2024年夏季上线。而早在一个月之前的4月17日,「天工3.0」大模型全面更新,体现至「天工」App上,其集成AI对话、搜索、音乐、社交于一体,支持AI识图、生成图片、数据分析及图表绘制等功能。


图 / 左:谷歌2024年I/O开发者大会demo截图;

右:APP端天工AI的截图


除了技术上的优势,天工大模型抢先布局了MoE架构也是略胜一筹。


2024年2月,昆仑万维率先采用业内顶尖MoE (Mixture-of-Experts) 专家混合模型架构的「天工2.0」大语言模型,相较此前版本,其应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。


天工秉持首创精神,不断突破自我,持续策略升级,永不止步。


于是,2024年4月17日,天工大模型迭代至3.0版本。


「天工3.0」采用4000亿参数MoE架构,在语义理解、逻辑推理等方面能力实现质的飞跃。同时,在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,多项评测指标达到全球领先水平。


目前,MoE路线已涌现出Mistral、Grok-1、DBRX等头部大模型。MoE混合专家模型是全球技术最领先、性能最强大的基座模型 (Foundation Model) 技术路径,相较于其他模型,MoE大模型应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。


而天工使用MoE架构后,在处理复杂任务、提高响应速度、降低成本以及增强可扩展性方面具有明显的优势。这些优势使得天工在AI领域具有较高的稀缺性和广泛的应用前景。


3






请到「今天看啥」查看全文