专栏名称: 天翼智库
天翼智库是中国电信研究院战略发展研究所承办的面向公众的智库研究信息发布平台,为您提供最新信息通信行业发展动态、政策观察、产业分析和战略洞察等。
目录
相关文章推荐
51好读  ›  专栏  ›  天翼智库

大模型公司对标:月之暗面

天翼智库  · 公众号  ·  · 2024-08-23 07:00

正文

公司档案

2023年4月杨植麟成立月之暗面科技有限公司(Moonshot AI),致力于寻求将能源转化为智能的最优解。10月,推出全球首个支持20万汉字无损上下文输入的C端产品:Kimi智能助手。11月,发布面向开发者的API平台。2024年3月,Kimi推出200万字无损上下文能力,巩固了其在长文本处理方面的优势。4月,Kimi迎来一系列更新,模型能力得到提升、支持 Kimi常用语及内置提示词、增加支持语音功能及搜索引用溯源;学会“使用工具”,API已支持Tool Calling功能。5月,Kimi推出付费打赏功能,为公司探索健康的商业模式奠定基础。7月,Kimi开放平台公测上下文缓存技术(Context Caching),降低大模型使用成本,提升响应速度。月之暗面始终以创新驱动为核心,专注于人工智能领域,通过不断研发先进技术,形成了以用户需求为导向,持续迭代产品,优化服务的企业发展模式。

图1 月之暗面公司发展历程

AI大模型技术、产品与服务

1.技术:在大模型长文本处理及其支持技术研发方面有显著优势

长文本技术: 通过优化Transformer模型、采用自研的分块处理策略、稀疏注意力机制、内存增强技术、优化算法与训练策略、上下文保留策略等一系列技术与方法,使模型在中文处理、多语言对话、长文本理解及专业领域应用等方面具备显著优势。

上下文缓存技术: 上下文缓存技术通过缓存用户交互的上下文信息,确保AI在多轮对话中能够高效、精准理解并回应用户的需求,在API价格不变的前提下,为开发者降低最高90%的长文本大模型使用成本,并显著提升模型的响应速度。

其他自研大模型技术受业界广泛认可: 发明了RoPE相对位置编码,是Meta LLaMa和Google PALM等大多数主流模型的重要组成部分;发明了group normalization,是Stable Diffusion等AI模型成功的关键组件,分别用于处理自然语言任务中的序列数据和用于加速训练并提高模型性能。

2. 产品与服务:围绕智能助手及生态平台持续深耕

Kimi智能助手: 2023年10月发布,致力于提供智能化的对话和信息处理服务,具备多语言对话能力,能够理解和生成自然语言文本,支持长文本处理、文件解析和网络搜索。提供问答服务、智能体服务及txt、pdf、ppt等多种类型的文件处理服务。作为全球首个支持20万汉字无损上下文输入的C端产品,在长文本处理、多语言支持、搜索能力方面具备显著优势。

Kimi开放平台: 2024年2月正式上线,旨在为企业和个人提供高度定制化的AI解决方案,以满足不同场景下的智能化需求。该平台通过集成前沿的自然语言处理技术和机器学习算法,为开发者提供API调用支持、用户数据分析、支付功能、企业服务等多项能力,在长文本生成、高度个性化定制方面优势显著。

3.商业模式 :重视用户体验,月之暗面坚持以C端市场为主

创立之初,杨植麟就决心走“To C”路线,以自研方式打造Super APP,实现用户体验的差异化,使其成为to C领域AI时代的流量入口,是月之暗面始终坚持的目标。

开创智能助手“打赏”模式: 随着Kimi智能助手使用量持续上升,口碑向好,其成本端压力不断增大,Kimi一度出现“宕机现象”。为此,Kimi推出“打赏”模式,并根据价格和时长给出6种打赏方案,花费从5.2元到399元不等,打赏后的用户可在相应时间段内不受限制使用Kimi。该“软性”付费方式更看重用户感情上的认可,有助于增强用户粘性。

开放API,为C端、B端用户提供服务: C端,按照使用的文本生成模型版本付费,价格从12元/1M tokens到60元/1M tokens不等,在此之上,使用上下文缓存功能需要额外付费,限速则与累计充值金额挂钩;B端则会在C端服务基础上,增加服务稳定性、拥有更高速率峰值,且数据将不会用于模型训练,相应的企业级api有充值门槛且报价不同。

AI市场拓展

不断重复“长文本”技术标签: 从Kimi上线之初,月之暗面就用“欢迎与Moonshot AI共同开启Looooooooooong LLM时代”标题,强调了Kimi的长文本优势,使用户以后看到“长文本”就想到“月之暗面”。在后续宣发中,更是不断强调该标签,杨植麟曾多次强调“长文本是登月第一步”。

推广渠道覆盖各大社交平台: 在微信、Bilibili、小红书上通过内容营销获客:与AI投资人、AIGC工具爱好者、学术KOL等腰部博主合作产出视频和图文,吸引对价格敏感且对文本阅读、生成辅助有刚需的大学生群体;在即刻、知乎平台上以口碑营销为主:通过运营动作引导用户分享prompt,营造知识共享的社群氛围,超50名技术答主对Kimi智能助手功能进行测评和对比。

与开发者合作,以游戏等新形式展开营销: 月之暗面通过推出API,使开发者免费接入MoonShot并获得技术支持,由开发者开发出的火爆应用进行成功的话题营销和品牌曝光。如游戏开发者范浩强接入API后开发了大模型解谜游戏--《完蛋!我被LLM包围了!》,两天内游戏用户突破1万,后月之暗面取得授权后,又对其进行了二次开发,推出《糟糕,我被高智商人类包围了!》。接入API的游戏《哄哄模拟器》同样爆火,至2月底其在线人数已突破1万,快速消耗超一亿tokens。

AI大模型组织与运营

月之暗面目前团队成员有100多人,来自CMU LTI、Google、Meta、Amazon等全球领先机构,具备极高的人才密度,团队呈现出以下特点:

高学历背景: 月之暗面5人创始团队中,有4人来自清华大学,1人毕业于复旦大学。其中,创始人杨植麟拥有清华大学计算机科学的专业背景以及卡内基梅隆大学的博士学位,曾与多位图灵奖得主合作发表论文,在ICLR、NeurIPS、ICML、ACL、EMNLP等顶级学术会议发表论文20+篇,研究成果在Google Shcolar上被引用次数超17000次;联合创始人张宇韬与杨植麟同为清华计算机系学生,研究方向为异构数据融合和知识图谱构建,曾在KDD、CIKM等计算机顶会上发表多篇文章。

强研发经验: 月之暗面团队核心成员拥有Meta、Google、旷视等知名科技公司从业经历,具备丰富模型、算法研发经验,参与过Google Gemini、Google Bard、盘古NLP、悟道等多个大模型研发工作,且多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。如算法团队负责人周昕宇毕业后加入旷视,与旷视研究院基础科研负责人张祥雨合作研究移动端模型,以共同一作身份撰写ShuffleNet论文,该项成果对后续包括苹果3D人脸解锁在内的各种手机毫秒级人脸解锁技术有着重要影响。

宽研发视野: 杨植麟认为公司管理团队需要具备独特、长远技术判断,且该判断能够影响公司的整体方向。例如,月之暗面今年年初已在布局auto-regressive多模态和lossless long-context长文本技术,并表示“长文本最终要建立在lossless(信息不随着文本长度增加而损失)上才有意义”,显示出团队在技术趋势上的前瞻性和敏锐度。

AI大模型资本运作

凭借专业研究团队和强大技术实力,月之暗面在成立不到两年时间内先后获得多轮融资。其中,2024年2月,月之暗面获得超10亿美元融资,是国内AI大模型厂商自ChatGPT发布以来单轮融资所获的最大金额。在2024年5月新一轮融资过后,月之暗面已同时获得国内两大互联网巨头——阿里、腾讯的加持,公司市场估值超过200亿元,反映了资本市场对其市场潜力的高度认可。

表1 月之暗面的融资情况

AI大模型生态体系

1.搭建AI开放平台,赋能开发者打造AI应用生态

2024年2月,月之暗面正式启动AI开放平台公开测试,允许开发者通过AI开放平台创建API Key,将Kimi智能助手背后的同款大模型能力如长文本处理、指令遵循能力等,接入自有产品或打造全新智能产品;平台API与OpenAI完全相兼容,在迁移过程中,开发者无需对代码进行基本参数外的额外修改,即可实现最快5分钟的“平滑迁移”。此外,AI开放平台API具备与多个开源仓库的兼容性,包括Huggingface Space、OpenAI Translator、LlamaIndex、LangChain等,为开发者提供了丰富开发资源及工具,加速AI应用的开发和部署。

2.积极与上下游企业开展合作,构建完整产业链生态

月之暗面积极拓展上下游合作伙伴,形成从算力供应到应用开发等多个环节的有机生态系统。例如,在算力供应方面,与火山引擎深度合作,火山引擎为其提供AI训练和推理加速解决方案;获得阿里大额投资,其中部分投资额置换成算力服务器,以支持模型的大规模训练。在数据服务方面,依托海天瑞声、循环智能构建的数据训练产业联盟,获取数据训练服务;与人民网合作,人民网作为其内容合规核心合作方和训练数据审核方等。在应用开发方面,与多家行业企业展开模型接入层面的合作,万兴科技旗下视频创意软件万兴喵影、超讯智能旗下指令师产品灵犀妙笔、掌阅科技旗下智能阅读App等均已接入Kimi智能助手。


本文作者







请到「今天看啥」查看全文