今天分享的是
AI专题系列
深度研究报告:《
AI专题:2024钉钉AI助理白皮书-人人都是创造者
》
(报告出品方:
钉钉
)
报告共计:
38
页
序言
从 1955 年起,"人工智能"(Artificial Intelligence)被第一次提出,如今A已不再是未来的科幻概念,正逐渐走进社会各行各业,成为推动社会变革的新引擎。随着互联网、大数据和算法等技术普及,技术取得突破式发展。以 ChatGPT为代表,2023年全球顶尖科技公司纷纷推出 AI大模型,在图文、视频、代码等领域展现出强大能力。而 2024 年则是"AI应用元年”,在大模型基础上,大量 A1应用不断涌现,快速渗透进生产制造、办公管理、科研教学、日常生活的方方面面,
在这场由 A1 技术引领的"第四次科技革命"中,各类 A 应用的开发者既有专业T 人士,各行各业的企业和组织,也包括非A专业的普通人,他们借助 A工具解决生产问题,提高工作效率和生活质量。仅在 GPT Store 上就有超过了万个创作者发布了基于 GPT技术的 AI应用,涉及聊天机器人、搜索引擎、学术研究、绘画、厨艺等领域。
作为国内重要的 A 应用厂商之一,钉钉在 2023年4月宣布接入通义千问大模型,开启全面智能化。2024 年初,钉钉正式发布智能化产品--A1 助理,并于4月18日上线AI助理市场(AlAgent Store),首批将推出超过 200 个 A1助理,进一步降低 AI 使用门槛,推动 A 成为普惠性的生产力工具。目前超过 220 万家企业在钉钉上使用 。
想象力就是生产力。2024年3月,钉钉在全国发起A1助理大赛”,面向科研机构、高等院校,创新企业及个人开发者开放报名,人人都可以借助钉钉 AI 能力,创造研发具备高度智能化、个性化特点的 A助理产品,为企业生产办公、日常学习生活等场景,打造更高效、更人性化的提升方案。
全球重要 AI 应用示例
Midjourney,Midjourney,2022年3月
基于生成对抗网络(GAN)的图像生成工具,用户输入文字描述后,自动生成照片及逼真图像。Midjourney 汇聚了上百亿张高质量图片数据,核心优势是图像质量高,能够模仿各种艺术风格和已知艺术家的作品风格,生成具有类似特征的新图像。
ChatGPT,OpenAl,2022年11月
基于 Transformer 网络模型的自然语言处理工具,A领域里程碑式的聊天机器人。ChatGPT 基于预训练阶段学习的大量语言模式和语法规则生成回答,根据聊天上下文进行互动,展现出强大的语言理解和生成能力。应用场景包括处理各种自然语言文本,完成撰写论文、邮件、脚本、文案、翻译、代码等任务,并应用于智能客服、智能家居、自然语言生成等领域,帮助企业和个人实现自动化服务和智能化控制。GPT-4 的发布,标志着OpenAl 向通用人工智能(AGI) 迈进新篇章。
钉钉 Al 助理,钉钉,2023年4月
融合了钉钉平台多项 AI产品功能,辅助企业日常工作流程、沟通协调等众多应用场景的智能化产品,提供内容生成与摘要,知识库回答办公常见问题,长文本理解与生成等智能助手服务。自 2023 年 4月18日宣布接入通义千问大模型,开启全面智能化战略一年后,钉钉 A 助理、文档 A1、宜搭 A1、智能 OA 等产品正在深入千行百业。截至 2024 年 3月底,钉钉 A1 已超过 220 万家企业使用,月活跃企业超过 170 万家。
Pi, Inflection Al,2023年5月
由 Inflection LLM 驱动的聊天机器人,注重情感陪伴和自然流畅对话,提供情绪价值和全方位生活服务的个人 A1 伴侣,以友善、幽默和富有同情心等特质,与同类产品形成差异化,每日使用时长达到 33分钟,超过Instagram。2023 年获得微软、英伟达等机构的 13 亿美元投资,估值超过 40 亿美元。
WarrenQ,恒生聚源,2023年6月
包含两款A1工具产品--WarrenQ-Chat和 ChatMiner。WarrenQ-Chat是一款金融垂直领域的 Chat产品利用大模型叠加搜索和恒生聚源金融数据库,通过对话指令,获得金融行情、资讯和数据,可以生成金融专业报表,生成对话均支持原文溯源。ChatMiner 是基于大模型和向量数据库构建的金融文档挖掘器,可以根据用户对话指令对指定文档进行快速解读,提供精准检与定位,提取关键信息,将信息进行整合归纳或拓展,处理海量文本数据。
豆包,字节跳动,2023年8月
基于云雀模型开发的 AI工具,具有语音识别和自然语言处理能力,支持多种交互方式,包括语音、触摸、手势等。豆包能够理解用户指令,进行对话并回答问题,帮助用户获取信息或完成特定任务。具备视觉识别和人脸识别技术,可以识别和跟踪人物、物体、场景以及用户面部特征。提供作业批改助手、全能写作助手、英语学习助手等实用工具。背靠抖音 C端流量导入,豆包 2024 年1月的月活数达到 1757 万,位列中国 AIGC 应用月活跃用户数排行榜第一。
Voyager,英伟达,2023年9月
将 GPT-4 模型与 Minecraft 游戏结合的游戏智能体,通过黑盒子査询与 GPT-4进行交互,能够根据游戏反馈自主训练,自行编写代码推动游戏任务,在游戏中进行全场景终身学习。在游戏《我的世界》里,Voyager 获得独特物品、行进距离和解锁关键科技树里程碑的速度,比此前技术增加了多倍。Voyager 展示了AI与游戏产业的深度结合,引发人们对未来游戏的猜想,即大模型驱动提高 NPC 水平,打造更加精细、多样化的沉浸式游戏世界。
Kimi 智能助手,月之暗面,2023年10 月
中国首个支持输入 200万汉字的智能助手产品,核心优势是对超长文本的无损处理和指令遵循能力,能够快速对大量文献和报告进行摘要和提炼,并支持多种文件格式,包括 PDF、Word 文档、PPT 幻灯片和 Excel 电子表格等,根据文件内容和类型进行自动分类。Kimi智能助手还具备联网搜索功能以搜集用户所需信息,能够将复杂数据整理成表格并进行数据分析,辅助理解和编写代码,覆盖 Pvthon、C++、Java 等多种编程语言,2024 年完成超 10 亿美元融资,目前估值 25 亿美元。
Sora,OpenAl,2024年2月
基于 Transformer 架构的文本生成视频模型。用户输入简单文字描述,能够生成具有视觉质量和连贯性的视频,包含多个角色、动作等元素。Sora的优势在于能够降低视觉数据的维度,生成不同分辨率的内容,使生成视频更加逼真和生动。在游戏开发领域可以生成角色动画、各类高度逼真的场景效果,提升游戏沉浸感和真实感。