文章介绍了大模型在PPT生成方面的应用,包括传统办公软件和互联网巨头推出的AI工具在内的多种产品进行了测试评估。文章提到了这些工具在生成PPT方面的功能、使用成本、模板样式、用户体验等方面的表现,并指出了当前AI在PPT生成领域存在的挑战和问题,如数据隐私保护、对用户使用场景理解不深刻等。
随着大模型技术的发展,PPT生成也成为了其应用之一。各企业纷纷推出自己的AI工具,试图在PPT生成赛道上取得优势。
文章介绍了多款AI产品在PPT生成方面的表现,包括WPS AI、Kimi、百度文库和讯飞智文等。这些产品在生成速度、内容质量、使用成本等方面有所不同。
文章指出了当前AI在PPT生成领域存在的挑战,如对数据的使用和处理能力、对用户使用场景的理解、数据隐私保护等问题。
文章提到了智能PPT行业的用户规模正在不断增长,市场竞争激烈。企业需要拿出真本领来抢占市场,同时也要注意用户培育模式,赢得市场与人心。
大模型从图文、图片、视频卷到了PPT生成,但距离“一键生成”的终极目标还有明显距离,这就得看谁能持续“烧钱”完成进步了。
@科技新知 原创
作者丨余寐 编辑丨赛柯
继聊天机器人、文本创作、图像生成、视频生成之后,大模型高调“卷”入PPT生成中。
入局者既包括传统办公软件开发商,如金山办公推出WPS AI、iSlide推出iSlide AI;也包括互联网巨头百度、阿里等携百度文库、夸克AI PPT出场;还有科大讯飞、天工AI、月之暗面Kimi等AI领域的重量级选手。各家纷纷拿出看家本领,争相在PPT赛道上赢得先机。
比如,国产大模型Kimi联合AiPPT推出PPT助手,而科大讯飞也不甘示弱,发布了讯飞智文2.0版本的智能文档AI助理,一键生成PPT升级版。这些工具不仅能提炼文档核心生成大纲,还能一键切换主题模板,甚至支持多文档到PPT的转换……每一个功能都写着“省时省力”,每一个营销点都体现着“卷”的决心。
毕竟“天下苦PPT久矣”,PPT制作一直是职场人士的一大痛点,技术的较量若能推动办公生产力的革新,用户自然喜闻乐见。但是,面对如此硬核的用户真需求,如若企业只是打着AI的幌子交一份伪答卷,无疑将达到反效果,伤了用户的心。
因此,「科技新知」本次将在国产大模型中挑选四名选手进行实测,包括Kimi、讯飞智文、百度文库、WPS,以观察大模型企业对打工人的诚意几何。
为确保测评结果的客观性和参考价值,我们采用以下设定:
1.使用统一的中文提示词,包括简易提示词和复合提示词;
2.每个大模型的测试项目都包括:输入主题生成PPT、上传文档生成PPT;
指令:
你是一名经验丰富的影视产业观察者,被邀请至高校的课堂做分享,主题是2024年国内五一档电影及其票房分析,现在需要你据此做一份PPT,要求要有清晰的结构和逻辑,精准的数据支持,精美的视觉设计,须包含图表,总页数不超过20页。
指令说明:
作为一个信息沟通工具,PPT应有效地在繁杂的信息中提炼要点、归纳总结,并将多数据部分做可视化呈现。因此,为测试这几款AI PPT的基本能力,本轮测试专门选用具备多主体、多数据主题。
WPS AI:
近900字的PPT大纲,层级分明、内容全面,不禁让人对这个汇报充满期待,但最终生成的PPT却只是把大纲填充进用户所挑选的模板中,具体内容仍需用户自行检索、归纳、分析。
如“背景介绍”部分,WPS AI非常直白地留下一句“分析2024年国内五一档电影市场,了解电影产业发展趋势”,相当于只给用户提供一个思考思路,但相信不少读者跟「科技新知」一样,希望AI能完成到分析这一步;对于“影视产业现状概览的市场规模”也仅有一句“高度概括”的表述:国内影视产业持续增长,市场规模不断扩大——水得太明显了。
Kimi:
1分钟的时间里,Kimi生成了近2000字的大纲,试图用20页PPT完成背景介绍、情况简介、票房数据分析、受众分析、成败因素分析、营销策略分析、政策环境与市场监管、未来市场展望……只能说全面,十分全面。但问题也在于此——主题不突出,未能聚焦“2024年国内五一档电影及其票房分析”。
和WPS AI一样,在“一键生成PPT”上,Kimi给到的也是一个思路框架、分析模板,如在“2024年票房数据分析”中,Kimi给出的回答是“详细列出2024年五一档期间各部影片的票房数据,包括总票房、单日票房、观影人次等关键指标。分析票房数据背后的市场因素,如影片质量、宣传力度、观众口碑等。”不得不承认,这是一个相当完整的分析思路,相较于WPS AI也更为详细。
百度文库:
如图所示,百度文库所生成的PPT目录页即其大纲的全部,看起来是位惜
字如金的选手。意料之外的是,低期待等来了小惊喜,在前三个产品的测试中,百度文库几乎是最符合「科技新知」对“一键生成PPT”所设想的,包括结构完整、详略得当、主题突出、能引用官方数据并做分析。
但在生成大纲环节上,百度文库出现两段100%重复的内容,由此生成出来的PPT也同样发生重复。但基于其在内容上的优异表现,这点不足倒也影响不大,只增加了后期手动删除的步骤。
讯飞智文:
出现多处排版叠字现象,但瑕不掩瑜,有别于WPS AI和Kimi的笼统和全面,讯飞智文对主题的把握更为准确,能够合理分配各部分内容的比例,并能围绕主题对相关维度做有效分析,如不同影片类型分布及特点、购票渠道与观影模式、重点城市票房数据等;信息抓取和文本生成能力较为突出,符合主题且有足够的丰富度。
指令:
你是一名大学生,要做一个课程期末汇报,文档名称为“电影《傲慢与偏见》人物形象分析汇报”,字数1500,包含电影简介与创作者简介、故事梗概、主要角色人物形象分析、人物刻画手法及小结,请你根据这份汇报讲稿生成一份PPT。
指令说明:
这项测试是为根据文档生成一份汇报演讲稿。按一般人平均语速约240字/分钟计算,整个汇报约6分半。主要评估AI的语言和场景理解能力、文本阅读能力、概括提炼能力等。
WPS AI:
整体而言,是名简约派选手,包含封面及尾图,成品仅6页。排版合理,但配图毫无关联;对文档内容的处理中规中矩,只做了基于文档本身的处理,没有做文档外的内容补充。
Kimi:
尽管上传的文档已经是完成的一篇汇报演讲稿,但Kimi似乎有自己另外的想法,它基于演讲稿的框架和模板做排篇布局,提炼要点,但没有展开分析,而是提供给用户思考的方向,更像是一份“半成品”。用户需再根据其指示自行填充内容。此外,Kimi在本轮表现中竟存在内容与小标题颠倒(混淆?倒置?还是说正文与小标题识别错误,位置颠倒之类的会清晰一点?)的低级错误。
百度文库:
根据其提供的选项,我们在“原文一致”和“适当扩写”中选择了后者,成稿确实有基于文档内容补充有效信息和完善,并且扩充内容能够围绕“人物形象”这个关键词展开,逻辑合理。排版无太大问题,较为致命的是配图出现错误,用成《小妇人》的电影截图。
讯飞智文:
排版依旧没有将模板和文字内容进行合理编排,出现多处叠字现象,且PPT页面字数过多,不仅影响观感,也不利于观众对信息的快速获取。但通过联网扩写,成品能基于演讲稿对汇报内容进行有效地完善。此外,其提供的AI配图是个亮点,虽然图文相关性还有待加强,但已比前几家的图片表现要好。
除整体成稿呈现外,我们还从以下几个相关维度进行测评:
响应速度与效率、使用成本和价格、模板与样式、用户体验与交互、安全与隐私保护。
“一键生成”无疑是被PPT硬控的打工人和学生党梦寐以求的功能。毕竟,一份精美的PPT从挑选模板开始,就要耗费大量的时间和精力。再到梳理结构、确定文本、斟酌用词、排版布局、设计优化等,可称为繁琐的集合。总体来看,本期测试的四款产品无论是通过输入主题生成还是上传文档生成,成品时间都控制在2.5分钟内。其背后考验的是高效的数据管理机制及算法系统等。
看起来,速度与质量有时难兼得。在输入主题生成中,讯飞智文以整体时间1分钟的优异成绩胜出,且内容质量高。在上传文档时,WPS AI仅用了29s,但内容在四家中垫底。