专栏名称: 远川科技评论
饭统戴老板小伙伴们的科技后花园,用投资视角,扒巨头秘史,没有客气,只有硬核!
目录
相关文章推荐
51好读  ›  专栏  ›  远川科技评论

自由画布,给创作者一个哆啦A梦的口袋

远川科技评论  · 公众号  ·  · 2025-01-24 15:03

正文



当代职场人最烦两件事,一是开会,二是线上开会。


我们常常把开会视作头脑风暴、思维碰撞的绝佳场所,辅以office、pdf等线上文件处理工具,打破了空间限制,似乎又延伸了思维拓展的边界。


但现实是,语言限制了思想表达的完整性,各类工具占满了电脑内存、烧干了CPU,不同文件用不同工具打开,满满当当的电脑屏幕,让人恨不得生出四双眼睛。


大模型时代,职场人对AI创作寄予厚望,可chatbot上来一个“how can I help you today”对话框就让语言的壁垒重现:该说什么才能让chatbot尽快理解我的需求?



我们希望chatbot能代替自己的眼睛和大脑,以更高的效率消化各类素材,将头脑风暴的范围限制在chatbot的一个界面里,以更高的密度和更小的信息传输损害,实现更精准地输出。


但“格式”成为了素材交融的最大屏障,降低了思维碰撞的效率和思维融合的范围,产出的文章、PPT、海报,总不尽如人意。


AI创作要真正改变职场人和创作者的困境,核心不在于提供一个对甲方需求永远耐心的“实习生”,而是一个打破语言、工具界限,思想碰撞更加高效无阻的思维宇宙和趁手可用的“小能手”。


从这一思路出发,2025年,一场AI创作的“拨乱反正”已经开始了。



格式无界,创作无界



两个月前,李彦宏在百度世界大会上亲自推荐了一款产品——“自由画布”,向AI创作的思维壁垒开了第一枪。


“自由画布”主打多格式、全模态文件的理解、生成、创作能力,不管素材有多少种文件格式,“一圈一拖”即可实现一站式、多线程地素材的消化和结果的输出。


“画布”的概念由来已久,上次引发瞩目是在2022年苹果在iPad上引入“无边记”。总结其为何打动创作者,其实是尊重了创作的天马行空,理解了灵感是迸发于不同素材之间的化学反应里的,为此作的努力是包容更多的素材,让这种化学反应来得更猛烈一些。


百度文库“自由画布”在做的是类似的事。


创作的过程可以概述为“输入->输出”的过程,输入素材的类型丰富程度、数量规模都极大程度地影响“输出”的表现。 但市面上的chatbot的普遍困境是,输入端“要素”过多导致超载。


我们日常创作需要的素材格式有超过100种,视频有mp4/avi/rmvb,文字资料有doc/epub/txt,图片有jpg/gif/png,处理起来仿佛八国联军会晤,沟通需要翻译,作战风格需要磨合。


过去没有大模型,我们也免不了在电脑上下载各类App,以避免“文件格式不支持”的窘境,chatbot不只是要支持不同格式的素材的呈现,还要能解读、生成,难度更大了。


自由画布依托于百度文库和百度网盘的全面打通,覆盖了我们日常创作中会用到的大部分素材格式 ,并且通过“一拖一圈”的极简操作,辅以自然语言对话,打破了过往AI创作类产品的单一交互方式。


例如写一篇《小巷人家》的剧评,需要的素材包括电视剧片段、剧照、剧情梗概、社交平台评论,延伸一些还包括主创幕后采访(文字/视频)等,创作者可以在将它们全部拖到一块“画布”上,或者直接从百度网盘一键上传。



每个素材都可以进行针对性解析,根据素材的内容,可以通过「一圈」的方式,分门别类地选择参考逻辑结构、语言风格、主要观点等等,实现灵感的激发和个性化内容的创作。



创作者在此基础上进行进一步筛选后,用鼠标圈定出可用的素材,点击“生成文档”,确认大纲后即可生成文档,生成的文档中会理解素材,并直接在合适的位置插入素材。



初稿不仅可修改(自由画布不仅内置编辑器,还能用AI对选定段落进行改写、扩写、写作风格的更改等等),还可以作为素材与其他素材再次“化学反应”,循环“一拖一圈”的步骤迭代到第二版、第三版。



自由画布的灵魂是“自由”,旨在提供一个不受限于格式的素材池,为创作者开辟一个无拘无束、充分拓展的思维空间,再辅以实用性更强的“AI小能手”,是思维空间,更是创作空间。



哆啦A梦的口袋



欧洲的民俗传说中有一双著名的“七里靴”,《浮士德》里的恶魔穿着它追赶浮士德“一步七里”。


创作者对AI创作的实际诉求类似于“七里靴”,本质是 让创作的每一个步骤都拥有更高的效率、范围更大的延伸,而不是让chatbot代替自己去创作,让“七里靴”代替自己去跑。


传统的chatbot限定了创作者以对话的形式“告诉”chatbot自己的需求,实际上是放弃了一部分“只可意会不可言传”的信息,造成产出与需求的错位,所以创作者普遍有这样的困惑,“明明该说的都说了,为什么chatbot写的文章还是不符合我的要求?”


自由画布在流程和功能设计上的“拨乱反正”由此入手,一个个功能明确的按钮取代了逼迫人咬文嚼字的对话框,就像windows自带的画图软件,看着死板却“开箱即用”。



功能设计则将重点放在提高重复性强、依赖算力的环节的效率以及素材的延伸和拓展,在这个过程中,各个“输出”关键节点的“确定权”仍在创作者手中,打造了一个 流程可控、多任务并行、公私域内容全面打通的高效创作空间。


假设要做一个有关“中国电动车技术发展现状”的ppt,可以上传一个内容弱相关、但布局风格可以借鉴的ppt,仅选择“使用当前模板”,内容方面,则可以上传机构报告、行业分析等,参考其中主要观点或文字风格。







请到「今天看啥」查看全文