主要观点总结
该文章介绍了RICH设计范式,一个由Ant Design提出的AI界面设计范式。文章首先回顾了WIMP范式,并解释了RICH范式的四个关键要素:意图、角色、对话和混合界面。文章还讨论了设计AI产品时需要面对的四个关键问题,包括AI如何理解并帮助用户解决意图、AI的人设和形象、AI的表达方式以及如何组织、操作多行为融合的界面。最后,文章强调了在AI时代,最好的界面设计应该让人机交互变得自然而然。
关键观点总结
关键观点1: 什么是RICH设计范式
RICH设计范式是Ant Design提出的AI界面设计新方法,旨在回答在智能时代下如何设计AI产品的交互界面。它包括四个关键要素:意图、角色、对话和混合界面。
关键观点2: WIMP范式的解释
WIMP范式是人际交往中的四种基本元素:窗口、图标、菜单和指针,通过它们实现人机交互。在智能时代下的界面设计,包括AR和VR设计,都基于这个范式。
关键观点3: 设计AI产品时的四个关键问题
在设计AI产品时,需要面对四个关键问题:AI如何理解并帮助用户解决意图、AI的人设和形象、AI的表达方式以及如何组织、操作多行为融合的界面。RICH设计范式提供了对这些问题的指导。
关键观点4: RICH设计范式的四个关键要素的解释
意图(Intent)帮助思考AI如何理解用户需求;角色(Role)定义AI的形象与能力;对话(Interaction)探索自然的交互方式;混合界面(Hybrid)解决多模态交互的整合问题。
关键观点5: 文章最后的观点
文章最后引用了设计师的话:“在AI时代,最好的界面设计不是让机器模仿人类,而是让人机交互变得自然而然。”表达了作者对AI界面设计的看法和期望。
正文
RICH设计范式是Ant Design提出来的一个AI界面设计范式,类似于图形用户界面的WIMP范式。它在回答我们该如何在智能时代下,设计一个AI产品的交互界面。
什么是WIMP范式?
在人机交互领域,WIMP 范式即 “Windows, Icons, Menus, Pointer”,是指一种通过窗口、图标、菜单和指针四种基本元素来实现人机交互的方式。
- 窗口:是一个独立的程序运行空间,不同程序可在各自窗口中同时运行且相互隔离。在多任务操作系统中,用户可同时打开多个窗口,进行文字编辑、浏览网页、查看邮件等操作,并可通过窗口管理功能对其进行移动、缩放、切换、关闭等操作。
- 图标:作为计算机执行动作的快捷方式,一个图标通常代表一个应用程序、文件、文件夹或系统功能。例如桌面上的浏览器图标,用户点击即可快速启动浏览器程序。
- 菜单:是基于文本或图标的选择系统,用于选择和执行各种程序或任务,会根据不同上下文环境而变化。例如在文字处理软件中,菜单提供文件操作、编辑功能、格式设置、排版选项等相关命令。
- 指针:是屏幕上的符号,代表用户控制的物理设备的移动,用于选择图标、数据元素等。常见的指针设备有鼠标、触摸板等,用户通过移动指针并点击相应元素来执行操作。
可以说我们目前所有的屏幕界面设计,包括现在的AR和VR设计,都还没有脱离这个范式去进行过设计。什么是RICH范式?
在这张图里,我们可以见证人机界面的交互形式随着技术革新的变迁,但我倒是觉得:我们的范式依然还处于NUI下,不过具体到能回答设计师该关注哪些设计元素的范式的确还没有定论。意图、角色、对话、混合界面,是设计师需要关注的四个要素。每一个要素,解决一个在设计AI产品时的关键疑问。在智能体的设计中,这是最初的一步。因为从人际交互的角度来说,只有当双方能够理解彼此,我们才可能拥有比较流畅的交流,人机交互也一样。但在我的实践中我发现,当我们要思考和思考AI怎样才能理解并帮助用户解决意图之前,首先要先定义清楚的是:
比如,在我最近做的项目中,AI的能理解被定义为XX知识库内&日常沟通相关。那什么又是日常沟通相关的?最简单的,比如我在中文系统里输入Hello,它会觉得不能理解吗?你会发现,在人际交往中似乎不是问题的,成为了智能体设计中的问题。在这个问题上,我们的技术人员挠了挠头,说那得取决于我能用的大模型了。就像每个人有每个人的形象、语气、认知、习惯外,越来越能够通过自然交互与人类交流的“机器”自然也需要有。我之前把它称作IP(Intellectual Property)设计,RICH里叫做角色设计。- 性格内核: 角色行为、决策与情感反应的根本驱动力,包含核心性格特质、价值观、信仰动机和情感状态。
- 专业能力: 角色在特定领域内掌握的知识技能、实践经验及解决问题的专长,支撑其职业表现,实现功能价值。
- 外在形象: 外观特征、服饰风格、肢体语言及声音特点等,是角色个性与背景故事的视觉与听觉体现。
优先解决专业能力,因为它决定了为什么用户需要和这个智能体交流,什么时候需要和这个智能体交流。换言之,对智能体的专业能力具体到可实操层的定义,决定了它为什么而存在。对话设计和以往的设计相比,我觉得最大的区别在于什么时候“隐性”处理。因为开始和结束不一定要说你好和再见,追问也不一定在末尾单独生成几个扩展问题才叫追问,提示和确认可能全部隐藏在语言中,错误也不是GUI设计中那种错误,只是人际交往中最常见的情况。这是我询问AI和它的交互流程是什么,它给我的回答,供设计参考:第一步:接收输入
等待并接收你发送的文本内容,涵盖各类问题、指令、话题描述等信息。第二步:理解意图。
运用自然语言处理技术对所接收的文本进行分析,尽力准确把握你想要表达的核心意图、期望达成的目标,例如是寻求知识解答、进行文案创作、要求语言翻译,还是单纯的闲聊等不同情况。第三步:信息检索与整合(如有需要)
如果你的问题涉及到需要外部信息来辅助回答的情况,会在相关知识库、数据源中进行检索,筛选出合适且准确的信息,并按照一定逻辑进行整合。第四步:生成回复
基于对意图的理解以及检索整合的信息(若有),通过语言生成模型等技术,按照符合语言规范、逻辑清晰、重点突出等要求来构建相应的回复内容。第五步:输出回复
将生成好的回复内容发送给你,以便你能查看并继续开展后续的交流互动。这是需要和具体的场景、产品深度绑定才能回答的一个问题。RICH给出的答案是基于目前最常用的Chat模式给出的,不同的产品、设备终端变化都可能让这个答案的具体形式产生变化。比如XR设备的用户输入,可能不一定是有形的聊天一般的文字等内容输入,可能是声音的输入,也可能是行为的输入。- Do 为主: 以界面操作为主,偶尔唤起 AI 快捷指令。例如 Quick Bar、固定指令式、内嵌生成式等。
- Do + Chat 均衡: 自然语言与界面操作均衡配合。例如双区联动交互、交互式操作气泡等。
- Chat 为主: 以自然语言为主,几乎没有界面操作。例如侧边式 Copilot、独立 Web Bot 等。
RICH设计范式为我们提供了一个在AI时代下设计智能界面的新思路。它通过四个关键要素来指导设计:- 意图(Intent)帮助我们思考AI如何理解用户需求
但具体到每个场景如何理解和使用它,依然需要我们自己的探索、研究、验证。最后,借用一位设计师所说:"在AI时代,最好的界面设计不是让机器模仿人类,而是让人机交互变得自然而然。"
文字内容来源于 林间小报