专栏名称: 待字闺中
深度分析大数据、深度学习、人工智能等技术,切中实际应用场景,为大家授业解惑。间或,也会介绍国内外相关领域有趣的面试题。
目录
相关文章推荐
程序员小灰  ·  这个春节,小灰一天都没休息 ·  昨天  
OSC开源社区  ·  DeepSeek-V3满血版在国产沐曦GPU ... ·  昨天  
OSC开源社区  ·  DeepSeek R1已在Gitee ... ·  4 天前  
程序员的那些事  ·  奥特曼:在开源 AI ... ·  5 天前  
51好读  ›  专栏  ›  待字闺中

AI 编程——产品篇

待字闺中  · 公众号  · 程序员  · 2024-11-01 13:00

正文

《正确与信念》by Claude 3.5 sonnet, Prompt 来自李继刚
这一篇想聊一聊产品设计层面的思考。
我会涉及到几种典型的产品设计形式:
1. 表单
2. Chat,对话的形式
3. Claude Artifacts
4. OpenAI Canvas
我试图找到适合 AI 产品的交互形式,我想暂时有一个阶段性的答案
以下的探讨围绕着有 AI 功能支持的、甚至为主要特点的产品,这是大背景。

我的实践
前面提到的四种产品形式,代表了 AI 产品发展的阶段,也是我自己探索 AI 应用的一个过程。这个过程中,我尝试做了几个产品,目的是更好的发挥 AI 的能力,解决用户的问题。
这背后的逻辑是:对 LLMs 的理解(以 ChatGPT,Claude 为主,偶尔用到 DeepSeek),对自己的理解。对 LLMs 的理解和对自己的理解,可以构成四象限。
最早 ChatGPT 刚刚发布的时候,真的觉得很强,那时候产生了一个疑问,为什么用这么低效的交互方式(Chat)呢? 鉴于这个想法,我很快做了一个问答的交互,类似 Perplexity 。
基于表单的产品设计
输入框可以直接输入问题,然后提交表单,就可以得到想要的结果。也可以设定系统的 Prompt,但整体是一个一次性的表达,潜在的含义是一次性就可以帮助用户解决问题。
这是普通用户最希望的方式,在形式上,极大的降低了门槛。但后面遇到了一些问题。
问题是:总会发现,一次 的结果并不好。一种选择是修改输入框的内容,这样就是新的一次问答,离开了刚才的上下文,重新开始,并没有利用刚才的结果。所以更好的是第二种,继续追问,也是 Perplexity 的形式。
其实这里隐隐的,我想放弃问答表单,重回 Chat 怀抱了,但需求还不强。
直到,为了复现网络上的一些 Prompt,我不断的给表单为主的交互增加功能的时候,我发现 Chat 越来越急迫了。
Prompt 抽卡
很多 Prompt 的效果很好,例如前阵子的 SVG 卡片生成。但实际用起来的时候,也要“抽卡”,好结果有一定的随机性。但问题是,当前的结果并不是完全不好,我可能只是想拿掉部分的内容,调整部分的颜色。
这时候,表单为主的交互,无能为力了。
表单是一个非常好的,以用户为中心的产品。但在这个场景,表现不佳,核心在于LLMs 模型的特点——不确定性。至此,我才理解为什么 ChatGPT 火了的产品设计上的点——Chat,是以用户为中心和以模型为中心的最好的结合,也是最好的权衡。
所以,我停止了这个工具的开发,转向了我理想中的工具,我起名字叫做 Code Zero。——这时候 Artifacts 如火如荼,OpenAI Canvas 还没有诞生。
这时候,我脑子里的产品交互形式,类似 Artifacts,但超越了 Artifacts,甚至有点类似编程 IDE 了。它具备:
- 通过 Chat 的形式,不断的明确框架的需求
- 通过预览,可以随时检查结果
- 通过人工编辑的干预,精确的引导 LLMs 的生成方向
一些用过 V0 的同学可能注意到,和 v0 很像,但是多了一个人工的编辑。是的,我认为必须有这个完成闭环。这底层的也是模型的本质决定的。整体的关系类似这个图的描述:
Chat 和场景的关系
即使人工做了修改,也可以回到 Chat 的上下文,也是很重要的。目前 Code Zero 是这个样子的。
Code Zero
左侧是 Chat 区域,右侧是 Preview 和 Source Code 区域,源代码可以编辑,编辑之后会合并到 Chat 中。Preview 直接可以看结果,可以下载最终渲染的 PNG 。目前支持的渲染有:
- SVG
- Mermaid
- React
这个类型会有很多,因为 LLMs 本身就是序列到序列的映射,在其理解了自然语言之后,可以充分的将用户的意图映射到某一个序列中。这个序列最好是有边界的,比如SVG,Mermaid 这些类似代码的描述工具。
这些边界清晰,逻辑确定的序列,是 LLMs 喜欢的,能够达到更好的效果。剩下的,就是我们如何开发。
大概时间点上,这时候 OpenAI 的 Canvas 上线了。也算是不谋而合,是模型,是精心分类出来的用户的必然选择。

我的实践就到这里。除了产品形式的清晰,我逐渐加深了一件事情的理解,当前的模型,以及基于模型的产品的用户,都是“专家类型”——一个能够在该抽象的时候抽象,该具体的时候具体的用户。






请到「今天看啥」查看全文