AI 编程——产品篇

待字闺中 · 公众号 · 程序员 · 2024-11-01 13:00

正文

《正确与信念》by Claude 3.5 sonnet， Prompt 来自李继刚

这一篇想聊一聊产品设计层面的思考。

我会涉及到几种典型的产品设计形式：

1. 表单

2. Chat，对话的形式

3. Claude Artifacts

4. OpenAI Canvas

我试图找到适合 AI 产品的交互形式，我想暂时有一个阶段性的答案

以下的探讨围绕着有 AI 功能支持的、甚至为主要特点的产品，这是大背景。

我的实践

前面提到的四种产品形式，代表了 AI 产品发展的阶段，也是我自己探索 AI 应用的一个过程。这个过程中，我尝试做了几个产品，目的是更好的发挥 AI 的能力，解决用户的问题。

这背后的逻辑是：对 LLMs 的理解（以 ChatGPT，Claude 为主，偶尔用到 DeepSeek），对自己的理解。对 LLMs 的理解和对自己的理解，可以构成四象限。

最早 ChatGPT 刚刚发布的时候，真的觉得很强，那时候产生了一个疑问，为什么用这么低效的交互方式（Chat）呢？鉴于这个想法，我很快做了一个问答的交互，类似 Perplexity 。

基于表单的产品设计

输入框可以直接输入问题，然后提交表单，就可以得到想要的结果。也可以设定系统的 Prompt，但整体是一个一次性的表达，潜在的含义是一次性就可以帮助用户解决问题。

这是普通用户最希望的方式，在形式上，极大的降低了门槛。但后面遇到了一些问题。

问题是：总会发现，一次性的结果并不好。一种选择是修改输入框的内容，这样就是新的一次问答，离开了刚才的上下文，重新开始，并没有利用刚才的结果。所以更好的是第二种，继续追问，也是 Perplexity 的形式。

其实这里隐隐的，我想放弃问答表单，重回 Chat 怀抱了，但需求还不强。

直到，为了复现网络上的一些 Prompt，我不断的给表单为主的交互增加功能的时候，我发现 Chat 越来越急迫了。

Prompt 抽卡

很多 Prompt 的效果很好，例如前阵子的 SVG 卡片生成。但实际用起来的时候，也要“抽卡”，好结果有一定的随机性。但问题是，当前的结果并不是完全不好，我可能只是想拿掉部分的内容，调整部分的颜色。

这时候，表单为主的交互，无能为力了。

表单是一个非常好的，以用户为中心的产品。但在这个场景，表现不佳，核心在于LLMs 模型的特点——不确定性。至此，我才理解为什么 ChatGPT 火了的产品设计上的点——Chat，是以用户为中心和以模型为中心的最好的结合，也是最好的权衡。

所以，我停止了这个工具的开发，转向了我理想中的工具，我起名字叫做 Code Zero。——这时候 Artifacts 如火如荼，OpenAI Canvas 还没有诞生。

这时候，我脑子里的产品交互形式，类似 Artifacts，但超越了 Artifacts，甚至有点类似编程 IDE 了。它具备：

- 通过 Chat 的形式，不断的明确框架的需求

- 通过预览，可以随时检查结果

- 通过人工编辑的干预，精确的引导 LLMs 的生成方向

一些用过 V0 的同学可能注意到，和 v0 很像，但是多了一个人工的编辑。是的，我认为必须有这个完成闭环。这底层的也是模型的本质决定的。整体的关系类似这个图的描述：

Chat 和场景的关系

即使人工做了修改，也可以回到 Chat 的上下文，也是很重要的。目前 Code Zero 是这个样子的。

Code Zero

左侧是 Chat 区域，右侧是 Preview 和 Source Code 区域，源代码可以编辑，编辑之后会合并到 Chat 中。Preview 直接可以看结果，可以下载最终渲染的 PNG 。目前支持的渲染有：

- SVG

- Mermaid

- React

这个类型会有很多，因为 LLMs 本身就是序列到序列的映射，在其理解了自然语言之后，可以充分的将用户的意图映射到某一个序列中。这个序列最好是有边界的，比如SVG，Mermaid 这些类似代码的描述工具。

这些边界清晰，逻辑确定的序列，是 LLMs 喜欢的，能够达到更好的效果。剩下的，就是我们如何开发。

大概时间点上，这时候 OpenAI 的 Canvas 上线了。也算是不谋而合，是模型，是精心分类出来的用户的必然选择。

我的实践就到这里。除了产品形式的清晰，我逐渐加深了一件事情的理解，当前的模型，以及基于模型的产品的用户，都是“专家类型”——一个能够在该抽象的时候抽象，该具体的时候具体的用户。