专栏名称: 待字闺中
深度分析大数据、深度学习、人工智能等技术,切中实际应用场景,为大家授业解惑。间或,也会介绍国内外相关领域有趣的面试题。
目录
相关文章推荐
OSC开源社区  ·  最强15岁初中生:用开源项目赚到了数百万、超 ... ·  12 小时前  
程序员的那些事  ·  顶级项目的代码仓库404,7万多star一夜 ... ·  2 天前  
程序猿  ·  JetBrains 官宣两款重量级 IDE ... ·  4 天前  
51好读  ›  专栏  ›  待字闺中

AI 编程——产品篇

待字闺中  · 公众号  · 程序员  · 2024-11-01 13:00

正文

《正确与信念》by Claude 3.5 sonnet, Prompt 来自李继刚
这一篇想聊一聊产品设计层面的思考。
我会涉及到几种典型的产品设计形式:
1. 表单
2. Chat,对话的形式
3. Claude Artifacts
4. OpenAI Canvas
我试图找到适合 AI 产品的交互形式,我想暂时有一个阶段性的答案
以下的探讨围绕着有 AI 功能支持的、甚至为主要特点的产品,这是大背景。

我的实践
前面提到的四种产品形式,代表了 AI 产品发展的阶段,也是我自己探索 AI 应用的一个过程。这个过程中,我尝试做了几个产品,目的是更好的发挥 AI 的能力,解决用户的问题。
这背后的逻辑是:对 LLMs 的理解(以 ChatGPT,Claude 为主,偶尔用到 DeepSeek),对自己的理解。对 LLMs 的理解和对自己的理解,可以构成四象限。
最早 ChatGPT 刚刚发布的时候,真的觉得很强,那时候产生了一个疑问,为什么用这么低效的交互方式(Chat)呢?鉴于这个想法,我很快做了一个问答的交互,类似 Perplexity 。
基于表单的产品设计
输入框可以直接输入问题,然后提交表单,就可以得到想要的结果。也可以设定系统的 Prompt,但整体是一个一次性的表达,潜在的含义是一次性就可以帮助用户解决问题。
这是普通用户最希望的方式,在形式上,极大的降低了门槛。但后面遇到了一些问题。
问题是:总会发现,一次的结果并不好。一种选择是修改输入框的内容,这样就是新的一次问答,离开了刚才的上下文,重新开始,并没有利用刚才的结果。所以更好的是第二种,继续追问,也是 Perplexity 的形式。
其实这里隐隐的,我想放弃问答表单,重回 Chat 怀抱了,但需求还不强。
直到,为了复现网络上的一些 Prompt,我不断的给表单为主的交互增加功能的时候,我发现 Chat 越来越急迫了。
Prompt 抽卡
很多 Prompt 的效果很好,例如前阵子的 SVG 卡片生成。但实际用起来的时候,也要“抽卡”,好结果有一定的随机性。但问题是,当前的结果并不是完全不好,我可能只是想拿掉部分的内容,调整部分的颜色。
这时候,表单为主的交互,无能为力了。
表单是一个非常好的,以用户为中心的产品。但在这个场景,表现不佳,核心在于LLMs 模型的特点——不确定性。至此,我才理解为什么 ChatGPT 火了的产品设计上的点——Chat,是以用户为中心和以模型为中心的最好的结合,也是最好的权衡。
所以,我停止了这个工具的开发,转向了我理想中的工具,我起名字叫做 Code Zero。——这时候 Artifacts 如火如荼,OpenAI Canvas 还没有诞生。
这时候,我脑子里的产品交互形式,类似 Artifacts,但超越了 Artifacts,甚至有点类似编程 IDE 了。它具备:
- 通过 Chat 的形式,不断的明确框架的需求
- 通过预览,可以随时检查结果
- 通过人工编辑的干预,精确的引导 LLMs 的生成方向
一些用过 V0 的同学可能注意到,和 v0 很像,但是多了一个人工的编辑。是的,我认为必须有这个完成闭环。这底层的也是模型的本质决定的。整体的关系类似这个图的描述:
Chat 和场景的关系
即使人工做了修改,也可以回到 Chat 的上下文,也是很重要的。目前 Code Zero 是这个样子的。
Code Zero
左侧是 Chat 区域,右侧是 Preview 和 Source Code 区域,源代码可以编辑,编辑之后会合并到 Chat 中。Preview 直接可以看结果,可以下载最终渲染的 PNG 。目前支持的渲染有:
- SVG
- Mermaid
- React
这个类型会有很多,因为 LLMs 本身就是序列到序列的映射,在其理解了自然语言之后,可以充分的将用户的意图映射到某一个序列中。这个序列最好是有边界的,比如SVG,Mermaid 这些类似代码的描述工具。
这些边界清晰,逻辑确定的序列,是 LLMs 喜欢的,能够达到更好的效果。剩下的,就是我们如何开发。
大概时间点上,这时候 OpenAI 的 Canvas 上线了。也算是不谋而合,是模型,是精心分类出来的用户的必然选择。

我的实践就到这里。除了产品形式的清晰,我逐渐加深了一件事情的理解,当前的模型,以及基于模型的产品的用户,都是“专家类型”——一个能够在该抽象的时候抽象,该具体的时候具体的用户。
普通用户可能很难,持续的提出有效的需求。比如,如果懂 svg 的语法,和不懂,提出的指令是完全不同的,效果也就有天壤之别。
我想,这也是为什么当前 AI 还在小圈子里火热,但普通用户无感的原因之一。AI 能力提升了很多,门槛并没有稳定的下降多少。普通用户使用需要准备很长的 Prompt,需要抽卡,体验自然不好。即使有了 Prompt,距离一个用户的产品,还有很远。
这个结论,也合了为什么 Cursor 当前大火——一种非常灵活的Chat 和 Context 的整合,你中有我,我中有你。当然,其最大的原因是 claude 3.5 sonnet 的能力。
所以,当前做 AI 的产品,面向某一类“专家”是更好的选择。因为面向普通用户,门槛仍然是高的,而且,即使有机会,也是 ChatGPT 、 Claude 、豆包们更优先的。
在我之前聊的 AI 编程产品之外,Agent 也是目前硅谷和国内很热的一个话题——天下皆知美之为美,这个话题单独聊。

后记
经过几个月的实践,想聊得很多。克制一下,多说几句 cursor 收一个尾。
cursor 的成功是非共识的,一个模型不是自己的、 IDE 不是自己的产品,竟然杀出重围。这里很多道理值得学习,cursor 找到了一个正确点的,并且坚信这个点一定能行。
模型和 IDE 不是自己的,并不重要,我只要结果的正确。这是很考验人的,但凡 Ego 比较大,但凡历史包袱重了一点,都无法选择,无法相信。
我想起达里奥一句话:我的目标是让自己正确——我并不关心正确的答案是不是来源于我。
最近朋友给我分享了一个道理,我们大部分人的成功和近距离看到的成功有关,其决定了我们相信什么。cursor 团队在那样的一个环境里,这个点上更容易相信一个大的,因为他们和前沿更近。
对我们国内的创业者来说,这个距离就远了,论到是否相信的时候很难,即使选择也只会相信一个小的——这背后也有文化差异的影响,毕竟我们的神话体系都是实用驱动的。
这没有问题,你打你的,我打我的。一花独放不是春,百花齐放春满园。