专栏名称: 前端早读课

我们关注前端，产品体验设计，更关注前端同行的成长。每天清晨五点早读，四万+同行相伴成长。

【第3466期】用语音编码：「Vibe Coding」让 AI 帮你写代码

前端早读课 · 公众号 · 前端 · 2025-03-05 08:00

正文

前言

利用 AI 技术进行语音编码的新兴趋势，即 “vibe coding”，这种方式通过声音指令将高层次的思想转换为代码，提高了编码的效率和流畅性。今日前端早读课文章由 @Addy Osmani 分享，@飘飘翻译。

译文从这开始～～

语音识别技术已经发展到可以用语音进行编码，而且这种方式可能会越来越高效。“Vibe coding”（氛围编码）指的是，开发者可以专注于高层次的想法，而让工具负责将你的 AI 提示和语音转换为代码。

借助 Super Whisper 和你喜欢的 AI 编码编辑器，开发者可以用语音描述需求，而不是手动输入代码，从而让编码变得更快捷、更流畅，甚至更符合人体工学。得益于 Whisper，我的工作效率明显提升了。

上面展示的是使用 Super Whisper 进行 “Vibe Coding”，通过语音修改现有应用的示例。我在 Cline 中使用它，但它同样适用于 Cursor 或 Windsurf。

相比手动输入，自然地用语音描述需求可以加快开发速度。借助 AI 辅助建议，我可以更专注于代码逻辑，而不必过多关注语法细节。除了 Super Whisper，还可以使用 VSCode Speech Extension 搭配 Copilot Chat 作为替代方案。

除了 Super Whisper，还可以使用 VSCode Speech Extension 搭配 Copilot Chat 作为替代方案。

除了语音输入外，实时共享屏幕还能带来更多可能性，使协作和代码演示更加直观高效。

为什么要用语音编码？

语音编码的优势不仅仅是减少键盘使用疲劳，还包括：

✅ 更快的输入速度

语音输入通常比键盘打字快 3 到 5 倍（人类语速 150+ 词 / 分钟，而打字速度约 40-80 词 / 分钟）。
结合 AI 后，你可以直接描述需求，而不必手动编写代码结构，AI 会自动生成并实现逻辑。

✅ 减少手部疲劳（RSI）

对于有腕管综合症（RSI）或希望减少打字疲劳的开发者来说，语音编码是一种无接触的替代方案。

✅ 更专注于代码逻辑

语音编码减少了在输入、语法检查和问题解决之间的上下文切换，让你可以专注于代码的核心逻辑。

例如，在上方的演示中，我用语音给 Bolt 发送指令，让它构建并迭代一个新应用，大大提升了开发效率。

当然，语音编码也有一定挑战，想要充分发挥其优势，正确的工具设置、最佳实践以及理解语音识别工具的特点都是关键。

【第3334期】AI Code 在团队开发工作流的融合思考

成功配置：工具与工作流

Super Whisper 是一款本地运行的高速高精度语音转文字引擎，专为编程优化。结合 AI 代码编辑器（如 Cursor、Windsurf、Cline 或 Copilot），你可以使用 AI 生成、编辑和调试代码。此外，Super Whisper 还支持 Bolt、Lovable 和 v0，让你实现真正的免提编码。

不像传统的语音听写工具需要不断输入，超级耳语智能检测沉默。这意味着你可以暂停，思考，然后继续说话，而不会失去上下文或中途被打断。
Super Whisper 的模型在处理复杂、专业的词汇方面表现出色，使其成为编程的理想选择。然而，有些词 —— 尤其是像 Vercel 这样的品牌名称 —— 可能无法直接被正确识别。
在使用 Super Whisper 时，您可能会发现有一些词的转录不太准确。解决办法？前往设置 → 替换，将错误的词映射到正确的词。例如，如果 “Versel” 总是被误解，添加一条规则将其替换为 “Vercel”。

提升语音编码体验的技巧

1、使用自然语言提示 AI 生成代码

无需逐字 dictating 每个括号或逗号，只需描述你的需求，AI 就能自动生成代码。

✅ 示例：

🗣️ "创建一个函数，读取 CSV 文件并返回行数。"
🔹 AI 代码工具会自动生成相应的函数。

2、利用 Super Whisper 的智能静音检测

许多语音工具在遇到停顿时容易截断输入，而 Super Whisper 能智能检测停顿，让你可以随时暂停思考，而不会丢失语音输入。

如果默认模型的表现不理想，你还可以切换本地或云端的 Whisper 版本，优化语音识别效果。

3、通过自定义规则优化语音识别

如果某些单词经常被误识别，你可以在 Super Whisper 设置 → 词汇替换中定义自定义替换规则，确保精准转录。

4、结合语音和 AI 进行调试与重构

🗣️ "重构这个函数，提升可读性。"
🔹 AI 代码编辑器会自动优化代码结构。

🗣️ "把所有 fooVar 改名为 userCount。"
🔹 代码中的所有 fooVar 变量会被自动重命名，无需手动修改。

🗣️ "解释这个错误的原因。"
🔹 AI 会分析代码，提供错误原因和可能的解决方案。

提升语音转录准确性的技巧

语音编码的最大挑战之一是确保你的语音能够准确转换为代码。以下是一些提高语音识别准确度的实用技巧：

1、使用高质量麦克风 🎤

清晰的音频输入能显著提升转录准确率，因此选择合适的麦克风很重要。

✅ 推荐使用：

带降噪功能的耳机或桌面麦克风（无需昂贵设备，但至少要选择一款音质清晰的）。
正确的麦克风摆放位置：距离嘴巴约 2.5 厘米（1 英寸），稍微偏向一侧，避免喷麦音（爆破音）。
调整输入音量：确保音量不过低或爆音，以获得最佳识别效果。
清晰的音频输入可以让 Whisper 等工具即使在嘈杂环境下也能精准转录。

2、尽量减少背景噪音 🔇

噪音会干扰语音识别，导致错误转录，因此建议：

在安静的环境下进行语音编码。
如果无法避免背景噪音，可以使用降噪或指向性麦克风。
一些现代语音识别模型能利用多麦克风或机器学习算法过滤噪音，但尽量从源头降低干扰效果更好。

3、说话清晰，保持稳定语速 🗣️

语音编码时，清晰度比语速更重要。

✅ 注意事项：

清晰发音，尤其是编程相关的关键词和指令词。
不要含糊其辞或语速过快，但也不必刻意放慢，适中的语速 + 清晰的发音是最理想的。
有口音的用户可能需要注意某些特定字母或术语的发音，并适当调整表达方式。

4、学习如何正确读出代码符号 🏷️

在编码过程中，语音输入需要处理各种符号（如括号、逗号、等号等）。不同工具的符号输入方式可能不同，因此建议：

✅ 常见符号发音示例：

( → "open parenthesis"（左括号）
) → "close parenthesis"（右括号）
{ → "open curly brace"（左大括号）
} → "close curly brace"（右大括号）
= → "equals"（等号）
_ → "underscore"（下划线）

部分语音编码工具（如 Talon Voice）支持自定义符号读法，例如：

你可以用 "LRangle" 代表 < ，或者使用字母的拼音读法。

如果默认转录结果不符合你的习惯，可以自定义语音命令，例如在 Super Whisper 里将 "new line" 映射为按回车键等。

5、复杂代码建议分段输入 ⏳

对于较复杂的代码结构，不建议一口气说完整行代码，而是拆分成小语句，以提高准确性。例如：

❌ 错误方式（一口气说完）：
🗣️ "If user age is greater than 18 then print welcome message else print access denied"

✅ 推荐方式（逐步输入）：
🗣️ "If condition colon"（等待：被正确插入）
🗣️ "Indent print variable X"（确认正确后继续下一步）

这样可以确保每一步的准确性，同时避免长句导致识别错误。

6、立即检查并修正错误 📝

即使采取了所有措施，语音识别仍可能会出错，因此养成随时检查和修正的习惯至关重要。

✅ 建议：

随时查看转录结果，如果某个单词识别错误，及时修改，而不是等错误积累后再修正。
使用 “词汇替换” 功能（如 Super Whisper 设置 → 词汇替换）来修正常见误识别词。
在必要时使用键盘进行小幅修改，即使是经验丰富的语音编码者，偶尔也会手动调整部分代码。

以上是一个演示，展示如何为您经常使用的长提示创建一个强大的快捷方式。

请记住，良好的识别准确率取决于多个因素：语音模型的质量、您的麦克风和环境，以及您的语音输入风格。随着练习的增加，您会逐渐掌握更符合语音识别引擎偏好的表达方式，从而提高速度和准确率。像 Whisper 这样的现代 AI 模型也在不断升级，因此语音识别的可靠性只会越来越高。

这是另一个语音编码应用的演示，这次使用的是 Vercel 的 v0 版本。

语音指令辅助 AI 编程

语音编码的一个强大之处在于，它可以与 AI 编程助手结合使用。与其逐个拼写括号和分号，你可以用自然语言描述你的需求，让 AI 生成或修改代码。这就是 “Vibe Coding”（氛围编码）的核心思想 —— 让 AI 处理语法，而你专注于高层次的设计思路。以下是一些有效利用 AI 语音辅助的方法：

1、用自然语言描述需求

当编辑器中集成了 AI 时，你可以直接用语音描述功能或提出问题。例如，你可以说：“创建一个 JavaScript 函数，读取 CSV 文件并打印每位客户的姓名和电子邮件。”

AI 将根据你的语音指令生成相应的代码。

2、迭代调整代码

AI 生成代码后，你可以继续用语音完善。如果初始代码不够完美，可以追加指令，比如：“现在从当前目录加载 customers.csv 文件，并逐行打印客户的姓名和电子邮件。”

AI 会相应调整代码，例如增加循环或打印语句。这样，你可以通过语音与 AI 进行一个高效的 “指令 → 代码 → 反馈 → 进一步指令” 迭代循环，逐步优化代码。

3、让 AI 提供建议或解释

AI 编程助手不仅能写代码，还能回答编程问题。例如，你可以说：“这个错误信息是什么意思？” 或 “如何优化这个函数？”

AI 会提供答案或优化建议。例如，在 VS Code 的 Copilot Chat 界面中，你可以直接用语音提出编程问题，并在聊天框中收到解答。这对于调试和学习非常有帮助。例如，如果你遇到 bug，可以问：“为什么 processData 函数在输入为空时返回 null？”

AI 可能会分析代码，解释问题所在，并提供解决方案。

4、语音驱动代码重构

你可以用语音指令让 AI 重构或优化代码。例如：

“重构这个函数，使用列表推导式并添加错误处理。”
“把变量 x 改名为 userCount，并在整个文件中替换。”

AI 会自动完成这些修改，而无需你手动查找和更改，提高效率。

5、结合 AI 进行测试

你甚至可以用语音让 AI 生成测试代码。例如：“为 processData 函数编写单元测试，覆盖边界情况。”

AI 将生成一整套测试用例，让你的代码更健壮。这种方式让 AI 成为你的 “语音配对编程伙伴”，提升开发效率。

6、明确表达，避免歧义

成功的关键在于清晰的语音指令。AI 会严格按照你的指令执行（或者接近你的要求），如果表达模糊，可能会得到不符合预期的代码。

如果 AI 生成的代码有误，通常用语音重新修正指令比手动修改更快。例如，你可以直接说：“哦，我的意思是用姓氏的首字母，而不是整个姓氏。”

这样 AI 会快速调整逻辑，减少手动修改的工作量。

7、代码审查与最终确认

虽然 AI 语音编码很高效，但最终你仍需对代码负责。AI 生成代码可能看起来 “神奇”，但你仍然需要检查其正确性。例如，你可以让 AI 自己解释代码：“这个新函数是做什么的？”

这样可以确保 AI 生成的代码符合你的预期。

总结：让 AI 与语音协作，提升编程体验

结合语音和 AI 编码，你可以真正 “vibe with your code”（沉浸式编码）：你专注于问题和设计，AI 处理语法和繁琐的细节。这种方式不仅能加快开发速度，还让编程更像是和搭档一起头脑风暴，而不是独自编写每一行代码。

优化你的语音编码工作流

除了准确性，语音编码的真正效率来源于优化工作流程。以下是一些策略，帮助你减少阻碍，让语音编码更顺畅：

1、使用自定义语音指令和宏