前言
利用 AI 技术进行语音编码的新兴趋势,即 “vibe coding”,这种方式通过声音指令将高层次的思想转换为代码,提高了编码的效率和流畅性。今日前端早读课文章由 @Addy Osmani 分享,@飘飘翻译。
译文从这开始~~
语音识别技术已经发展到可以用语音进行编码,而且这种方式可能会越来越高效。“Vibe coding”(氛围编码)指的是,开发者可以专注于高层次的想法,而让工具负责将你的 AI 提示和语音转换为代码。
借助 Super Whisper 和你喜欢的 AI 编码编辑器,开发者可以用语音描述需求,而不是手动输入代码,从而让编码变得更快捷、更流畅,甚至更符合人体工学。得益于 Whisper,我的工作效率明显提升了。
上面展示的是使用 Super Whisper 进行 “Vibe Coding”,通过语音修改现有应用的示例。我在 Cline 中使用它,但它同样适用于 Cursor 或 Windsurf。
相比手动输入,自然地用语音描述需求 可以加快开发速度。借助 AI 辅助建议,我可以更专注于代码逻辑,而不必过多关注语法细节。除了 Super Whisper,还可以使用 VSCode Speech Extension 搭配 Copilot Chat 作为替代方案。
除了 Super Whisper,还可以使用 VSCode Speech Extension 搭配 Copilot Chat 作为替代方案。
除了
语音
输入外,实时共享屏幕 还能带来更多可能性,使协作和代码演示更加直观高效。
为什么要用语音编码?
语音编码的优势不仅仅是减少键盘使用疲劳,还包括:
✅ 更快的输入速度
✅ 减少手部疲劳(RSI)
✅ 更专注于代码逻辑
语音编码减少了在 输入、语法检查和问题解决 之间的上下文切换,让你可以专注于代码的核心逻辑。
例如,在上方的演示中,我用语音给 Bolt 发送指令,让它构建并迭代一个新应用,大大提升了开发效率。
当然,语音编码也有一定挑战,想要充分发挥其优势,正确的工具设置、最佳实践以及理解语音识别工具的特点 都是关键。
【第3334期】AI Code 在团队开发工作流的融合思考
成功配置:工具与工作流
Super Whisper 是一款本地运行的高速高精度语音转文字引擎,专为编程优化。结合 AI 代码编辑器(如 Cursor、Windsurf、Cline 或 Copilot),你可以使用 AI 生成、编辑和调试代码。此外,Super Whisper 还支持 Bolt、Lovable 和 v0,让你实现真正的免提编码。
-
不像传统的语音听写工具需要不断输入,超级耳语智能检测沉默。这意味着你可以暂停,思考,然后继续说话,而不会失去上下文或中途被打断。
-
Super Whisper 的模型在处理复杂、专业的词汇方面表现出色,使其成为编程的理想选择。然而,有些词 —— 尤其是像 Vercel 这样的品牌名称 —— 可能无法直接被正确识别。
-
在使用 Super Whisper 时,您可能会发现有一些词的转录不太准确。解决办法?前往设置 → 替换,将错误的词映射到正确的词。例如,如果 “Versel” 总是被误解,添加一条规则将其替换为 “Vercel”。
提升语音编码体验的技巧
1、使用自然语言提示 AI 生成代码
无需逐字 dictating 每个括号或逗号,只需描述你的需求,AI 就能自动生成代码。
✅ 示例:
🗣️ "创建一个函数,读取 CSV 文件并返回行数。"
🔹 AI 代码工具会自动生成相应的函数。
2、利用 Super Whisper 的智能静音检测
许多语音工具在遇到停顿时容易截断输入,而 Super Whisper 能智能检测停顿,让你可以随时暂停思考,而不会丢失语音输入。
如果默认模型的表现不理想,你还可以切换本地或云端的 Whisper 版本,优化语音识别效果。
3、通过自定义规则优化语音识别
如果某些单词经常被误识别,你可以在 Super Whisper 设置 → 词汇替换 中定义自定义替换规则,确保精准转录。
4、结合语音和 AI 进行调试与重构
🗣️ "重构这个函数,提升可读性。"
🔹 AI 代码编辑器会自动优化代码结构。
🗣️ "把所有 fooVar 改名为 userCount。"
🔹 代码中的所有 fooVar 变量会被自动重命名,无需手动修改。
🗣️ "解释这个错误的原因。"
🔹 AI 会分析代码,提供错误原因和可能的解决方案。
提升语音转录准确性的技巧
语音编码的最大挑战之一是确保你的语音能够准确转换为代码。以下是一些提高语音识别准确度的实用技巧:
1、使用高质量麦克风 🎤
清晰的音频输入能显著提升转录准确率,因此选择合适的麦克风很重要。
✅ 推荐使用:
-
带降噪功能的耳机 或 桌面麦克风(无需昂贵设备,但至少要选择一款音质清晰的)。
-
正确的麦克风摆放位置:距离嘴巴约 2.5 厘米(1 英寸),稍微偏向一侧,避免喷麦音(爆破音)。
-
调整输入音量:确保音量不过低或爆音,以获得最佳识别效果。
-
清晰的音频输入可以让 Whisper 等工具即使在嘈杂环境下也能精准转录。
2、尽量减少背景噪音 🔇
噪音会干扰语音识别,导致错误转录,因此建议:
3、说话清晰,保持稳定语速 🗣️
语音编码时,清晰度比语速更重要。
✅ 注意事项:
4、学习如何正确读出代码符号 🏷️
在编码过程中,语音输入需要处理各种符号(如括号、逗号、等号等)。不同工具的符号输入方式可能不同,因此建议:
✅ 常见符号发音示例:
-
(
→ "open parenthesis"(左括号)
-
)
→ "close parenthesis"(右括号)
-
{
→ "open curly brace"(左大括号)
-
}
→ "close curly brace"(右大括号)
-
=
→ "equals"(等号)
-
_
→ "underscore"(下划线)
部分语音编码工具(如 Talon Voice)支持自定义符号读法,例如:
如果默认转录结果不符合你的习惯,可以自定义语音命令,例如在 Super Whisper 里将 "new line" 映射为按回车键等。
5、复杂代码建议分段输入 ⏳
对于较复杂的代码结构,不建议一口气说完整行代码,而是拆分成小语句,以提高准确性。例如:
❌ 错误方式(一口气说完):
🗣️ "If user age is greater than 18 then print welcome message else print access denied"
✅ 推荐方式(逐步输入):
🗣️ "If condition colon"(等待:被正确插入)
🗣️ "Indent print variable X"(确认正确后继续下一步)
这样可以确保每一步的准确性,同时避免长句导致识别错误。
6、立即检查并修正错误 📝
即使采取了所有措施,语音识别仍可能会出错,因此养成随时检查和修正的习惯至关重要。
✅ 建议:
-
随时查看转录结果,如果某个单词识别错误,及时修改,而不是等错误积累后再修正。
-
使用 “词汇替换” 功能(如 Super Whisper 设置 → 词汇替换)来修正常见误识别词。
-
在必要时使用键盘进行小幅修改,即使是经验丰富的语音编码者,偶尔也会手动调整部分代码。
以上是一个演示,展示如何为您经常使用的长提示创建一个强大的快捷方式。
请记住,良好的识别准确率取决于多个因素:语音模型的质量、您的麦克风和环境,以及您的语音输入风格。随着练习的增加,您会逐渐掌握更符合语音识别引擎偏好的表达方式,从而提高速度和准确率。像 Whisper 这样的现代 AI 模型也在不断升级,因此语音识别的可靠性只会越来越高。
这是另一个语音编码应用的演示,这次使用的是 Vercel 的 v0 版本。
语音指令辅助 AI 编程
语音编码的一个强大之处在于,它可以与 AI 编程助手结合使用。与其逐个拼写括号和分号,你可以用自然语言描述你的需求,让 AI 生成或修改代码。这就是 “Vibe Coding”(氛围编码)的核心思想 —— 让 AI 处理语法,而你专注于高层次的设计思路。以下是一些有效利用 AI 语音辅助的方法:
1、用自然语言描述需求
当编辑器中集成了 AI 时,你可以直接用语音描述功能或提出问题。例如,你可以说:“创建一个 JavaScript 函数,读取 CSV 文件并打印每位客户的姓名和电子邮件。”
AI 将根据你的语音指令生成相应的代码。
2、迭代调整代码
AI 生成代码后,你可以继续用语音完善。如果初始代码不够完美,可以追加指令,比如:“现在从当前目录加载 customers.csv 文件,并逐行打印客户的姓名和电子邮件。”
AI 会相应调整代码,例如增加循环或打印语句。这样,你可以通过语音与 AI 进行一个高效的 “指令 → 代码 → 反馈 → 进一步指令” 迭代循环,逐步优化代码。
3、让 AI 提供建议或解释
AI 编程助手不仅能写代码,还能回答编程问题。例如,你可以说:“这个错误信息是什么意思?” 或 “如何优化这个函数?”
AI 会提供答案或优化建议。例如,在 VS Code 的 Copilot Chat 界面中,你可以直接用语音提出编程问题,并在聊天框中收到解答。这对于调试和学习非常有帮助。例如,如果你遇到 bug,可以问:“为什么 processData 函数在输入为空时返回 null?”
AI 可能会分析代码,解释问题所在,并提供解决方案。
4、语音驱动代码重构
你可以用语音指令让 AI 重构或优化代码。例如:
AI 会自动完成这些修改,而无需你手动查找和更改,提高效率。
5、结合 AI 进行测试
你甚至可以用语音让 AI 生成测试代码。例如:“为 processData 函数编写单元测试,覆盖边界情况。”
AI 将生成一整套测试用例,让你的代码更健壮。这种方式让 AI 成为你的 “语音配对编程伙伴”,提升开发效率。
6、明确表达,避免歧义
成功的关键在于 清晰的语音指令。AI 会严格按照你的指令执行(或者接近你的要求),如果表达模糊,可能会得到不符合预期的代码。
如果 AI 生成的代码有误,通常 用语音重新修正指令比手动修改更快。例如,你可以直接说:“哦,我的意思是用姓氏的首字母,而不是整个姓氏。”
这样 AI 会快速调整逻辑,减少手动修改的工作量。
7、代码审查与最终确认
虽然 AI 语音编码很高效,但最终你仍需对代码负责。AI 生成代码可能看起来 “神奇”,但你仍然需要检查其正确性。例如,你可以让 AI 自己解释代码:“这个新函数是做什么的?”
这样可以确保 AI 生成的代码符合你的预期。
总结:让 AI 与语音协作,提升编程体验
结合语音和 AI 编码,你可以真正 “vibe with your code”(沉浸式编码):你专注于 问题和设计,AI 处理 语法和繁琐的细节。这种方式不仅能 加快开发速度,还让编程更像是和搭档一起头脑风暴,而不是独自编写每一行代码。
优化你的语音编码工作流
除了准确性,语音编码的真正效率来源于优化工作流程。以下是一些策略,帮助你减少阻碍,让语音编码更顺畅:
1、使用自定义语音指令和宏