专栏名称: 前端早读课
我们关注前端,产品体验设计,更关注前端同行的成长。 每天清晨五点早读,四万+同行相伴成长。
目录
相关文章推荐
龙视新闻联播  ·  两会热搜|共赴春天的盛会 ·  2 天前  
龙视新闻联播  ·  两会热搜|共赴春天的盛会 ·  2 天前  
前端早读课  ·  【早阅】寻求拒绝,而不是寻求肯定的答复 ·  2 天前  
前端大全  ·  不会吧,2025年了,还没有用cursor ·  3 天前  
得物技术  ·  LSM-TREE从入门到入魔:从零开始实现一 ... ·  3 天前  
得物技术  ·  LSM-TREE从入门到入魔:从零开始实现一 ... ·  3 天前  
前端早读课  ·  【第3465期】转向纯 ... ·  3 天前  
51好读  ›  专栏  ›  前端早读课

【第3466期】用语音编码:「Vibe Coding」让 AI 帮你写代码

前端早读课  · 公众号  · 前端  · 2025-03-05 08:00

正文

前言

利用 AI 技术进行语音编码的新兴趋势,即 “vibe coding”,这种方式通过声音指令将高层次的思想转换为代码,提高了编码的效率和流畅性。今日前端早读课文章由 @Addy Osmani 分享,@飘飘翻译。

译文从这开始~~

语音识别技术已经发展到可以用语音进行编码,而且这种方式可能会越来越高效。“Vibe coding”(氛围编码)指的是,开发者可以专注于高层次的想法,而让工具负责将你的 AI 提示和语音转换为代码。

借助 Super Whisper 和你喜欢的 AI 编码编辑器,开发者可以用语音描述需求,而不是手动输入代码,从而让编码变得更快捷、更流畅,甚至更符合人体工学。得益于 Whisper,我的工作效率明显提升了。

上面展示的是使用 Super Whisper 进行 “Vibe Coding”,通过语音修改现有应用的示例。我在 Cline 中使用它,但它同样适用于 Cursor 或 Windsurf。

相比手动输入,自然地用语音描述需求 可以加快开发速度。借助 AI 辅助建议,我可以更专注于代码逻辑,而不必过多关注语法细节。除了 Super Whisper,还可以使用 VSCode Speech Extension 搭配 Copilot Chat 作为替代方案。

除了 Super Whisper,还可以使用 VSCode Speech Extension 搭配 Copilot Chat 作为替代方案。

除了 语音 输入外,实时共享屏幕 还能带来更多可能性,使协作和代码演示更加直观高效。

为什么要用语音编码?

语音编码的优势不仅仅是减少键盘使用疲劳,还包括:

✅ 更快的输入速度

  • 语音输入通常比键盘打字快 3 到 5 倍(人类语速 150+ 词 / 分钟,而打字速度约 40-80 词 / 分钟)。

  • 结合 AI 后,你可以直接描述需求,而不必手动编写代码结构,AI 会自动生成并实现逻辑。

✅ 减少手部疲劳(RSI)

  • 对于有腕管综合症(RSI)或希望减少打字疲劳的开发者来说,语音编码是一种无接触的替代方案。

✅ 更专注于代码逻辑

语音编码减少了在 输入、语法检查和问题解决 之间的上下文切换,让你可以专注于代码的核心逻辑。

例如,在上方的演示中,我用语音给 Bolt 发送指令,让它构建并迭代一个新应用,大大提升了开发效率。

当然,语音编码也有一定挑战,想要充分发挥其优势,正确的工具设置、最佳实践以及理解语音识别工具的特点 都是关键。

【第3334期】AI Code 在团队开发工作流的融合思考

成功配置:工具与工作流

Super Whisper 是一款本地运行的高速高精度语音转文字引擎,专为编程优化。结合 AI 代码编辑器(如 Cursor、Windsurf、Cline 或 Copilot),你可以使用 AI 生成、编辑和调试代码。此外,Super Whisper 还支持 Bolt、Lovable 和 v0,让你实现真正的免提编码。

  • 不像传统的语音听写工具需要不断输入,超级耳语智能检测沉默。这意味着你可以暂停,思考,然后继续说话,而不会失去上下文或中途被打断。

  • Super Whisper 的模型在处理复杂、专业的词汇方面表现出色,使其成为编程的理想选择。然而,有些词 —— 尤其是像 Vercel 这样的品牌名称 —— 可能无法直接被正确识别。

  • 在使用 Super Whisper 时,您可能会发现有一些词的转录不太准确。解决办法?前往设置 → 替换,将错误的词映射到正确的词。例如,如果 “Versel” 总是被误解,添加一条规则将其替换为 “Vercel”。

提升语音编码体验的技巧

1、使用自然语言提示 AI 生成代码

无需逐字 dictating 每个括号或逗号,只需描述你的需求,AI 就能自动生成代码。

✅ 示例:

🗣️ "创建一个函数,读取 CSV 文件并返回行数。"
🔹 AI 代码工具会自动生成相应的函数。

2、利用 Super Whisper 的智能静音检测

许多语音工具在遇到停顿时容易截断输入,而 Super Whisper 能智能检测停顿,让你可以随时暂停思考,而不会丢失语音输入。

如果默认模型的表现不理想,你还可以切换本地或云端的 Whisper 版本,优化语音识别效果。

3、通过自定义规则优化语音识别

如果某些单词经常被误识别,你可以在 Super Whisper 设置 → 词汇替换 中定义自定义替换规则,确保精准转录。

4、结合语音和 AI 进行调试与重构

🗣️ "重构这个函数,提升可读性。"
🔹 AI 代码编辑器会自动优化代码结构。

🗣️ "把所有 fooVar 改名为 userCount。"
🔹 代码中的所有 fooVar 变量会被自动重命名,无需手动修改。

🗣️ "解释这个错误的原因。"
🔹 AI 会分析代码,提供错误原因和可能的解决方案。

提升语音转录准确性的技巧

语音编码的最大挑战之一是确保你的语音能够准确转换为代码。以下是一些提高语音识别准确度的实用技巧:

1、使用高质量麦克风 🎤

清晰的音频输入能显著提升转录准确率,因此选择合适的麦克风很重要。

✅ 推荐使用:

  • 带降噪功能的耳机 或 桌面麦克风(无需昂贵设备,但至少要选择一款音质清晰的)。

  • 正确的麦克风摆放位置:距离嘴巴约 2.5 厘米(1 英寸),稍微偏向一侧,避免喷麦音(爆破音)。

  • 调整输入音量:确保音量不过低或爆音,以获得最佳识别效果。

  • 清晰的音频输入可以让 Whisper 等工具即使在嘈杂环境下也能精准转录。

2、尽量减少背景噪音 🔇

噪音会干扰语音识别,导致错误转录,因此建议:

  • 在安静的环境下进行语音编码。

  • 如果无法避免背景噪音,可以使用降噪或指向性麦克风。

  • 一些现代语音识别模型能利用多麦克风或机器学习算法过滤噪音,但尽量从源头降低干扰效果更好。

3、说话清晰,保持稳定语速 🗣️

语音编码时,清晰度比语速更重要。

✅ 注意事项:

  • 清晰发音,尤其是编程相关的关键词和指令词。

  • 不要含糊其辞或语速过快,但也不必刻意放慢,适中的语速 + 清晰的发音 是最理想的。

  • 有口音的用户 可能需要注意某些特定字母或术语的发音,并适当调整表达方式。

4、学习如何正确读出代码符号 🏷️

在编码过程中,语音输入需要处理各种符号(如括号、逗号、等号等)。不同工具的符号输入方式可能不同,因此建议:

✅ 常见符号发音示例:

  • ( → "open parenthesis"(左括号)

  • ) → "close parenthesis"(右括号)

  • { → "open curly brace"(左大括号)

  • } → "close curly brace"(右大括号)

  • = → "equals"(等号)

  • _ → "underscore"(下划线)

部分语音编码工具(如 Talon Voice)支持自定义符号读法,例如:

  • 你可以用 "LRangle" 代表 < ,或者使用字母的拼音读法。

如果默认转录结果不符合你的习惯,可以自定义语音命令,例如在 Super Whisper 里将 "new line" 映射为按回车键等。

5、复杂代码建议分段输入 ⏳

对于较复杂的代码结构,不建议一口气说完整行代码,而是拆分成小语句,以提高准确性。例如:

❌ 错误方式(一口气说完):
🗣️ "If user age is greater than 18 then print welcome message else print access denied"

✅ 推荐方式(逐步输入):
🗣️ "If condition colon"(等待:被正确插入)
🗣️ "Indent print variable X"(确认正确后继续下一步)

这样可以确保每一步的准确性,同时避免长句导致识别错误。

6、立即检查并修正错误 📝

即使采取了所有措施,语音识别仍可能会出错,因此养成随时检查和修正的习惯至关重要。

✅ 建议:

  • 随时查看转录结果,如果某个单词识别错误,及时修改,而不是等错误积累后再修正。

  • 使用 “词汇替换” 功能(如 Super Whisper 设置 → 词汇替换)来修正常见误识别词。

  • 在必要时使用键盘进行小幅修改,即使是经验丰富的语音编码者,偶尔也会手动调整部分代码。

以上是一个演示,展示如何为您经常使用的长提示创建一个强大的快捷方式。

请记住,良好的识别准确率取决于多个因素:语音模型的质量、您的麦克风和环境,以及您的语音输入风格。随着练习的增加,您会逐渐掌握更符合语音识别引擎偏好的表达方式,从而提高速度和准确率。像 Whisper 这样的现代 AI 模型也在不断升级,因此语音识别的可靠性只会越来越高。

这是另一个语音编码应用的演示,这次使用的是 Vercel 的 v0 版本。

语音指令辅助 AI 编程

语音编码的一个强大之处在于,它可以与 AI 编程助手结合使用。与其逐个拼写括号和分号,你可以用自然语言描述你的需求,让 AI 生成或修改代码。这就是 “Vibe Coding”(氛围编码)的核心思想 —— 让 AI 处理语法,而你专注于高层次的设计思路。以下是一些有效利用 AI 语音辅助的方法:

1、用自然语言描述需求

当编辑器中集成了 AI 时,你可以直接用语音描述功能或提出问题。例如,你可以说:“创建一个 JavaScript 函数,读取 CSV 文件并打印每位客户的姓名和电子邮件。”

AI 将根据你的语音指令生成相应的代码。

2、迭代调整代码

AI 生成代码后,你可以继续用语音完善。如果初始代码不够完美,可以追加指令,比如:“现在从当前目录加载 customers.csv 文件,并逐行打印客户的姓名和电子邮件。”

AI 会相应调整代码,例如增加循环或打印语句。这样,你可以通过语音与 AI 进行一个高效的 “指令 → 代码 → 反馈 → 进一步指令” 迭代循环,逐步优化代码。

3、让 AI 提供建议或解释

AI 编程助手不仅能写代码,还能回答编程问题。例如,你可以说:“这个错误信息是什么意思?” 或 “如何优化这个函数?”

AI 会提供答案或优化建议。例如,在 VS Code 的 Copilot Chat 界面中,你可以直接用语音提出编程问题,并在聊天框中收到解答。这对于调试和学习非常有帮助。例如,如果你遇到 bug,可以问:“为什么 processData 函数在输入为空时返回 null?”

AI 可能会分析代码,解释问题所在,并提供解决方案。

4、语音驱动代码重构

你可以用语音指令让 AI 重构或优化代码。例如:

  • “重构这个函数,使用列表推导式并添加错误处理。”

  • “把变量 x 改名为 userCount,并在整个文件中替换。”

AI 会自动完成这些修改,而无需你手动查找和更改,提高效率。

5、结合 AI 进行测试

你甚至可以用语音让 AI 生成测试代码。例如:“为 processData 函数编写单元测试,覆盖边界情况。”

AI 将生成一整套测试用例,让你的代码更健壮。这种方式让 AI 成为你的 “语音配对编程伙伴”,提升开发效率。

6、明确表达,避免歧义

成功的关键在于 清晰的语音指令。AI 会严格按照你的指令执行(或者接近你的要求),如果表达模糊,可能会得到不符合预期的代码。

如果 AI 生成的代码有误,通常 用语音重新修正指令比手动修改更快。例如,你可以直接说:“哦,我的意思是用姓氏的首字母,而不是整个姓氏。”

这样 AI 会快速调整逻辑,减少手动修改的工作量。

7、代码审查与最终确认

虽然 AI 语音编码很高效,但最终你仍需对代码负责。AI 生成代码可能看起来 “神奇”,但你仍然需要检查其正确性。例如,你可以让 AI 自己解释代码:“这个新函数是做什么的?”

这样可以确保 AI 生成的代码符合你的预期。

总结:让 AI 与语音协作,提升编程体验

结合语音和 AI 编码,你可以真正 “vibe with your code”(沉浸式编码):你专注于 问题和设计,AI 处理 语法和繁琐的细节。这种方式不仅能 加快开发速度,还让编程更像是和搭档一起头脑风暴,而不是独自编写每一行代码。

优化你的语音编码工作流

除了准确性,语音编码的真正效率来源于优化工作流程。以下是一些策略,帮助你减少阻碍,让语音编码更顺畅:

1、使用自定义语音指令和宏







请到「今天看啥」查看全文