上线特惠:Pro 方案立省 20%,限时自动生效
指南Apr 20267 min read

用语音输入提示词:如何在ChatGPT、Claude和所有AI工具中使用语音打字

大多数人用手工打字输入每一条AI提示词。改用说话可以在更短时间内写出更长、更丰富的提示词––而更好的提示词始终能获得更好的回答。

Glowing voice waveform on a dark screen, representing speaking a prompt into an AI chat interface

大多数人使用AI工具的方式存在一个几乎无人提及的瓶颈。不是模型质量,不是上下文窗口,也不是输出速度。是提示词(prompt)。具体来说,是写一条提示词所需的时间和精力。

普通知识工作者的打字速度是每分钟40到50个词(约60-80个汉字)。一条真正有用的提示词––包含足够上下文、约束条件和示例––往往需要100到200个词。以每分钟40词的速度,在得到任何回应之前需要两到五分钟的打字时间。足以让人失去思考的线索,足以让人放弃,转而发送一条简短模糊的提示词。

简短模糊的提示词只能得到平庸的回答。就这样,恶性循环继续:每个人都抱怨AI工具无法发挥潜力,却仍以键盘速度输入提示词,纳闷为什么输出结果不尽如人意。

语音输入打破了这个循环。本指南介绍如何使用系统级语音键盘向所有AI工具口述––不只是那些内置语音模式的工具––以及为什么从打字转为说话往往能获得明显更好的结果。

为什么更长的提示词真的很重要

提示词长度与输出质量之间的关系并非线性,但规律是一致的:更多上下文会产生更相关的回答。这不是因为模型需要大量文字,而是因为精心构建的提示词减少了模型需要自行解决的歧义。

当你输入"总结这份文件给我的经理"时,模型必须猜测你的经理关心什么、语气应该多正式、摘要应该多长,以及你的经理已有哪些背景知识。当你说"请把这份文件总结给我的经理,他负责采购且已读过执行摘要––重点关注供应商风险部分,标注本周需要决策的内容,控制在200字以内"时,模型几乎无需猜测。输出结果有实质性的差异。

转向语音提示的人们一致反映,他们写的提示词比打字版本更长、更具体––不是因为他们刻意多写,而是说话速度远比打字快,添加上下文的摩擦几乎消失了。研究发现,语音用户平均写出的提示词比打字用户长2到3倍。

额外的上下文体现在回答质量上,差距是真实的。

听写与内置语音模式:有什么区别?

大多数主流AI工具都添加了某种语音功能。Claude有语音模式,ChatGPT有语音,Gemini也有语音。这些都是有用的功能,但它们设计用于不同目的:免提对话,你说话,模型说话回应。它们并非为了将文字插入文本框而设计。

这个区别比听起来更重要。如果你想撰写提示词、发送前编辑、在问题旁粘贴文档摘录,或在语音对话模式不可用的场景中使用模型––自定义GPT、Open WebUI中的本地模型、Perplexity、Notion AI、公司内部部署的Claude––你需要听写,而不是语音模式。听写是系统级的,光标在哪里就在哪里工作。

系统级语音键盘的工作方式:按住快捷键时捕获麦克风输入,转录后将结果输入当前聚焦的字段。无需任何集成。AI工具不会知道你是说话而非打字,它只是接收到了文本。

两分钟完成设置

设置极为简单。安装一个在整个Mac上都能工作的语音键盘––不只是在某一应用内。指定一个说话时可以按住的快捷键。要口述提示词时,点击正在使用的AI工具的文本框,按住快捷键,说话,松开。转录内容会出现在光标所在位置。

使用Talkpad,快捷键可自定义,转录速度足够快,口述完整提示词后发送的速度几乎与打完一条短提示词一样快。免费计划每周2,500个词。

实际上应该对AI工具说什么

语音提示改变了值得书写内容的经济逻辑。以前打字太费力而放弃的内容,以每分钟130词的速度说出来时变得轻而易举。几个效果良好的模式:

研究与简报

打字:"关于磷酸铁锂电池我需要了解什么?"

语音:"我正在评估是否将一批配送车辆的铅酸电池换为LFP电池,该地区气温最低可达零下15摄氏度。我知道LFP循环寿命更长,但低温性能较差。我需要比较以下内容:低温下的实际容量衰减、按每年300个循环计算的五年总拥有成本,以及充电基础设施方面的实际问题。请给我诚实的权衡分析,而不是推销话术。"

语音版本说出来大约需要30秒,打字需要3到4分钟。得到的回答具有实际操作价值,而非泛泛的百科全书式内容。

写作简报

打字:"写一封产品公告邮件。"

语音:"请为我们的新企业版套餐起草一封产品公告邮件。受众是目前使用商业计划的现有客户。我们宣布的核心功能是团队级分析仪表板。语气应直接而有自信––我们不再是初创公司了。从客户收益而非功能开始。不要埋没行动号召。最多200字。最后附上主题行建议。"

调试与代码上下文

打字:"这个函数不工作了。"

语音:"我有一个TypeScript函数,本应对API调用进行防抖处理,但第一次调用时立即触发,之后才正常。我在React中使用useCallback进行记忆化,我认为问题可能出在闭包捕获timeout ref的方式上。观察到的行为:第一次调用,无延迟;后续调用,正确的300ms延迟。我想理解第一次调用为何绕过了防抖逻辑,而不只是要一个修复方案。"

AirPods的优势

语音提示有一个超越打字速度的被低估优势:在离开键盘时也能使用。如果你有值得捕捉的想法––会议中产生的研究问题,回到桌前想运行的提示词––AirPods和语音键盘让你在想法形成的那一刻就能捕捉到它。

工作流程:你在会议中,有个话题想进一步调查。会议结束,你走向桌子。在这两分钟的途中,戴着AirPods,Mac在某处开着,你在细节还新鲜时,直接向Claude或ChatGPT窗口口述想探索的完整上下文。等你坐下时,AI已经开始工作了。

用自己的语言提问

语音提示有一个很少被讨论的优势:如果英语不是你的母语,你大概在母语中思维更流畅。写一条详细的英文提示词既是写作也是翻译––这种翻译负担会消耗原始思想的一些丰富性。

语音翻译改变了这一点。在Talkpad中激活翻译模式(⌃⌥T切换),你用中文、西班牙语、日语、印地语或100多种支持语言中的任何一种说话,你的话会以英文出现在AI工具的文本框中。你用自己思考的语言构建提示词,模型收到它最擅长回应的语言。

一些效果不好的情况

语音提示有值得了解的局限性。

精确格式––Markdown表格、逐字符口述的代码片段、精确的命令行语法––很难口述。语音在散文和上下文方面很快;需要精确字符序列的内容,打字仍然更好。

背景噪音会显著降低转录质量。安静的房间或降噪耳机能带来明显改善。

在分心状态下口述会产生散漫的提示词。如果不确定想问什么,先思考30秒再说话。

免费开始

如果你主要通过打字使用AI工具,转向语音提示值得进行一周的有意识实验。你写的提示词将更长、更具体;收到的回答将更直接有用。设置只需约两分钟。

在Mac上试用Talkpad––实时翻译,免费。免费计划每周2,500个词,无需信用卡。今日登陆Mac,更多平台即将推出。

Share

今天就免费试用Talkpad。

提供免费计划。无需承诺。只是更快的输入。

macOS · 隐私优先 · 100+ 种语言 · 实时翻译 · 免费计划