但AI感受不到這種痛苦——對(duì)人來(lái)說(shuō)難以忍受的口語(yǔ)化文字,對(duì)AI來(lái)說(shuō)沒(méi)有任何理解障礙,人說(shuō)得再亂再碎,它都能從中提取意圖。語(yǔ)音輸入“方便了自己,痛苦了別人”的問(wèn)題,在接收方變成AI的那一刻起就消失了。
于是,語(yǔ)音辦公在兩類(lèi)場(chǎng)景中快速鋪開(kāi)。第一類(lèi)場(chǎng)景是,用戶(hù)對(duì)著Claude、DeepSeek或ChatGPT說(shuō)話(huà)下達(dá)指令,AI直接理解意圖并執(zhí)行任務(wù),整個(gè)過(guò)程不需要產(chǎn)出一段通順的文字給人看。第二類(lèi)場(chǎng)景是,即便最終還是需要產(chǎn)出文字給人看,AI也在語(yǔ)音轉(zhuǎn)寫(xiě)之后增加了一層語(yǔ)義處理:自動(dòng)刪除語(yǔ)氣詞,修正語(yǔ)法,理順邏輯,調(diào)整句式,輸出一段可以直接使用的通順文字。
事實(shí)上,過(guò)去兩年,一批圍繞AI語(yǔ)音聽(tīng)寫(xiě)的創(chuàng)業(yè)公司在快速成長(zhǎng),其中估值最高的是位于美國(guó)舊金山的Wispr公司。這家公司2021年成立,最初做腦機(jī)接口腕帶(用于無(wú)聲語(yǔ)音輸入),2024年年中轉(zhuǎn)型做語(yǔ)音聽(tīng)寫(xiě)軟件。公開(kāi)信息顯示,截至2026年初,Wispr累計(jì)完成約8100萬(wàn)美元融資。根據(jù)Wispr披露的數(shù)據(jù),持續(xù)使用產(chǎn)品超過(guò)6個(gè)月的用戶(hù),日常輸入中72%的字符通過(guò)語(yǔ)音而非鍵盤(pán)完成;產(chǎn)品上線(xiàn)至今,用戶(hù)規(guī)模同比增長(zhǎng)超過(guò)100倍,使用滿(mǎn)12個(gè)月的用戶(hù)中有70%仍在活躍使用。
訊飛輸入法也在跟進(jìn)這個(gè)方向。2025年底,訊飛輸入法在鍵盤(pán)界面新增了一個(gè)AI鍵,用戶(hù)長(zhǎng)按該鍵即可用語(yǔ)音直接向AI下達(dá)指令,不需要切換到其他應(yīng)用??拼笥嶏w2025年年報(bào)披露,訊飛輸入法大模型服務(wù)用戶(hù)滲透率提升900%,輸入效率提升77%。
這或許可以說(shuō)明,語(yǔ)音辦公的需求正在從極客圈向更廣泛的職場(chǎng)人群滲透。語(yǔ)音辦公的速度優(yōu)勢(shì)很明確,但辦公不只是追求速度。寫(xiě)一封措辭謹(jǐn)慎的郵件、改一段邏輯復(fù)雜的代碼、打磨一份給客戶(hù)的方案,這些場(chǎng)景需要的是精確控制,而不是快速表達(dá)。能不能覆蓋這些場(chǎng)景,是語(yǔ)音辦公能走多遠(yuǎn)的關(guān)鍵問(wèn)題之一。