更深遠(yuǎn)的影響在于:當(dāng)系統(tǒng)級Agent成為每部手機(jī)的標(biāo)配,AI調(diào)度應(yīng)用的方式將逐步取代用戶主動打開App的習(xí)慣,應(yīng)用分發(fā)邏輯將被重寫。誰掌握了AI調(diào)度的入口,誰就掌握了下一代流量的分配權(quán)。
AI手機(jī)的正確姿勢是什么?如果說2025年底豆包手機(jī)助手的亮相,是一場模型公司與硬件廠商聯(lián)合的突襲。到了2026年開年,這場戰(zhàn)役的格局已經(jīng)今非昔比。手機(jī)廠商、操作系統(tǒng)、AI模型公司正在同一條賽道上加速,目標(biāo)高度一致:讓AI接管手機(jī)操作,成為用戶的全能代理。
要理解它們的本質(zhì)差異,需要先厘清一個更底層的技術(shù)問題:AI到底應(yīng)該怎樣“操作”手機(jī)?
OpenClaw的核心設(shè)計(jì)理念是本地運(yùn)行,基于MCP協(xié)議的三層結(jié)構(gòu)——核心層調(diào)用大模型,適配層連接平臺,技能層執(zhí)行任務(wù)——它不依賴視覺識別,而是通過系統(tǒng)API直接執(zhí)行指令。
豆包手機(jī)助手的路徑則截然相反:用戶下指令,手機(jī)截屏發(fā)給云端大模型,模型看懂屏幕后返回操作指令,手機(jī)執(zhí)行,再截屏,如此循環(huán)。這是一種徹底的“視覺仿人”路線,AI像人一樣盯著屏幕干活。
這套讀屏路線的早期成效有目共睹。2025年12月1日,豆包手機(jī)助手技術(shù)預(yù)覽版發(fā)布,搭載該助手的努比亞M153工程樣機(jī)首批3萬臺一夜售罄,在科技圈引發(fā)現(xiàn)象級關(guān)注??缙脚_比價點(diǎn)外賣、自動整理旅行攻略、批量處理消息,幾乎覆蓋手機(jī)日常使用的全場景,只在付款等關(guān)鍵環(huán)節(jié)需要人工介入。
但這一技術(shù)路線,與現(xiàn)有移動應(yīng)用生態(tài)存在天然沖突。實(shí)際落地中,微信曾觸發(fā)“登錄環(huán)境異?!卑踩崾?,部分銀行App也彈窗要求關(guān)閉AI助手相關(guān)功能,豆包因此宣布暫停金融場景的AI自動操作。這背后既有用戶隱私與安全的合規(guī)考量,更核心的是商業(yè)利益博弈:AI時代流量入口、用戶數(shù)據(jù)與操作鏈路的價值愈發(fā)關(guān)鍵,讀屏路線試圖繞開現(xiàn)有App壁壘,勢必面臨極大的生態(tài)阻力。