谷歌DeepMind團(tuán)隊于5月27日宣布推出SignGemma,這是其迄今為止最強(qiáng)大的手語翻譯模型,能夠?qū)⑹终Z轉(zhuǎn)化為口語文本。該開源模型計劃在今年晚些時候加入Gemma模型家族。SignGemma支持多語言功能,但目前主要針對美國手語(ASL)和英語進(jìn)行了深度優(yōu)化,開發(fā)者可以自由使用并改進(jìn)它。
DeepMind希望通過這項技術(shù)幫助手語使用者克服溝通障礙,在工作、學(xué)習(xí)和社交中更加順暢地參與。今年,DeepMind還推出了Gemma 3n模型,可以從音頻、圖像、視頻及文本輸入生成智能文本,助力開發(fā)者打造實時互動應(yīng)用。
谷歌與佐治亞理工學(xué)院及Wild Dolphin Project合作,基于巴哈馬大西洋斑點海豚的長期研究數(shù)據(jù)構(gòu)建了DolphinGemma模型,用于分析并生成海豚聲音。此外,MedGemma模型作為Gemma 3家族的新成員,專注于醫(yī)療AI領(lǐng)域,支持臨床推理和醫(yī)學(xué)影像分析,推動醫(yī)療與人工智能的融合創(chuàng)新。