Altman宣布,OpenAI今年早些時(shí)候發(fā)布的軟件工程智能體Codex正式上線。OpenAI的開(kāi)發(fā)者體驗(yàn)主管Romain Huet未編寫(xiě)任何代碼就演示了Codex,展示了如何用語(yǔ)音即時(shí)創(chuàng)建軟件。例如,他用語(yǔ)音命令開(kāi)發(fā)環(huán)境顯示所有與會(huì)者的姓名,就像電影中的片尾字幕一樣。
Altman還宣布將在API中推出GTP-5 Pro和一個(gè)小語(yǔ)音模型GPT-realtime-mini。上周發(fā)布的新一代音視頻生成模型Sora 2也已加入API。Altman展示了AI生成的視頻,包括狗在沙灘上嬉戲和皮劃艇運(yùn)動(dòng)員在湍急河流中劃槳的場(chǎng)景。他表示,Sora 2能將聲音與視覺(jué)效果完美結(jié)合,不僅僅是語(yǔ)音,還包括豐富的音景和基于用戶所見(jiàn)內(nèi)容同步的環(huán)境音頻效果。
此次DevDay吸引了超過(guò)1500人參加,OpenAI高管發(fā)表了主題演講。分析師預(yù)計(jì),此次活動(dòng)可能幫助投資者評(píng)估整個(gè)AI行業(yè)格局。
在今日凌晨的直播中,OpenAI 正式發(fā)布了 o3 和 o4-mini 模型。這些模型代表了 ChatGPT 能力的一次重大飛躍,適用于從普通用戶到高級(jí)研究人員的各種需求
2025-04-17 08:27:45OpenAI最智能模型能夠推理圖片