國產(chǎn)大模型DeepSeek近日在蘋果中國和美國應(yīng)用商店免費APP下載排行榜上登頂,超越了ChatGPT。DeepSeek由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā),該公司成立于2023年7月,背后有幻方量化的支持。
今年1月20日,深度求索公司發(fā)布了DeepSeek-R1,這款產(chǎn)品因性價比高而受到好評。根據(jù)DeepSeek公眾號信息,DeepSeek-R1 API服務(wù)定價為每百萬輸入tokens 1元(緩存命中)或4元(緩存未命中),每百萬輸出tokens 16元。
國外大模型排名榜Chatbot Arena顯示,DeepSeek-R1的基準(zhǔn)測試排名已升至全類別大模型第三,與OpenAI的ChatGPT-4最新版并列。值得注意的是,DeepSeek-R1的預(yù)訓(xùn)練費用僅為557.6萬美元,不到OpenAI GPT-4模型訓(xùn)練成本的十分之一。
招聘網(wǎng)站信息顯示,深度求索公司的北京子公司正在招聘,共放出52個崗位,包括深度學(xué)習(xí)研究員、核心系統(tǒng)研發(fā)工程師以及資深UI設(shè)計師等,均為14薪。其中,核心系統(tǒng)研發(fā)工程師(校招)薪資最高,范圍為6萬元至9萬元;大部分崗位起薪在2萬元及以上。此外,該公司還在招聘實習(xí)生,AGI大模型實習(xí)生工資為500元/天至1000元/天,數(shù)據(jù)百曉生實習(xí)生工資為500元/天至510元/天。