DeepSeek是一家在大模型領(lǐng)域備受矚目的公司,其用人邏輯與其他公司相似,注重年輕高潛人才。這些人才通常年齡在1998年左右出生,工作經(jīng)驗(yàn)不超過五年,具備聰明、理工科背景。
與國內(nèi)其他大模型創(chuàng)業(yè)公司相比,DeepSeek顯得幸運(yùn)許多,沒有融資壓力,也不需要向投資人證明自己。然而,作為一家商業(yè)公司,它最終會面臨類似其他模型公司的挑戰(zhàn)和壓力。
2024年中國大模型圈最火的公司之一便是DeepSeek。自去年年中發(fā)起大模型價(jià)格戰(zhàn)以來,該公司逐漸進(jìn)入公眾視野。隨后發(fā)布的開源模型DeepSeek-V3和推理模型DeepSeek-R1進(jìn)一步引爆了輿論場。DeepSeek-V3僅花費(fèi)557.6萬美元的訓(xùn)練成本,而DeepSeek-R1則被許多人視為OpenAI的o1等推理模型的強(qiáng)大競爭對手。
DeepSeek之所以能以極低的成本訓(xùn)練出高性能的大模型,主要得益于其算法創(chuàng)新。該公司使用了一系列工程技巧優(yōu)化了模型架構(gòu),如強(qiáng)化學(xué)習(xí)技術(shù)和多頭潛在注意力機(jī)制,顯著降低了算力成本。此外,DeepSeek還通過數(shù)據(jù)總結(jié)和分類提高了訓(xùn)練效率,實(shí)現(xiàn)了高性能與低成本的平衡。
DeepSeek的成功并非一蹴而就,而是多年積累的結(jié)果。創(chuàng)始人梁文鋒曾帶領(lǐng)團(tuán)隊(duì)探索全自動量化交易,并在2020年推出了超級計(jì)算機(jī)“螢火一號”。2023年7月,DeepSeek正式成立,至今未對外融資。這種專注使得公司在工程技術(shù)和算法上取得了突破。
DeepSeek的開源行為贏得了開發(fā)者們的廣泛好評,提升了其技術(shù)品牌。公司團(tuán)隊(duì)成員大多來自頂尖高校,年紀(jì)輕且充滿活力。工作氛圍自由,管理扁平化,鼓勵自下而上的創(chuàng)新。
盡管DeepSeek目前表現(xiàn)亮眼,但認(rèn)為中國AI已經(jīng)超越美國還為時(shí)過早。未來的發(fā)展路徑仍不明確,中國仍在追趕階段。DeepSeek將面臨更多壓力和挑戰(zhàn),商業(yè)化也被提上日程。對于國內(nèi)模型行業(yè)來說,有這樣具備真正技術(shù)實(shí)力的公司加入是一件好事。
2月5日,華為純血鴻蒙HarmonyOS NEXT的小藝助手App正式接入了深度求索(DeepSeek)人工智能技術(shù)。智能體廣場也同步上線了DeepSeek-R1 Beta版本
2025-02-05 23:05:12華為小藝已接入DeepSeek30歲左右、年收入20萬元的打工族今年可以怎樣理財(cái)?詢問DeepSeek后發(fā)現(xiàn),它可以基于用戶提供的信息進(jìn)行深入思考,并給出詳細(xì)的投資建議
2025-02-16 14:48:24DeepSeek對年入20萬的30歲年輕人理財(cái)建議