劉哲清晰記得去年5月參加DeepSeek線上面試的情景。面試官連續(xù)3小時(shí)的高強(qiáng)度提問讓他感到壓力巨大。盡管他作為211、985高校的應(yīng)屆博士生,在校期間已有所成就,但面對那些深入且具有挑戰(zhàn)性的問題,仍覺得難度不小。
劉哲表示,與其他互聯(lián)網(wǎng)公司不同,DeepSeek會(huì)根據(jù)應(yīng)聘者的專業(yè)背景量身定制編程題目。網(wǎng)絡(luò)上也有人分享面試經(jīng)歷時(shí)提到遇到出乎意料的問題,例如“DPO為什么用KL散度,不用交叉熵?機(jī)器學(xué)習(xí)中什么時(shí)候必須用KL散度,什么時(shí)候必須用交叉熵,什么時(shí)候兩者可互換”。有網(wǎng)友感嘆這些問題非常難懂。
近期,國產(chǎn)AI大模型DeepSeek在全球范圍內(nèi)引發(fā)轟動(dòng),登上各大熱搜,推動(dòng)科技變革浪潮。一方面,國產(chǎn)AI芯片、云服務(wù)提供商以及軟硬件廠商正加速與DeepSeek適配,其技術(shù)滲透到汽車等多個(gè)領(lǐng)域,AI生態(tài)系統(tǒng)持續(xù)壯大;另一方面,這也促使谷歌、OpenAI等科技巨頭加快產(chǎn)品升級和開源的步伐。
人們特別好奇的是,在短短兩年內(nèi),核心團(tuán)隊(duì)不到100人的DeepSeek如何實(shí)現(xiàn)了其他大型互聯(lián)網(wǎng)公司和實(shí)驗(yàn)室未能達(dá)成的技術(shù)突破。在劉哲看來,DeepSeek的崛起似乎是必然的。他透露,應(yīng)聘者普遍來自清華、北大等頂尖學(xué)府,面試過程嚴(yán)謹(jǐn)且要求高,當(dāng)時(shí)招聘并未設(shè)定人數(shù)上限,明顯感受到公司旨在吸引頂尖智慧人才,只招收天才級別的精英。
劉哲描述了面試流程:最初有一個(gè)編程環(huán)節(jié),根據(jù)應(yīng)聘者的專業(yè)出題,測試結(jié)果決定是否進(jìn)入面試。面試持續(xù)3小時(shí),由兩位不超過30歲的年輕面試官分別進(jìn)行。其中一位面試官深入考察機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí),另一位則關(guān)注項(xiàng)目經(jīng)驗(yàn)。整個(gè)過程體驗(yàn)良好,團(tuán)隊(duì)充滿活力。