AI數(shù)據(jù)告急,大廠盯上廉價(jià)年輕人
互聯(lián)網(wǎng)大廠正采取新策略獲取人工智能(AI)訓(xùn)練所需的新數(shù)據(jù):他們直接招募“AI錄音員”,支付每次約300元的報(bào)酬,定制專屬的語料庫。在北京,某大廠從年初就開始邀請普通人參與,每次需兩人一組,進(jìn)行3小時(shí)的錄音,其中包括自由聊天與有提示詞的對話,確保內(nèi)容充實(shí)且符合要求。錄音過程中,至少兩名員工會全程監(jiān)督,以保證錄音質(zhì)量和信息含量,避免低質(zhì)量內(nèi)容,并強(qiáng)調(diào)不能改動預(yù)設(shè)的提示詞。
二線城市的如成都、太原、貴州等地,已成為字節(jié)跳動、百度、阿里巴巴等企業(yè)構(gòu)建AI數(shù)據(jù)資源的外包中心。據(jù)知情人士透露,這些公司過去招聘的數(shù)據(jù)標(biāo)注員和方言朗讀者門檻較低,但現(xiàn)在更傾向于聘請來自頂尖高校的實(shí)習(xí)生來管理外包項(xiàng)目。
AI大模型的發(fā)展依賴于數(shù)據(jù)、算法和算力,其中,高質(zhì)量的數(shù)據(jù)是訓(xùn)練模型的基礎(chǔ)。然而,公開可用的互聯(lián)網(wǎng)數(shù)據(jù)正面臨枯竭,預(yù)計(jì)在未來幾年內(nèi),科技公司將耗盡可用于AI語言模型訓(xùn)練的數(shù)據(jù)。這迫使大模型團(tuán)隊(duì)尋找創(chuàng)新途徑,以獲取能有效“喂養(yǎng)”模型的新數(shù)據(jù)。
為了避免因使用未授權(quán)數(shù)據(jù)引發(fā)的法律爭議,一些大型科技公司開始自己動手制作數(shù)據(jù),力求數(shù)據(jù)的時(shí)效性和高質(zhì)量。他們繞過第三方平臺,直接參與設(shè)計(jì)AI所需的“劇本”,探索維持模型競爭力的新路徑。
在社交媒體平臺上,出現(xiàn)了標(biāo)價(jià)300元一次的AI錄音兼職廣告,吸引眾多求職者。盡管報(bào)酬誘人,但這份工作并不輕松。應(yīng)聘者需先提交樣音,通過嚴(yán)格篩選,隨后參與長時(shí)間、高要求的錄音環(huán)節(jié),包括自由聊天和依據(jù)特定提示詞的對話。整個(gè)過程受到嚴(yán)密監(jiān)控,任何影響錄音質(zhì)量的因素都需要糾正重錄。
青年就業(yè)現(xiàn)狀與趨勢深度觀察在當(dāng)今社會,青年群體的就業(yè)情況牽動著國家、社會與家庭的未來
2024-07-09 16:30:10年輕人買車更傾向科技大廠