
數(shù)據(jù)標注是一項枯燥的工作,不少數(shù)據(jù)標注員喜歡戴著耳機聽音樂。向凱 攝
在上海徐家匯一家廣告公司做文案的索琳,從未想過自己也能參與打磨人工智能的應(yīng)用。她最近接到任務(wù),教一位只存在于手機應(yīng)用程序里的“老爺爺”與用戶對話。比如,當用戶問“世界上誰最美”,他就會回答“當然是你最美”。一問一答均由索琳事先寫好,再由一家擅長語音識別的人工智能(AI)公司植入。索琳編寫了近3000條問答,一心想把“老爺爺”培養(yǎng)得更風趣、睿智。不過,實際上她只是提供了最基礎(chǔ)的數(shù)據(jù)。
一千多公里之外的貴州惠水縣百鳥河數(shù)字小鎮(zhèn),一家提供數(shù)據(jù)服務(wù)的公司,22歲的吳潘威正對著電腦用鼠標“貼標簽”:將一張普通道路交通圖中的機動車、行人、非機動車逐一框中……和索琳教機器對話一樣,吳潘威貼標簽的目的是教人工智能看圖識物,他們被叫作“數(shù)據(jù)標注員”。
當前,以互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能為代表的新一代信息技術(shù)日新月異。人工智能在去年、今年兩度被寫入政府工作報告;而大數(shù)據(jù),已經(jīng)成為世界認識貴州的新名片。在脫貧攻堅主戰(zhàn)場的貴州,大數(shù)據(jù)的經(jīng)濟增速已連續(xù)7年位居全國前列。
產(chǎn)業(yè)勃興,數(shù)據(jù)標注員因此成為新興職業(yè)。多名業(yè)內(nèi)人士告訴記者,目前國內(nèi)至少有大小近千家標注公司,共20余萬名數(shù)據(jù)標注員。
在百鳥河數(shù)字小鎮(zhèn),僅吳潘威所在的夢動科技有限公司就有400多名標注員。他們是踩著信息技術(shù)浪潮的流水線工人。
“教機器認識這個世界”
來電顯示利益鏈 最近浙江尹先生發(fā)現(xiàn)自己手機號被軟件平臺標注成了“教育科研機構(gòu)”。而要查詢是被哪些軟件標注的,需要花錢,取消這個錯誤標注,要花更多的錢