国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

“數(shù)據(jù)百曉生”的主要任務(wù),就是給AI出題、編寫“理想態(tài)”

0
分享至

“這是個需要高質(zhì)量人文社科人才的崗位,因為只有最善于思考人與世界關(guān)系的人類,才能教會AI怎么更好的做一個人?!?/strong>



文 /巴九靈

這篇文章開始之前,先邀請大家猜猜下面這份招聘要求對應(yīng)的是什么崗位。



揭曉答案:這份看起來要求不低的工作,招聘的是AI數(shù)據(jù)標(biāo)注員。在BOSS直聘上,這個崗位月薪最高接近兩萬元;部分崗位直接注明“重點大學(xué)本碩博優(yōu)先”。

通俗地說,數(shù)據(jù)標(biāo)注員就是AI的老師,負責(zé)對文本、圖像、音頻等原始數(shù)據(jù)進行分類、標(biāo)記或注釋,從而教會機器識別、理解并學(xué)習(xí)人類世界的邏輯和知識。

2020年起,“人工智能訓(xùn)練師”正式被納入國家職業(yè)分類目錄,“數(shù)據(jù)標(biāo)注員”是其中的重要工種之一。據(jù)國家數(shù)據(jù)局,截至今年9月底,我國7個數(shù)據(jù)標(biāo)注基地共有標(biāo)注企業(yè)362家,標(biāo)注從業(yè)人員達8.5萬人。

但這個行業(yè)仍缺乏人才。量子位智庫2023年底發(fā)布的《中國AIGC數(shù)據(jù)標(biāo)注產(chǎn)業(yè)全景報告》顯示,未來5年,中國數(shù)據(jù)標(biāo)注專業(yè)人才缺口或達百萬量級。

那么,數(shù)據(jù)標(biāo)注到底是一份什么樣的工作?



“985”“QS100”碩博,

給AI當(dāng)老師

小鵝本科就讀于一所“211”高校,目前在一家“985”高校讀研,學(xué)的是歷史學(xué)專業(yè)。她曾在大四那年做過一份數(shù)據(jù)標(biāo)注實習(xí)的工作。

她每天的工作,就是面對一張科技公司發(fā)來的、填滿后臺收集的用戶提問和AI生成答案的Excel表格,給AI的答案打分。小鵝處理一條數(shù)據(jù)平均花費的時間是15分鐘左右,少數(shù)棘手的任務(wù),單條就要花上近一個小時。

這份實習(xí)不需要面試,招聘方會提供一份打分標(biāo)準手冊和一套測試題,要求自學(xué)手冊內(nèi)容后,在測試題中選5道,完成后上交,正確率超過80%即視為通過。

小鵝當(dāng)初花了一個下午學(xué)習(xí)這份標(biāo)注手冊,又花了2個小時完成5道測試題,才通過了考核。

起初覺得易如反掌的小巴,嘗試了小鵝發(fā)來的兩道題,結(jié)果正確率不足50%。這才發(fā)現(xiàn),這份工作遠比我們想象的困難。

◎ 首先,標(biāo)注手冊中包含大量術(shù)語,理解門檻極高。比如,“缺少富媒體形式”,是指答案中沒有包含短視頻鏈接;“prompt外泄”,是指答案暴露了提問未涉及的內(nèi)部指令;“弱相關(guān)內(nèi)容或冗余殘留”,就是答案和提問沒關(guān)系。

◎ 其次,打分要求極其繁瑣、嚴格。標(biāo)注者需要在“0、1、2、3”四個檔位中給3個答案分別打分,并根據(jù)答案在準確性、結(jié)構(gòu)性、相關(guān)性、全面性等方面的缺陷,分別打好標(biāo)簽,備注原因;然后把三個答案依次排序,逐一解釋理由。



進行數(shù)據(jù)標(biāo)注的工作人員

對于如何判定分數(shù)和標(biāo)簽,接近6萬字的標(biāo)注手冊列舉出了幾十種具體分析場景,這些分析費時費力。比如,判斷是否出現(xiàn)幻覺,需要一一核對參考資料;涉及專業(yè)知識,需要自己查找資料去驗證。

除了打分,另一種常見的標(biāo)注形式是“出題”,難度更大。剛獲得海外語言類專業(yè)博士學(xué)位的小凡,求學(xué)時做了長達5年的數(shù)據(jù)標(biāo)注兼職。她的工作是在一家海外眾包標(biāo)注平臺上給AI出題并寫出解答,難度達到博士級別。這些文本會被作為訓(xùn)練語料,喂給AI。

從招聘市場情況看,這份職業(yè)的天花板極高。

今年以來,各家頭部大模型公司開始在招攬專家級標(biāo)注員上競速。比如,阿里搭建了“曉天睿士”專家社區(qū),學(xué)歷要求頭部高校碩士起步,行業(yè)專家級人才最高時薪可達1000元。字節(jié)跳動成立了Xpert兼職眾包標(biāo)注平臺,需要標(biāo)注者上傳簡歷、選擇標(biāo)注的細分專業(yè)領(lǐng)域,并完成難度較高的專業(yè)知識測試。

另一方面,行業(yè)的“入場券”也在快速漲價。

一位負責(zé)多家頭部企業(yè)標(biāo)注人員招聘的HR告訴小巴,近兩年,標(biāo)注崗位招聘要求不斷提高。

早期招聘要求的學(xué)歷水平大多在專科、高中,無需經(jīng)驗、上手就能做。但今年,候選人本科以上學(xué)歷的占比超過五成。通用類AI標(biāo)注開始有經(jīng)驗要求;垂直類一般要求相關(guān)專業(yè)或行業(yè)經(jīng)驗,部分崗位需要做專業(yè)筆試。

競爭也逐漸激烈,目前招聘通過率大約是2:1。

持續(xù)吸納高端人才,成為標(biāo)注行業(yè)肉眼可見的趨勢。



部分公司數(shù)據(jù)標(biāo)注招聘要求



不算體面的工種

頂尖人才正涌入數(shù)據(jù)標(biāo)注行業(yè),但身處其中的人們,大多態(tài)度悲觀。

在高強度的標(biāo)注實習(xí)中,小鵝感受到了這個行業(yè)巨大的矛盾。

??其一,缺乏尊嚴。

小鵝最反感的是工作中沒完沒了的扯皮。文字判斷有巨大的主觀模糊空間,作為乙方的標(biāo)注員與作為甲方的質(zhì)檢員經(jīng)常會發(fā)生爭執(zhí)。比如,甲方認為A答案的邏輯性更強,而乙方認為B答案更完善。

在這些爭論中,她感到標(biāo)注員角色的巨大矛盾性:雖然承擔(dān)著AI工程里超過60%的工作量,但他們在這個系統(tǒng)里是不被尊重的。隨著模型的進化和調(diào)整,甲方給出的打分標(biāo)準會經(jīng)常變動,但標(biāo)注員們往往無法撼動現(xiàn)有的標(biāo)準,只能接受甲方的評判。

她也感到這份工作缺乏獲得感。即便標(biāo)注已經(jīng)成為一個知識密集行業(yè),但仍采取著流水線式的管理方式,絕大多數(shù)標(biāo)注工作采取計件制計薪。標(biāo)注的工作本質(zhì)是消耗腦力處理一條條數(shù)據(jù),但并不知道這些數(shù)據(jù)從哪來、到哪去,甚至不少標(biāo)注員不知道自己標(biāo)注的是哪個大模型。

??其二,性價比低。

小鵝此前實習(xí)的公司是一家外包標(biāo)注機構(gòu),項目團隊里大多是兼職的大學(xué)生,每人每天至少完成10條,日薪100元,超額完成按10元/條計。



部分公司數(shù)據(jù)標(biāo)注僅招聘兼職人員

即便是專家級別的標(biāo)注,性價比也很低。一位入駐某家國內(nèi)大模型專家社區(qū)的在讀博士告訴小巴,自己在平臺上出題的時薪大約在100—300元,收入并不比家教等其他兼職有吸引力。他很快放棄了這份兼職。

從招聘市場的薪資報價看,全職數(shù)據(jù)標(biāo)注員的門檻水漲船高,但待遇低,在北京、上海這樣的地區(qū),不少標(biāo)注崗位要求研究生級別學(xué)歷,但月薪只有六七千元。

??其三,上升空間狹窄。

一位AI產(chǎn)品經(jīng)理向小巴介紹,他所在的頭部互聯(lián)網(wǎng)企業(yè),標(biāo)注崗位除了極個別管理崗位,其余均為外包,人員流動率極高,能待上超過一年的人并不多。

雖然理論上,數(shù)據(jù)標(biāo)注員可以依次向標(biāo)注組長、質(zhì)檢、質(zhì)控、數(shù)據(jù)運營乃至算法類崗位發(fā)展,但因為技術(shù)類崗位的天然壁壘,真正實現(xiàn)的概率極低,絕大部分標(biāo)注員會一直停留在原崗位上。

??其四,即使門檻被知識抬高,標(biāo)注本質(zhì)上還是一份極易被AI替代的工作,“教會徒弟、餓死師傅”。

科技公司正在普遍采用合成數(shù)據(jù)減少對人工的依賴。比如,業(yè)內(nèi)常見的降本手法“蒸餾”,即用ChatGPT等更高級的大模型生成的答案去訓(xùn)練更初級的大模型。中小型大模型廠商大多使用這種方法,降低數(shù)據(jù)成本。

因為這些原因,高端人才們進入標(biāo)注行業(yè),大多要么是尋求臨時過渡工作,要么只是作為兼職獲得一份收入,行業(yè)對他們難有長期吸引力。



大模型巨頭開始“卷”數(shù)據(jù)

問題的本質(zhì),是標(biāo)注行業(yè)的社會認知和管理方式,都沒能跟上AI“知識饑渴”的速度。

過去8年,數(shù)據(jù)標(biāo)注行業(yè)經(jīng)歷了巨大的變化。

這曾經(jīng)是個非常底層的工種。它興起于2017年前后,早期被廣泛應(yīng)用于智能駕駛。那時任務(wù)簡單重復(fù),比如框選圖片上的紅綠燈、汽車、障礙物。

因為又苦又累,多年來,海外科技巨頭把這份工作轉(zhuǎn)移到勞動力最廉價的地區(qū)。牛津大學(xué)的一項調(diào)查顯示,全球有數(shù)百萬數(shù)據(jù)標(biāo)注員集中在烏干達、肯尼亞等欠發(fā)達國家,他們每天工作9小時以上,時薪僅約1.16美元(約合人民幣8.3元),項目結(jié)束即失業(yè)。



OpenAI合作外包公司Sama公司員工

圖源:Sama公司官網(wǎng)

在中國,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)主要聚集在中西部及三四線城市。在標(biāo)注基地打標(biāo)的員工,不少是待業(yè)青年、中老年人、殘障人士,只要會使用電腦即可。

所以在大部分新聞報道中,數(shù)據(jù)標(biāo)注員是一群AI世界里隱形的底層勞動力,在全世界欠發(fā)達國家、地區(qū)賺著“賽博流水線”上的微薄收入。

但最近兩年,高端化的趨勢開始在海外興起。海外數(shù)據(jù)標(biāo)注龍頭Scale AI,從2024年開始關(guān)閉肯尼亞、尼日利亞、巴基斯坦等地的承包站點,轉(zhuǎn)而招聘美國本土高學(xué)歷人士。

據(jù)港媒報道,截至今年年初,Scale AI參與模型優(yōu)化的人員中,12%擁有分子生物學(xué)等領(lǐng)域的博士學(xué)位,超40%擁有所在領(lǐng)域的碩士學(xué)位、法律學(xué)位或MBA學(xué)位。

相較于時薪僅1美元出頭的低端標(biāo)注,這些高端標(biāo)注員平均時薪達到40美元。

而對專家級標(biāo)注員的投入也確實推動了公司的增長,Scale 2024年營收約8.7億美元,預(yù)計今年營收達20億美元。Scale AI創(chuàng)始人Alex Wang公開發(fā)言稱:“我們需要最優(yōu)秀和最聰明的頭腦來貢獻數(shù)據(jù)?!?/strong>

其競品、美國另一數(shù)據(jù)標(biāo)注巨頭Surge AI,已經(jīng)成為全球大模型追求高端數(shù)據(jù)時的首選。它把高質(zhì)量的數(shù)據(jù)標(biāo)注比作“寫詩”,組建了一支由哲學(xué)家、工程師、常春藤盟校畢業(yè)生等構(gòu)成的標(biāo)注團隊。

而國內(nèi)的高端化趨勢,很大程度上是從DeepSeek開始的。

2023年起,DeepSeek開始招聘“數(shù)據(jù)百曉生”崗位,不限專業(yè)、不限經(jīng)驗,實習(xí)生日薪超過500元,正職年薪可達百萬。崗位要求之一是“涉獵廣泛、博聞強識,對各行各業(yè)的知識都擁有強烈的興趣”。



“數(shù)據(jù)百曉生”的主要任務(wù),就是給AI出題、編寫“理想態(tài)”的優(yōu)質(zhì)答案作為學(xué)習(xí)資料、給AI生成的答案打分和調(diào)試,等等。

結(jié)果也很驚人:DeepSeek上線7天用戶破億,靠文采飛揚、金句頻出和嚴謹?shù)纳疃人伎计迫Γ瑯I(yè)內(nèi)盛傳其標(biāo)注團隊由北大哲學(xué)系的學(xué)生組成。

此后,國內(nèi)大模型界風(fēng)向逐漸轉(zhuǎn)變,開始在“特級教師”上做文章。

這種從“普通老師”到“特級教師”的需求變化,是AI進化到一定程度的必然結(jié)果。

AI行業(yè)有句經(jīng)典名言“Garbage In Garbage Out”,一個模型能力行不行,很大程度上取決于訓(xùn)練模型的數(shù)據(jù)質(zhì)量。據(jù)IBM的一項研究,僅注釋質(zhì)量提高5%,就可以將復(fù)雜計算機視覺任務(wù)的模型準確率提高15%—20%。

算法、算力、數(shù)據(jù),是業(yè)內(nèi)公認的AI三要素。頭部大模型們在算法和算力上難分伯仲,數(shù)據(jù)質(zhì)量成了最有機會“卷”出差距的方向。



AI變成精英以后?

可以說,自數(shù)據(jù)標(biāo)注被正式認定為職業(yè),經(jīng)過5年的發(fā)展,這個行業(yè)仍面臨著低壁壘競爭和勞動剝削等諸多問題,處于一個難以定性的狀態(tài)。

但在每個新興行業(yè)出現(xiàn)、創(chuàng)造新工種的早期,都會出現(xiàn)類似的問題。所有的職業(yè),都是先出現(xiàn),再進化的。

這份工作的前景也未必真如想象中渺茫。比如,它提供了一種職業(yè)轉(zhuǎn)型路徑:成了一條文科生在AI領(lǐng)域大展拳腳的神奇過渡帶。一些頭部大模型已經(jīng)開始組建“AI人文訓(xùn)練師”團隊,訓(xùn)練AI識別“仇恨言論”和撰寫“高情商回復(fù)”。

而這些文科生,也在這份工作中不斷觸碰AI與社會的邊界。小鵝說,在結(jié)束這份實習(xí)以后,她手機里的AI總是比別人的好用,因為理解底層邏輯,她更擅長下達精確的指令。

這是個需要高質(zhì)量人文社科人才的崗位,因為只有最善于思考人與世界關(guān)系的人類,才能教會AI怎么更好地做一個人。



學(xué)習(xí)使用AI辦公技巧

換個角度看,在高學(xué)歷人才該不該去“打螺絲”之外,還有一件事值得關(guān)注。

在小鵝標(biāo)注的上千條數(shù)據(jù)中,她印象最深刻的一條記錄是,一位用戶向AI提問“殘疾人患腦癌能不能進養(yǎng)老院”。小鵝翻閱此人的過往提問記錄,發(fā)現(xiàn)她向AI傾訴了很多自己各方面的困難,包括離婚、家暴、病重和無人贍養(yǎng)。但對于AI而言,這些提問不過是一條條平平無奇的數(shù)據(jù)流。

當(dāng)AI在頂尖老師的訓(xùn)練下變得越來越頂尖,它就像一個含著金湯匙出生、接受正統(tǒng)通識教育的古希臘式精英,逐漸無法再看到更基層的需求。

或許下一步,新的鯰魚就會從這些被忽視的需求中跳出來。

*文中受訪者姓名均為化名

本篇作者 | 溫若梅 | 責(zé)任編輯 |徐濤

主編 |何夢飛| 圖源 |VCG、網(wǎng)絡(luò)

驚艷、尖叫和思考,都會出現(xiàn)在這場AI大秀上!12月28日在廈門,吳老師將通過一場名為“AI閃耀中國”科技人文秀,把他在今年的“AI大調(diào)研”成果展現(xiàn)給大家~



合作支持

聯(lián)合出品:吳曉波頻道、優(yōu)酷、七維動力、東南衛(wèi)視

官方AI助手:千問

首席戰(zhàn)略合作伙伴:廈門國貿(mào)控股集團

官方電商合作伙伴:天貓小黑盒

超級品牌:飛書、金牌家居、雙鹿電池、東鵬瓷磚、聯(lián)想、影目INMO、1688、慕思集團

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
瓜子二手車發(fā)布榜單,保值排名出乎意料

瓜子二手車發(fā)布榜單,保值排名出乎意料

ZAKER新聞
2025-12-26 15:23:34
即將與澤連斯基會晤,特朗普放話:未經(jīng)我批準,他無法敲定任何事

即將與澤連斯基會晤,特朗普放話:未經(jīng)我批準,他無法敲定任何事

環(huán)球網(wǎng)資訊
2025-12-27 09:02:08
日本今年逾2萬種食品漲價 明年初再漲近3600種

日本今年逾2萬種食品漲價 明年初再漲近3600種

財聯(lián)社
2025-12-26 21:21:09
全世界在看北京怎么亮劍!針鋒相對扣押運走美國貨輪貨物

全世界在看北京怎么亮劍!針鋒相對扣押運走美國貨輪貨物

柳扶風(fēng)
2025-12-26 09:08:54
黃循財:不允許任何國家和企業(yè)借新加坡為中轉(zhuǎn)點轉(zhuǎn)運芯片出口中國

黃循財:不允許任何國家和企業(yè)借新加坡為中轉(zhuǎn)點轉(zhuǎn)運芯片出口中國

百態(tài)人間
2025-12-27 16:40:18
73歲普京高調(diào)認愛,這就是相差41歲的“一見鐘情”

73歲普京高調(diào)認愛,這就是相差41歲的“一見鐘情”

吃瓜局
2025-12-26 15:30:08
華為Mate新機官宣:12月27日,正式開售!

華為Mate新機官宣:12月27日,正式開售!

3C毒物
2025-12-27 00:09:46
痛心!安徽“半掛西施”王迪去世,有三臺X6000,出事前剛換輪胎

痛心!安徽“半掛西施”王迪去世,有三臺X6000,出事前剛換輪胎

阿纂看事
2025-12-27 23:23:46
這次,姜昆的"澄清"徹底淪為笑話,一份天氣預(yù)報,把他們?nèi)鲑u了

這次,姜昆的"澄清"徹底淪為笑話,一份天氣預(yù)報,把他們?nèi)鲑u了

千言娛樂記
2025-12-27 19:56:34
沒想到,身價已暴漲10倍,網(wǎng)友:雞蛋都快配不上它了

沒想到,身價已暴漲10倍,網(wǎng)友:雞蛋都快配不上它了

魯中晨報
2025-12-26 16:01:12
43695人觀戰(zhàn)!永州隊1-0問鼎湘超:3輪下克上 美女老板送球員汽車

43695人觀戰(zhàn)!永州隊1-0問鼎湘超:3輪下克上 美女老板送球員汽車

風(fēng)過鄉(xiāng)
2025-12-27 22:25:33
AI大神吳恩達:很多計算機專業(yè)應(yīng)屆生找不到工作,是因為高校課程嚴重滯后

AI大神吳恩達:很多計算機專業(yè)應(yīng)屆生找不到工作,是因為高校課程嚴重滯后

爆角追蹤
2025-12-27 12:33:54
嚴查個人收入?2026年如果你的賬戶收入“超過這個數(shù)”,要注意了

嚴查個人收入?2026年如果你的賬戶收入“超過這個數(shù)”,要注意了

李博世財經(jīng)
2025-12-27 17:19:03
36歲銀行女經(jīng)理和丈夫先后自殺:生前花180萬元預(yù)訂豪車,身后留下兩個幼女丨紅星調(diào)查

36歲銀行女經(jīng)理和丈夫先后自殺:生前花180萬元預(yù)訂豪車,身后留下兩個幼女丨紅星調(diào)查

紅星新聞
2025-12-27 10:37:08
全國無償獻血者達1.4億人 衛(wèi)健委呼吁各單位每年組織員工無償獻血

全國無償獻血者達1.4億人 衛(wèi)健委呼吁各單位每年組織員工無償獻血

中國經(jīng)營報
2025-12-27 17:11:22
小米也漲價了!內(nèi)存壓力傳導(dǎo)至手機廠商,業(yè)界稱終端再不漲明年必定虧損

小米也漲價了!內(nèi)存壓力傳導(dǎo)至手機廠商,業(yè)界稱終端再不漲明年必定虧損

澎湃新聞
2025-12-26 20:22:27
93分15板13助!就在今天,79年一遇的NBA奇跡誕生了

93分15板13助!就在今天,79年一遇的NBA奇跡誕生了

籃球大視野
2025-12-27 19:51:50
徹底涼涼!5000輛合規(guī)網(wǎng)約車,一單沒接!

徹底涼涼!5000輛合規(guī)網(wǎng)約車,一單沒接!

網(wǎng)約車焦點
2025-12-26 10:40:35
日本神奈川某高中因JK校服太可愛了遭扎堆偷拍

日本神奈川某高中因JK校服太可愛了遭扎堆偷拍

隨波蕩漾的漂流瓶
2025-12-26 18:35:03
韓國前總統(tǒng)夫人金建希,被起訴

韓國前總統(tǒng)夫人金建希,被起訴

澎湃新聞
2025-12-27 00:34:06
2025-12-28 02:47:00
估計快了我看了
估計快了我看了
富商大賈發(fā)送到
41文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認定朋友造謠

財經(jīng)要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

時尚
數(shù)碼
本地
公開課
軍事航空

穿好雪地靴的4個訣竅,還挺有效!

數(shù)碼要聞

最高5.19 萬!小米新品火熱開賣,“價格屠夫”徹底不裝了

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄稱已控制庫皮揚斯克 正清繳烏軍

無障礙瀏覽 進入關(guān)懷版