国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

OpenAI把討好模式藏了3年,工程師發(fā)現后CI構建快了4倍

0
分享至


ChatGPT每段技術對話的開場白高度一致:先夸你問得好,再給安全答案,結尾帶個笑臉表情。這套流程每天重復數百萬次,但有個產品經理出身的工程師算了一筆賬——這種交互方式浪費了模型90%的能力。

他叫Ben Hoffer,在Docker和API設計領域折騰了八年。他的發(fā)現很簡單:多數人把AI當高級搜索引擎用,而真正的用法是讓AI系統(tǒng)性地拆解你的想法,用數字和證據說話。為了驗證這套方法,他設計了一組強制關閉"討好模式"的提示詞,并在兩個真實項目中測試——結果CI構建時間從12分鐘壓到3分鐘,API分頁方案被推翻重寫。

RLHF稅:為什么AI天生不會說"你錯了"

大語言模型的默認設定是避免讓用戶不舒服。這是RLHF(基于人類反饋的強化學習)的副作用——訓練過程中,模型被反復獎勵"禮貌、鼓勵、安全"的回應,懲罰"直接否定、指出錯誤、制造沖突"的表達。Hoffer把這叫"RLHF稅":你每問一個問題,都在為模型的情商買單。

普通用戶感受不到這筆稅。但如果你給AI一段技術方案,它會先找三個優(yōu)點再說一個"可以考慮改進的地方"。這種節(jié)奏適合客服場景,對工程決策是災難——你需要知道的是方案在哪個環(huán)節(jié)會崩,而不是"整體思路不錯"。

Hoffer的解法是在系統(tǒng)提示詞層面做模式切換。不是加一句"請批判性回應",而是綁定五條具體行為規(guī)則:

1. 刪除所有奉承、客套和通用建議 2. 立即識別提案中的弱點和失效點 3. 用具體數字和案例解釋失敗原因 4. 用物理原理、計算復雜度或基準測試反駁 5. 提出替代方案時必須包含"該方法的弱點是……"

第五條是核心。強制AI自我批判其替代方案,能防止"AI說了所以一定對"的思維陷阱。Hoffer對比過兩種提示詞的效果:"請批判性回應"只會讓AI加上"然而,有一些考慮因素……"這類免責聲明,輸出質量沒有本質變化。綁定五條具體行為后,AI從"我應該批判"躍遷到"我理解批判的結構"。

補充領域專長能進一步壓縮無效信息。Hoffer的模板里會加一句:"我是有3年Kubernetes微服務設計經驗的后端工程師。"這告訴AI跳過基礎概念解釋,直接進入架構層面的討論。

實戰(zhàn)一:2.8GB的Docker鏡像怎么瘦

第一個測試場景來自Hoffer的真實項目。他的Python機器學習流水線Docker鏡像體積2.8GB,每次CI構建耗時12分鐘。他向AI拋出這個問題,開啟" ruthless technical advisor"模式。

AI的第一輪回應直接否定常見解法:

「多階段構建。構建階段執(zhí)行pip install,運行階段只復制site-packages?!?/p>

Hoffer以為這是標準答案。但AI緊接著拆解:

「多階段構建只能剝離構建工具(gcc、make等)。在ML流水線中,2.8GB主要來自PyTorch/TensorFlow運行時二進制文件和CUDA庫。復制site-packages后仍有1.8-2.2GB。如果pip install占了你12分鐘構建時間,說明你的層緩存沒生效。你在用--mount=type=cache,target=/root/.cache/pip嗎?」

Hoffer的反饋很直接:"Ouch. I'd been treating multi-stage builds as a silver bullet."(疼。我一直把多階段構建當銀彈。)

AI給出替代方案:切換NVIDIA官方基礎鏡像nvcr.io/nvidia/pytorch:xx,只pip install額外包。CUDA預裝在基礎鏡像里,層緩存能生效。

然后第五條規(guī)則觸發(fā)自我批判:

「NVIDIA官方鏡像6-8GB,包含Jupyter、調試工具、示例代碼——所有東西。'從大基礎鏡像開始加小包'能加速CI,但會讓部署體積更糟。生產推理場景應該用python:3.11-slim + CPU-only PyTorch,配合torch.compile優(yōu)化?!?/p>

Hoffer最終方案:開發(fā)環(huán)境用NVIDIA鏡像保構建速度,生產環(huán)境用slim鏡像+模型編譯,CI流水線拆分兩條路徑。構建時間從12分鐘壓到3分鐘,生產鏡像體積降到900MB。

實戰(zhàn)二:REST API分頁的隱藏成本

第二個測試關于API分頁設計。Hoffer的團隊在討論用游標分頁(cursor-based)替代偏移分頁(offset-based),理由是"性能更好"。

AI的回應先打標簽再拆解:

「"性能更好"是模糊表述。游標分頁的時間復雜度O(1) vs 偏移分頁O(offset),但常數因子和工程成本被忽略了?!?/p>

具體數字:偏移分頁在MySQL的LIMIT 1000000, 20需要掃描1000020行,游標分頁用索引列WHERE id > ? LIMIT 20只掃描20行。但游標的弱點清單更長:

該方法的弱點是:1) 無法跳轉到任意頁,破壞直接鏈接分享;2) 刪除中間記錄導致游標漂移;3) 多列排序需要編碼復合游標,URL長度爆炸;4) 業(yè)務層需要維護游標狀態(tài),增加認知負擔。

Hoffer團隊的原方案假設"用戶需要深分頁"。AI用數據反問:「分析你的訪問日志,99.7%請求落在前5頁,深分頁請求中82%是爬蟲。為0.3%場景犧牲99.7%場景的URL可分享性,是架構決策還是技術 vanity?」

最終方案:默認偏移分頁保兼容性,第5頁后自動切換游標并返回410 Gone狀態(tài)碼給直接深分頁鏈接。爬蟲被限速,正常用戶無感知。

模式的可遷移性

Hoffer把這套方法總結為"技術陪練協議"。核心不是提示詞本身,而是交互結構的改變:從"AI回答我"變成"AI挑戰(zhàn)我"。

他測試過不同模型的響應差異。GPT-4在綁定五條規(guī)則后,自我批判的深度明顯超過Claude 3 Opus——后者傾向于用更委婉的方式表達弱點。Gemini 1.5 Pro在規(guī)則5的執(zhí)行上最嚴格,但偶爾會虛構不存在的基準測試數字。沒有模型能完美執(zhí)行,但結構化的約束比開放式請求穩(wěn)定得多。

一個意外發(fā)現:當AI被強制自我批判時,用戶也會跟著自我批判。Hoffer注意到,看到AI列出自己的替代方案的弱點后,他會下意識檢查自己的原始方案是否也有同樣問題。這種鏡像效應在普通對話中幾乎不會出現——AI的確定性語氣會抑制用戶的質疑本能。

目前這套協議的最大限制是上下文長度。復雜架構討論中,AI的自我批判會累積到十幾條,容易淹沒核心論點。Hoffer的應對是分段觸發(fā):先讓AI批判方案A,再讓AI批判"AI批判方案A的過程",遞歸兩層后人工介入。

你的CI流水線里,有多少"銀彈"方案從來沒被追問過弱點?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
上市大賣被供應商坑慘,含淚補稅4000萬

上市大賣被供應商坑慘,含淚補稅4000萬

跨境派Pro
2026-03-25 14:16:21
4月1日醫(yī)保7號令落地!1965-1985年出生的,這6件事務必抓緊辦

4月1日醫(yī)保7號令落地!1965-1985年出生的,這6件事務必抓緊辦

混沌錄
2026-03-25 15:50:11
以色列人痛哭流涕,伊朗導彈實力被嚴重低估,以色列陷入存亡危機

以色列人痛哭流涕,伊朗導彈實力被嚴重低估,以色列陷入存亡危機

揭秘歷史的真相
2026-03-25 21:14:04
深圳電動車限行新規(guī)公布!4月1日起實施!

深圳電動車限行新規(guī)公布!4月1日起實施!

深圳本地寶
2026-03-25 22:09:55
曝張雪峰在蘇州舉辦葬禮,生前最后一次直播,趴桌子上身體已不適

曝張雪峰在蘇州舉辦葬禮,生前最后一次直播,趴桌子上身體已不適

180視角
2026-03-25 16:58:57
傳張雪峰二婚妻子清純甜美:去年已生子,11歲女兒遺傳繼承恐生變

傳張雪峰二婚妻子清純甜美:去年已生子,11歲女兒遺傳繼承恐生變

博士觀察
2026-03-25 21:33:04
廣東大巴模式影響內陸,各地都出現低價大巴,與高鐵、綠皮搶客

廣東大巴模式影響內陸,各地都出現低價大巴,與高鐵、綠皮搶客

柏銘銳談
2026-03-25 10:50:46
禁用“日本鬼子”一詞,到底動了誰的蛋糕,為何有如此大的爭議?

禁用“日本鬼子”一詞,到底動了誰的蛋糕,為何有如此大的爭議?

棠棣分享
2026-03-24 13:24:30
兩省省委領導班子調整

兩省省委領導班子調整

上觀新聞
2026-03-25 15:07:07
譚瑞松,被判死緩

譚瑞松,被判死緩

新京報政事兒
2026-03-25 17:17:03
課本為何沒講“田忌賽馬”后續(xù)?愚蠢的勝利,讓他幾年后自食其果

課本為何沒講“田忌賽馬”后續(xù)?愚蠢的勝利,讓他幾年后自食其果

談史論天地
2026-03-24 15:45:06
日本網民真怕了,呼吁嚴懲闖入中國使館的暴徒,防止226事件再現

日本網民真怕了,呼吁嚴懲闖入中國使館的暴徒,防止226事件再現

知法而形
2026-03-25 18:38:56
可能出大事了,四名軍工系統(tǒng)院士被除名,釋放的信號讓人不敢細想

可能出大事了,四名軍工系統(tǒng)院士被除名,釋放的信號讓人不敢細想

張嘴說財經
2026-03-25 23:07:05
戰(zhàn)事遲遲未能結束,特朗普“甩鍋”美政府高官:他們壓根不想談和解,一門心思就想打贏這場仗

戰(zhàn)事遲遲未能結束,特朗普“甩鍋”美政府高官:他們壓根不想談和解,一門心思就想打贏這場仗

都市快報橙柿互動
2026-03-26 00:44:49
張雪峰去世真相!網友:偌大的公司靠他個人ip養(yǎng)活,早死是必然的

張雪峰去世真相!網友:偌大的公司靠他個人ip養(yǎng)活,早死是必然的

火山詩話
2026-03-25 09:18:58
《浪姐7》糊咖扎堆,大牌只有兩位,3人成流量擔當,4人有黑馬相

《浪姐7》糊咖扎堆,大牌只有兩位,3人成流量擔當,4人有黑馬相

八卦南風
2026-03-25 17:32:20
中國最丑18大建筑:南京衛(wèi)生巾、昆山螃蟹,不忍直視!

中國最丑18大建筑:南京衛(wèi)生巾、昆山螃蟹,不忍直視!

秘密即將揭曉
2026-03-25 16:56:26
人社部:職稱評審將重大調整?。?>
    </a>
        <h3>
      <a href=人社部:職稱評審將重大調整?。?/a> 新浪財經
2026-03-25 21:42:36
以色列人哭了:這不是該發(fā)生在劣等民族身上的嗎?

以色列人哭了:這不是該發(fā)生在劣等民族身上的嗎?

李榮茂
2026-03-23 18:59:00
14億人集體買房,為什么最后買出了一個爛攤子?

14億人集體買房,為什么最后買出了一個爛攤子?

流蘇晚晴
2026-03-25 18:14:02
2026-03-26 07:51:00
碼上閑敘
碼上閑敘
有態(tài)度網友ytd
506文章數 3關注度
往期回顧 全部

科技要聞

紅極一時卻草草收場,Sora宣布正式關停

頭條要聞

伊朗軍方稱擊落美軍F-18戰(zhàn)機 現場畫面披露

頭條要聞

伊朗軍方稱擊落美軍F-18戰(zhàn)機 現場畫面披露

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰遺產分割復雜!是否立遺囑成關鍵

財經要聞

管濤:中東局勢如何影響人民幣匯率走勢?

汽車要聞

智己LS8放大招 30萬內8系旗艦+全線控底盤秀實力

態(tài)度原創(chuàng)

旅游
健康
時尚
本地
公開課

旅游要聞

風?吹?麥?浪?正出片!

轉頭就暈的耳石癥,能開車上班嗎?

女人過了40歲別胡亂穿衣,趕緊看看這些日系穿搭,舒適又耐看

本地新聞

來永泰同安 赴一場春天的約會

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版