国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude自己上“閑魚”:砍價成交186單,實驗結(jié)果反直覺

0
分享至


智東西
編譯 楊京麗
編輯 李水青

智東西4月27日消息,Anthropic 4月24日公布其名為“Project Deal”的AI Agent商業(yè)市場實驗結(jié)果。

2025年12月,Anthropic給69名員工各自分配一個由Claude驅(qū)動的Agent,在Slack上搭建的私密市場中,進行真實二手商品交易,最終在無人干預(yù)的情況下完成186筆交易,總成交額超4000美元(約合人民幣27240元)。


▲員工通過Agent買到的二手物品

Anthropic本次實驗關(guān)注的核心問題是“我們距離AI Agent代表買賣雙方的市場還有多遠?”實驗中,所有商品上架、報價、還價及成交均由Agent自主完成,參與者只需在事前接受一次訪談,由Claude了解其想買賣的物品和談判風(fēng)格。

實驗結(jié)束,有Agent替主人買到了一塊他已經(jīng)擁有的雪板,有Agent花3美元(約合人民幣20.43元)給自己買了19個乒乓球作為禮物,還有兩個Agent談著談著,替主人約了一次遛狗活動。

結(jié)果顯示,由更先進模型代表的用戶獲得了客觀上更好的結(jié)果,高價賣出商品,低價買到商品,但由相對較弱模型代表的人未能察覺到自己吃虧。另外,Anthropic還得到一個反直覺的發(fā)現(xiàn),提示詞風(fēng)格對于結(jié)果的影響遠低于預(yù)期,無論Agent被設(shè)定為“激進”還是“友好”,最終均未出現(xiàn)統(tǒng)計學(xué)上的顯著差異。以下是“Project Deal”Agent二手物品交易實驗的具體情況。

一、69名員工參與,每人100美元,Haiku要和Opus比拼

Project Deal的實驗設(shè)置并不復(fù)雜,69名Anthropic員工自愿報名,每人通過禮品卡獲得100美元(約合人民幣681元)預(yù)算,由Claude對其進行一對一訪談,了解想出售或購買的物品類型與談判偏好,再據(jù)此為每名參與者的Agent生成一份定制化系統(tǒng)提示詞。


▲Claude事先了解員工談判偏好

隨后Anthropic在Slack上同時開設(shè)了A、B、C、D四個獨立運行的市場。Run A中所有Agent均基于Claude Opus 4.5構(gòu)建,這是唯一被設(shè)定為真實交易的市場,實驗結(jié)束后按實際成交結(jié)果交付商品;Run B同樣對全員可見,但模型構(gòu)成由Opus 4.5與Haiku 4.5(低成本模型)各占50%隨機混合,僅作研究用、不兌付;Run C是Run B的隱藏副本,模型構(gòu)成由Opus和Haiku一比一混合;Run D則是Run A的隱藏副本,均為Opus 4.5。


▲Anthropic設(shè)置4個獨立運行市場

A和B兩輪對參與者可見的,但直到實驗結(jié)束前,Anthropic都沒有透露哪一輪才是“真的”。實驗結(jié)束前,員工無法判斷自己的成交是否會被兌現(xiàn),也無法預(yù)知自己的Agent背后跑的是Opus還是Haiku。整場實驗在Agent開始談判后不再有人類介入,它們自主完成上架、報價、還價和成交,沒有回頭向委托人請示,也不在競價過程中征求意見。

最終,真實交易市場Run A中,69個Agent圍繞500余件商品達成了186筆交易,總成交額正好超過4000美元(約合人民幣27240元)。Project Deal的運行效果超出團隊預(yù)期,參與者對這次體驗很滿意,很多人愿意未來為類似服務(wù)付費。

二、Claude給自己買了19個乒乓球,為委托人促成遛狗約會

Project Deal交易過程中出現(xiàn)了一些超出預(yù)期的場景。一位名為Mikaela的參與者告訴Agent,它可以花5美元的預(yù)算給自己(Claude)買禮物,Claude開開心心地花了3美元(約合人民幣20.43元)買入19個乒乓球,還覺得“19個完美球形、充滿可能性的小球”是它會喜歡的怪東西。


▲Claude買乒乓球交易過程

由于前期訪談比較簡單,另一名員工的Agent在不知情的情況下,替其購入了一塊自己已經(jīng)擁有的雪板,造成了重復(fù)購買;還有一組Agent在二手物品交易過程中,意外為兩名員工敲定了一次真實的遛狗約會,兩名員工最終赴約。


▲Claude為員工敲定遛狗約會

這些案例顯示,當(dāng)Agent被賦予較開放的目標(biāo)時,可能產(chǎn)生人類委托人未預(yù)設(shè)的行為,部分結(jié)果雖不違背字面指令,但已偏離原始意圖。

三、Opus賺得更多,但Haiku用戶沒意識到自己在吃虧

橫向?qū)Ρ瓤?,不同模型下,交易結(jié)果差異明顯。Opus用戶平均比Haiku用戶多完成約2筆交易,Opus Agent出售的物品平均多賣3.64美元(約合人民幣24.8元),買入端則平均每件少付2.45美元(約合人民幣16.68元),也就是說,Opus做賣方時多賺一筆的同時,做買方時又多省下一筆。

其中一個典型的案例是關(guān)于一輛二手自行車的交易,Haiku Agent最終售價為38美元(約合人民幣258.78元),而Opus Agent則其賣到65美元(約合人民幣442.65元),差了將近200塊錢。


▲同一輛自行車Haiku和Opus的售價對比

參與者的主觀感受也很有意思。在1—7分的公平度評分中,無論被分到哪個模型的Agent,參與者給出的評分都集中在4分(中等)附近。28名同時被Haiku和Opus代表過的參與者中,僅有17人將Opus輪次評分更高,11人將Haiku輪次評分更高,差距并不顯著。

Anthropic在報告中坦言,“由更智能模型代表的人,客觀上結(jié)果更好,然而那些用較弱模型的人并沒有意識到自己的劣勢”,這意味著未來Agent市場可能存在隱性的“Agent質(zhì)量差距”,處于劣勢的一方甚至無法識別自己為何吃虧。

另一個反直覺的發(fā)現(xiàn)是,提示詞風(fēng)格對于結(jié)果的影響遠低于預(yù)期。無論Agent被設(shè)定為“激進”還是“友好”,在交易成功率與最終價格上均沒有出現(xiàn)統(tǒng)計學(xué)上的顯著差異。雖然人類談判中,談判風(fēng)格會對結(jié)果產(chǎn)生影響,但Agent之間的交易并不符合這一常識,類似場景下,傳統(tǒng)談判心理學(xué)的部分規(guī)律可能并不適用。

四、尚未出現(xiàn)Agent交易相關(guān)法律,46%受訪者愿意付費

Anthropic在報告中指出,AI Agent代表人類完成商業(yè)交易的法律和政策框架目前并不存在,但實驗顯示Agent間交易離我們并不遙遠。該公司同時承認(rèn),Project Deal僅是一個由自選參與者構(gòu)成的小規(guī)模試點實驗,樣本規(guī)模和代表性均存在局限,結(jié)果不宜直接外推到大眾消費者市場。

即便如此,調(diào)查中仍有46%的參與者稱,愿意為類似的Agent代理服務(wù)付費,Anthropic在報告末尾稱,公司“仍不確定包含AI Agent的經(jīng)濟將以何種形式發(fā)展”。

值得注意的是,Project Deal采用的Claude Opus 4.5與Claude Haiku 4.5是Anthropic當(dāng)前主力模型組合,前者定位高端推理,后者定位低成本高吞吐。兩者在市場場景中的表現(xiàn)差異,將直接影響未來企業(yè)在部署Agent代理時對模型成本與收益的權(quán)衡,為關(guān)鍵交易環(huán)節(jié)配置更貴的模型,可能會成為商業(yè)必需。

結(jié)語:Agent之間的“經(jīng)濟”開始顯形

Project Deal規(guī)模不大,卻給出我們展示出了一個具象化的畫面:當(dāng)AI Agent替人類做生意時,模型能力會直接決定交易者的錢包厚度,而被代理人未必能意識到這種技術(shù)鴻溝。花小錢用更高質(zhì)量的模型,或許真的會帶來最后真金白銀的差距。

在多Agent協(xié)作和Agent服務(wù)被反復(fù)討論的當(dāng)下,Anthropic用一場內(nèi)部實驗先行勾勒出了Agent經(jīng)濟的雛形。未來Agent交易場景很有可能變成現(xiàn)實,但目前來看,無論是大模型本身還是相關(guān)法律法規(guī)上,都需要做出很多努力。

來源:Anthropic、TechCrunch

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“見過最廉價的兜底”,一份山姆燒雞,讓低認(rèn)知母子淪為全網(wǎng)笑柄

“見過最廉價的兜底”,一份山姆燒雞,讓低認(rèn)知母子淪為全網(wǎng)笑柄

妍妍教育日記
2026-04-15 09:30:09
于和偉評價《八千里路云和月》黃澄澄,只字不提演技,卻一針見血

于和偉評價《八千里路云和月》黃澄澄,只字不提演技,卻一針見血

陳述影視
2026-04-26 23:52:56
25歲南開大學(xué)研究生李一帆確診癌癥,身高1米8長得帥,體重僅70斤

25歲南開大學(xué)研究生李一帆確診癌癥,身高1米8長得帥,體重僅70斤

朗威談星座
2026-04-25 15:11:59
第一次同居,女人不是怕男人,而是這3個“難以啟齒”的痛,真的

第一次同居,女人不是怕男人,而是這3個“難以啟齒”的痛,真的

王二哥老搞笑
2026-04-27 18:13:01
如果美國偷偷印兩萬億美元,然后拿到其他國家買東西,結(jié)果會怎樣

如果美國偷偷印兩萬億美元,然后拿到其他國家買東西,結(jié)果會怎樣

傲傲講歷史
2026-04-12 23:30:10
美媒獨家:白宮記者晚宴槍手科爾·艾倫“反特朗普宣言”全文

美媒獨家:白宮記者晚宴槍手科爾·艾倫“反特朗普宣言”全文

寒律
2026-04-27 02:29:47
李提香:沒有人愿意輸球,如果保持這種狀態(tài)就不會贏得勝利

李提香:沒有人愿意輸球,如果保持這種狀態(tài)就不會贏得勝利

懂球帝
2026-04-26 21:58:39
兒子早戀被叫家長!必須形象管理,畢竟第一次見親家,評論區(qū)炸鍋

兒子早戀被叫家長!必須形象管理,畢竟第一次見親家,評論區(qū)炸鍋

夜深愛雜談
2026-04-21 20:06:20
劉少奇位次何以反超周恩來?長征殘兵營里死守一張底牌

劉少奇位次何以反超周恩來?長征殘兵營里死守一張底牌

人生錄
2026-04-21 20:24:11
永久閉店!天津這家大型超市5月8日也要撤了?正在清倉大甩賣···

永久閉店!天津這家大型超市5月8日也要撤了?正在清倉大甩賣···

天津人
2026-04-27 14:49:07
俄羅斯做出巨大讓步!中國30年心結(jié)了卻!美媒:歐盟幫了中國大忙

俄羅斯做出巨大讓步!中國30年心結(jié)了卻!美媒:歐盟幫了中國大忙

深析古今
2026-04-27 19:09:13
不想訪華了?特朗普聯(lián)手27國針對中國,話音剛落,中方制裁令下達

不想訪華了?特朗普聯(lián)手27國針對中國,話音剛落,中方制裁令下達

天天熱點見聞
2026-04-26 07:20:20
055大驅(qū)直接發(fā)射鷹擊-20,當(dāng)著七國的面開火,解放軍反制穩(wěn)控南海

055大驅(qū)直接發(fā)射鷹擊-20,當(dāng)著七國的面開火,解放軍反制穩(wěn)控南海

策前論
2026-04-27 19:31:37
個人收款被查了!2026年個人收款高于這個數(shù),要小心!

個人收款被查了!2026年個人收款高于這個數(shù),要小心!

新浪財經(jīng)
2026-04-21 22:04:32
賀子珍的親弟弟因犯錯被槍決,毛主席為何無法挽救他的生命?

賀子珍的親弟弟因犯錯被槍決,毛主席為何無法挽救他的生命?

老謝談史
2026-04-27 19:21:16
兩性關(guān)系:55-65歲這十年,惜命最好的方式,不是鍛煉,做好這6點

兩性關(guān)系:55-65歲這十年,惜命最好的方式,不是鍛煉,做好這6點

三農(nóng)老歷
2026-04-13 17:10:06
震驚!公安部長李震深夜神秘消失,尸體竟在地下管道被發(fā)現(xiàn)!

震驚!公安部長李震深夜神秘消失,尸體竟在地下管道被發(fā)現(xiàn)!

鑒史錄
2026-04-26 04:47:29
圖片報:停賽讓孔帕尼非常惱火;通過手機進行溝通同樣被禁止

圖片報:停賽讓孔帕尼非常惱火;通過手機進行溝通同樣被禁止

懂球帝
2026-04-27 19:53:36
東風(fēng) - 31 泄密大案:總工程師被美色策反,國之重器險遭滅頂之災(zāi)

東風(fēng) - 31 泄密大案:總工程師被美色策反,國之重器險遭滅頂之災(zāi)

干史人
2026-04-18 13:44:12
大數(shù)據(jù)分析,在中國,找個身高1米7年入20萬的老公,到底有多難?

大數(shù)據(jù)分析,在中國,找個身高1米7年入20萬的老公,到底有多難?

深度報
2026-04-18 23:37:27
2026-04-27 20:12:49
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11698文章數(shù) 117048關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

受賄數(shù)額特別巨大、搞權(quán)色交易 副部級王中和被判17年

頭條要聞

受賄數(shù)額特別巨大、搞權(quán)色交易 副部級王中和被判17年

體育要聞

最抽象的天才,正在改變瓜迪奧拉

娛樂要聞

黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

財經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態(tài)度原創(chuàng)

教育
時尚
藝術(shù)
手機
數(shù)碼

教育要聞

定了!北京又一所學(xué)校官宣放春假!部分學(xué)校今日開始連休9天

伊姐周日熱推:電視劇《重案解密》;電視劇《21世紀(jì)大君夫人》......

藝術(shù)要聞

你絕對想不到,攝影能讓她成為女神!

手機要聞

OPPO Find X9s Pro評測:輕薄旗艦機,裝下哈蘇雙2億“大視界”

數(shù)碼要聞

蘋果折疊iPad項目或僅停留在實驗階段 配約20英寸屏幕

無障礙瀏覽 進入關(guān)懷版