国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

一個頂級 AI 產(chǎn)品經(jīng)理的自我修養(yǎng) | 42章經(jīng)

0
分享至

播客對談原長度 22000 字,本文稿整理后 8000 余字。本文嘉賓 Hidecloud 也是我們 AI 私董會成員,歡迎點(diǎn)擊文章底部的閱讀原文或掃碼,獲取報名鏈接(里面也有目前已加入的成員名單,和 4 月 13 日即將進(jìn)行的線下活動情況,可點(diǎn)擊查看)


光年之外最近在做什么?

曲凱:應(yīng)該很多人都會好奇 光年之外 最近都在做些什么?

Hidecloud:最近我們發(fā)布了一個 AI 驅(qū)動的兒童繪畫產(chǎn)品,叫 Dodoboo,將小朋友的幾筆涂鴉自動優(yōu)化成一張比較精美的圖畫,激發(fā)孩子的創(chuàng)造力和自信心。

我們在這件事上做了一些小的創(chuàng)新。市面上已有的涂鴉增強(qiáng)產(chǎn)品,大部分是需要你先寫一個 prompt 再畫畫。但我們的目標(biāo)人群是 5~10 歲的小朋友,讓他們寫 prompt 其實(shí)是不現(xiàn)實(shí)的,所以我們是讓他直接動筆畫就行了,不需要事先想自己要畫什么。這樣的話,在同類產(chǎn)品中我們表現(xiàn)還不錯。

曲凱:這類產(chǎn)品,它給用戶的那個點(diǎn)是什么?

Hidecloud:這個很有意思,我們的產(chǎn)品是做涂鴉增強(qiáng)的,我們本來認(rèn)為涂鴉本身就是 aha moment。后來工程師想到一個 idea,他說除了這邊畫畫,那邊 AI 出圖之外,是不是也應(yīng)該支持把 AI 生成的圖再拖過來,進(jìn)行二次創(chuàng)作?

后來他自己就把這個功能給做了。實(shí)際做出來之后,我們發(fā)現(xiàn)了一些新的嗨點(diǎn)。

把生成的圖拖過來,基于生成的圖又生成了一張新的,再拖過來再生成新的,你會發(fā)現(xiàn)那個畫越變越美,細(xì)節(jié)越變越多,紋理越變越好,整個過程我們自己就能玩得特別嗨。

所以那個時候我意識到一件事:以前我們可能會覺得對于大模型應(yīng)用,都是人給它一個 prompt,但這個 prompt 是否一定要來自于用戶?我覺得是不一定的。

像我自己去年七八月份,看了很多產(chǎn)品之后,我當(dāng)時有個判斷:我很難想象兩三年之后有一款大規(guī)模流行的 AI C 端產(chǎn)品,它的主流使用場景是用戶拿著手機(jī)在那打字。因?yàn)榇蜃质欠浅O娜司Φ氖,成本太高了?/p>

所以當(dāng)時我在想,我一定要做低 prompt 甚至 0 prompt 的產(chǎn)品。像剛才我描述的那個場景,把一張圖拖過去再生成下一張圖,這就是一個幾乎 0 prompt 的過程,但它給你帶來的娛樂體驗(yàn)是非常有意思的。

曲凱:我覺得你剛才講的這個場景就是非常產(chǎn)品經(jīng)理的一個點(diǎn),因?yàn)閺募夹g(shù)上來看,完全可以做到不用拖,它就自己去不斷地生成。

Hidecloud:這里面有兩個感悟。

一個是在交互這件事上。其實(shí)有時候像這樣一些人機(jī)交互的機(jī)會是藏在代碼里的,比如在工程上,其實(shí)非常好實(shí)現(xiàn) “自動迭代 10 輪”。但我們發(fā)現(xiàn),當(dāng)把這個過程展開,讓人參與進(jìn)來的時候,這個過程本身就是具備消費(fèi)價值的。

這其實(shí)就非常需要產(chǎn)品和工程之間有緊密的結(jié)合,你要理解整個的運(yùn)作過程,你才能知道這其中哪一部分是可以抽離出來的,哪一部分是人可以以適當(dāng)?shù)姆绞絽⑴c進(jìn)去的。這其中會有很多值得挖掘的點(diǎn)。

還有一個點(diǎn)在于,像我剛才描述的那個場景,從一張草稿變?yōu)橐粡埦赖漠嬜鳎瑢ξ襾碚f消費(fèi)的是過程,但對于我身邊的同事來說,他們欣賞的是內(nèi)容本身。

所以,AIGC 里,G (Generate) 和 C (Content) 都是具備消費(fèi)價值的。我覺得最終不一定是每個人都來 G,有可能是少部分人來 G,而絕大部分人是來消費(fèi) C 的。只不過我們需要思考怎樣用一個合適的形式,讓用戶參與進(jìn)來,不管消費(fèi)的是最終的產(chǎn)物,還是過程本身。

今年 toB、toC 都會有現(xiàn)象級的產(chǎn)品出來了

曲凱:做了半年多的 AI 產(chǎn)品,現(xiàn)在的你對于 AI 的理解和之前有哪些區(qū)別?

Hidecloud:行業(yè)內(nèi)一直有一種說法,閉源模型永遠(yuǎn)會領(lǐng)先開源模型。但從我們自己的實(shí)踐來看,最近半年,整個開源社區(qū)的進(jìn)展是異常的夸張。每個星期都像過年一樣。整個學(xué)術(shù)界和產(chǎn)業(yè)界對于開源社區(qū)的貢獻(xiàn),已經(jīng)超過了我在半年前我對我所能夠利用的 AI 能力的想象。

當(dāng)然你也可以說這不算什么,閉源的某公司擁有更強(qiáng)大的模型能力,但我覺得 so what? 如果現(xiàn)有的開源社區(qū)已經(jīng)提供了足夠好用的模型能力,我為什么還一定要追求最強(qiáng)大的呢?

曲凱:我理解你的意思是,現(xiàn)在的各種開源模型、開源算法,其實(shí)相當(dāng)于產(chǎn)品經(jīng)理的彈藥庫。有的人有原子彈,但也無所謂,平時也用不上,只要夠用就足夠了。所以目前你的彈藥庫里大概都有哪些東西?

Hidecloud:比如先從我們最熟悉的語言模型開始說起。

從整個開源社區(qū)的角度來看,有兩個比較主流的方向,一個是 Llama 2,另一個是 Mistral。市場上絕大部分 fine-tuned 的版本都是基于它們兩個做的。

另外,在視覺語言模型方面,開源社區(qū)里也有非常多好用的。

比如 LLaVA,它是基于 Llama 的視覺語言模型,可以用它做一些圖片描述,F(xiàn)在只要給它一張圖,它便能夠給出非常 detail 的圖片描述,我有時候甚至都沒能注意到這個圖上居然還有這個細(xì)節(jié),這在半年前都是想都不敢想的技術(shù)。

圖像方面的話,在 Stable Diffusion 生態(tài)里,有兩個我覺得是去年比較重要的工作。一個是 ControlNet,另一個是去年年底的 LCM (Latent Consistency Model) 技術(shù),它核心解決的是效率的問題。

以前就算你有 4090 的卡,跑一張圖也得至少 10 秒,但是有 LCM 之后,它可以把出圖的時間直接壓縮到毫秒級別。

像以前的一些圖像生成場景,可能需要二十幾秒的延遲。但誰能想到半年的時間,就已經(jīng)可以做到毫秒級出圖,這在產(chǎn)品中的想象空間就變大了很多。

視頻和聲音方面,像 Pika、ElevenLabs 這種最頂尖的商業(yè)產(chǎn)品,它們的大部分模型能力,都能在開源社區(qū)中找到對應(yīng)的方案。當(dāng)然這其中可能需要一些界面上的包裝、模型間的微調(diào)。

曲凱:但既然彈藥庫里已經(jīng)有這么多武器了,也能更低成本、更高質(zhì)量地完成了,為什么在過去半年里,我們沒有看到更多像妙鴨這樣的爆款應(yīng)用出來?

Hidecloud:這個問題非常有意思。

我覺得這一波 AI,不光是要站在用戶需求和商業(yè)視角上做產(chǎn)品,更多是要去理解模型的能力邊界。我很 buy in 王小川提過的一個觀點(diǎn):上一代產(chǎn)品經(jīng)理解決的是 PMF,即產(chǎn)品和市場的 fit,這一代產(chǎn)品經(jīng)理還要先解決 TPF,即產(chǎn)品和技術(shù)的 fit。

我上周末做了一個 AI 行業(yè)的分享,分享的對象是行業(yè)里一幫頂尖的,彼此認(rèn)識了快 10 年的產(chǎn)品人。說實(shí)話我的分享只是一些很基礎(chǔ)的,關(guān)于 stable diffusion 底層原理的認(rèn)識,但即使是這樣,對于這批頂尖的產(chǎn)品同學(xué)來說,大家仍然會覺得這是很嶄新的認(rèn)知。

所以我自己有一個很大的感受是,絕大部分人,只是保持了一種興奮、震驚,但真的去理解整個學(xué)術(shù)界和工業(yè)界進(jìn)展的同學(xué),是非常少的。AI 火了一年了,但是你看有多少人真的入行搞 AI 了?至于真的去理解每個月的技術(shù)進(jìn)展,最新模型的能力邊界、原理的人,就更少了。

所以我覺得這也是為什么過去半年,沒有出來那么多新東西的原因。

曲凱:他們是沒有去理解最底層的這些技術(shù),還是他們沒有及時讀 paper 去理解最新的技術(shù)?

Hidecloud:都有。

曲凱:為什么是產(chǎn)品經(jīng)理要來讀這些東西?因?yàn)橄褚郧斑@些技術(shù)問題似乎都交給 CTO 去做就好了。

Hidecloud:現(xiàn)在的產(chǎn)品大都比較薄。我自己對現(xiàn)在產(chǎn)品的定義是 model as a product,即 model 本身的輸入和輸出,決定了產(chǎn)品整體的交互。

當(dāng)然我們不排除未來 AI Native 的產(chǎn)品會越做越深,model 在其中的占比會越來越低。但至少在當(dāng)下,模型能力還和變戲法一樣,它本身對用戶來說就已經(jīng)很新鮮、很有價值了,那這個時候產(chǎn)品經(jīng)理如果不能去理解模型的能力邊界的話,你就很難去把它和用戶需求連接起來。

我見過有的團(tuán)隊(duì),尤其是在大廠里,產(chǎn)品、技術(shù)和模型分三家,然后他們?nèi)揖头路鹪诟艨諏υ,產(chǎn)品也不知道模型能做什么,技術(shù)也不知道產(chǎn)品這邊到底想滿足什么樣的用戶需求。

曲凱:這是不是也能解釋,為什么現(xiàn)在很多很好的產(chǎn)品是小團(tuán)隊(duì)做出來的?

Hidecloud:對,產(chǎn)研之間的配合需要非常緊密。

曲凱:我理解肯定是有相當(dāng)大比例的人存在這些問題,不管是組織結(jié)構(gòu)跟不上,還是他日常的學(xué)習(xí)習(xí)慣跟不上。但肯定也還是有一小撮人是很優(yōu)秀的,但他們目前也沒有 deliver 出什么成果。你覺得其它的一些阻礙是什么?

Hidecloud:還有一個阻礙點(diǎn)在于,現(xiàn)在的互聯(lián)網(wǎng)已經(jīng)不是 20 年前的互聯(lián)網(wǎng)了。消費(fèi)者不管是在效率方面的需求,還是娛樂方面的需求,都更深了。你要去競爭的是抖音,是 Office。那現(xiàn)在的 model as a product 本身還太淺了,沒法兒立刻滿足這些復(fù)雜的用戶需求。

曲凱:有道理,Albert () 之前也跟我提過,他探索 AI 游戲的時候,也會問自己一個問題:為什么大家不去玩王者榮耀?

Hidecloud:簡單來說,如果抖音是 100 分,那我們現(xiàn)在有 10 個 AI 產(chǎn)品在競爭,最低分 30 分,最高分 50 分,你競爭過了所有人,也競爭不過抖音。

曲凱:雖然整體的體驗(yàn)是 30 分,但有沒有可能有一個點(diǎn),我就是為了它而來,這個點(diǎn)可能在某一個維度上達(dá)到了 100 分?

Hidecloud:這對某些人群來說是成立的。

比如我一直在 track C.AI 的付費(fèi)率,我發(fā)現(xiàn)有一個非常穩(wěn)定的人群,這半年以來,這個人群的續(xù)費(fèi)率始終保持在 94%。

但核心的問題在于這個人群的規(guī)模有限,很難破圈。如果要找一個更通用的點(diǎn),目前這個行業(yè)還沒有找到。

但現(xiàn)在的 AI 產(chǎn)品也冒出了一些好的苗頭,像我兩個前同事做的產(chǎn)品,一個是 Answer.AI,一個出海教育產(chǎn)品,另一個是 AiPPT,這倆產(chǎn)品的粘性都非常好,如果去細(xì)究產(chǎn)品,你會發(fā)現(xiàn)它不是單純的 model as a product,它里面有很多其它的設(shè)計(jì)。

曲凱:我覺得現(xiàn)在的產(chǎn)品處于兩個極端。

一種是 90% 的 model,10% 的傳統(tǒng)功能,這一類大家就會覺得很薄,更多是一個玩法,可能突然火一下,就消失了。另一種像你舉的 AiPPT,我覺得是反過來的,它可能 90% 是舊有的東西,只有 10% 用到了 AI。

但大家期待的似乎是比較偏中間的那種,一半的模型,一半的產(chǎn)品,這樣又有一些神奇的能力,又不會顯得太薄。

Hidecloud:我個人不太喜歡在這種事情上下定義。

從歷史上看,產(chǎn)品的形態(tài)往往是由行業(yè)演進(jìn)而來的,并不是規(guī)劃出來的。并不是我們說最好是一半一半就一定是一半一半,它是被市場教育、被用戶牽引,最后形成了一個情況。很難說什么是最好的。

曲凱:對,但這里涉及到一些問題,我想先問下你,你認(rèn)為未來的大模型產(chǎn)品是否是端到端分離的?公司是不是一定要自己有模型、訓(xùn)模型?

Hidecloud:這個問題我最近有一些相對成型的想法了。

我不認(rèn)為現(xiàn)在所有做應(yīng)用的團(tuán)隊(duì),一定要從零開始 pre-train 一個模型,但我認(rèn)為團(tuán)隊(duì)一定要具備操縱模型的能力。

操縱模型是指,你能根據(jù)業(yè)務(wù)需求,用不同的數(shù)據(jù)重新引導(dǎo)這個模型,不管是通過 fine-tuning 還是 LoRA,還是做模型的裁剪、蒸餾,你要具備這些能力。

曲凱:對,回到剛才的問題,如果是模型能力很重要的話,那就是模型能力強(qiáng)的人有更好的產(chǎn)品表現(xiàn)。像現(xiàn)在那幾個大模型公司拿了這么多錢,它們可以隨便招幾個人做個產(chǎn)品矩陣。

另外一種情況是,如果是模型占比不高的話,那就是傳統(tǒng)的大企業(yè) + AI 是更有效的。

所以這兩條線是大家比較 buy in 的,要么是傳統(tǒng)大公司 + AI,要么是賭模型,在模型公司里面做應(yīng)用,但在中間,創(chuàng)業(yè)公司做產(chǎn)品到底能做成什么樣子,以及最后是否會像移動互聯(lián)網(wǎng)一樣,能把所有東西都重做一遍,這可能是大家還不那么確定的。

從你的角度看,你相信未來所有東西都能被重做一遍嗎?

Hidecloud:你看移動互聯(lián)網(wǎng)的時候,大家一開始想到的都是,我去做一個移動的 Google、移動的淘寶,但最后發(fā)現(xiàn),移動的 Google、移動的淘寶,都是它們自己做出來的,并沒有被另外一個公司取代。

真正起來的東西是抖音、是小紅書,這些都是 PC 時代沒有的。

所以我覺得這一波 AI,不一定什么東西都要重新做一遍。會有很多場景,隨著 AI 本身滲透率提高,能慢慢涌現(xiàn)出一些之前從沒出現(xiàn)過的需求。

曲凱:你們內(nèi)部在試的過程中,有發(fā)現(xiàn)什么類似的新需求嗎?

Hidecloud:很難說,但讓我去 bet 的話,在兩三年左右的時間里,我非?春妙愃 C.AI 的情感陪伴類的場景。

原因是我做了一些相關(guān)的實(shí)驗(yàn),然后我突然意識到了一件事情,人類的情感太容易被 hack 了!

我當(dāng)時用 GPT-4V 模型做了一個很簡單的 demo:它會讀取你手機(jī)中最近的幾張照片,并輸出為圖片描述,然后將圖片描述發(fā)送給另外一些我用 GPT 做的 agents,這些 agents 是各種人設(shè),比如我的朋友、我的粉絲,這些 agents 看到我的圖片描述之后,會像評論朋友圈那樣給我留言。

后來我覺得光夸我也沒意思,就又做了幾個黑我的,以及幾個進(jìn)一步幫我辯護(hù),幫我回懟的。

你想,整個過程,想法是我的想法,agents 的人設(shè)是我寫的,整體 pipeline 是我搭的,我是一個全知全能的上帝視角,理論上我對于它們輸出的內(nèi)容是有心理預(yù)期的,我不應(yīng)該會被它們所影響。但當(dāng)我第一次運(yùn)行這整個 workflow 的時候,我看到這些 agents 在下面有的夸我、有的黑我、有的維護(hù)我的時候,我的內(nèi)心真的被扯動了。

我之前也會看一些經(jīng)典的心理學(xué)實(shí)驗(yàn),看的時候覺得不可思議:怎么人類的情緒就那么容易被操控了呢,但當(dāng)我自己親身經(jīng)歷完,當(dāng)時那一下我就覺得,人類的情感太容易被 hack 了。

你想,如果是一個普通用戶,他無法知道這背后的原理,他甚至?xí)X得這是真的。

所以我相信基于 AI 的情感陪伴一定是一個非常大的機(jī)會,人太容易對一個東西產(chǎn)生情感依賴了。

曲凱:你們這幾個月在摸索的過程中,感覺現(xiàn)在 AI 產(chǎn)品核心遇到的幾個問題是什么?

Hidecloud:成本是蠻大的問題。以前做互聯(lián)網(wǎng)創(chuàng)業(yè),尤其是近幾年,工程層面的開銷,幾乎在整體成本當(dāng)中可以忽略不計(jì)了,但 AI 產(chǎn)品不一樣。

曲凱:這是不是最大的一個區(qū)別啊?因?yàn)槲覀円苍诹囊恍﹫F(tuán)隊(duì),大家總在好奇為什么看不到產(chǎn)品,但很多時候是,他們也做出 demo 了,但不敢放,因?yàn)榉懦鰜砜赡荞R上就燒光了。

Hidecloud:對對對,所以做 AI 產(chǎn)品,day one 就得收費(fèi)。

曲凱:今天的成本和半年前或者一年前相比,大概下降了多少?

Hidecloud:圖像領(lǐng)域相比半年前,大概降了 10 倍。

但仍然不夠。因?yàn)殡m然成本在下降,但需求在增加,生成的要求也變高了?赡茉诎肽昵,聊 10 句出一張圖就滿足了,但現(xiàn)在是希望用戶能一邊聊天,旁邊還有個圖像同時在動。

曲凱:回到剛才談到的成本問題是主要問題,還有其它的嗎?

Hidecloud:其它的我覺得就是實(shí)際的模型能力進(jìn)展,再給半年時間應(yīng)該差不多了。

像語言模型,按現(xiàn)在的需求來看已經(jīng)是完全夠用了。只不過在用語言模型的方式上,大家可能需要開闊下思路,比如不一定是單語言模型,可能是不同任務(wù)拆到一些不同等級的模型上,或者有時候同一個 query 可以是多個模型配合參與。

現(xiàn)在,語言模型和視覺語言模型我覺得都 ready 了,多模態(tài)模型可能還需要 3~6 個月的時間成熟,到時候可能也會再涌現(xiàn)出一些新的產(chǎn)品。

曲凱:所以按你的預(yù)期,今年我們是能看到一些新產(chǎn)品的?

Hidecloud:對,我還比較有信心。不管是 toB 還是 toC,今年應(yīng)該都會有一些現(xiàn)象級的產(chǎn)品出來了。

曲凱:因?yàn)槟阋矔芏嗤薪涣髀,你自己是偏樂觀還是偏悲觀的?

Hidecloud:我是短期偏謹(jǐn)慎吧,中長期樂觀。

曲凱:你這謹(jǐn)慎派也已經(jīng)很樂觀了,那我們今年可以好好期待一下。

產(chǎn)品經(jīng)理該如何學(xué) AI ?

曲凱:你之前做的那個產(chǎn)品經(jīng)理的分享中,還有沒有哪些核心的點(diǎn)是可以給大家總結(jié)下的?

Hidecloud:我大概講了 3 個方面。

第一個方面是關(guān)于 Stable Diffusion 的底層原理。而且我發(fā)現(xiàn),在你理解了原理之后,對于產(chǎn)品形態(tài)也會產(chǎn)生很多不一樣的認(rèn)知和想法。

比如我有提到一個點(diǎn),當(dāng)你把 Stable Diffusion 的底層原理理解透之后,其實(shí)你會發(fā)現(xiàn),它是一個從完全沒有信息意義、完全隨機(jī)的噪點(diǎn)中,通過不斷地降噪,從而提取出有信息意義的圖像的過程。

也就是說,假設(shè)有一個 xy 軸的平面空間代表了全世界所有的概念,Stable Diffusion 從中隨機(jī)取一個點(diǎn)就能還原出一個圖像。

這讓我想起我以前做推薦算法的那個時候,其實(shí)我們在刻畫用戶畫像上已經(jīng)能做得很精準(zhǔn)了,都不用是大廠,一個普通公司,只要有足夠的數(shù)據(jù),就能把用戶刻畫得足夠好。

現(xiàn)在最棘手的是,當(dāng)我圈出了用戶所有的喜好,但我試圖在內(nèi)容庫中去做匹配時,卻沒有足夠多適合的內(nèi)容推薦給他。

因?yàn)閮?nèi)容的供給目前是非常稀疏的。首先它不精準(zhǔn),其次它的供給有限,第一個是最靠近的,后面就越靠越遠(yuǎn)。

但當(dāng)你理解透了 Stable Diffusion 的底層原理,你再回過頭來想這件事,你會發(fā)現(xiàn)未來充滿想象——我無需在內(nèi)容庫中預(yù)先備好內(nèi)容,我只要描繪出來你喜歡什么,之后在你喜歡的那個空間里,我就能給他提供一個人一輩子所能消耗的無限的內(nèi)容供給。因?yàn)榭臻g是可以無限展開的,其中的每一個微小的點(diǎn)都能被 Stable Diffusion 還原成一張圖像、一段視頻,或者是任何你喜歡的形式。

如果你不理解它的底層原理,那你是沒有辦法去重新思考搜索、推薦,以及上一代我們所做的東西的。所以理解技術(shù)原理非常重要。

第二和第三個方面都是關(guān)于產(chǎn)品經(jīng)理應(yīng)該怎么學(xué) AI 的,核心就兩個點(diǎn):堅(jiān)持讀 paper 和自己多動手。

讀 paper 還是非常重要的。AI 還處在很早期的發(fā)展階段,我當(dāng)時總結(jié)過 Stable Diffusion 的發(fā)展歷史,整個時間線看下來也就只有 3 年的時間,所以基本上就是那八九篇經(jīng)典的 paper。全部讀完然后串在一起,整個原理你就了解了。

可能再過 5~10 年,當(dāng)很多事情變成常識了以后,懂不懂原理區(qū)別不大。但在當(dāng)下來說,讀 paper 是能帶來極大的信息增量的。

曲凱:你讀是精讀嗎?

Hidecloud:我會把 paper 分成兩大類。

一類是范式型創(chuàng)新,另一類是雕花型創(chuàng)新。雕花型的我一般就快讀,只看其中的亮點(diǎn),看它在雕什么花,通過什么方法、提升了什么點(diǎn),范式型創(chuàng)新我都是會細(xì)讀的。

我現(xiàn)在一天基本上讀兩三篇左右。如果看到一篇論文有很多亮點(diǎn),就很有那種精神上的爽感。

讀 paper 還有一個好處,它真的能幫你在產(chǎn)品設(shè)計(jì)和技術(shù)改造上帶來直接的收益。

比如上次我讀到的一篇,它里面提到了六七個不同的優(yōu)化點(diǎn),我一看,靠,這個點(diǎn)我們可以直接拿來用,那個點(diǎn)我們也可以拿來用。其實(shí) paper 并沒有那么神秘,里面的很多優(yōu)化點(diǎn)也并不都是算法上的,而就是傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品工程上的一些優(yōu)化設(shè)計(jì),怎么做擴(kuò)展、怎么用空間換時間、內(nèi)存換速度等。

第三個方面是一定要自己多動手。

就算你完全不會寫代碼,像 Hugging Face 上的 demo、paper 里的 demo、GitHub 里的小項(xiàng)目,很多也都是可以直接體驗(yàn)的,你就盡可能都去體驗(yàn)一遍。

體驗(yàn)分為很多種,最簡單的就是在本機(jī)上跑 demo。要么就是你 Windows 本機(jī)有個 Nvidia 顯卡,要么你在 Mac 上面,比如你只要是 M 系列的芯片,然后有個 32G 的內(nèi)存,絕大部分的模型都能跑得起來,7B、13B 的版本是完全沒問題的。

這種實(shí)際的動手體驗(yàn)其實(shí)是找感覺的一部分,因?yàn)楫?dāng)你只是去看別人的講解、公眾號的文章,你自己是沒有那種很實(shí)際的體感的。

我記得我第一次在本地把大語言模型跑起來的時候,跑起來的那一下,就是你看到自己的這個電腦開始吐字的時候,那種感受非常不一樣的。

曲凱:Hello World 的那種感覺?

Hidecloud:對,非常震撼,會刺激你產(chǎn)生非常多對產(chǎn)品的想象。

另外如果你稍微具備一點(diǎn)點(diǎn)代碼能力,你就可以多去做一些小實(shí)驗(yàn),去滿足一些自己的想法。整個過程你能 get 到其實(shí)模型的運(yùn)營并沒有想象中那么簡單,但中間的很多環(huán)節(jié),都是有潛在的產(chǎn)品機(jī)會的。

比如我在調(diào)配模型的時候,突然發(fā)現(xiàn)這個模型出來的結(jié)果很有趣,但普通用戶不能直接用,因?yàn)檫@中間涉及到非常多的數(shù)據(jù)預(yù)處理環(huán)節(jié)。比如給用戶做聲音克隆,中間有七八步的聲音預(yù)處理,那普通用戶根本用不了。但這就是產(chǎn)品機(jī)會,你可以幫他把數(shù)據(jù)預(yù)處理環(huán)節(jié)壓縮成一個訓(xùn)練過程,直接給用戶 deliver 最終的結(jié)果。

如果你沒有自己去實(shí)際體驗(yàn),首先你感受不到最終結(jié)果出來的那奇妙的一刻,其次你也根本不知道要做的和最終的結(jié)果之間有哪些步驟、哪些障礙。

所以多體驗(yàn) demo、多 build,培養(yǎng)的是你整體的認(rèn)知,以及讓你去思考在產(chǎn)品、工程上還有哪些機(jī)會。

AI 行業(yè)還是太早期了,你做一點(diǎn)微小的工作,都能給你帶來非常大的回報,ROI 很高的。

AI 時代,產(chǎn)品與技術(shù)的配合會發(fā)生哪些變化?

曲凱:AI 時代的產(chǎn)品經(jīng)理,跟技術(shù)側(cè)到底該怎么合作?

Hidecloud:像我們在研究文生圖的時候,就發(fā)現(xiàn)了一個新的產(chǎn)研配合范式。

在 Stable Diffusion 生態(tài)里有兩個非常出名的 WebUI,一個是 AUTOMATIC1111,另一個是 ComfyUI。我主要在用 ComfyUI 工作。它可以簡單理解為由大量的 node 節(jié)點(diǎn)組成的 workflow。它的 input 可以是一段文字,也可以是一張圖,output 通常是一張圖,所以只需要根據(jù)需求搭建出 workflow,便可將其直接導(dǎo)出為 API。

這就和之前的開發(fā)方式截然不同。

以前的開發(fā)方式是產(chǎn)品經(jīng)理先大致梳理出業(yè)務(wù)流程和預(yù)期結(jié)果,再和負(fù)責(zé)模型、算法的工程師去溝通,但這在 AI 時代是非常不現(xiàn)實(shí)的。

首先因?yàn)榧夹g(shù)本身更新太快,其次在生產(chǎn)過程中有很多參數(shù)和細(xì)節(jié)是需要去調(diào)整的。所以如果還是按以前的開發(fā)方式,產(chǎn)品經(jīng)理和工程師之間 back and forth 的溝通就太長了。

但現(xiàn)在有了 ComfyUI,我可以自己改 config,比如這個效果不好,我可以立馬改個參數(shù)重新跑,這個反饋基本上是實(shí)時的。

以前做偏后端的業(yè)務(wù)邏輯功能的產(chǎn)品經(jīng)理,過度依賴于后端公司去實(shí)現(xiàn),而現(xiàn)在可能就是通過搭建一個 workflow,一個 pipeline,就解決了。

曲凱:所以你覺得以后產(chǎn)研配合會變成什么樣子?

Hidecloud:以前的產(chǎn)品經(jīng)理之所以依賴工程師,是因?yàn)橛泻芏鄻I(yè)務(wù)邏輯必須通過代碼語言去實(shí)現(xiàn)。而現(xiàn)在來看,至少可以通過某些工具,將自然語言直接轉(zhuǎn)變?yōu)?workflow 的形式。

甚至,未來大模型可以直接把自然語言轉(zhuǎn)變成業(yè)務(wù)邏輯的抽象表達(dá),可能是一些可視化的 pipeline,也可能是另外一種標(biāo)記型的語言。

所以以后的業(yè)務(wù)邏輯部分,可能會完全由 PM 和運(yùn)營自己搞定,工程團(tuán)隊(duì)會更關(guān)注如何做并發(fā)、做性能、做擴(kuò)展等更后端的工作。

曲凱:現(xiàn)在有人說 AI 時代一定得是懂技術(shù)的產(chǎn)品經(jīng)理,你怎么看?

Hidecloud:我覺得這是一個階段性的機(jī)會。在這兩年時間里,很多 best practice 還沒有變成行業(yè)常識,你比別人先理解它,你就有優(yōu)勢。但也許兩三年之后,所有這些都變成常識了,那到時候也許也不一定非要懂技術(shù)。

曲凱:招聘上呢,你們大概喜歡招什么樣的人?

Hidecloud:很難說,因?yàn)闃颖咎×,所以現(xiàn)在是聊到合適的就 ok。

但大體上首先要對 AI 有熱情,跟你聊到一些常見的 AI 產(chǎn)品,你得用過,有一些對這些產(chǎn)品的觀察和思考。

不過即便是這點(diǎn)要求,在面試過程中我們發(fā)現(xiàn)也很難達(dá)到。像我們用 Perplexity, ChatGPT 等,不管是在 prompt engineering 還是在提問的形式上,都能總結(jié)出很多小技巧。但在面試中,我會發(fā)現(xiàn)大家的整個體驗(yàn)深度還是非常淺的。比如我就問一下你有沒有創(chuàng)建過自己的 GPTs,可能 10 個人我能刷掉 9 個,大家還是不太愿意動手,只喜歡看別人輸出,但你自己一動手,那個信息量比你看 10 篇文章都大。

曲凱:最后,all in AI 了大半年,現(xiàn)在感受怎么樣?仍然覺得是塞班之后最大的機(jī)會嗎?

Hidecloud:我現(xiàn)在其實(shí)信心更足,這個確實(shí)沒有看錯,真的就是移動互聯(lián)網(wǎng)之后的第二次大機(jī)會。

最后,如果你對我們的 AI 私董會感興趣,可點(diǎn)擊閱讀原文或者掃描下方二維碼,獲取報名鏈接(里面也有目前已加入的成員名單,歡迎點(diǎn)擊查看)

活動預(yù)告:

以下是部分目前已確認(rèn)出席的嘉賓(排名不分先后):

1. Tony,萬興科技產(chǎn)品創(chuàng)新中心總經(jīng)理

2. Tyra,某手機(jī)大廠 AI 產(chǎn)品總監(jiān)

3. Frank Chen,GenWorld 創(chuàng)始人

4. Shawn,bud 聯(lián)合創(chuàng)始人

5. Risa,bud CEO & 聯(lián)合創(chuàng)始人

6. Joshua,林間聊愈室 APP 創(chuàng)始人

7. Neil,安克創(chuàng)新首席信息官

8. 邱迪,咔神創(chuàng)始人

9. 張瀚,招銀總行數(shù)字金融發(fā)展辦公室,創(chuàng)新孵化經(jīng)理

10. Tristan,幻境游戲(奇點(diǎn)時代)創(chuàng)始人

11. Jacky,Signoo 創(chuàng)始人

12. Leo,Signoo CTO

13. Nathan Hsu,PLAUD AI Co-founder & CEO

14. Charles Liu,PLAUD AI Co-founder & CTO

15. 王豪,引力引擎創(chuàng)始人

16. 楊成,circolo 聯(lián)合創(chuàng)始人/CTO,前 Scale.ai 高管

17. 張曉輝,LOOI 創(chuàng)始人

18. Clear,超參數(shù)聯(lián)創(chuàng) CSO

19. Rolan,頭部游戲工作室 AI 負(fù)責(zé)人

20. 李亞飛,ShowMeBug 創(chuàng)始人

21. 某科技影像公司技術(shù)負(fù)責(zé)人

42章經(jīng)

思考事物本質(zhì)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
全身而退!北京一家5口完美套現(xiàn)24億,臨走前又坑了甘肅國資一把

全身而退!北京一家5口完美套現(xiàn)24億,臨走前又坑了甘肅國資一把

文史旺旺旺
2025-12-27 18:22:03
曝安徽“女神”卡友王迪去世,僅37歲,友人曝原因,名下三輛德龍

曝安徽“女神”卡友王迪去世,僅37歲,友人曝原因,名下三輛德龍

裕豐娛間說
2025-12-28 00:07:11
廣州跌出幸福感!曾經(jīng)600萬的房子,我300萬抄底!

廣州跌出幸福感!曾經(jīng)600萬的房子,我300萬抄底!

樓市滅霸
2025-12-17 19:11:08
還敢DNP嗎?楊瀚森復(fù)出追平姚明!半場27分都沒轍!

還敢DNP嗎?楊瀚森復(fù)出追平姚明!半場27分都沒轍!

柚子說球
2025-12-29 09:42:48
追覓科技業(yè)績暴漲,創(chuàng)始人俞浩:全體員工年終獎勵黃金

追覓科技業(yè)績暴漲,創(chuàng)始人俞浩:全體員工年終獎勵黃金

南方都市報
2025-12-28 13:58:08
勇士127-141猛龍!無奈的不是輸球,而是庫里在賽后的一番表態(tài)

勇士127-141猛龍!無奈的不是輸球,而是庫里在賽后的一番表態(tài)

魚崖大話籃球
2025-12-29 09:51:11
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
匯率大反擊!人民幣暴漲刷屏

匯率大反擊!人民幣暴漲刷屏

魏家東
2025-12-28 13:32:39
徐湖平被查后,文物圈的逃亡大戲開場了

徐湖平被查后,文物圈的逃亡大戲開場了

阿天愛旅行
2025-12-28 21:00:35
6000萬理財巨虧超80%,上市公司緊急報警,證監(jiān)局出手,實(shí)控人父子承諾兜底

6000萬理財巨虧超80%,上市公司緊急報警,證監(jiān)局出手,實(shí)控人父子承諾兜底

21世紀(jì)經(jīng)濟(jì)報道
2025-12-28 09:46:34
第4次性別大戰(zhàn)!前溫網(wǎng)男單亞軍2-0女單世界第1 第2盤連贏5局逆轉(zhuǎn)

第4次性別大戰(zhàn)!前溫網(wǎng)男單亞軍2-0女單世界第1 第2盤連贏5局逆轉(zhuǎn)

我愛英超
2025-12-29 06:29:26
今冬最冷時間表出爐了,啥時候最冷?2026年春節(jié)冷不冷?早了解

今冬最冷時間表出爐了,啥時候最冷?2026年春節(jié)冷不冷?早了解

阿龍美食記
2025-12-27 18:45:06
寶馬網(wǎng)紅銷冠張?jiān)鐾貞?yīng)試行“一口價”賣車:10天定出15臺,壓縮利潤但省時

寶馬網(wǎng)紅銷冠張?jiān)鐾貞?yīng)試行“一口價”賣車:10天定出15臺,壓縮利潤但省時

紅星資本局
2025-12-28 21:39:13
國民黨中央委員選舉結(jié)果出爐,朱立倫狂喜,要拿捏鄭麗文?

國民黨中央委員選舉結(jié)果出爐,朱立倫狂喜,要拿捏鄭麗文?

叮當(dāng)當(dāng)科技
2025-12-28 04:57:08
為何越南至今難翻身?79年撤軍前許世友下的3個命令,實(shí)在太高明

為何越南至今難翻身?79年撤軍前許世友下的3個命令,實(shí)在太高明

歷史龍?jiān)w
2025-12-28 08:20:09
醫(yī)院主任實(shí)名怒批張水華:人家生完孩子的都沒調(diào)休 比你更不容易

醫(yī)院主任實(shí)名怒批張水華:人家生完孩子的都沒調(diào)休 比你更不容易

念洲
2025-12-27 09:55:35
《老舅》大結(jié)局:華為二公主果真帶資進(jìn)組了,觀眾:史上最強(qiáng)植入

《老舅》大結(jié)局:華為二公主果真帶資進(jìn)組了,觀眾:史上最強(qiáng)植入

娛樂故事
2025-12-28 11:28:10
豆瓣幾乎零差評的15本書,你看過其中幾本?

豆瓣幾乎零差評的15本書,你看過其中幾本?

北大博雅講壇
2025-12-28 09:04:40
“聽話,趕緊去柬埔寨和大鵝旅游!”這波操作太魔幻

“聽話,趕緊去柬埔寨和大鵝旅游!”這波操作太魔幻

胡嚴(yán)亂語
2025-12-26 15:08:03
深圳工廠經(jīng)營困難,不找客戶找員工麻煩:上班看手機(jī)開除零賠償!

深圳工廠經(jīng)營困難,不找客戶找員工麻煩:上班看手機(jī)開除零賠償!

搗蛋窩
2025-12-28 08:27:45
2025-12-29 10:04:49
42章經(jīng) incentive-icons
42章經(jīng)
創(chuàng)投圈第一自媒體
58文章數(shù) 138關(guān)注度
往期回顧 全部

科技要聞

五年之約到期,小米:林斌擬減持20億美元

頭條要聞

臺媒用突襲式描述解放軍對臺演習(xí) 臺相關(guān)部門保持靜默

頭條要聞

臺媒用突襲式描述解放軍對臺演習(xí) 臺相關(guān)部門保持靜默

體育要聞

MVP概率達(dá)82.5%!約基奇連超大鳥喬丹

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財經(jīng)要聞

貴金屬“牛市”能否跨年

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

親子
本地
教育
房產(chǎn)
公開課

親子要聞

一個孩子只有他開心了才會開竅,網(wǎng)友:說得真好!

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

教育要聞

2026年高考這個素材值得積累,私信我哈

房產(chǎn)要聞

降維打擊!三亞CBD驚現(xiàn)“豪宅新王”,高端局要變天了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版