国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

初學者怎么入門大語言模型(LLM)?

0
分享至

最近發(fā)現(xiàn)一個非常好的學習資料,可以一次性的掌握從理論到從頭創(chuàng)建一個大模型,再到預訓練,SFT(有監(jiān)督微調),甚至到最后還有RAG以及Agent的搭建方式,非常的齊全。

就是這個Happy-LLM,Github將近10000星了,上升勢頭非??臁?/p>


由于下個學期可能需要講一些類似的內容,所以自己過了一遍,教程一共有7章,我把它分成了三個部分:1-4理論部分, 5-6大模型創(chuàng)建和訓練實踐,7大模型擴展應用。


學習過程中我總結出這么幾點學習經(jīng)驗:

  • 如果你是科班生,自學過NLP(自然語言處理)的相關內容,你可以跳過第一章,只是一些基礎概念知識;

  • 如果你還在讀研或者以后想要搞大模型相關的科研,建議多花點時間讀2,3章,因為這里面會有大量的數(shù)學公式以及模型介紹,非常的細,可以拿筆和本出來跟著算(模型魔改的Idea就從這里出了)

  • 如果你想了解LLM大模型訓練背后的流程,那么第四章一定要好好看

  • (有卡再看)第五章講的是如何用代碼搭一個Llama2出來,以及如何訓練,但即使是很小的模型,作者在8張Nvidia 4090的前提下,都花了46個小時。

  • (沒卡也能看)第六章適合窮人玩,從頭訓練一個大模型對于個人來說沒有特別大的意義,用已有的開源大模型做繼續(xù)訓練會更加適合普通人,這里面用的是Qwen的1.5B模型,對于一般的筆記本來說都沒什么問題,所以強推!

  • (第七章選讀)RAG,Agent的構建其實有更方便的手段,比如LLM框架LangChain,LazyLLM等。

所以總結下,要搞科研的,2,3,5必看,可以深入到算法層次;長見識的第四章看完足夠了;有錢有卡的大佬,可以著重看第五章,從頭訓練一個大模型,看著進度條一點點走,Loss一點點降是非常有成就感的。

話不多說,我來帶大家過一遍這個教程的核心內容。

第一章NLP基礎概念

大模型的最前身其實來自于NLP,現(xiàn)在大模型的很多任務,比如翻譯,回答,詞性分析啥的,最開始都是NLP的工作,并且這些工作單個拿出來都是NLP的細分研究方向。


這一章就是給歷史源頭講起,感興趣的同學可以看看,就當看歷史書了,可以對大模型能做的事情有一個理論性的認識。

第二章 Transformer 架構

這一章我上面提到了,如果有意向在這個方向搞科研的,一定得仔細看,因為不管怎么樣,Transformer這個東西你怎么都繞不過去,這里不學也得在別的地方學。


2.1部分會詳細的講注意力機制,特別是它的由來,從前饋神經(jīng)網(wǎng)絡(Feedforward Neural Network,F(xiàn)NN)到卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN),再到循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN),最后再分析他們各自的缺點。

也就是第一沒辦法捕獲長序列的相關關系以及第二限制并行計算能力。


這個部分的偽代碼建議仔細看看,講的很細致,還是那句話,你繞不開這塊的。


剩下的部分更多的是代碼實現(xiàn),就是一步步的教用代碼實現(xiàn)下面這個經(jīng)典的Transformer模型。


每一塊都會細致的講解以及附有代碼,所以多看幾次肯定能看懂的。

第三章 預訓練語言模型

這一章的內容非常有意義,因為它講了為什么ChatGPT以前的同類產(chǎn)品為什么沒有獲得如此大的影響,其實在ChatGPT之前還有Bert這個非常有名的模型,是Google做的,也是基于Transformer結構的(畢竟先Google發(fā)明了Transformer)。

并且將主流的結構分為了三種,并且列舉了對應的代表模型。


從表中可以看到,GPT用的是Decoder-only流派,也就是它的核心是“一邊讀一邊寫,專注于生成”,這也是GPT中G代表的Generative生成式的來源,所以也對應了GPT擅長的領域:續(xù)寫預測、長文本創(chuàng)作、對話等。

這一章也很推薦,畢竟流行趨勢這種東西輪流換,說不定過幾年其他流派又會興盛,徹底搞懂最好。

第四章 大語言模型

這一章再經(jīng)過1-3章的鋪墊,其實就很容易了,如果你已經(jīng)有基礎,其實可以直接從這張開始看。

它講的東西結構很清晰,主要分為了四部分:

4.1 LLM是什么

超大規(guī)模:參數(shù)≥數(shù)十億,在數(shù) T token上預訓練(GPT-3 175 B≈開端)。

與傳統(tǒng)PLM差異:同架構同任務,但規(guī)模引發(fā)“量變→質變”,呈現(xiàn)全新能力。

4.2 LLM的四大“看家本領”

  • 涌現(xiàn)(Emergence):模型越大,突然解鎖復雜技能。

  • 上下文學習(In-context Learning):用幾句話示范即可完成新任務,幾乎不用再微調。

  • 指令遵循(Instruction Following):理解自然語言指令,像 ChatGPT 那樣“一句喚醒,多步完成”。

  • 逐步推理(Step-by-Step Reasoning):能寫“思維鏈”,解決多步邏輯、數(shù)學與編碼問題。

4.3講了它的額外特性以及4.4從理論上講了大模型訓練的三個主要步驟,也就是下面的Pretrain,SFT和RLHF。


總結成表格就是下面的內容,這部分需要理解下,理解了之后就能搞懂為什么現(xiàn)在都說搞底模很吃虧,而是搞post-training+RL的路子見效最快這種說法。


第五章 動手搭建大模型

這章我之前提過,比較適合有卡有錢的玩家,因為我直接把這一章最后一部分內容給你拿出來。

你看作者在8張4090的前提下,還花了將近2天時間,后面的SFT階段又得24天,你要有卡我不攔著,你要是租我不建議。


所以這一章內容寫的非常詳細,但是并不適合大多數(shù)人,看看即可,不用細追究。

第六章 大模型訓練流程實踐

反而我建議大多數(shù)同學可以試試第六章,因為它是主要講“預訓練”模型的,也就是在已有的模型基礎上再訓練。


它里面會講到大模型時代非常重要的網(wǎng)站Huggingface以及它開發(fā)的一個庫Transformers。你只要會用這個庫,就可以基于全世界那些非常強的開源模型再創(chuàng)作,比如阿里的Qwen系列,甚至以后資源豐富了DeepSeek滿血版也不是不能自己去微調。


Happy-LLM就是用的Qwen2.5的1.5B版本做的微調


很詳細的教你怎么加載模型,查看模型結構等,都非常的實用。


接著還會講的SFT,也是現(xiàn)在小成本創(chuàng)新的主要渠道。


最后一部分完美收尾,用高效微調的方法收尾。


這一章非常的干貨,直接把微調的內容都放一起講了。

第七章 大模型應用

這一章簡要的講了下大模型的測評和基于它的RAG和Agent應用。


測評部分就當課外知識了解下即可。

RAG和Agent部分也是看看就行,因為有很多可以實現(xiàn)這種效果的框架,要更簡單,更好用。

比如LangChain


再比如LazyLLM,有中文文檔,支持幾行代碼就能構建一個常見的LLM應用。


最后總結,再重復下我的建議,要搞科研的,2,3,5必看,可以深入到算法層次;長見識的第四章看完足夠了;有錢有卡的大佬,可以著重看第五章,從頭訓練一個大模型,看著進度條一點點走,Loss一點點降是非常有成就感的;沒卡的也不用灰心,可以看看第六章,有很多的平臺都是支持你薅羊毛的,比如colab,微調個1.5B模型還是不在話下的,一般的筆記本本身也能跑。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
釘在恥辱柱上!國家文物局出手,這三個跳梁小丑,真的徹底涼涼了

釘在恥辱柱上!國家文物局出手,這三個跳梁小丑,真的徹底涼涼了

戶外阿嶄
2025-12-28 17:07:24
女卡車司機“半掛西施”去世后,網(wǎng)友分析網(wǎng)名,4個字竟字字應驗

女卡車司機“半掛西施”去世后,網(wǎng)友分析網(wǎng)名,4個字竟字字應驗

千言娛樂記
2025-12-28 20:02:42
苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

科普100克克
2025-12-07 18:20:34
美國國務院發(fā)火,要求中國大陸“必須停止”,島內一個時代或終結

美國國務院發(fā)火,要求中國大陸“必須停止”,島內一個時代或終結

三石記
2025-12-27 15:03:24
米蘭20天首勝!暫登頂意甲,10戰(zhàn)維羅納全勝,連刷4大紀錄

米蘭20天首勝!暫登頂意甲,10戰(zhàn)維羅納全勝,連刷4大紀錄

奧拜爾
2025-12-28 21:33:44
杭州姑娘“兔子警官”主動回應“哄孩子式執(zhí)法”:“他們需要外力推一下……”

杭州姑娘“兔子警官”主動回應“哄孩子式執(zhí)法”:“他們需要外力推一下……”

都市快報橙柿互動
2025-12-28 14:07:18
保定大量商戶突然關閉,整個街道冷冷清清

保定大量商戶突然關閉,整個街道冷冷清清

映射生活的身影
2025-12-27 18:09:05
統(tǒng)治澳洲!韓旭26分鐘12中9高效22+5 加盟6戰(zhàn)全勝狂勝138分

統(tǒng)治澳洲!韓旭26分鐘12中9高效22+5 加盟6戰(zhàn)全勝狂勝138分

醉臥浮生
2025-12-28 18:09:56
瓜子二手車發(fā)布榜單,保值排名出乎意料

瓜子二手車發(fā)布榜單,保值排名出乎意料

ZAKER新聞
2025-12-26 15:23:34
1960年春節(jié),周總理請溥儀吃飯,酒桌上溥儀講了個慈禧的“笑話”,總理聽完,當場陷入了沉思

1960年春節(jié),周總理請溥儀吃飯,酒桌上溥儀講了個慈禧的“笑話”,總理聽完,當場陷入了沉思

歷史回憶室
2025-12-24 10:29:12
香港男子命喪天水圍橋底,嫌疑人在深圳灣口岸落網(wǎng)!押回現(xiàn)場

香港男子命喪天水圍橋底,嫌疑人在深圳灣口岸落網(wǎng)!押回現(xiàn)場

南方都市報
2025-12-28 12:18:04
直擊:日本發(fā)生重大交通事故,67輛車連環(huán)撞,幸存者顫抖回憶慘烈現(xiàn)場……

直擊:日本發(fā)生重大交通事故,67輛車連環(huán)撞,幸存者顫抖回憶慘烈現(xiàn)場……

日本物語
2025-12-27 20:32:22
閃評丨澤連斯基訪美之際 普京再就俄烏沖突局勢表態(tài)

閃評丨澤連斯基訪美之際 普京再就俄烏沖突局勢表態(tài)

國際在線
2025-12-28 15:07:02
畸形兒風波反轉!醫(yī)院回應透露2個關鍵信息 闞清子的沉默早有預兆

畸形兒風波反轉!醫(yī)院回應透露2個關鍵信息 闞清子的沉默早有預兆

觀察鑒娛
2025-12-28 10:26:06
201米!40億!騰訊西南總部,世界“第一扭”摩天樓

201米!40億!騰訊西南總部,世界“第一扭”摩天樓

GA環(huán)球建筑
2025-12-25 23:00:32
羽球天王杯:銅牌誕生!世界第8復仇喬納坦,石宇奇首局7-11落后

羽球天王杯:銅牌誕生!世界第8復仇喬納坦,石宇奇首局7-11落后

劉姚堯的文字城堡
2025-12-28 20:01:00
61歲奧巴馬夫人暴瘦后“逆生長”,與前總統(tǒng)丈夫合照笑開了花

61歲奧巴馬夫人暴瘦后“逆生長”,與前總統(tǒng)丈夫合照笑開了花

艷兒說電影
2025-12-27 21:11:14
甚至來不及準備,湘超冠軍永州隊巡游花車為臨時切割公交車改造而成

甚至來不及準備,湘超冠軍永州隊巡游花車為臨時切割公交車改造而成

懂球帝
2025-12-28 16:35:07
廣東一小伙,因入住毛坯房而走紅,花費僅1萬,卻無一絲窮酸氣!

廣東一小伙,因入住毛坯房而走紅,花費僅1萬,卻無一絲窮酸氣!

阿離家居
2025-12-28 10:19:49
沖上熱搜!黃子韜因腦淤血接受開顱手術縫了43針,本人回應

沖上熱搜!黃子韜因腦淤血接受開顱手術縫了43針,本人回應

半島晨報
2025-12-28 18:04:45
2025-12-28 21:52:49
平凡AI incentive-icons
平凡AI
高校AI從業(yè)者
54文章數(shù) 23關注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財經(jīng)要聞

英偉達的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

房產(chǎn)
本地
親子
時尚
健康

房產(chǎn)要聞

降維打擊!三亞CBD驚現(xiàn)“豪宅新王”,高端局要變天了!

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

親子要聞

爸爸非常自責呢

2026年了,最好看還是這件大衣!

這些新療法,讓化療不再那么痛苦

無障礙瀏覽 進入關懷版