国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

關(guān)于AMD ZEN 6,一些看法

0
分享至

公眾號記得加星標(biāo)??,第一時間看推送不會錯過。

12 月 12 日,AMD 更新了其技術(shù)文檔,并發(fā)布了“ AMD Family 1Ah Model 50h-57h 處理器的性能監(jiān)視器計數(shù)器”, InstLatX64首先注意到了這一點。

AMD尚未正式解釋AMD Family 1Ah Model 50h-57h處理器的具體信息,但這份文件的文件名是“69163-VenicePMC-pub.pdf”,這清楚地表明它是一款Venice處理器——也就是基于Zen 6架構(gòu)的EPYC處理器。我(指代本文作者)認為可以肯定地說,這是首份關(guān)于Zen 6內(nèi)部配置的文件。

從性能監(jiān)控計數(shù)器中了解到的事實

什么是性能監(jiān)視器計數(shù)器?它記錄 CPU 的內(nèi)部性能狀態(tài),并在使用名為 Profiler 的信息采集工具分析性能時使用(包含此 Profiler 的分析工具名為“ AMD μProf Performance Analyzer ”)。

順便一提,AMD μProf 性能分析器是“ AMD μProf 開發(fā)工具” 的組件之一,并且可以免費使用。撰寫本文時,最新版本為 5.2 版,于 12 月 11 日發(fā)布,而上述文檔于次日發(fā)布,這意味著 Zen 6 架構(gòu)的支持預(yù)計將在下一個 μProf 版本(5.3 版?)中實現(xiàn)。

性能監(jiān)視器計數(shù)器并非 Zen 6 的新功能,它已經(jīng)推出一段時間了。EPYC 9005 系列(或 Zen 5 EPYC)的相關(guān)說明請參見本文檔。

到目前為止一切正常,但有一家網(wǎng)站開始聲稱,關(guān)于 Zen 6 兼容性能監(jiān)視器計數(shù)器的文檔,Zen 6 并非 Zen 5 的擴展,而是一種面向吞吐量的架構(gòu)。這篇文章來自 Tom's Hardware,隨后許多信息網(wǎng)站開始對此大肆宣傳,聲稱 Zen 6 的內(nèi)容與 Zen 5 有顯著差異。

你在 Zen 5 中一開始就用的是 8 格寬的布局嗎?

然而,我讀完之后,覺得情況并非如此。因此,我想更認真地審視一下這份文件。

首先,確定性能監(jiān)視器計數(shù)器的位置。

每個線程有 6 個性能事件計數(shù)器,每個 L3 復(fù)合體有 6 個性能事件計數(shù)器,每個數(shù)據(jù)結(jié)構(gòu)有 16 個性能事件計數(shù)器。

可以使用 RDPMC(讀取性能監(jiān)控計數(shù)器)命令讀取每個性能事件計數(shù)器。

RDPMC[5:0] 訪問核心事件,RDPMC[9:6,1B:10] 訪問數(shù)據(jù)結(jié)構(gòu)事件,RDPMC[F:A] 訪問緩存事件。

這是 Zen 5 和 Zen 6 的共同點。

接下來,我們比較一下通用性能統(tǒng)計數(shù)據(jù)(圖 1)。左側(cè)為 Zen 5,右側(cè)為 Zen 6。黃色表示變化,綠色表示新增內(nèi)容。核心本身并無特別變化,主要區(qū)別在于,當(dāng) L1 數(shù)據(jù)緩存填滿時,現(xiàn)在可以獲取更詳細的填充來源信息;除此之外,沒有其他區(qū)別。


第三部分是流水線利用率分析統(tǒng)計數(shù)據(jù)的比較(圖 2)。就指令流水線而言,左側(cè)是 Zen 5,右側(cè)是 Zen 6。


這里對“總派遣槽位”的解釋實際上有所不同(黃色部分),但可以確定這實際上是 Zen 5 方面的一個拼寫錯誤。

這是因為公式中明明寫著“一個周期內(nèi)最多可以分派 6 條指令”,但實際公式卻是“8 * 事件”,這顯然很奇怪。而且,這與 AMD 的解釋也不一樣。

圖 3 展示了 Zen 5 的內(nèi)部結(jié)構(gòu),這在去年的 Hot Chips 上已經(jīng)解釋過了。在前端的末尾,在 MicroOp 隊列下方,可以清楚地看到“Dispatch 8-wide”的字樣。


Tom's Hardware 的文章指出,Zen 6 將采用“面向吞吐量的寬設(shè)計,配備八槽調(diào)度引擎和同步多線程”,這讓人很難不聯(lián)想到 Zen 6 的 8 槽解碼結(jié)構(gòu)與 Zen 5 相同。因此,流水線似乎不會發(fā)生顯著變化。

但這并不意味著沒有改進的空間

兩者之間存在一些差異。例如,計數(shù)器 PMCx003(FP 退役的 SSE 和 AVX FLOPs)(圖 4)的有效值在 Zen 5(左側(cè))中被“保留”6-7 小時,但在 Zen 6(右側(cè))中則被分配給了 FP16 的“標(biāo)量半部分/打包半部分”。這表明 Zen 6 支持 Zen 5 不支持的 AVX512-FP16(打包 FP16)以及 FPU 中的 FP16(標(biāo)量 FP16)運算。


一個有趣的新增功能是 PMCx00F(FP 打包的 512 個微操作,由 FP 或 INT 類型退役)和 PMCx013(FP NSQ 讀取停頓)(圖 5)。


奇怪的是,PMCx00F 和 PMCx013 都未出現(xiàn)在 Zen 5 架構(gòu)中,但這可能只是因為當(dāng)時的技術(shù)尚未成熟。PMCx00F 用于監(jiān)控 512 位操作(即 AVX512 操作模式),而 NSQ 用于監(jiān)控非調(diào)度隊列的狀態(tài)。這兩個模塊在 Zen 6 之前就已經(jīng)存在(512 位 AVX512 操作在 Zen 5 架構(gòu)中就已經(jīng)實現(xiàn))。相反,PMCx18E(IC 標(biāo)簽命中/未命中事件)(圖 6)不知何故在 Zen 6 中被移除。


最明顯的區(qū)別在于 PMCx0AF(動態(tài)令牌調(diào)度停頓周期 2)(圖 7)。左側(cè)的 Zen 5 代架構(gòu)統(tǒng)一處理所有調(diào)度組,而右側(cè)的 Zen 6 代架構(gòu)則會檢查整數(shù)調(diào)度器 1-6 和 Retire 的令牌是否存在。這使得我們可以更詳細地監(jiān)控哪些調(diào)度器處于空閑狀態(tài)。


事實上,這里有六個調(diào)度器,由于上面的圖 2 中有一個拼寫錯誤,似乎有人做出了奇怪的解釋,認為 Zen 6 將 8-Wide 調(diào)度引擎分成了六個域,但請再看一下這里的圖 3。

在 Zen 5 架構(gòu)中,調(diào)度器已經(jīng)是 8 路寬。輸出的整數(shù)部分在進入調(diào)度器之前會被重命名,而調(diào)度器在 Zen 5 架構(gòu)中已經(jīng)是 6 路寬?;蛘吒_切地說,我唯一能理解的信息是,已經(jīng)實現(xiàn)了 6 個 ALU,并且計數(shù)器配置已更改,用于衡量這些 ALU 的調(diào)度效率。

順便一提,Zen 6 中已經(jīng)實現(xiàn)了這一點,這也意味著 Zen 5 和 Zen 6 之間這方面的結(jié)構(gòu)并沒有改變。

Zen 6 是 Zen 5 的改進版。

除此之外,我沒發(fā)現(xiàn)其他任何區(qū)別(就我所知)。簡而言之,雖然也有像 PMCx18E 這樣的例外,但目前 Zen 5 和 Zen 6 之間的主要區(qū)別在于 Zen 6 現(xiàn)在可以提供更詳細的性能計數(shù)器,并且 FPU/AVX512 增加了對 FP16 的支持。我從這份文檔中沒有找到任何關(guān)于設(shè)計策略根本性變化的信息。

我認為,結(jié)構(gòu)本身將與圖 3 幾乎相同。但是,我認為在改變結(jié)構(gòu)之前有很多事情可以做,例如改進將 x86 指令轉(zhuǎn)換為 MicroOps 的方法,改進調(diào)度器中的調(diào)度技術(shù),以及改進分支預(yù)測(目前還不清楚它們是否仍然基于 TAGE)。

即使現(xiàn)在,它仍然擁有相當(dāng)強大的流水線,包含 8 個指令解碼和 10 個指令分發(fā),但其性能是否得到充分利用仍值得商榷。下一代架構(gòu),即 Zen 7 及更高版本,可能會采用更廣泛的解碼和分發(fā)方式,但 Zen 6 架構(gòu)在 Zen 5 的基礎(chǔ)上朝著提升效率的方向發(fā)展,這似乎是合理的。

首先,吞吐量計算正是推土機架構(gòu)的核心設(shè)計理念,而推土機架構(gòu)過去曾遭遇慘敗,所以我認為AMD現(xiàn)在不會重蹈覆轍。此外,如今對吞吐量的重視主要集中在AI工作負載上,因此與其調(diào)整CPU流水線,不如直接安裝能夠高速執(zhí)行矩陣運算的加速器,例如AMX或(Arm的)SME2,這樣更便捷高效。

https://pc.watch.impress.co.jp/docs/column/tidbit/2073493.html

(來源:編譯自pcwatch)

*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點,半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達一種不同的觀點,不代表半導(dǎo)體行業(yè)觀察對該觀點贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。

今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4266期內(nèi)容,歡迎關(guān)注。

加星標(biāo)??第一時間看推送,小號防走丟

求推薦

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
網(wǎng)傳女子春節(jié)前五天結(jié)婚,朋友不能請假無法參加婚禮,她反而委屈

網(wǎng)傳女子春節(jié)前五天結(jié)婚,朋友不能請假無法參加婚禮,她反而委屈

筆尖下的人生
2025-12-28 16:47:48
就在今天,威少一戰(zhàn)創(chuàng)造3紀錄,歷史第一!260萬底薪太超值了

就在今天,威少一戰(zhàn)創(chuàng)造3紀錄,歷史第一!260萬底薪太超值了

大西體育
2025-12-28 10:36:25
今日要聞!11月28號上午10點前,剛剛發(fā)生的最新消息!

今日要聞!11月28號上午10點前,剛剛發(fā)生的最新消息!

林子說事
2025-12-28 11:39:08
連Andrej Karpathy都慌了:AI編程的9級地震正在發(fā)生什么

連Andrej Karpathy都慌了:AI編程的9級地震正在發(fā)生什么

AI進化論花生
2025-12-27 11:26:15
上海行長陸振華:豢養(yǎng)32位女員工,專挑膚白貌美,個個死心塌地

上海行長陸振華:豢養(yǎng)32位女員工,專挑膚白貌美,個個死心塌地

凱裕說故事
2024-10-08 15:50:00
“漲到可怕了!”有人一覺醒來賺了18萬元!從業(yè)者:史詩級行情,這場面真沒見過

“漲到可怕了!”有人一覺醒來賺了18萬元!從業(yè)者:史詩級行情,這場面真沒見過

每日經(jīng)濟新聞
2025-12-27 17:57:08
無巧不成書,南博事件又解鎖一個新人物。

無巧不成書,南博事件又解鎖一個新人物。

生活魔術(shù)專家
2025-12-28 08:53:51
特朗普恐怕沒料到,大批軍火還沒運抵臺島,中方一招直打美國七寸

特朗普恐怕沒料到,大批軍火還沒運抵臺島,中方一招直打美國七寸

面包夾知識
2025-12-27 00:00:32
科學(xué)家最終確定:仙女座正在撞向銀河系,速度高達每秒300公里

科學(xué)家最終確定:仙女座正在撞向銀河系,速度高達每秒300公里

觀察宇宙
2025-12-19 21:59:03
大伯砸了我兒八萬鋼琴,我未吵鬧,一通電話讓他丟了三百萬年薪。

大伯砸了我兒八萬鋼琴,我未吵鬧,一通電話讓他丟了三百萬年薪。

戶外阿嶄
2025-12-27 16:56:20
明日沖擊17℃,冷空氣跨年夜抵達→

明日沖擊17℃,冷空氣跨年夜抵達→

上海預(yù)警發(fā)布
2025-12-28 10:28:43
蘿莉島內(nèi)幕曝光:克林頓與霍金竟暗藏不為人知的秘密!

蘿莉島內(nèi)幕曝光:克林頓與霍金竟暗藏不為人知的秘密!

舞指飛揚
2025-12-28 11:44:19
身在美國卻說和祖國不能分割,姜昆的圣誕離岸愛國秀,諷刺感拉滿

身在美國卻說和祖國不能分割,姜昆的圣誕離岸愛國秀,諷刺感拉滿

歷史總在押韻
2025-12-25 22:58:56
不再執(zhí)教全紅嬋?陳若琳生日,陳芋汐慶生,誰注意全紅嬋舉動

不再執(zhí)教全紅嬋?陳若琳生日,陳芋汐慶生,誰注意全紅嬋舉動

樂聊球
2025-12-28 11:46:04
曝安徽“女神”卡友王迪去世,僅37歲,友人曝原因,名下三輛德龍

曝安徽“女神”卡友王迪去世,僅37歲,友人曝原因,名下三輛德龍

裕豐娛間說
2025-12-28 00:07:11
他比黎智英更“毒”!潛伏30年,用510萬策劃香港暴亂,結(jié)局如何

他比黎智英更“毒”!潛伏30年,用510萬策劃香港暴亂,結(jié)局如何

云舟史策
2025-12-22 07:04:23
尿是黃色!金子也是黃色!德國男子為了提煉黃金,煮了五千升尿液

尿是黃色!金子也是黃色!德國男子為了提煉黃金,煮了五千升尿液

扶蘇聊歷史
2025-12-25 16:18:51
盧偉不地道!帶0分球員參加發(fā)布會,結(jié)果被攆走了,理由是沒資格

盧偉不地道!帶0分球員參加發(fā)布會,結(jié)果被攆走了,理由是沒資格

小樓侃體育
2025-12-28 17:03:55
原來他已去世13年!曾因春晚一夜爆紅,當(dāng)過局長,無兒無女太凄涼

原來他已去世13年!曾因春晚一夜爆紅,當(dāng)過局長,無兒無女太凄涼

小熊侃史
2025-12-28 11:00:51
突然!黃一鳴自曝和新男友分手,原因疑男友嫌她無法提供情緒價值

突然!黃一鳴自曝和新男友分手,原因疑男友嫌她無法提供情緒價值

小徐講八卦
2025-12-28 16:13:58
2025-12-28 17:27:00
半導(dǎo)體行業(yè)觀察 incentive-icons
半導(dǎo)體行業(yè)觀察
專注觀察全球半導(dǎo)體行業(yè)資訊
12566文章數(shù) 34734關(guān)注度
往期回顧 全部

數(shù)碼要聞

錯過“雙11”別急!年底買板U套裝價格同樣實惠

頭條要聞

環(huán)球:美媒一定程度上承認了“斬殺線”存在

頭條要聞

環(huán)球:美媒一定程度上承認了“斬殺線”存在

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

姚晨打卡絕版機位 高崎機場背后的遺憾

財經(jīng)要聞

英偉達的收購史

科技要聞

AR眼鏡第一案,究竟在爭什么?

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

旅游
教育
親子
本地
公開課

旅游要聞

廣東肇慶七星巖落羽杉紅葉醉人

教育要聞

“三年級就剩2個娃了”,老師曬農(nóng)村教育現(xiàn)狀:咋考都是前三名

親子要聞

90后魔丸寶媽帶娃的一天:我不是蛋神

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版