国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

存算一體芯片,會成為AI計算的原子彈嗎?

0
分享至

國產(chǎn),存算一體,基于 12nm 工藝制程,在 Int8 數(shù)據(jù)精度下實(shí)現(xiàn)高達(dá) 256TOPS 的物理算力,典型功耗低至 35W,能效比高達(dá) 7.3Tops/W,高計算效率、低計算延時、低工藝依賴……

這是5月10日 ,后摩智能正式發(fā)布的首款存算一體智駕芯片鴻途?H30的關(guān)鍵參數(shù),是不是讓你眼前一亮?

△后摩智能創(chuàng)始人兼CEO吳強(qiáng)

這款芯片的關(guān)鍵詞有兩個——“存算一體”和“智駕”。

后者并不陌生,且已有特斯拉FSD、英偉達(dá)Orin、地平線征程5等代表產(chǎn)品。因此,想要在這些產(chǎn)品中留下印象,“存算一體”是關(guān)鍵。

1

什么是存算一體?

存算一體這個概念最早可以追溯到上個世紀(jì),沒有很快興起主要有兩個原因:

一是當(dāng)時存算一體雖然可以解決部分性能提升問題,但能解決的部分在整個系統(tǒng)中只占10%-20%,意義不大。更重要的一點(diǎn)是,過去幾十年摩爾定律還在持續(xù)被驗(yàn)證,行業(yè)并不需要架構(gòu)的創(chuàng)新,只需要每一到兩年升級一代芯片工藝,就能實(shí)現(xiàn)性能的快速提升和成本的同步降低。

但隨著摩爾定律逐漸走到盡頭,以及近幾年云計算和人工智能應(yīng)用的快速發(fā)展,數(shù)據(jù)洪流撲面而來,數(shù)據(jù)搬運(yùn)慢、搬運(yùn)能耗大等問題成為了計算的關(guān)鍵瓶頸。

△馮諾依曼架構(gòu)示意圖

在經(jīng)典的馮諾依曼架構(gòu)中,數(shù)據(jù)存儲與數(shù)據(jù)處理在物理上是兩個相互分離的單元,在數(shù)據(jù)處理過程中,處理器與存儲器之間需要不斷地通過數(shù)據(jù)總線交換數(shù)據(jù)。

從下圖不難看出,算力發(fā)展速度遠(yuǎn)超存儲器,導(dǎo)致存儲器的數(shù)據(jù)訪問速度愈發(fā)跟不上處理器的數(shù)據(jù)處理速度,后者性能與效率受到嚴(yán)重制約,這就是我們常說的“存儲墻”。

△截圖來自《存算一體芯片技術(shù)及其最新發(fā)展趨勢》

另外,從處理單元外的存儲器提取數(shù)據(jù),搬運(yùn)時間往往是運(yùn)算時間的成百上千倍,整個過程的無用能耗大概在60%-90%之間,能效非常低!肮膲Α保瑯映蔀榱讼拗菩酒l(fā)展的因素。

解決數(shù)據(jù)在計算單元和存儲單元之間頻繁的移動問題,成了深度學(xué)習(xí)加速的最大挑戰(zhàn)。

過去幾年,行業(yè)嘗試了多種方法,例如為了減少數(shù)據(jù)搬運(yùn)的大粒度的指令(集)或?qū)S弥噶睿、訪存優(yōu)化(替換/預(yù)取)、調(diào)度優(yōu)化、內(nèi)存/緩存壓縮、低擺幅電路、大緩存技術(shù)等;或是提高并行度的SIMD、SIMT、STMD、指令預(yù)測等技術(shù);還有降低數(shù)據(jù)進(jìn)度、使用新型封裝、器材或材料等方式,但都未能從根本上解決數(shù)據(jù)密集型算力的問題。

突破兩堵墻,依然是關(guān)鍵,此時,存算一體架構(gòu)開始重入行業(yè)視野。

2

以場景做選擇

存算一體可以簡單從字面理解為在存儲單元中潛入計算能力,以新的運(yùn)算架構(gòu)進(jìn)行二維和三維矩陣乘法/加法運(yùn)算,從本質(zhì)上消除不必要的數(shù)據(jù)搬移的延遲和功耗,大幅提高AI計算效率,降低成本。

從實(shí)現(xiàn)路徑上,雖然沒有統(tǒng)一的定義,但根據(jù)計算單元與存儲單元的關(guān)系主要有查存計算、近存計算、存內(nèi)計算和存內(nèi)邏輯,而目前行業(yè)中使用最多的是近存計算和存內(nèi)計算。

前者計算操作由位于存儲區(qū)域外部的獨(dú)立計算芯片/模塊完成,通過先進(jìn)的封裝方式以及合理的硬件布局和結(jié)構(gòu)優(yōu)化,增強(qiáng)二者間通信帶寬,增大數(shù)據(jù)傳輸速率,進(jìn)而提高數(shù)據(jù)處理效率。這種架構(gòu)設(shè)計的代際設(shè)計成本較低,適合傳統(tǒng)架構(gòu)芯片轉(zhuǎn)入。典型代表是AMD的Zen系列CPU,2021年年末,阿里達(dá)摩院推出基于SeDRAM的3D堆疊芯片也是采用了該技術(shù)路徑。

而存內(nèi)計算由位于存儲芯片/區(qū)域內(nèi)部的獨(dú)立計算單元完成,存儲和計算可以是模擬也可以是數(shù)字。

國外的Mythic,千芯、閃億、知存以及這次發(fā)布新產(chǎn)品的后摩智能都是這條路徑上的代表企業(yè)。

除了技術(shù)路徑,在存儲器選擇上,存算一體芯片也有兩個主要方向:

一、易失性存儲器,但在計算上具有突出的優(yōu)勢的,主要有SRAM靜態(tài)隨機(jī)存儲器和DRAM動態(tài)隨機(jī)存儲器;

二、非易失存儲器,在芯片的成本上具有一定優(yōu)勢的,主要有RRAM 阻變隨機(jī)存儲器、MRAM 磁性隨機(jī)存儲器、FeRAM 鐵電隨機(jī)存儲器、PCM 相變存儲器、FLASH 閃存等。

世上沒有完美的選擇,自然沒有一種存儲器具備在所有場景下的絕對優(yōu)勢。因此,芯片企業(yè)存儲器件的選擇,以及數(shù)字存算還是模擬存算的選擇,都與應(yīng)用場景密切相關(guān)。

△截圖來自《存算一體芯片技術(shù)及其最新發(fā)展趨勢》

對于把重點(diǎn)放在智駕的后摩,SRAM顯然是其最優(yōu)解。

3

以新型架構(gòu)擴(kuò)展算力

根據(jù)后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮介紹,后摩面向智能駕駛場景打造了專用 IPU(處理器架構(gòu))——天樞架構(gòu),采用多核、多硬件線程的方式擴(kuò)展算力。

一個芯片里有4個完全相同的IPU核,每個IPU核內(nèi)部,又由4個完全相同的Tile組成,每個Tile對應(yīng)一個或者多個硬件線程,每個Tile的內(nèi)部又包括了CPU、Tensor Engine、Special Function Unit, DMA和Vector Processor等,其中Tensor Engine就是由存算電路和一個Feature Buffer,還有相應(yīng)的一些控制電路組成,這些計算單元在CPU的統(tǒng)一調(diào)度下進(jìn)行計算。

“在SRAM電路旁邊,我們加入了一些定制化的電路結(jié)構(gòu),包括乘法器、加法數(shù)、累加器等,這些定制化的電路結(jié)構(gòu)和SRAM的電路整合在一起,就實(shí)現(xiàn)高效的存內(nèi)并行計算。存儲器單元中存儲的數(shù)據(jù),可以在同一時刻一起讀出來參與計算! 陳亮解釋說,“定制化的乘加電路和傳統(tǒng)的SRAM Bit Cell電路完全融合在一起,帶來更加規(guī)整的電路結(jié)構(gòu),因而就有更緊湊的電路設(shè)計,面積也就相應(yīng)減少了。不管是傳統(tǒng)的SRAM電路,還是定制化的計算電路,都是純數(shù)字的設(shè)計,因而不會有任何的計算誤差!

現(xiàn)場,陳亮還展示了后摩智能存算一體電路的一些技術(shù)參數(shù)與業(yè)界5nm工藝的對比。后摩這款芯片在采用相對更成熟的12納米制程后,按陳亮的說法,實(shí)現(xiàn)了“既要馬兒跑,又讓馬兒少吃草”的結(jié)果。

“我們已經(jīng)在28納米、22納米、16納米、12納米等不同工藝下進(jìn)行過流片和測試!

△后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮

據(jù)悉,目前鴻途?H30 已成功運(yùn)行常用的經(jīng)典CV網(wǎng)絡(luò)和多種自動駕駛先進(jìn)網(wǎng)絡(luò),包括當(dāng)前業(yè)內(nèi)最受關(guān)注的 BEV 網(wǎng)絡(luò)模型以及廣泛應(yīng)用于高階輔助駕駛領(lǐng)域的 Pointpillar 網(wǎng)絡(luò)模型。以鴻途?H30 打造的智能駕駛解決方案已經(jīng)在新石器的無人小車上完成部署,這也是業(yè)界第一次基于存算一體架構(gòu)的芯片成功運(yùn)行端到端的智能駕駛技術(shù)棧。

4

量產(chǎn),漫長的季節(jié)

本次發(fā)布會,后摩智能同步推出了基于鴻途?H30 芯片打造的智能駕駛硬件平臺——力馭?,CPU 算力高達(dá)200 Kdmips,AI算力達(dá)256Tops(INT8物理算力),支持多傳感器輸入。官方介紹,力馭?平臺功耗僅為 85W,可采用更加靈活的散熱方式,實(shí)現(xiàn)更低成本的便捷部署,有利于推動大算力智能駕駛場景的普及應(yīng)用。

此外,為了讓客戶擁有更好的產(chǎn)品使用體驗(yàn),后摩智能還基于鴻途?H30 芯片自主研發(fā)了一款軟件開發(fā)工具鏈——后摩大道?,支持 PyTorch、TensorFlow 、ONNX 等主流開源框架,編程兼容 CUDA 前端語法,同時支持 SIMD 和 SIMT 兩種編程模型,兼顧運(yùn)行效率和開發(fā)效率,以無侵入式的底層架構(gòu)創(chuàng)新保障了通用性的同時,進(jìn)一步實(shí)現(xiàn)了鴻途?H30 的高效、易用。

據(jù)后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭透露,鴻途?H30 將于6月份開始給 Alpha 客戶送測。同時,后摩智能的第二代產(chǎn)品鴻途?H50 已經(jīng)在全力研發(fā)中,將于2024年推出,支持客戶 2025年的量產(chǎn)車型。

△后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭

行業(yè)對大算力芯片需求的激增,給了后來者后摩智能迎頭趕上的空間,不到半年時間完成芯片流片、點(diǎn)亮到發(fā)布,后摩對于時代給予的機(jī)會展現(xiàn)出了十分積極的姿態(tài)。不過這還僅僅是開始,想要進(jìn)汽車供應(yīng)鏈,產(chǎn)品送測后還有定點(diǎn)、訂單、小規(guī)模試裝,然后才是規(guī)模量產(chǎn),量產(chǎn)后還要看終端的銷量……過程中的變數(shù)依然很大。

另一個重大課題,就是讓每一家科技公司都頭痛的工程交付。就像發(fā)布會現(xiàn)場一位下游需求方說的,“存算一體是個新的方向和嘗試,但關(guān)鍵要看量產(chǎn)落地的能力!

對于后摩,依然有一個“漫長的季節(jié)”,度過之后,將是另一片天地。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
原國家房改課題組組長孟曉蘇:建議叫停法拍房,有些法拍房折價50%,連帶周邊房價全面下跌

原國家房改課題組組長孟曉蘇:建議叫停法拍房,有些法拍房折價50%,連帶周邊房價全面下跌

臺州交通廣播
2026-01-11 13:19:25
重磅,上海大鯊魚裁掉弗格,新外援提上日程,趙繼偉戰(zhàn)青島迎復(fù)出

重磅,上海大鯊魚裁掉弗格,新外援提上日程,趙繼偉戰(zhàn)青島迎復(fù)出

體壇小快靈
2026-01-12 11:32:45
閃迪SSD將漲價超100%!且必須全款

閃迪SSD將漲價超100%!且必須全款

快科技
2026-01-11 18:59:04
38920分!庫里父子總分超科比父子升歷史第二 僅輸詹姆斯父子

38920分!庫里父子總分超科比父子升歷史第二 僅輸詹姆斯父子

醉臥浮生
2026-01-12 11:57:13
第一批免簽去俄羅斯的中產(chǎn)傻眼了

第一批免簽去俄羅斯的中產(chǎn)傻眼了

風(fēng)向觀察
2025-12-16 18:26:08
聽完王皓現(xiàn)場指導(dǎo)林詩棟,終于明白,為什么王皓暫?偀o效了?

聽完王皓現(xiàn)場指導(dǎo)林詩棟,終于明白,為什么王皓暫?偀o效了?

卿子書
2026-01-12 08:53:07
“女性偉哥”,來了

“女性偉哥”,來了

中國新聞周刊
2026-01-09 20:47:07
官媒怒批后,一天時間,閆學(xué)晶再迎2大噩耗,這次,她真的要哭了

官媒怒批后,一天時間,閆學(xué)晶再迎2大噩耗,這次,她真的要哭了

叨嘮
2026-01-10 21:54:58
皇馬2-3巴薩!維尼進(jìn)球被換下,誰是丟冠罪魁?賽后數(shù)據(jù)給出答案

皇馬2-3巴薩!維尼進(jìn)球被換下,誰是丟冠罪魁?賽后數(shù)據(jù)給出答案

小火箭愛體育
2026-01-12 08:00:41
溫州一企業(yè)給20年老員工發(fā)純金獎牌,已有超過百人獲得獎勵,獲獎?wù)咧薪^大部分為一線員工

溫州一企業(yè)給20年老員工發(fā)純金獎牌,已有超過百人獲得獎勵,獲獎?wù)咧薪^大部分為一線員工

三湘都市報
2026-01-10 15:57:57
揚(yáng)威亞洲!韓媒盛贊U23國足:黃金一代!中國隊真要進(jìn)世界杯嗎?

揚(yáng)威亞洲!韓媒盛贊U23國足:黃金一代!中國隊真要進(jìn)世界杯嗎?

國足風(fēng)云
2026-01-11 21:49:11
上觀新聞:安東尼奧的丑陋踢法符合中國足球?qū)嶋H

上觀新聞:安東尼奧的丑陋踢法符合中國足球?qū)嶋H

懂球帝
2026-01-11 22:32:27
51年,彭老總下狠心槍決周總理女婿,總理急電:罪不致死押回國內(nèi)

51年,彭老總下狠心槍決周總理女婿,總理急電:罪不致死押回國內(nèi)

談古論今歷史有道
2026-01-09 09:30:03
美聯(lián)儲主席鮑威爾回應(yīng)遭刑事調(diào)查:將繼續(xù)恪守職責(zé)

美聯(lián)儲主席鮑威爾回應(yīng)遭刑事調(diào)查:將繼續(xù)恪守職責(zé)

界面新聞
2026-01-12 08:44:33
特朗普發(fā)文自稱“委內(nèi)瑞拉代總統(tǒng)”,他在“空軍一號”上發(fā)表講話:無論如何都要拿下格陵蘭島,如果影響到北約,那也沒辦法

特朗普發(fā)文自稱“委內(nèi)瑞拉代總統(tǒng)”,他在“空軍一號”上發(fā)表講話:無論如何都要拿下格陵蘭島,如果影響到北約,那也沒辦法

每日經(jīng)濟(jì)新聞
2026-01-12 11:56:19
12月狂賣6.5萬輛,到底誰在買特斯拉Model Y?

12月狂賣6.5萬輛,到底誰在買特斯拉Model Y?

川雨玩車
2026-01-11 23:10:20
中航官宣殲10CE無傷擊落多架戰(zhàn)機(jī),印度無從狡辯,歐美俄哀嚎一片

中航官宣殲10CE無傷擊落多架戰(zhàn)機(jī),印度無從狡辯,歐美俄哀嚎一片

嘯鷹評
2026-01-11 12:48:25
給孩子發(fā)壓歲錢,記得:2數(shù)不發(fā),3人不給,4事不做,開心過年,這可不是迷信

給孩子發(fā)壓歲錢,記得:2數(shù)不發(fā),3人不給,4事不做,開心過年,這可不是迷信

美食格物
2026-01-11 16:24:12
U23國足掀翻澳洲!董路:李鐵4年前用同一招輸日本1個球 卻被網(wǎng)暴

U23國足掀翻澳洲!董路:李鐵4年前用同一招輸日本1個球 卻被網(wǎng)暴

風(fēng)過鄉(xiāng)
2026-01-12 08:04:27
專題片剖析唐仁健案:組建“周末愉快”微信群,每到周末就召老板們吃喝

專題片剖析唐仁健案:組建“周末愉快”微信群,每到周末就召老板們吃喝

澎湃新聞
2026-01-11 20:44:28
2026-01-12 12:28:49
智車星球 incentive-icons
智車星球
服務(wù)智能汽車創(chuàng)業(yè)者
96文章數(shù) 44關(guān)注度
往期回顧 全部

科技要聞

小米二手車價大跳水:SU7半年跌5萬元

頭條要聞

媒體:美國"不演了" 特朗普直白表態(tài)震驚世界

頭條要聞

媒體:美國"不演了" 特朗普直白表態(tài)震驚世界

體育要聞

聰明的球員,不是教練教出來的

娛樂要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項目騙局

汽車要聞

"家轎之王"變帥了 東風(fēng)日產(chǎn)全新軒逸量產(chǎn)下線

態(tài)度原創(chuàng)

健康
房產(chǎn)
手機(jī)
數(shù)碼
公開課

血常規(guī)3項異常,是身體警報!

房產(chǎn)要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

手機(jī)要聞

2026年第一款真全面屏來了!紅魔11 Air官宣

數(shù)碼要聞

Khadas公布Mind Go概念:筆記本、平板、帶屏迷你主機(jī)三合一

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版