国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Nebius推出Token Factory,提供大規(guī)模生產(chǎn)AI推理

0
分享至

Nebius推出了Token Factory(詞元工廠),這是一個(gè)生產(chǎn)推理平臺(tái),使垂直人工智能(AI)公司和數(shù)字企業(yè)能夠大規(guī)模部署和優(yōu)化開(kāi)源和定制模型,并具有企業(yè)級(jí)的可靠性和控制能力。

Token(詞元)在人工智能領(lǐng)域,是AI 理解語(yǔ)言的最小“單元”。它把人類(lèi)語(yǔ)言(句子、段落)分解成 AI 能看懂的小塊,每塊就是一個(gè) token。AI 通過(guò)處理這些token 來(lái)理解、生成、回答問(wèn)題。


基于Nebius的全棧人工智能基礎(chǔ)設(shè)施,Nebius Token Factory將高性能推理、后訓(xùn)練和細(xì)粒度訪問(wèn)管理整合到一個(gè)單一的治理平臺(tái)中。它支持所有主要的開(kāi)放模型,包括DeepSeek、OpenAI的GPT-OSS、Llama、NVIDIA Nemotron和Qwen,并為客戶(hù)提供托管自己模型的選項(xiàng)。

隨著人工智能從實(shí)驗(yàn)轉(zhuǎn)向生產(chǎn),依賴(lài)封閉模型可能會(huì)造成擴(kuò)展瓶頸。開(kāi)源和定制模型可以消除這些障礙,釋放創(chuàng)新和更好的經(jīng)濟(jì)性,但對(duì)于大多數(shù)團(tuán)隊(duì)來(lái)說(shuō),在生產(chǎn)中管理和保護(hù)它們?nèi)匀皇菑?fù)雜和資源密集型的。

Nebius Token Factory通過(guò)將開(kāi)放模型的靈活性與大規(guī)模運(yùn)行人工智能所需的治理、性能和成本效益相結(jié)合,使團(tuán)隊(duì)能夠?qū)崿F(xiàn)這些優(yōu)勢(shì)。它針對(duì)效率進(jìn)行了優(yōu)化,提供亞秒級(jí)延遲、自動(dòng)擴(kuò)展吞吐量和99.9%的正常運(yùn)行時(shí)間,即使對(duì)于每分鐘超過(guò)數(shù)億個(gè)請(qǐng)求的工作負(fù)載也是如此。


Nebius的聯(lián)合創(chuàng)始人兼首席業(yè)務(wù)官Roman Chernin表示:“每個(gè)團(tuán)隊(duì)都有獨(dú)特的要求,他們希望在不繁重工作的情況下實(shí)現(xiàn)速度、可靠性和成本效益。”“我們建立NebiusToken Factory不僅是為了服務(wù)模型,也是為了幫助客戶(hù)解決真正的挑戰(zhàn)和進(jìn)行規(guī)模工程——優(yōu)化推理管道,將開(kāi)放模型轉(zhuǎn)化為生產(chǎn)就緒系統(tǒng)?!?/p>

全棧人工智能基礎(chǔ)設(shè)施作為基礎(chǔ)

Nebius Token Factory建立在Nebius AI Cloud 3.0“以太坊”之上。這確保了企業(yè)級(jí)的安全性、主動(dòng)監(jiān)控和一致的性能,并通過(guò)包括MLPerf推理在內(nèi)的基準(zhǔn)測(cè)試進(jìn)行了驗(yàn)證。通過(guò)將Nebius的全棧基礎(chǔ)設(shè)施與針對(duì)推理進(jìn)行優(yōu)化的技術(shù)棧相結(jié)合,NebiusToken Factory幫助客戶(hù)更快地?cái)U(kuò)展其AI應(yīng)用程序和解決方案。

SemiAnalysis首席分析師Dylan Patel表示:“在SemiAnalysis,我們跟蹤每個(gè)GPU云播放器的總擁有成本。Nebius是唯一一個(gè)使用定制ODM機(jī)箱的新云,這意味著總擁有成本大大降低。我們很高興看到他們的新推理平臺(tái)圍繞成本、每位用戶(hù)的輸出速度和模型質(zhì)量這一權(quán)衡三角進(jìn)行設(shè)計(jì)?!?/p>


人工智能項(xiàng)目形成規(guī)模通常比周?chē)膱F(tuán)隊(duì)更快。Nebius Token Factory簡(jiǎn)化了訓(xùn)練后的生命周期,將開(kāi)源模型權(quán)重轉(zhuǎn)化為優(yōu)化的、生產(chǎn)就緒的系統(tǒng),具有有保證的性能和透明的每個(gè)Token成本。集成的微調(diào)和蒸餾管道使團(tuán)隊(duì)能夠根據(jù)自己的數(shù)據(jù)調(diào)整大型開(kāi)放模型,同時(shí)將推理成本和延遲降低高達(dá)70%。

優(yōu)化后的模型可以立即部署到生產(chǎn)端點(diǎn),而無(wú)需手動(dòng)設(shè)置基礎(chǔ)設(shè)施。這種方法使人工智能構(gòu)建者和企業(yè)能夠更快地迭代,可預(yù)測(cè)地管理成本,并對(duì)所服務(wù)的每個(gè)Token保持完全透明。

Token Factory引入了團(tuán)隊(duì)和訪問(wèn)管理、單點(diǎn)登錄(SSO)、項(xiàng)目分離和以企業(yè)為中心的計(jì)費(fèi),以簡(jiǎn)化協(xié)作并確保合規(guī)性。管理員可以設(shè)置精細(xì)的角色,強(qiáng)制最低權(quán)限訪問(wèn),并在所有部署中維護(hù)清晰的審計(jì)跟蹤,從早期實(shí)驗(yàn)到關(guān)鍵任務(wù)工作負(fù)載。


Nebius Token Factory——主要特點(diǎn)

具有有保證的性能和隔離的專(zhuān)用端點(diǎn),具有99.9%的SLA、可預(yù)測(cè)的延遲和自動(dòng)擴(kuò)展的吞吐量。

歐盟或美國(guó)數(shù)據(jù)中心的零保留推斷,支持嚴(yán)格的數(shù)據(jù)駐留要求。

安全認(rèn)證,包括SOC 2 Type II,包括HIPAA、ISO 27001和ISO 27799認(rèn)證。

全面的微調(diào)功能支持LoRA和完整模型訓(xùn)練,實(shí)現(xiàn)無(wú)縫一鍵部署和托管。

支持40多種開(kāi)源模型,包括最新的Deep Seek、Llama、OpenAI和Qwen,針對(duì)最新芯片進(jìn)行了優(yōu)化。

通過(guò)設(shè)計(jì)進(jìn)行治理,包括團(tuán)隊(duì)和訪問(wèn)管理、SSO、統(tǒng)一計(jì)費(fèi)和審計(jì)友好的工作區(qū)。

OpenAI兼容的API,用于從專(zhuān)有端點(diǎn)無(wú)縫遷移。

可用性

Nebius Token Factory是Nebius AI Studio的下一代版本,經(jīng)過(guò)重新設(shè)計(jì),可用于企業(yè)就緒和完整的模型生命周期管理?,F(xiàn)已可用,支持60多個(gè)跨文本、代碼和視覺(jué)的開(kāi)源模型。當(dāng)前的AI Studio用戶(hù)將自動(dòng)升級(jí)到Token Factory。


關(guān)于Nebius

Nebius是一家為全球人工智能行業(yè)構(gòu)建全棧云基礎(chǔ)設(shè)施的技術(shù)公司。該公司總部位于荷蘭阿姆斯特丹,在納斯達(dá)克(Nasdaq:NBIS)上市,在歐洲、北美和以色列設(shè)有研發(fā)中心,業(yè)務(wù)遍及全球。Nebius AI Cloud是為密集型AI工作負(fù)載從頭開(kāi)始構(gòu)建的。憑借內(nèi)部設(shè)計(jì)的專(zhuān)有軟件和硬件,Nebius AI Cloud為AI構(gòu)建者提供了構(gòu)建、調(diào)整和運(yùn)行模型所需的計(jì)算、存儲(chǔ)、托管服務(wù)和工具。

與 Ai 時(shí)代前沿合作,將大門(mén)向更多普通用戶(hù)敞開(kāi)!無(wú)論你是對(duì)新技術(shù)充滿(mǎn)好奇心的愛(ài)好者,還是希望提升自己技能的職場(chǎng)人士,這里都有適合你的課程和資源。歡迎掃碼加入我們!


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突發(fā)重傷!再見(jiàn)了,湖人!三巨頭解體倒計(jì)時(shí)

突發(fā)重傷!再見(jiàn)了,湖人!三巨頭解體倒計(jì)時(shí)

籃球?qū)崙?zhàn)寶典
2025-12-27 23:56:50
一夜暴漲!杭州有人今早緊急出手30斤!“太瘋狂了,要小心……”

一夜暴漲!杭州有人今早緊急出手30斤!“太瘋狂了,要小心……”

環(huán)球網(wǎng)資訊
2025-12-27 15:10:57
官媒對(duì)成龍的稱(chēng)呼變了,三字之差釋放強(qiáng)烈信號(hào),王晶的話(huà)有人信了

官媒對(duì)成龍的稱(chēng)呼變了,三字之差釋放強(qiáng)烈信號(hào),王晶的話(huà)有人信了

振華觀史
2025-12-23 20:24:20
全球汽零第一巨頭,攻入機(jī)器人腹地!

全球汽零第一巨頭,攻入機(jī)器人腹地!

投研邦V
2025-12-27 19:36:38
中方:納瓦羅言論極為卑劣,堅(jiān)決反對(duì)!

中方:納瓦羅言論極為卑劣,堅(jiān)決反對(duì)!

占豪
2025-12-27 23:01:20
持續(xù)發(fā)酵!特朗普最新發(fā)聲

持續(xù)發(fā)酵!特朗普最新發(fā)聲

環(huán)球時(shí)報(bào)國(guó)際
2025-12-27 23:59:47
支持中國(guó)分裂,拒飛內(nèi)地航線(xiàn),歧視大陸游客的國(guó)泰航空,如今怎樣

支持中國(guó)分裂,拒飛內(nèi)地航線(xiàn),歧視大陸游客的國(guó)泰航空,如今怎樣

小莜讀史
2025-12-15 21:00:06
成精了,石宇奇受傷后有頓悟,游擊打法2-0拉尼爾闖進(jìn)天王杯決賽

成精了,石宇奇受傷后有頓悟,游擊打法2-0拉尼爾闖進(jìn)天王杯決賽

真理是我親戚
2025-12-27 20:40:01
新加坡開(kāi)始對(duì)中國(guó)海南封關(guān)展開(kāi)反擊!

新加坡開(kāi)始對(duì)中國(guó)海南封關(guān)展開(kāi)反擊!

時(shí)分秒說(shuō)
2025-12-27 11:42:18
兒子在家啃老33年后自盡,母親收拾遺物時(shí),發(fā)現(xiàn)兒子的存款后傻眼

兒子在家啃老33年后自盡,母親收拾遺物時(shí),發(fā)現(xiàn)兒子的存款后傻眼

人間頌
2025-11-15 12:31:03
F-16擊落全部34枚導(dǎo)彈,“匕首”沒(méi)擊中目標(biāo)!確認(rèn)犧牲英雄身份

F-16擊落全部34枚導(dǎo)彈,“匕首”沒(méi)擊中目標(biāo)!確認(rèn)犧牲英雄身份

鷹眼Defence
2025-12-24 16:17:27
笑發(fā)財(cái)了!當(dāng)大學(xué)生從家?guī)Я顺缘娜ニ奚?,我要笑死在評(píng)論區(qū)!

笑發(fā)財(cái)了!當(dāng)大學(xué)生從家?guī)Я顺缘娜ニ奚?,我要笑死在評(píng)論區(qū)!

另子維愛(ài)讀史
2025-12-19 15:35:10
你的辦公搭子,要漲價(jià)了

你的辦公搭子,要漲價(jià)了

中國(guó)新聞周刊
2025-12-19 13:33:38
女性的私處哪種形態(tài)更好?女性陰部的形狀類(lèi)型有哪些?不妨來(lái)了解

女性的私處哪種形態(tài)更好?女性陰部的形狀類(lèi)型有哪些?不妨來(lái)了解

醫(yī)者榮耀
2025-12-25 12:05:06
美國(guó)過(guò)年,中國(guó)第三架殲36升空,樣子又變了,已進(jìn)入下一階段

美國(guó)過(guò)年,中國(guó)第三架殲36升空,樣子又變了,已進(jìn)入下一階段

頭條爆料007
2025-12-26 17:46:35
第3波救市還沒(méi)來(lái),房?jī)r(jià)就開(kāi)始沸騰了,漲幅不足20%,還不買(mǎi)房嗎!

第3波救市還沒(méi)來(lái),房?jī)r(jià)就開(kāi)始沸騰了,漲幅不足20%,還不買(mǎi)房嗎!

樓市味道
2025-12-27 21:17:05
一句“謝謝”,讓12歲的喬治王子意外站上輿論風(fēng)口

一句“謝謝”,讓12歲的喬治王子意外站上輿論風(fēng)口

全球奇趣娛樂(lè)八卦
2025-12-27 21:02:45
蔡斌賽前輕敵,老將仲慧許曉婷王唯漪無(wú)用!上海女排為何不用新人

蔡斌賽前輕敵,老將仲慧許曉婷王唯漪無(wú)用!上海女排為何不用新人

金毛愛(ài)女排
2025-12-27 22:43:26
成也飯圈敗也飯圈!看到被央視點(diǎn)名的孫穎莎,樊振東的話(huà)有人信了

成也飯圈敗也飯圈!看到被央視點(diǎn)名的孫穎莎,樊振東的話(huà)有人信了

璀璨幻行者
2025-11-18 10:47:31
和軍人離婚后,她成為央視名嘴,64歲定居北京農(nóng)村,享受田園生活

和軍人離婚后,她成為央視名嘴,64歲定居北京農(nóng)村,享受田園生活

素衣讀史
2025-12-25 17:10:53
2025-12-28 04:44:49
Ai時(shí)代前沿
Ai時(shí)代前沿
人工智能新聞動(dòng)態(tài)及應(yīng)用案例。
1607文章數(shù) 510關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱(chēng)終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線(xiàn) 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線(xiàn) 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂(lè)要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開(kāi)始拉物價(jià)了!

汽車(chē)要聞

好音響比大屏更重要?車(chē)企開(kāi)始“聽(tīng)”用戶(hù)的

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
家居
房產(chǎn)
公開(kāi)課

藝術(shù)要聞

驚艷!這件木雕美得讓人心動(dòng),絕對(duì)不容錯(cuò)過(guò)!

穿好雪地靴的4個(gè)訣竅,還挺有效!

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

房產(chǎn)要聞

年銷(xiāo)20億+!中交·藍(lán)色港灣用好房子致敬好生活

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版