omniture

一级片在线播放-国产高清不卡-男女黄色片-国产精品黄色片-亚洲在线视频观看-日韩欧美偷拍-亚洲va在线-君岛美绪在线-69av在线播放-久久精品a-总裁憋尿呻吟双腿大开憋尿-成年人免费观看视频网站-人妻巨大乳hd免费看-在线观看中文字幕2021-比利时xxxx性hd极品

詳解:本土AI超節點元腦SD200如何率先實現token生成速度8.9ms

2025-11-10 11:19 1377

北京2025年11月10日 /美通社/ -- 近日,在2025人工智能計算大會上,浪潮信息公布,基于元腦SD200超節點AI服務器,DeepSeek R1大模型token生成速度僅需8.9毫秒,創造國內大模型最快token生成速度。


元腦SD200創新設計滿足低延遲推理需求

智能體時代的標志性特征是多模型協同與實時決策,每個智能體具備感知-決策-執行的閉環能力,涉及復雜的、多步驟的工作流,需要任務分解、自主決策以及持續的規劃和執行。在智能體推理的過程中,即使是單個推理步驟中的延遲也會在多步驟任務中被指數級放大,導致用戶體驗遲滯。因此,token生成速度正成為影響用戶評價的一個關鍵指標。

元腦SD200超節點AI服務器基于高帶寬、低延時、原生內存語義的開放總線協議,通過構建高性能交換單元打造3D Mesh高性能互連超擴展系統,支持64張本土AI芯片高密度算力擴展,能夠很好地滿足DeepSeek等大模型的低延遲推理需求,加快token生成速度。


  • 精簡互連協議:采用事務層-數據鏈路層-物理層三層精簡互連協議,事務層天然支持Load/Store內存語義;數據鏈路層支持基于信用的流控機制和鏈路級錯誤重傳保障;物理層建立10-12低誤碼率的高可靠物理通道,報文有效數據利用率達成96%以上。
  • 全局統一編址:為解決跨主機域通信難題,設計獨立于主機域的交換域全局地址空間,將多個獨立主機域下的GPU在交換域進行統一的顯存編址,為GPU互訪提供基礎保障。
  • 全局地址映射與數據路由:創新研發影子設備技術,通過影子設備將遠端GPU映射到本地主機域,實現所有獨立主機對全局GPU的顯存訪問,通過端口高效轉發技術實現跨主機P2P訪問。


定制通信算法深度適配元腦SD200

除了硬件方面的創新,浪潮信息AI團隊也針對DeepSeek、Kimi等模型的計算特征和元腦SD200的硬件架構特征,完成了通信庫、計算框架層面等多方面的優化,充分發揮了元腦SD200的計算性能,最終實現了低延遲推理。同時,也支持預填充-解碼 (Prefill-Decode) 分離推理,在滿足客戶業務場景SLO需求的基礎上提供更高性能。

通信庫層面,針對Allreduce、Allgather、Alltoall等典型通信算子,浪潮信息制定了與元腦SD200深度適配的通信算法。例如,對于Allreduce,為了充分發揮元腦SD200的低延遲優勢,專為Allreduce設計了分層算法策略:針對小數據量,采用全量收集,本地規約的低延遲定制One-Shot算法,旨在最小化GPU間的同步與通信開銷;針對大數據量,采用高吞吐的定制化環形算法,以徹底解決帶寬瓶頸并實現最優帶寬利用率。而對于模型應用中最常見的中等數據量,則采用兼顧延遲與帶寬的定制Two-Shot算法。浪潮信息更結合芯片緩存特性對此核心場景進行了深度優化:對中小數據量啟用無緩存方案以追求極致延遲;對中大數據量則啟用緩存方案,從而最大化吞吐效率。

實測數據表明,在64 GPU集群上進行DeepSeek R1 671B模型的BF16推理時,針對Batch Size為1的decode階段(其Allreduce數據量約為14 KB),優化后的算法將通信時延降低了5.8倍。此外,在16 KB至16 MB這一核心數據量區間內,定制優化算法的通信時延相較于未優化前的實現降低了1.6至5.8倍;與傳統scale-out系統相比,時延降低幅度則進一步擴大至4.5至12.7倍。

全方位框架優化保障計算低延遲

框架層面,浪潮信息AI團隊完成了并行方式、算子融合、多流水線等多方面優化,來保證計算的低延遲。

首先,在并行方式上,選擇了整網的張量并行。在此并行模式下,通過模型均勻切分實現了設備間計算負載的完全均衡、各個計算板卡之間計算的完全并行和同步,消除了流水線氣泡與負載不均衡問題。同時,元腦SD200的高帶寬、低延遲確保了AllReduce、AllGather等通信算子性能的大幅提升,使得通信時間大幅下降,從而實現了超低延遲的推理性能。

其次,在算子上,實現了極致的算子融合等優化。GPU的計算速度遠遠超過了內存帶寬的訪問速度,從內存中讀寫數據的時間成本,大部分時候比實際進行計算的時間成本還要高。算子融合可以通過減少不必要的內存讀寫和計算開銷,來顯著提升推理速度、降低延遲并減少內存占用,所以基于SGlang框架的已有實現,進行了多個算子的融合。

  • 對MLA模塊中attn_mla計算前的算子進行融合,該融合算子以Query和Key向量進行RMSnorm計算后的輸出為輸入,以attn_mla計算的輸入q_input、k_input、v_input等為輸出,包含bmm計算、rotary_emb計算以及向量拆分轉置等計算;
  • RMSNorm和add計算融合;
  • 實現int8精度的量化和RMSNorm、silu等激活函數的融合;
  • 將路由專家分組選擇中多個算子的融合為一個算子。

最后,也進行了多stream的優化。多個算子計算時,默認在單stream模式下,所有操作都排成一條隊,一個接一個地執行。當算子本身的計算量不是很大時,會導致GPU的部分硬件單元在計算時處于空閑狀態,也就浪費了計算資源。多stream優化就是為了讓這些硬件單元"同時忙起來",對于相互之間沒有依賴關系的操作,可以放到不同的stream中并行執行,提高硬件的利用效率,同時減小整體的計算時間。在多stream并行優化方面,浪潮信息實現了MLA層的多個layernorm計算的并行,并實現了MoE階段和共享專家計算和路由專家分組選擇的并行等,實現了約10%的性能提升。

預填充-解碼分離軟件提高整體計算性能

此外,浪潮信息開發了預填充-解碼 (Prefill-Decode) 分離軟件,針對預填充與解碼不同的計算特性,使用不同的并行計算策略、硬件配置等,提高系統整體的計算性能。同時在業務部署中,支持節點服務的動態擴展;支持利用負載均衡和鍵值緩存(KV cache)命中率進行任務分配,把任務下發到鍵值緩存匹配度相對較高、任務負載相對較小的節點,減少重復計算,同時最大化計算資源利用率。另外,PD分離軟件還實現了鍵值緩存offload技術,可把鍵值緩存到CPU端內存與分布式存儲系統上,增大緩存空間。


元腦SD200超節點AI服務器通過高帶寬和超低延遲通信、超大顯存池、智能路由優化、PD分離推理等創新技術,大幅提升了DeepSeek、Kimi等大模型的推理輸出速度。元腦SD200搭載64張本土AI芯片運行DeepSeek R1大模型,當輸入長度為4096、輸出長度為1024時,單用戶token生成達到112 tokens/s,每token生成時間僅為8.9ms,率先實現國內AI服務器token生成速度低于10ms,將推動萬億參數大模型在金融、科研、智能制造等領域快速落地。

消息來源:浪潮信息
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發布全球互聯網、科技、媒體、通訊企業的經營動態、財報信息、企業并購消息。掃描二維碼,立即訂閱!
collection
午夜精品视频在线观看 | 欧美精品在线视频 | 影音先锋国产精品 | 90岁肥老奶奶毛毛外套 | 中文字幕永久免费 | 尤物av在线| 成年视频在线观看 | 国产免费一级片 | 超碰在线99 | 黄色特级毛片 | 天天射天天干天天操 | 亚洲天堂视频在线观看 | 波多野结衣电影免费观看 | 免费视频国产 | 亚洲中文字幕在线观看 | 国产一区二区精品丝袜 | 亚洲综合欧美 | 又色又爽| 亚洲狠狠 | 蜜桃91精品入口 | 久久发布国产伦子伦精品 | 欧美视频网站 | 狠狠干在线视频 | 玩弄人妻少妇500系列视频 | 91亚洲精品久久久久久久久久久久 | 免费在线毛片 | 中文字幕电影 | 欧美激精品 | 欧美一区视频 | 日韩欧美视频在线 | a级免费视频 | 久久久久久av | 永久免费看片在线播放 | 亚洲免费观看高清完整版在线 | 欧美一级在线 | 边添小泬边狠狠躁视频 | 免费看片成人 | 日本精品一区二区三区四区的功能 | 精品伊人| 国产精品9 | 超碰久草 | 97福利 | 婷婷久久五月天 | 91av导航| 中国字幕在线观看免费国语版 | 欧美做受高潮 | 亚洲精品成人在线 | 成人在线观看免费 | 中文字幕在线不卡 | 国产日韩视频 | av黄色网址 | 亚洲天堂免费视频 | 无码人妻精品一区二区三区不卡 | 亚洲伦理一区 | 日本不卡高清 | 日韩中文视频 | 毛片免费一区二区三区 | 91看黄| 苍井空无码| 成人动漫视频 | 欧美成人小视频 | 亚洲97 | 日本精品一区二区三区四区的功能 | 欧美性生活视频 | 久操视频在线 | 天堂在线8| 亚洲精品一区二区三区精华液 | 欧美在线免费 | 青草视频在线免费观看 | 人妻无码中文字幕免费视频蜜桃 | 特级丰满少妇一级aaaa爱毛片 | 日韩在线观看 | 中文字幕免费在线 | 免费观看在线高清 | 黄色一级大片在线免费看产 | 91视频高清 | 国语对白做受按摩的注意事项 | 久久99久久99精品免观看软件 | 国产精品1 | 五月天在线 | 亚洲免费在线观看视频 | 麻豆精品国产 | 国产午夜在线观看 | 亚洲av无一区二区三区久久 | 一区二区中文字幕 | 三级网站 | 日本一区二区不卡视频 | 久久成人精品视频 | 中文字幕在线观看第一页 | 激情综合五月 | 香蕉视频在线观看免费 | 日韩久久电影 | 老妇荒淫牲艳史 | 亚洲精品免费在线观看 | 日日视频| 国产ts在线 | 美女爱爱视频 | 91成人在线观看喷潮 | 91涩漫成人官网入口 | 无码人妻aⅴ一区二区三区玉蒲团 | 五月天av在线 | 福利视频一区二区 | 欧美高清一区二区 | 亚洲AV无码国产精品 | 国产激情av | 亚洲福利网 | 国产女18毛片多18精品 | 看片黄全部免费 | 波多野结衣乳巨码无在线观看 | 一区在线观看 | 国产稀缺真实呦乱在线 | 国产一区二区三区免费播放 | 日日干夜夜操 | 中文字幕电影 | 欧美视频| 在线激情视频 | 91视频一区二区 | 国内自拍视频在线观看 | 亚洲欧美另类在线 | 邻居少妇张开双腿让我爽一夜 | 精品国产一区二区三区四区 | 97精品国产露脸对白 | 亚洲熟女一区 | 黄色三级三级三级三级 | 色爱综合 | 日韩综合网 | 毛片毛片毛片毛片 | 我们2018在线观看免费版高清 | 国产又大又长又粗 | 欧美熟妇精品黑人巨大一二三区 | 国产91丝袜在线播放 | 国产在线一区二区 | 69视频在线 | 国产日韩欧美 | 国产无码精品一区二区 | 国产a区| 波多野结衣乳巨码无在线观看 | 青春草视频| 日本一区二区在线视频 | 大地资源在线观看免费高清版粤语 | 福利在线 | 日本女人毛茸茸 | 邻家有女4完整版电影观看 国产ts丝袜人妖系列视频 | 国产十八熟妇av成人一区 | 天堂av电影 | 尤物在线 | 婷婷一区二区三区 | 视频在线免费观看 | 97自拍| 三级视频在线观看 | 今天成全在线观看免费播放动漫 | 日本免费在线视频 | 亚洲视频在线看 | 久久人人爽人人爽人人片 | a在线视频| 91蝌蚪少妇| 亚洲一区中文字幕 | 欧美精产国品一二三 | 日韩精品电影在线观看 | 91好色先生 | 麻豆做爰免费观看 | 相亲对象是问题学生动漫免费观看 | 欧美视频在线观看 | 69av在线| 一级片日本 | 色妞色视频一区二区三区四区 | 四虎视频 | 天堂伊人 | 久久综合一区 | 久久精品视频一区 | 男人的天堂亚洲 | 亚洲天天干 | 欧美 日韩 人妻 高清 中文 | 日韩精品毛片 | 精品在线免费观看 | 国产做爰高潮呻吟视频 | 国产亚洲天堂 | 两性午夜视频 | 青青草视频在线免费观看 | 污污视频在线免费观看 | 国产精品天美传媒沈樵 | 亚洲av无码乱码在线观看性色 | 免费看a级片 | 国产91在线播放 | 黄色网在线 | 国产在线不卡视频 | 欧洲精品码一区二区三区免费看 | 亚洲天堂影院 | 无码av免费精品一区二区三区 | 国产精品视频免费观看 | 黄视频免费 | 在线免费av观看 | 极品一区| 久久天堂 | 国产视频一区二区在线观看 | 久久久久国产 | 对白超刺激精彩粗话av | 蜜桃av乱码一区二区三区 | 黄色片毛片 | 精品久久网 | 欧美顶级少妇做爰hd | 激情网页| 视频在线观看网站免费 | 一本色道久久综合狠狠躁的推荐 | 欧洲女性下面有没有毛发 | 日韩欧美色图 | 亚洲免费观看高清完整版在线观看 | 超级砰砰砰97免费观看最新一期 | 一区二区三区www污污污网站 | 亚洲12p| 欧美日韩激情视频 | 天天摸夜夜操 | 久久精品成人 | 黄瓜视频在线免费观看 | 中国白嫩丰满人妻videos | 亚洲精品乱码久久久久久蜜桃欧美 | 日韩午夜 | 少妇精品无码一区二区免费视频 | 男女啪啪网站 | 国产日韩欧美在线 | 美女爆吸乳羞羞免费网站妖精 | 裸体的日本在线观看 | 日韩欧美电影 | 天天舔天天操 | 日韩中文字幕在线观看 | 午夜成人在线视频 | 99在线精品视频 | 在线观看欧美 | 日本人妻丰满熟妇久久久久久 | 51成人做爰www免费看网站 | 一级黄毛片 | 无码精品在线观看 | 色黄视频 | 国内自拍第一页 | 国产精品色 | 尤物精品 | 一级视频在线观看 | 青青草91 | 911精品国产一区二区在线 | 四虎8848| 亚洲三级网站 | 亚洲综合在线播放 | 青青草精品视频 | 国产crm系统91在线 | 国产一区二区三区免费 | 中文字幕影院 | 四川少妇xxx奶大xxx | 精品亚洲一区二区 | 欧美极品少妇 | 苍井空亚洲精品aa片在线播放 | 美日韩精品 | 一区二区三区在线播放 | 99在线精品视频 | 欧美日韩a | 麻豆做爰免费观看 | 伊人网在线 | 欧美不卡一区二区三区 | 久草视频免费在线 | 欧美性生活视频 | 精品人妻无码一区二区三区 | 伊人久久精品 | 黄色片免费 | 强制高潮抽搐哭叫求饶h | 娇妻被老王脔到高潮失禁视频 | 亚洲电影在线观看 | 精品久久久久久久久久久久久 | 99久热| 手机福利视频 | 久久影院午夜理论片无码 | 成人网在线观看 | 一级做a爰片毛片 | 亚洲成人免费 | 日本在线免费 | 国产性生活 | 精品久久久久久 | 无码人妻aⅴ一区二区三区玉蒲团 | 国产美女视频 | 日韩一区二区精品 | 久草视频免费在线观看 | 先锋影音中文字幕 | 免费在线成人网 | 三级视频在线 | 99热精品在线观看 | 双腿张开被9个男人调教 | 久久久久久久电影 | 中文字幕亚洲天堂 | 一区二区三区免费在线观看 | 夜色资源网| 精品黑人一区二区三区在线观看 | 欧美黄色影院 | 免费毛片视频 | 熟女肥臀白浆大屁股一区二区 | 欧美婷婷 | 欧美日韩精品在线观看 | 成全影视在线观看第8季 | 黄色一级片黄色一级片 | www.欧美日韩| 欧美va| 国产精品久久久久久久久久免费看 | 亚洲免费黄色 | 九月婷婷 | 免费av大全 | 国产激情片 | 亚洲资源网| 欧美性天天影院 | 欧洲毛片| 调教撅屁股啪调教打臀缝av | 最新中文字幕在线 | 国产一二三四区 | 久久夜色精品国产欧美乱极品 | 五月久久| 国产伦精品一区三区精东 | 国产天堂在线 | 不卡的av电影 | 成年人在线观看视频 | 精品一区国产 | 私人午夜影院 | 久久性视频| 欧美激精品 | 五月婷婷激情 | 国精产品99永久一区一区 | 久久久久一区 | 毛片在线视频 | 欧美日韩一 | 黄色a一级 | 国产成人在线免费观看 | 成人小视频在线观看 | 国产伦精品一区二区三区视频女 | 欧美爱爱视频 | 国产69精品久久久久久 | 高清乱码免费网 | 果冻传媒av | 免费看黄色大片 | 色中文字幕 | 午夜国产在线 | 91少妇丨porny丨 | 欧美一级片 | 国产精品亚洲无码 | 欧美在线小视频 | 97在线观看免费 | 九九精品视频在线观看 | 网址你懂得 | 亚洲乱熟女一区二区 | 日韩欧美国产一区二区 |