燧原科技發布首款人工智能推理產品“云燧®i10”。這是一款面向云端數據中心的高性能推理卡。云燧i10是單槽位標準卡,支持PCIe 4.0,FP32算力達到17.6TFLOPS,BF16/FP16算力70.4TFLOPS。同時,燧原科技發布了推理引擎“鑒算TopsInference”,可以為深度學習應用提供低延遲、高吞吐率的推理性能,并降低數據中心的部署成本。云燧i10將于明年第一季度上市。
“云燧i10”擁有卓越的算力、出色的通用性以及優異的價值特性。
燧原科技同時推出針對推理產品的高性能神經網絡模型推理引擎“鑒算TopsInference”,通過計算圖優化、算子融合、模型壓縮、量化等優化技術,可以為深度學習應用提供低延遲、高吞吐率的推理性能。通過TopsInference的推理加速,配合i10 的高算力及虛擬化技術,數據中心可以高性價比地部署計算密集型深度學習工作負載。此外TopsInference除TensorFlow、PyTorch模型格式外,還支持ONNX通用模型格式,借助燧原GCU-CARA架構的可編程性,可以應對未來深度神經網絡日益多樣化、復雜的增長趨勢。
(美通社,2020年12月21日上海)