全國(guó)信標(biāo)委委員談AI算力標(biāo)準(zhǔn)化：DeepX G20系列的標(biāo)準(zhǔn)化實(shí)踐與產(chǎn)業(yè)啟示

2025/10/29 10:58:47

【2025年10月29日，北京】作為全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)委員，我長(zhǎng)期關(guān)注AI算力基礎(chǔ)設(shè)施的標(biāo)準(zhǔn)化工作。近年來(lái)，隨著AI技術(shù)的快速發(fā)展，算力需求呈指數(shù)級(jí)增長(zhǎng)，但算力供給模式卻面臨著成本高企、安全性堪憂、標(biāo)準(zhǔn)不統(tǒng)一等結(jié)構(gòu)性問(wèn)題。在參與制定相關(guān)技術(shù)標(biāo)準(zhǔn)的過(guò)程中，我們觀察到一個(gè)明確的趨勢(shì)：AI算力正在從"集中式云端"走向"分布式本地"，從"租賃模式"走向"自主可控"。這不僅是技術(shù)演進(jìn)的自然結(jié)果，更是標(biāo)準(zhǔn)化發(fā)展的必然方向。

一、AI算力標(biāo)準(zhǔn)化面臨的三大挑戰(zhàn)

挑戰(zhàn)一：性能評(píng)估標(biāo)準(zhǔn)缺失，市場(chǎng)存在"測(cè)試混亂"

當(dāng)前AI算力市場(chǎng)存在一個(gè)普遍問(wèn)題：不同廠商使用不同的性能指標(biāo)，導(dǎo)致用戶(hù)無(wú)法橫向比較。

現(xiàn)狀：

云廠商強(qiáng)調(diào)"TFLOPS"（浮點(diǎn)運(yùn)算能力）
芯片廠商強(qiáng)調(diào)"TOPS"（整數(shù)運(yùn)算能力）
服務(wù)器廠商強(qiáng)調(diào)"功耗比"
各自為政，用戶(hù)困惑

標(biāo)準(zhǔn)化需求：參考MLPerf等國(guó)際基準(zhǔn)測(cè)試標(biāo)準(zhǔn)，我們?cè)谌珖?guó)信標(biāo)委推動(dòng)《信息技術(shù)人工智能算力評(píng)估規(guī)范》明確提出：

統(tǒng)一測(cè)試基準(zhǔn)：LLaMA推理、Stable Diffusion生成、YOLO目標(biāo)檢測(cè)等實(shí)際場(chǎng)景
統(tǒng)一評(píng)估維度：性能、能效、成本、延遲四位一體
統(tǒng)一測(cè)試環(huán)境：溫度、濕度、負(fù)載條件標(biāo)準(zhǔn)化

DeepX的標(biāo)準(zhǔn)化實(shí)踐：東方超算的DeepX G20系列在產(chǎn)品發(fā)布時(shí)，主動(dòng)采用了第三方標(biāo)準(zhǔn)化測(cè)試：

委托CHAI進(jìn)行MLPerf v3.1標(biāo)準(zhǔn)測(cè)試
公開(kāi)完整測(cè)試報(bào)告和測(cè)試環(huán)境參數(shù)
結(jié)果可復(fù)現(xiàn)：LLaMA 13B推理779 tok/s，Stable Diffusion XL生成2.10s/張

這種透明化做法，正是標(biāo)準(zhǔn)化推廣的重要實(shí)踐。

挑戰(zhàn)二：接口標(biāo)準(zhǔn)不統(tǒng)一，生態(tài)碎片化嚴(yán)重

現(xiàn)狀：

NVIDIA CUDA生態(tài)封閉，供應(yīng)商鎖定嚴(yán)重
AMD ROCm、Intel oneAPI各自為政
國(guó)產(chǎn)AI芯片（寒武紀(jì)、海光等）接口不兼容
開(kāi)發(fā)者移植成本高，模型無(wú)法跨平臺(tái)復(fù)用

標(biāo)準(zhǔn)化需求：參考ONNX（Open Neural Network Exchange）等開(kāi)放標(biāo)準(zhǔn)，我們需要：

統(tǒng)一的算子標(biāo)準(zhǔn)（Operator Standard）
統(tǒng)一的模型格式（Model Format）
統(tǒng)一的API接口（Runtime API）
統(tǒng)一的部署標(biāo)準(zhǔn)（Deployment Specification）

DeepX的標(biāo)準(zhǔn)化實(shí)踐：DeepX G20系列基于x86架構(gòu)+開(kāi)源生態(tài)，天然具備標(biāo)準(zhǔn)化優(yōu)勢(shì)：

硬件層：Intel x86架構(gòu)，兼容所有主流操作系統(tǒng)和軟件
軟件層：支持ONNX、TensorFlow、PyTorch等主流框架
接口層：AppMall提供RESTful API，符合OpenAPI 3.0標(biāo)準(zhǔn)
模型層：推動(dòng)1000+模型的ONNX格式標(biāo)準(zhǔn)化適配

AppMall的生態(tài)開(kāi)放性，為模型標(biāo)準(zhǔn)化提供了實(shí)踐平臺(tái)。目前已有130+開(kāi)發(fā)者上傳標(biāo)準(zhǔn)化模型，形成了良性循環(huán)。

挑戰(zhàn)三：數(shù)據(jù)安全標(biāo)準(zhǔn)滯后，本地化需求爆發(fā)

現(xiàn)狀：

《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》要求數(shù)據(jù)本地化
煙草、金融、醫(yī)療等行業(yè)數(shù)據(jù)不能上云
但云GPU是主流方案，存在合規(guī)風(fēng)險(xiǎn)
企業(yè)面臨"要性能還是要合規(guī)"的兩難選擇

標(biāo)準(zhǔn)化需求：參考ISO/IEC 27001信息安全標(biāo)準(zhǔn)和等保2.0要求，我們需要：

明確AI算力的數(shù)據(jù)流轉(zhuǎn)標(biāo)準(zhǔn)
建立本地化部署的安全評(píng)估體系
制定算力設(shè)備的等保認(rèn)證規(guī)范
推動(dòng)"數(shù)據(jù)不出域"的技術(shù)標(biāo)準(zhǔn)

DeepX的標(biāo)準(zhǔn)化實(shí)踐：DeepX G20系列的100%本地化部署，天然符合數(shù)據(jù)安全標(biāo)準(zhǔn)：

數(shù)據(jù)零上傳：所有計(jì)算在本地完成，數(shù)據(jù)不經(jīng)過(guò)互聯(lián)網(wǎng)
物理隔離：支持內(nèi)網(wǎng)部署，符合等保三級(jí)要求
審計(jì)能力：AppMall內(nèi)置日志記錄，可追溯所有操作

二、AI算力標(biāo)準(zhǔn)化的發(fā)展趨勢(shì)：從云端到本地

從標(biāo)準(zhǔn)化角度看，AI算力正在經(jīng)歷一場(chǎng)深刻的范式轉(zhuǎn)移。

趨勢(shì)一：從"租賃為主"到"買(mǎi)斷為主"

傳統(tǒng)模式：

企業(yè)需求 → 購(gòu)買(mǎi)云GPU → 按小時(shí)付費(fèi) → 持續(xù)支出→ 數(shù)據(jù)上傳 → 算力調(diào)度 → 結(jié)果下載

問(wèn)題：

-長(zhǎng)期成本不可控（3年TCO高達(dá)數(shù)百萬(wàn)）

-數(shù)據(jù)安全風(fēng)險(xiǎn)（上傳云端）

-性能波動(dòng)（共享資源）

-供應(yīng)商鎖定（遷移成本高）

新模式：

企業(yè)需求 → 購(gòu)買(mǎi)本地設(shè)備 → 一次性投入 → 零邊際成本→ 數(shù)據(jù)本地 → 算力自主 → 零延遲

優(yōu)勢(shì)：

TCO降低95%以上
數(shù)據(jù)100%自主可控
性能穩(wěn)定可預(yù)期
無(wú)供應(yīng)商鎖定

從標(biāo)準(zhǔn)化角度，"買(mǎi)斷模式"更符合長(zhǎng)期趨勢(shì)：

成本可預(yù)測(cè)：符合企業(yè)財(cái)務(wù)管理標(biāo)準(zhǔn)
資產(chǎn)可管理：納入固定資產(chǎn)，符合會(huì)計(jì)準(zhǔn)則
安全可審計(jì)：滿足等保和合規(guī)要求
生態(tài)可遷移：不依賴(lài)單一供應(yīng)商

DeepX的1824 TOPS算力、4萬(wàn)元價(jià)格，將TCO降至云GPU的1/375，正是這一趨勢(shì)的代表性產(chǎn)品。

趨勢(shì)二：從"通用算力"到"場(chǎng)景化算力"

傳統(tǒng)云GPU的問(wèn)題：

通用設(shè)計(jì)，但企業(yè)80%的需求集中在推理而非訓(xùn)練
大而全，但中小企業(yè)只需要"夠用"的算力
配置復(fù)雜，需要專(zhuān)業(yè)團(tuán)隊(duì)運(yùn)維

場(chǎng)景化算力的特征：

針對(duì)推理優(yōu)化（INT8/INT4量化）
算力適度（1-2P足以滿足90%企業(yè)需求）
開(kāi)箱即用（3分鐘部署，零運(yùn)維）

從標(biāo)準(zhǔn)化角度，"場(chǎng)景化"符合ISO 9126質(zhì)量模型：

功能性：滿足實(shí)際需求而非堆砌參數(shù)
易用性：降低使用門(mén)檻，AppMall實(shí)現(xiàn)"點(diǎn)擊式部署"
效率性：能效比優(yōu)化，功耗僅300W
可移植性：1.68kg便攜設(shè)計(jì)，可跨場(chǎng)景使用

某建筑設(shè)計(jì)院的案例很能說(shuō)明問(wèn)題：他們需要在工地現(xiàn)場(chǎng)演示BIM方案，云GPU需要聯(lián)網(wǎng)+筆記本，延遲高且不穩(wěn)定。DeepX裝進(jìn)背包，到工地插電就用，客戶(hù)現(xiàn)場(chǎng)修改方案、實(shí)時(shí)渲染，投標(biāo)中標(biāo)率從30%提升到70%。這就是場(chǎng)景化算力的價(jià)值。

趨勢(shì)三：從"硬件采購(gòu)"到"生態(tài)訂閱"

傳統(tǒng)硬件采購(gòu)的問(wèn)題：

買(mǎi)完設(shè)備就結(jié)束，供應(yīng)商無(wú)持續(xù)服務(wù)動(dòng)力
模型升級(jí)、功能迭代需要重新采購(gòu)
客戶(hù)學(xué)習(xí)成本高，復(fù)購(gòu)率低

生態(tài)訂閱模式的特征：

硬件是"入口"，生態(tài)是"價(jià)值"
AppMall持續(xù)更新模型，硬件持續(xù)增值
客戶(hù)深度綁定，LTV是硬件價(jià)格的5-8倍

從標(biāo)準(zhǔn)化角度，"生態(tài)模式"符合服務(wù)化趨勢(shì)：

符合ISO/IEC 20000服務(wù)管理標(biāo)準(zhǔn)
建立持續(xù)改進(jìn)機(jī)制（PDCA循環(huán)）
形成客戶(hù)成功體系（Customer Success）

AppMall目前1,247個(gè)模型，月新增85個(gè)，這個(gè)速度是任何企業(yè)內(nèi)部團(tuán)隊(duì)無(wú)法達(dá)到的。某量化私募反饋：他們每月在AppMall測(cè)試10-15個(gè)新策略模型，創(chuàng)新速度提升50倍。硬件會(huì)折舊，但生態(tài)會(huì)增值。

三、DeepX G20系列的標(biāo)準(zhǔn)化設(shè)計(jì)理念

作為東方超算創(chuàng)始人，我在設(shè)計(jì)DeepX系列時(shí)，始終將標(biāo)準(zhǔn)化作為核心原則。

設(shè)計(jì)原則一：架構(gòu)開(kāi)放，拒絕生態(tài)封閉

選擇x86而非ARM/專(zhuān)用芯片的理由：

x86是事實(shí)上的工業(yè)標(biāo)準(zhǔn)，40年生態(tài)積累
兼容所有主流操作系統(tǒng)（Windows/Linux/macOS）
支持所有AI框架（TensorFlow/PyTorch/ONNX）
開(kāi)發(fā)者零學(xué)習(xí)成本，模型直接遷移

對(duì)比：

這個(gè)選擇犧牲了部分性能，但換來(lái)了標(biāo)準(zhǔn)化和生態(tài)開(kāi)放性。從長(zhǎng)期看，這是正確的。

設(shè)計(jì)原則二：性能透明，接受標(biāo)準(zhǔn)化測(cè)試

我們主動(dòng)做了三件事：

委托第三方測(cè)試：基于MLPerf v3.1標(biāo)準(zhǔn)測(cè)試
公開(kāi)測(cè)試數(shù)據(jù)：完整報(bào)告發(fā)布在官網(wǎng)，任何人可下載
接受復(fù)現(xiàn)驗(yàn)證：提供測(cè)試代碼和環(huán)境配置

測(cè)試結(jié)果（MLPerf v3.1標(biāo)準(zhǔn)）：

LLaMA 13B推理：779 tok/s（vs 參照系統(tǒng)612 tok/s，+27%）
Stable Diffusion XL：2.10s/張（vs 參照系統(tǒng)3.33s，+58%）
YOLOv8目標(biāo)檢測(cè)：186 FPS（vs 參照系統(tǒng)67 FPS，+178%）

這種透明化，正是標(biāo)準(zhǔn)化推廣的基礎(chǔ)。我們歡迎任何機(jī)構(gòu)重復(fù)測(cè)試，如果發(fā)現(xiàn)數(shù)據(jù)不符，我們承諾退貨退款。

設(shè)計(jì)原則三：生態(tài)開(kāi)放，推動(dòng)模型標(biāo)準(zhǔn)化

AppMall的三個(gè)標(biāo)準(zhǔn)化目標(biāo)：

模型格式標(biāo)準(zhǔn)化

推動(dòng)所有模型轉(zhuǎn)為ONNX格式
當(dāng)前1,247個(gè)模型，82%已完成ONNX轉(zhuǎn)換
目標(biāo)：2025年底100%標(biāo)準(zhǔn)化

API接口標(biāo)準(zhǔn)化

遵循OpenAPI 3.0規(guī)范
RESTful API設(shè)計(jì)，支持跨平臺(tái)調(diào)用
開(kāi)發(fā)者可用任何語(yǔ)言接入（Python/Java/Go/Node.js）

部署流程標(biāo)準(zhǔn)化

一鍵部署：3分鐘完成模型部署
零配置：自動(dòng)優(yōu)化參數(shù)，無(wú)需手動(dòng)調(diào)優(yōu)
可復(fù)現(xiàn)：記錄所有部署參數(shù),支持導(dǎo)出

某醫(yī)療機(jī)構(gòu)的案例：他們?cè)?/span>AppMall部署了8個(gè)AI診斷模型（肺結(jié)節(jié)、骨折、腦卒中等），所有模型都是ONNX格式，部署流程完全一致。如果未來(lái)更換硬件平臺(tái)，這8個(gè)模型可以零成本遷移。這就是標(biāo)準(zhǔn)化的價(jià)值。

四、標(biāo)準(zhǔn)化工作的未來(lái)方向與產(chǎn)業(yè)建議

作為全國(guó)信標(biāo)委委員，我認(rèn)為AI算力標(biāo)準(zhǔn)化還有很多工作要做：

方向一：建立統(tǒng)一的性能測(cè)試標(biāo)準(zhǔn)

當(dāng)前問(wèn)題：

各廠商自說(shuō)自話，測(cè)試方法不統(tǒng)一
用戶(hù)無(wú)法橫向比較產(chǎn)品

建議：

推動(dòng)《AI算力基準(zhǔn)測(cè)試規(guī)范》國(guó)家標(biāo)準(zhǔn)制定
建立第三方測(cè)試認(rèn)證機(jī)制
強(qiáng)制要求廠商公開(kāi)測(cè)試數(shù)據(jù)

東方超算承諾：我們?cè)敢忾_(kāi)放DeepX的所有測(cè)試數(shù)據(jù)，供標(biāo)準(zhǔn)制定參考。

方向二：推動(dòng)模型格式標(biāo)準(zhǔn)化

當(dāng)前問(wèn)題：

TensorFlow/PyTorch/ONNX等格式并存
模型移植成本高

建議：

推廣ONNX為國(guó)家推薦標(biāo)準(zhǔn)
建立模型格式轉(zhuǎn)換工具庫(kù)
鼓勵(lì)企業(yè)開(kāi)放模型

東方超算承諾：AppMall將在2026年實(shí)現(xiàn)100%模型ONNX化，并開(kāi)源轉(zhuǎn)換工具。

方向三：制定數(shù)據(jù)安全合規(guī)標(biāo)準(zhǔn)

當(dāng)前問(wèn)題：

本地化部署缺乏評(píng)估標(biāo)準(zhǔn)
企業(yè)不知道如何選型

建議：

制定《AI算力本地化部署安全規(guī)范》
建立等保認(rèn)證體系
明確不同行業(yè)的合規(guī)要求

東方超算承諾：我們?cè)敢鈱?/span>DeepX的安全設(shè)計(jì)經(jīng)驗(yàn)貢獻(xiàn)給標(biāo)準(zhǔn)制定，并配合相關(guān)部門(mén)完善認(rèn)證體系。

五、結(jié)語(yǔ)：標(biāo)準(zhǔn)化是產(chǎn)業(yè)健康發(fā)展的基石

AI算力產(chǎn)業(yè)正處于從無(wú)序競(jìng)爭(zhēng)到標(biāo)準(zhǔn)化發(fā)展的關(guān)鍵轉(zhuǎn)折點(diǎn)。

作為從業(yè)者，我有三點(diǎn)體會(huì)：

第一，標(biāo)準(zhǔn)化不是約束，而是賦能。

統(tǒng)一標(biāo)準(zhǔn)降低了用戶(hù)的選型成本
開(kāi)放生態(tài)降低了開(kāi)發(fā)者的遷移成本
透明測(cè)試增強(qiáng)了市場(chǎng)的信任基礎(chǔ)

第二，本地化是趨勢(shì)，而非倒退。

云計(jì)算解決了"算力稀缺"問(wèn)題
本地化解決了"成本和安全"問(wèn)題
兩者將長(zhǎng)期共存,各有適用場(chǎng)景

第三，生態(tài)開(kāi)放才能走得長(zhǎng)遠(yuǎn)。

封閉生態(tài)短期獲利，長(zhǎng)期受限
開(kāi)放生態(tài)短期投入，長(zhǎng)期共贏
AppMall的1,247個(gè)模型，就是開(kāi)放的成果

東方超算DeepX G20系列只是標(biāo)準(zhǔn)化實(shí)踐的一個(gè)案例。我們希望看到更多企業(yè)參與標(biāo)準(zhǔn)化工作，共同推動(dòng)AI算力產(chǎn)業(yè)健康發(fā)展。

當(dāng)然，DeepX也存在待改進(jìn)之處：

在超大規(guī)模集群部署方面，尚缺乏統(tǒng)一的調(diào)度標(biāo)準(zhǔn)
能效測(cè)試方法需要進(jìn)一步與國(guó)際標(biāo)準(zhǔn)對(duì)接
跨平臺(tái)模型遷移工具仍需完善

這些問(wèn)題的解決，需要全行業(yè)共同努力，也是我們?cè)谌珖?guó)信標(biāo)委推動(dòng)標(biāo)準(zhǔn)制定的重點(diǎn)方向。

關(guān)于作者

本文作者現(xiàn)任東方超算（深圳）科技有限公司創(chuàng)始人，全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)委員，長(zhǎng)期從事云計(jì)算、高性能計(jì)算、存儲(chǔ)、算力基礎(chǔ)設(shè)施的研發(fā)和標(biāo)準(zhǔn)化工作。本文觀點(diǎn)代表作者個(gè)人，不代表全國(guó)信標(biāo)委立場(chǎng)。

關(guān)于東方超算

東方超算（深圳）科技有限公司是東方材料（603110.SH）全資子公司，專(zhuān)注于便攜式企業(yè)級(jí)AI算力解決方案。核心產(chǎn)品DeepX G20系列和AppMall.ai應(yīng)用商城，致力于通過(guò)標(biāo)準(zhǔn)化、本地化、生態(tài)化，讓AI算力真正普及到千行百業(yè)。

DeepX G20

相關(guān)閱讀

久草中文字母在线|www.成人在线|91av二区三区|久草√e久草久草|91探花视频在线|日产精品自拍偷拍|精品无码一区三区|加勒比Av大轮奸|日韩无码一站二站三站|国产AV一区五月

全國(guó)信標(biāo)委委員談AI算力標(biāo)準(zhǔn)化：DeepX G20系列的標(biāo)準(zhǔn)化實(shí)踐與產(chǎn)業(yè)啟示