
時間:2025-09-12來源:本站
今年以來,DeepSeek作為國產(chǎn)大模型中的一匹黑馬,正以卓越的性能和極致的成本優(yōu)勢,在多個行業(yè)落地生花,公開數(shù)據(jù)顯示:在金融領(lǐng)域,其信貸欺詐識別準(zhǔn)確率高達99.3%,智能投研助手可實現(xiàn)研報分鐘級生成;在醫(yī)療健康場景,它融合病理影像、基因與病歷數(shù)據(jù),將肺癌早期誤診率從18%降至2.4%;在政務(wù)應(yīng)用中,DeepSeek數(shù)智人可處理百類事項、千條語料,大幅提升服務(wù)效率與群眾滿意度。
然而,盡管DeepSeek表現(xiàn)驚艷,傳統(tǒng)部署方式下的百萬級成本卻讓眾多中小企業(yè)望而卻步。
瞄準(zhǔn)這一痛點,聚焦中小企業(yè)“小并發(fā)、低成本、高性價比” 的核心需求,寶德攜手openEuler,打破AI部署百萬門檻,推出最具性價比的國產(chǎn)滿血DeepSeek一體機方案——僅需單機8張Atlas 300I Duo推理卡,即可流暢運行671B大模型,單機吞吐量突破 300 tokens/s,而且成本30萬級別可控,讓中小企業(yè)也能以低成本享受到頂級 AI 算力。
該方案基于寶德自強®AI推理服務(wù)器PR410KI,創(chuàng)新融合了鯤鵬處理器與昇騰等多種國產(chǎn)加速卡,最大支持10張Atlas全高全長單/雙寬PCIe標(biāo)卡,能實現(xiàn)CPU與NPU的指令級協(xié)同,具有高算力密度、高擴展、極致能效比與高網(wǎng)絡(luò)帶寬等特點,在自然語言處理、圖像識別等推理場景中,可實現(xiàn)單位算力成本降低40%,推理時延縮短至毫秒級。該方案實測數(shù)據(jù)顯示,單機8卡部署DS-671B INT4量化模型,512-512序列的非首token吞吐單并發(fā)11 tokens/s,最高達321 tokens/s;單機4卡部署Qwen/QWQ-32B INT8 稀疏壓縮模型,512/256序列吞吐最高可達487 tokens/s,性能表現(xiàn)處于業(yè)界領(lǐng)先水平。
?
如此強勁的性能背后,是寶德與openEuler在系統(tǒng)層、框架層與算子層的全棧協(xié)同優(yōu)化:

?通過vLLM服務(wù)化框架、MindSpore計算框架與昇騰自定義算子的深度融合,充分釋放Atlas 300I Duo的硬件潛力;
?針對MoE結(jié)構(gòu)、量化計算等關(guān)鍵模塊作融合優(yōu)化,端到端推理時延降低超30%;
?采用張量/流水線/數(shù)據(jù)并行的混合并行策略,結(jié)合內(nèi)存融合技術(shù),突破單芯片內(nèi)存限制,高效支撐超大規(guī)模參數(shù)模型;
?依托openEuler操作系統(tǒng)的高可靠性與兼容性,確保系統(tǒng)穩(wěn)健運行和生態(tài)廣泛支持。
這一方案不僅性能“滿血”,更具“極致的性價比”。用戶無需復(fù)雜集群設(shè)計和高昂運維投入,單機即可完成部署應(yīng)用,大幅降低模型推理成本,真正實現(xiàn)“小投入、大效能”,中小企業(yè)客戶再也不用望AI而興嘆了。
作為openEuler社區(qū)AI聯(lián)合工作組首批成員,寶德始終積極參與開源生態(tài)建設(shè),推動操作系統(tǒng)與AI技術(shù)的深度融合。本次推出的國產(chǎn)滿血DeepSeek一體機,不僅是技術(shù)成果的體現(xiàn),更是寶德攜手社區(qū)推動多樣性計算發(fā)展的關(guān)鍵里程碑。
圖片源于網(wǎng)絡(luò),侵刪
從“望而卻步”到“觸手可及”,寶德-openEuler國產(chǎn)滿血DeepSeek一體機方案,正在重新定義中小企業(yè)AI 部署的成本與性能邊界。如今,頂級大模型不再是大企業(yè)的專屬,更多中小企業(yè)和創(chuàng)業(yè)者們,都能以更低門檻擁抱智能變革,在AI浪潮中站穩(wěn)腳步、搶占發(fā)展先機。未來,寶德將繼續(xù)攜手openEuler,共同打造更加堅實可靠的算力基石,為千行百業(yè)的數(shù)智化轉(zhuǎn)型升級注入持續(xù)動力,共創(chuàng)智能新紀(jì)元。