▍算力強勁,小巧低耗
DX-M1BNM5604是一款基于DEEPX DX-M1處理器設計的高性能、低功耗AI算力加速卡,具有如下特點:
極致算力:基于高性能AI架構(gòu),支持INT8,算力高達25TOPS。
高速存儲:板載2片LPDDR5,總?cè)萘扛哌_4GByte,數(shù)據(jù)吞吐大。
極速傳輸:支持PCIe 3.0(4Lane),具備高吞吐量輸入輸出能力,保障任務流暢運行。
超低功耗:最低功耗僅2.69W,綠色節(jié)能,散熱壓力小。
小巧便攜:尺寸僅為80*22*4.7mm,重量約9.7g,易于嵌入各種設備。
框架兼容:全面支持TensorFlow、PyTorch、ONNX、Keras等主流深度學習框架。


▍硬核實測,性能炸裂
為了驗證適配效果,我們在DX-M1 M.2 AI算力加速卡上運行了經(jīng)典的yolov5s目標檢測模型,測試數(shù)據(jù)顯示,在運行yolov5s模型時,平均處理幀率高達652.8fps,性能表現(xiàn)很優(yōu)秀。

根據(jù)官方數(shù)據(jù)手冊,DX-M1算力加速卡運行各類AI模型的功耗及推理性能(FPS)如下:

在運行YoloV9T模型時,功耗最低僅2.69W,展現(xiàn)了出色的能效控制能力。這種低功耗特性使得該方案特別適合對功耗敏感的邊緣部署場景。
▍全棧工具,開發(fā)無憂
DEEPX提供了完善的DXNN軟件框架和工具鏈,大幅降低開發(fā)門檻,助力開發(fā)者快速落地。


AI模型編譯環(huán)境(Compile Environment)
包含DX-COM、DX-TRON、DX-Model Zoo。其中DX-COM是DEEPX SDK中的編譯器,能夠根據(jù)ONNX模型和JSON配置文件生成經(jīng)過硬件優(yōu)化的.dxnn二進制文件,從而在DEEPX NPU上實現(xiàn)低延遲、高效率的推理運算。
AI模型運行環(huán)境(Runtime Environment)
包含DX-APP、DX-STREAM、DX-RT等。其中DX-RT(運行時)通過固件和設備驅(qū)動與DEEPX NPU直接交互,利用PCIe接口實現(xiàn)主機與NPU之間的高速數(shù)據(jù)傳輸,并為應用程序提供C/C++和Python API以進行推理控制。
▍工業(yè)優(yōu)選,場景落地
DEEPX算力加速卡引出M.2 Key M接口,可適配創(chuàng)龍科技RK3576、RK3588等工業(yè)單板機及創(chuàng)龍科技RK3576等工業(yè)評估板,亦可通過M.2轉(zhuǎn)PCIe轉(zhuǎn)接板與創(chuàng)龍科技RK3588等工業(yè)評估板搭配使用。
目前,創(chuàng)龍科技已完成RK3588工業(yè)評估板 + DX-M1評估套件的適配工作,可提供詳細測試步驟文檔。


RK3588負責多任務調(diào)度與復雜邏輯處理,DX-M1專注高負載AI推理,該組合可廣泛應用于智能機器人、工業(yè)視覺檢測、輸電線路巡檢、鐵路巡防等場景,為端側(cè)AI部署提供強勁算力支撐。

客服












