AMD release Nitro-T, text-to-image diffusion models

10 Jul 2025

【AMD推出 Nitro-T:高效訓練的文字轉圖像擴散模型】

AMD去年尾發表過 Nitro-T , 而日前正式發布Nitro-T系列及公開下戴, 這是專注於高效訓練的文字轉圖像擴散模型 , Nitro-T 僅使用 32 顆 AMD Instinct MI300X GPU 從零開始訓練不到一天 , 即可達到競爭性的效果

Nitro-T 提供兩種variants , 已可在huggingface9免費下載:
– 0.6B 參數的 Diffusion Transformer (DiT):最佳化於 512px 圖像生成
– 1.2B 參數的 Multimodal Diffusion Transformer (MMDiT):最佳化於高解析度 1024px 圖像生成
這些模型使用 Llama 3.2 1B 模型作為文字條件輸入並採用可縮短 patch 序列長度、加速收斂與提升訓練吞吐量的策略與設計選擇