AMD XDNA2 NPU: 43.7 t/s com 0.947 J/tok na Inferência de LLMs | WAI News