vLLM et gpt-oss : Économie de 40% sur l'Infrastructure IA | WAI News