MMRB-Benchmark: 4.750 Proben enthüllen Schwächen von MLLMs | WAI News