Terminal-Benchmark 2.0: OSS-Agent erzielt 87,5, schlägt Gemini-3 | WAI News