Der Benchathon 2026: Ein Werkstattbericht von der Human Baseline
Die Autorin hat am Benchathon 2026 teilgenommen und teilt im Folgenden ihre persönlichen Erfahrungen sowie Wahrnehmung aus dem Austausch mit anderen Teilnehmenden. Dabei wurde ihr schnell klar: In einer Zeit, in der KI juristische Fälle in Sekunden löst, wird menschliche Geduld zu einer neuen Schlüsselqualifikation.
Am 14. und 15. März 2026 fand der Benchathon statt – ein Benchmarking-Event im deutschsprachigen Raum, bei dem ich gemeinsam mit anderen Teilnehmenden die Plattform BenGER nutzte, um Aufgaben zu lösen und Ergebnisse zu vergleichen. Teilnehmende kamen aus Berlin, München und online zusammen.
Warum?
Hinter der Plattform steht das Forschungsprojekt BenGER an der Technischen Universität München (TUM), das misst, wie gut verschiedene KI-Modelle juristische Aufgaben lösen. Das zentrale Problem dabei: Diese Ergebnisse lassen sich kaum einordnen, solange kein menschlicher Vergleichswert existiert. Der Benchathon sollte genau diese sogenannte Human Baseline erstmals systematisch und wissenschaftlich belastbar erheben – also den Ausgangswert, der beschreibt, wie gut Menschen dieselben Aufgaben lösen, die KI-Modelle … … weiterlesen
. Utilizing continuous user feedback, the next-level AI Assistant delivers an increasingly personalized experience to support legal professionals in making informed decisions faster, generating outstanding work, and freeing up time to focus on efforts that drive economic value. All existing Lexis+ AI customers will have access to the enhanced AI Assistant.