Vor nicht allzu langer Zeit war der Begriff „Computer“ nicht der Name einer Maschine, sondern vielmehr ein Beruf. Bevor elektronische Geräte Einzug hielten, gab es Menschen, deren Hauptaufgabe darin bestand, komplexe Berechnungen manuell durchzuführen. Diese sogenannten „Human Computer“ erhielten eine Vielzahl von mathematischen Problemstellungen, lösten sie von Hand und lieferten die Ergebnisse zurück. Sie waren unersetzliche Arbeitnehmende in einer Ära, in der Rechenmaschinen noch nicht verfügbar waren. Doch mit der Einführung elektronischer Taschenrechner und später von Computern wurden diese menschlichen Rechner zunehmend überflüssig.
Was heute eine Selbstverständlichkeit ist, war damals revolutionär und veränderte grundlegend den Blick auf das, was eine wertvolle Arbeitstätigkeit ausmacht. Diese historische Entwicklung gibt wertvolle Parallelen für die heutige Zeit mit dem Aufkommen von agentischer Künstlicher Intelligenz her. Während damals das Beherrschen der manuellen Rechenkunst als Beweis für berufliche Eignung galt, stellt sich heute immer mehr die Frage: Würde es noch Sinn machen, eine Person danach zu bewerten, wie schnell und fehlerfrei sie lange Divisionen im Kopf löst, wenn praktisch jeder Arbeitsplatz mit einem Taschenrechner oder einer Software ausgestattet ist? Es wirkt völlig absurd, wenn ein Arbeitgeber noch immer darauf beharrt, potenzielle Mitarbeitende auf diese Weise zu testen. Doch genau diese Situation lässt sich heute im IT-Bereich beobachten. Programmierer werden oft noch immer danach beurteilt, wie gut und schnell sie klassischen Programmiercode schreiben können – in einer Zeit, in der moderne Entwicklerteams zunehmend Agenten und KI-basierte Helfer einsetzen, die große Teile der Programmierung automatisieren.
Die Rolle des Programmierers wandelt sich von der des reinen Code-Schreibers hin zu einer Art „Dirigent“ oder „Orchestrator“ von intelligenten Werkzeugen, die die Arbeit erledigen. Das Handwerk des einzelnen Codierens verliert seine zentrale Bedeutung, ersetzt durch Fähigkeiten im Umgang mit KI-Systemen, die komplexe Aufgaben ausführen und iterativ verbessert werden. Ein Interview, das ausschließlich auf Basis klassischer Programmieraufgaben besteht, die ganz ohne Hilfsmittel gelöst werden müssen, demonstriert nicht mehr die tatsächliche Tätigkeit und die notwendigen Kompetenzen eines modernen Entwicklers. Die Frage, wie viele Zeilen Code ein Bewerber unter Zeitdruck ohne Hilfsmittel fehlerfrei schreibt, ist mittlerweile ein Relikt vergangener Zeiten – vergleichbar mit der Aufforderung, eine lange Division ausschließlich im Kopf zu lösen. Viel wichtiger ist heute die Fähigkeit, komplexe Arbeitsprozesse mit Hilfe von KI-Agenten zu planen, zu steuern und zu überprüfen, um konkrete Geschäftsziele effizient und innovativ zu erreichen.
Diese neue Realität bringt erhebliche Herausforderungen für die Personalauswahl mit sich. Klassische Bewertungsmethoden wie Data-Structure- und Algorithmus-Fragen sind einfach zu beurteilen, da es hierbei klare richtige oder falsche Antworten gibt. Man kann die Resultate objektiv vergleichen, ähnlich wie bei standardisierten Tests. Doch wo KI-agentenbasierte Systeme zum Einsatz kommen, sind die Ergebnisse häufig nicht deterministisch. Ein und dasselbe Problem kann mehrfache, unterschiedliche aber gleichwertige Antworten hervorbringen, die sich zudem situativ an die Bedürfnisse und Zielvorgaben anpassen müssen.
Es wird immer schwieriger, mit herkömmlichen unit-tests oder quantitativen Metriken eine sinnvolle Aussage über die Fähigkeiten eines Kandidaten zu treffen. In China illustriert ein Beispiel aus dem Kunst-College-Aufnahmeverfahren im Jahr 2017 diese Problematik sehr gut: Wenn professoren fotorealistische Malerei bewerten wollen, wäre es doch unsinnig, eine Fotografie als Prüfungsleistung zu verlangen. Vielmehr muss die Bewertung die Kreativität, das Verständnis von Komposition und die fachliche Ausdruckskraft berücksichtigen. Analog dazu müssen Mitarbeiterbewertungen im Zeitalter der KI den Umgang mit Ambiguität, Problemlösungskompetenz und Entscheidungsfindung in komplexen, unstrukturierten Szenarien ins Zentrum stellen. In der Praxis bedeutet dies, dass neue Interviewmethoden und Evaluierungsansätze entwickelt werden müssen, die den Bewerber nicht auf starre Aufgaben mit präzisen Antworten reduzieren, sondern vielmehr ihre Fähigkeit testen, mit unvollständigen Informationen, widersprüchlichen Anforderungen und sich ändernden Zielsetzungen umzugehen.
Typische Fragestellungen könnten sein, ob ein Kandidat erkennt, wenn eine Aufgabe nicht ausreichend definiert ist, ob er aktiv nach Klärungen sucht oder ob er unrealistische oder widersprüchliche Anforderungen hinterfragt. Auch die strategische Nutzung verschiedener technischer Tools und die Fähigkeit, einen umfassenden Arbeitsplan zu erstellen und dessen Ergebnisse selbstständig zu verifizieren, sind Fähigkeiten, die künftig eine höhere Bedeutung haben werden. Dieser Fokus auf agentische Intelligenz, also darauf, wie Menschen mit intelligenten Systemen zusammenarbeiten und diese effektiv steuern, ist ein fundamentales Umdenken in der Arbeitswelt. Es rückt das Menschliche und Sozial-Kommunikative in den Vordergrund, statt sich auf bloße technische Fertigkeiten zu konzentrieren. Schließlich ist eine KI nicht in der Lage, berechtigte Einwände zu erheben, Ziele zu hinterfragen oder pragmatisch realistische Arbeitspläne zu erstellen.
Diese Eigenschaften bleiben weiterhin den Menschen vorbehalten und sind im digitalen Zeitalter wertvoller denn je. Angesichts all dieser Veränderungen stellt sich die zentrale Frage: Wie sollte man heute also Bewerber bewerten, wenn klassische Tests obsolet werden und KI-Systeme die Arbeitsleistung mitbestimmen? Die Antwort lautet vereinfacht: durch realistische Arbeitssimulationen. Dabei geht es darum, die tatsächlichen Anforderungen der Stelle und die relevanten Arbeitsprozesse nachzubilden, so dass Kandidaten unter möglichst realistischen Bedingungen zeigen können, wie sie mit den heutigen Tools und Herausforderungen umgehen. Nur so lässt sich sicherstellen, dass jene, die eingestellt werden, auch tatsächlich für die Arbeit von morgen geeignet sind. Zusammengefasst führt die technologische Entwicklung zum Paradigmenwechsel in der Bewertung von Arbeitsfähigkeiten.