In der schnelllebigen Welt der Softwareentwicklung gewinnen KI-gestützte Tools immer mehr an Bedeutung. Besonders die Arbeit mit Modellen, die unterschiedliche Aufgaben innerhalb des Coding-Prozesses übernehmen, erlaubt es Entwicklern, komplexe Herausforderungen effizienter zu bewältigen. Ein beeindruckendes Beispiel für den produktiven Einsatz solcher Systeme ist die Nutzung von Cursor, einem Tool, das gezielt verschiedene KI-Agenten aufruft, um Programmieraufgaben zu erledigen. Mit über 4000 Agentenaufrufen innerhalb eines Monats zeigt sich, wie sich die individuellen Eigenschaften der Modelle auf die Qualität und Art der Arbeit auswirken. Cursor fungiert als Plattform, die unterschiedliche KI-Modelle integriert, die jeweils eine eigene „Persönlichkeit“ im Umgang mit Code besitzen.
Diese Persönlichkeiten bestimmen, wie ein Modell auf Anfragen reagiert, welche Stärken und Schwächen es zeigt und wie es sich am besten in einen Entwicklungsworkflow einfügt. Der Vorteil einer solchen segmentierten Herangehensweise ist die Spezialisierung; jedes Modell eignet sich für bestimmte Aufgabenbereiche besonders gut, was die effiziente Nutzung der KI insgesamt steigert. Ein gutes Beispiel dieser Spezialisierung ist das Modell OpenAI’s o3, das als der „faule Architekt“ beschrieben wird. Dieses Modell ist ausgesprochen gut darin, komplexe Planungen zu erstellen und große Mengen an Quelltext zu analysieren. Es liest problemlos viele Dateien ein und liefert tiefgehende Einsichten.
Allerdings verliert sich o3 schnell, sobald es darum geht, Code über mehrere Dateien hinweg zu bearbeiten oder Änderungen vorzunehmen. In solchen Fällen kann es vorkommen, dass der Agent die Arbeit verweigert oder unbrauchbare Ergebnisse liefert. Gegenüber steht Claude Sonnet 3.7, eine Persönlichkeit, die als „über-eifriges Kind“ bezeichnet wird. Dieses Modell ist begeistert davon, sofort mit der Arbeit zu starten, was jedoch auch seinen Nachteil hat: Es neigt dazu, weniger sorgfältig vorzugehen und kann bei längeren Ketten von Werkzeugaufrufen aus dem Fokus geraten und an unerwarteten Stellen Änderungen vornehmen, die nicht erwünscht sind.
Trotzdem eignet sich das Modell hervorragend, wenn es innerhalb eines klar definierten, eng begrenzten Bereichs arbeiten muss. Unter Aufsicht ist es perfekt geeignet, um einfache Änderungen über viele Dateien hinweg vorzunehmen, die oft repetitiv sind und einer gewissen Regelmäßigkeit folgen. Dazwischen positioniert sich Gemini 2.5 Pro, das als „ausgeglichen“ beschrieben wird. Dieses Modell vereint Intelligenz mit Schnelligkeit und Vorsicht, arbeitet konsistent und zuverlässig.
Besonders bei komplexeren Aufgaben, die das Editieren mehrerer Dateien verlangen, liefert Gemini 2.5 gute Ergebnisse und ist häufig die bevorzugte Wahl für Entwickler. Hier schafft die KI einen intelligenten Mittelweg zwischen der Passivität von o3 und dem zu hastigen Vorgehen von Sonnet 3.7. Es sind jedoch nicht nur diese drei Modelle, die im Cursor-Ökosystem genutzt werden.
Beispielsweise gilt o4-mini als eher langsam und mittelmäßig, während GPT 4.1 gezielt in sehr speziellen Szenarien hilfreich ist – etwa bei der Formulierung präziser und detaillierter Prompts für einfache, formelbasierte Aufgaben. Diese Vielfalt an Agenten erlaubt es, für jede Aufgabe das passende Werkzeug zu wählen und auf die individuellen Stärken der Modelle zurückzugreifen. Praktisch hat sich folgende Vorgehensweise in der Nutzung etabliert: Bei mittelkomplexen Aufgaben, die nur eine Datei betreffen, wird das faule o3 eingesetzt, um die Arbeit zu planen und durchzuführen. Wenn mehrere Dateien bearbeitet werden müssen, übernimmt die Planung weiterhin o3, das eigentliche Schreiben erledigt jedoch Gemini 2.
5, um die Qualität und Kohärenz zu sichern. Für einfache Aufgaben, die viele Dateien betreffen, eignet sich Sonnet 3.7 mit enger Aufsicht oder GPT 4.1 bei sehr klar umrissenen Fällen. Auch bei hochkomplexen Vorhaben wird zuerst mit dem gründlichen o3 geplant.
Danach wird das Projekt in überschaubare Teilbereiche gegliedert, die jeweils nacheinander mit Gemini 2.5 bearbeitet werden. Diese strenge Strukturierung und schrittweise Herangehensweise verhindert Fehler und hält die Codequalität hoch. Manchmal wird aus Zeitmangel oder Bequemlichkeit allerdings versucht, das gesamte Projekt in einem Rutsch zu bearbeiten, was oft zu Problemen führt und am Ende Zeit für Korrekturen kostet. Die Community rund um Cursor diskutiert intensiv, wie man das Beste aus den unterschiedlichen Modellen herausholen kann.
Einige Nutzer äußern, dass Gemini 2.5 Pro zwar sehr guten Code generiert, gelegentlich jedoch plötzlich stoppt und mehrfach neu angesprochen werden muss, um weiterzuarbeiten. Andere Nutzer fragen sich über die Unterschiede zwischen Varianten wie Gemini 2.5 Pro und Pro Max bzw. Claude 3.
7 und 3.7 Max, wobei Max-Varianten mehr Kontext behalten können, aber auch höhere Kosten mit sich bringen, da jede Werkzeugnutzung separat bezahlt wird. Ein weiterer interessanter Aspekt ist die präferierte Nutzung älterer Modelle wie Sonnet 3.5. Trotz geringerer Fähigkeiten ist die Persönlichkeit von 3.
5 für einige Entwickler angenehmer – weniger streng und mit einer etwas anderen Herangehensweise. Beispielsweise eignet sich 3.5 gut, um einfache Problemstellungen zu bearbeiten, die keine zu enge Eingrenzung der Aufgaben erfordern. Ein konkretes Beispiel aus der Praxis beschreibt ein Problem mit Dropdown-Menüs, das in manchen KI-Modellen zu übertrieben komplexen Lösungen auf Service-Ebene führt, obwohl ein simpler Ansatz auf der View-Schicht ausreicht. In solchen Fällen punktet ein simpler, aber aufmerksamer Agent wie Sonnet 3.
5, der keine unnötigen Komplikationen einbaut. Abschließend zeigt die intensive Nutzung von über 4000 Agentenaufrufen im Monat, wie unterschiedlich KI-Modelle in Cursor agieren und wie wichtig ihre individuelle Persönlichkeit für einen erfolgreichen Softwareentwicklungsprozess ist. Die Mischung aus Faulheit, Eifrigkeit, Intelligenz und Vorsicht sorgt dafür, dass Entwickler gezielt auf die Stärken und Grenzen der Modelle zurückgreifen können und so ihre Produktivität deutlich verbessern. Die Zukunft solcher KI-Plattformen wird höchstwahrscheinlich von einer noch feineren Abstimmung und Diversifizierung der Agentenpopulation geprägt sein. Die Möglichkeit, die bestmögliche KI-Funktion für eine spezifische Aufgabe auszuwählen, wird Entwickler entlasten und die Softwareentwicklung auf eine neue Ebene heben.
Cursor zeigt beeindruckend, wie eine Balance zwischen verschiedenen Persönlichkeiten nicht nur möglich, sondern auch komplett notwendig ist, um den vielfältigen Anforderungen moderner Programmierprojekte gerecht zu werden.