Agentische KI: Wenn Sprachmodelle Werkzeuge zum Handeln erhalten

Agentische KI erweitert Sprachmodelle um Werkzeuge, Gedächtnis und die Fähigkeit zu handeln. Anstatt sich auf ein einziges grosses Modell zu verlassen, können viele kleinere Agenten sich spezialisieren, kooperieren und Fähigkeiten wiederverwenden. Dies macht KI-Systeme modularer und praxistauglicher, wirft aber auch neue Fragen zu Transparenz, Koordination und Verantwortung auf.

Grosse Sprachmodelle (LLMs) wie ChatGPT und Gemini können fliessend schreiben, zusammenfassen und schlussfolgern, doch immer grössere Modelle zu bauen ist teuer, und viele praktische Aufgaben erfordern mehr als reine Textgenerierung [5]. Hier kommt agentische KI ins Spiel: Anstatt eines geschlossenen Chatbots gibt ein agentisches System einem Modell Werkzeuge, Gedächtnis und die Fähigkeit zu handeln. Es kann Informationen suchen, Code ausführen, Teilaufgaben delegieren und Schritt für Schritt auf ein Ziel hinarbeiten.

Was macht KI agentisch?

Ein agentisches System bettet ein Sprachmodell in einen Agenten ein, der seine Umgebung wahrnehmen, über das weitere Vorgehen nachdenken und dann handeln kann. Abbildung 1 zeigt ein konkretes Beispiel: Eine Forschungsfrage wird beantwortet, indem die Arbeit auf mehrere spezialisierte Agenten verteilt wird.

Abbildung 1: Multi-Agenten-System für Tiefenrecherche: Eine Anfrage wird in Teilaufgaben zerlegt, Ressourcen werden autonom gesucht und eine Antwort wird synthetisiert.

Diese Struktur bietet vier wesentliche Vorteile: Spezialisierung (jeder Agent konzentriert sich auf eine Aufgabe), Robustheit (ein Agent kann das Ergebnis eines anderen prüfen), Skalierbarkeit (neue Agenten können hinzugefügt werden, ohne das System neu aufzubauen) und Transparenz (es ist einfacher nachzuvollziehen, welcher Teil ein bestimmtes Ergebnis erzeugt hat [4]).

Wie funktioniert das?

Im Kern agentischer KI steht eine Denk-Handlungs-Schleife: Das Modell liest die Aufgabe, ruft ein Werkzeug auf, liest das Ergebnis und wiederholt dies bis zur Fertigstellung (Abb. 2). Frameworks wie AutoGen helfen dabei, diese Interaktionen zu strukturieren [7].

Abbildung 2: Das ReAct-Framework (Denk-Handlungs-Schleife) verknüpft das Schlussfolgern des LLM mit dem Aufrufen von Werkzeugen.

Wird das Modell zum Beispiel gebeten, die Fläche eines Dreiecks zu berechnen, wählt es die richtige Formel, ruft ein Berechnungswerkzeug auf und erklärt das Ergebnis in verständlicher Sprache, anstatt zu raten. Die zentrale Herausforderung ist die Orchestrierung: zu entscheiden, welcher Agent wann handelt, und einen Menschen zum richtigen Zeitpunkt einzubeziehen.

Bestehende Werkzeuge

Mehrere Werkzeuge machen agentische KI heute auf verschiedenen technischen Niveaus zugänglich [1]. Abbildung 3 ordnet eine Auswahl auf einem Spektrum von code-basierten Bibliotheken (wie LangChain oder LlamaIndex) bis hin zu visuellen Plattformen ohne Programmierung (wie n8n oder Zapier) ein.

Abbildung 3: Überblick über aktuelle agentische Werkzeuge. Die horizontale Achse reicht von code-basierten bis zu visuellen Oberflächen ohne Programmierung, die vertikale von leichtgewichtigen Frameworks bis zu stärker verwalteten Plattformen. Logos stammen von den offiziellen Websites.

Zwei Ideen gewinnen an Bedeutung, um Agenten langfristig leistungsfähiger zu machen. Erstens Fähigkeiten (Skills): wiederverwendbare Bausteine, die ein Agent speichern und abrufen kann, sodass er aus Erfahrung lernt, anstatt von vorne zu beginnen, wie im Voyager-Projekt gezeigt [6]. Zweitens ermöglichen gemeinsame Protokolle wie das Model Context Protocol (MCP), dass Agenten aus verschiedenen Systemen zuverlässig dieselben Werkzeuge aufrufen können [2]. Abbildung 4 zeigt, wie beides zusammenspielt.

Abbildung 4: Fähigkeiten und MCP erfüllen unterschiedliche Rollen in einem agentischen System. Fähigkeiten liefern interne wiederverwendbare Bausteine, während MCP eine standardisierte externe Schnittstelle bereitstellt, über die der Agent Werkzeuge und Dienste erreicht.

Anwendungsbeispiele

AgentischeWorkflows sind besonders wertvoll, wenn eine grössere Aufgabe in unabhängige Schritte aufgeteilt werden kann, die von verschiedenen Komponenten übernommen werden. In der Business Intelligence und Datenanalyse kann ein Agent Rohinformationen sammeln, ein anderer sie bereinigen und ein dritter die Ergebnisse in einem Dashboard oder Bericht aufbereiten. Bei der Tiefenrecherche durchsuchen mehrere Agenten das Web parallel, vergleichen Quellen und erstellen eine strukturierte Zusammenfassung, weit zuverlässiger als ein einziger langer Prompt. Im Gesundheitswesen können kollaborative Diagnosesysteme medizinisches Schlussfolgern mit separaten Compliance- oder Sicherheitsprüfungen kombinieren, was die Entscheidungsunterstützung robuster macht [3]. In jedem Fall übernimmt das Sprachmodell die Rolle des Koordinators, ohne spezialisierte Werkzeuge zu ersetzen, aber indem es sie steuert.

Herausforderungen

Trotz aller Versprechen bleiben mehrere Herausforderungen bestehen. Zu viele interagierende Agenten können Arbeit duplizieren oder das gesamte System verlangsamen (Koordinationsaufwand). Nutzerinnen und Nutzer müssen ausserdem verstehen, was jede Komponente getan hat und wann ein Mensch eingreifen sollte, bevor das System fortfährt (Vertrauen und Transparenz). Mehrstufige Workflows erfordern viele Modellaufrufe, was Latenz und Betriebskosten erhöht (Token-Kosten). Schliesslich wird es schwierig zu sagen, wer bei einem Fehler die Verantwortung trägt, wenn eine Kette von Agenten gemeinsam eine reale Aktion ausgelöst hat (Verantwortlichkeit). Diese Fragen werden darüber entscheiden, ob agentische KI zu einer verlässlichen Infrastruktur wird oder ein vielversprechender Prototyp bleibt.

Fazit

Agentische KI zielt weniger darauf ab, ein einzelnes, schlaueres Modell zu bauen, als darauf, Intelligenz modular zu gestalten,wie ein kleines Team, in dem sich jedes Mitglied auf eine Aufgabe spezialisiert. Ob dieses Potenzial ausgeschöpft wird, hängt davon ab, wie diese Systeme gebaut werden: Mit Transparenz, menschlicher Aufsicht und gemeinsamen Standards könnten sie zu praktischer Infrastruktur für Forschung, Medizin und den beruflichen Alltag werden.

Literatur

[1] Anthropic. Building e ective agents. https://www.anthropic.com/engineering/building-effective-agents, 2024. Accessed: August 2025.

[2] Anthropic and Partners. Model context protocol (mcp). https://modelcontextprotocol.io/docs/getting-started/intro, 2024. Accessed: August 2025.

[3] Xi Chen, Huahui Yi, Mingke You, WeiZhi Liu, Li Wang, Hairui Li, Xue Zhang, Yingman Guo, Lei Fan, Gang Chen, Qicheng Lao, Weili Fu, Kang Li, and Jian Li. Enhancing diagnostic capability with multi-agents conversational large language models. npj Digital Medicine, 8(1), March 2025.

[4] Peter Kairouz et al. Advances and open problems in federated learning. Foundations and Trends in Machine Learning, 14(1 2):1 210, 2021.

[5] Chen Qin et al. Large language model empowered agents: A survey. arXiv preprint arXiv:2309.07864, 2023.

[6] Guanzhi Wang, Yuqi Xie, Yunfan Jiang, Ajay Mandlekar, Chaowei Xiao, Yuke Zhu, Linxi Fan, and Anima Anandkumar. Voyager: An open-ended embodied agent with large language models. arXiv preprint arXiv:2305.16291, 2023.

[7] Yuchen Wu et al. Autogen: Enabling next-gen llm applications via multi-agent conversation. arXiv preprint arXiv:2308.08155, 2023.

Dr. Albin Grataloup ist Postdoktorand im Bereich Datenwissenschaften an der Berner Fachhochschule. Seine Forschung befasst sich mit personalisierten und datenschutzfreundlichen Lernmethoden, die unter anderem im medizinischen Monitoring, im Wohlbefindens-Tracking sowie in generativen und Empfehlungssystemen eingesetzt werden.

Agentische KI: Wenn Sprachmodelle Werkzeuge zum Handeln erhalten

Was macht KI agentisch?

Wie funktioniert das?

Bestehende Werkzeuge

Anwendungsbeispiele

Herausforderungen

Fazit

Literatur

Ähnliche Beiträge

Dein Kommentar

Schreiben Sie einen Kommentar Antwort abbrechen

RSS abonnieren

Kontakt

Newsletter