Effiziente Nachrichtensuche mit einem News-Agenten und externen Tools
✅ Lizenz für diesen Beitrag erwerben
Agenten auf der Grundlage von Sprachmodellen wie Claude, GPT oder Mistral lassen sich vielfältig nutzen, um zum Beispiel die Suche nach geeigneten Nachrichten etwa mit dem Schwerpunkt „KI & Bildung“ mithilfe von Tools wie Google Search & YouTube über API-Verbindungen zu automatisieren. Das Sim Studio ist eine Open-Source-Plattform (GitHub), mit der User simpel per Drag & Drop solche komplexen Systeme aufbauen können. Viele solcher „KI-Workflow-Plattformen“ funktionieren nach diesem Schema.
Und so könnte es gehen:
1) Login über Sim Studio
2) Zum Start-Block einen Agenten-Block hinzufügen und diese miteinander über die Konnektoren verbinden. Siehe linke Navigation mit Switch „Blöcke“ und „Tools“.
3) Wechsel auf „Tools“ und die Anwendungen „Google Search“ & „YouTube“ auf die Arbeitsoberfläche ziehen und diese mit dem Agenten-Block verbinden.
4) Über Tools nun „Google Docs“ auf das Canvas ziehen und mit „Google Search“ und „YouTube“ verbinden. Im Docs werden die Links aus der Google-Suche und YouTube gespeichert.
5) „Google Drive“ auf die Arbeitsoberfläche ziehen und mit Docs verbinden, um den Upload zu ermöglichen.
6) User loggt sich täglich in Docs ein und geht die Linkliste durch
Ziel: Über Agenten mit LLM und externen Tools automatisiert KI-Neuigkeiten generieren
Mit dem Start-Block geht es los und dann wird über Konnektoren verbunden
Die obere Abbildung aus dem Sim Studio zeigt die beiden Blöcke „Start“ und „Agent“, die miteinander über Linien und die in der Mitte der Blöcke angebrachten Stellen verbunden sind. Die Konnektoren ermöglichen den AI Workflow, also von Block zu Block bis zum endgültigen Resultat. Denkt bitte immer dran, dass die gewünschten Einheiten miteinander verbunden sind. Den Agenten-Block habe ich links über die Navigation einfach auf die Arbeitsoberfläche gezogen und kann diesen dort auch beliebig verschieben. Die Linien lassen sich auch jederzeit wieder lösen. Dies einfach mal kurz durchtesten. In der unteren Abbildung ist jeder Schritt etwas detaillierter bezeichnet, wie etwa die genaue Einstellung eines exakten Start-Termins wie täglich um 07:00 und erst dann startet der gesamte Worflow.
LLM und Tools über API connecten – nun steht die Verbindung
Im Agenten-Block des Sim Studio lassen sich u.a. Settings zum Systemprompt & Userprompt setzen, um den Agenten genaue Anweisungen zu erteilen, wie er denn stets agieren soll. Im Beispiel habe ich im Systemprompt u.a. Folgendes eingetragen: „Du agierst im Stile eines Tech-Journalisten mit Schwerpunkt Künstliche Intelligenz und bist auf den D-A-CH-Raum spezialisiert.“ Als Sprachmodell wurde GPT-4o ausgewählt, das erst genutzt werden kann, wenn ein gültiger OpenAI API-Key eingetragen wird, wobei dann jeder „Durchgang“ kleine Cent-Beträge kostet. Das ist wichtig zu wissen im Umgang mit Agentensystemen und den zahlreichen API-Keys, die bei Large Language Models und auch externen Tools benötigt werden. Hier geht es um die stetige Verbindung, aber auch um eine korrekte Abrechnung.
Zusätzlich zu den API-Keys für das LLM GPT-4o und Google Search (kostenpflichtig) & YouTube (kostenlos) müssen Nutzer dann noch ihre Google-Accounts connecten, um in diesem Fall Google Docs und Google Drive über die Cloud verwenden zu können. Es gibt also allerlei kleine Einstellungen, die man für jeden einzelnen Block tätigen kann. Nein, ich habe nicht jede Einheit mit API und Google-Account verbunden, sondern möchte hiermit nur kurz zeigen, wie sich solche Agentensysteme aufbauen und mit diversen Anwendungen verbinden ließen. Die Zuverlässigkeit hinsichtlich des Outputs in der Form „guter“ Links (in Docs) darf bitte jeder selber testen. Hier geht es dann auch um Anpassungen seitens der Settings und weiteren Durchläufen, bis schlussendlich der Output zufriedenstellend bzw. der gesamte Arbeitsprozess optimiert erscheint.
Es empfiehlt sich definitiv, dem Agentensystem einen ganz eigenen Zugang etwa zu einer Cloud zu erstellen, denn dass solch eine KI einen direkten Zugang zu euren privaten Dokumenten und Bildern erhielte, dies würde ich vermeiden, da natürlich immer Fehler passieren könnten, etwa bezüglich entwendeter Dateien oder Ähnlichem. Passt hier definitiv auf!

Vom Prompt- zum Context-Engineering: Ein neues Jobprofil entsteht
Aktuell wird der aus den USA stammende Begriff des Context-Engineering etabliert, der den gesamten Kontext rund um die Nutzung von LLMs mit Agenten und Tools und den dazugehörigen Settings bezeichnet. Das Prompt-Engineering hingegen skizziert ausschließlich das optimale Schreiben eines Prompts etwa für einen Chatbot oder eine Bild- und Video-KI, mehr i.d.R. nicht. Oben bei den Erklärungen zu den Agenten-Settings hatte ich zum Beispiel meinen Teil-Input zum Systemprompt dargestellt und genau dies wäre das Prompt-Engineering, aber der User muss natürlich noch viel mehr „Dinge“ einstellen, damit dieser AI Workflow wirklich funktioniert, wie etwa das Hinzufügen der APIs oder die Verbindung mit einem Google-Account und den gewünschten Anwendungen oder Datenbanken und dem Memory. Und genau diese Gesamtheit an „kleinen“ Aufgaben lässt sich dann aus meiner Sicht als Context-Engineering bezeichnen. Das Prompt-Engineering ist nun also ein kleiner Teil des Context-Engineering. Hieraus könnte sich in Zukunft ein komplexes Jobprofil im Rahmen der Nutzung von KI-Anwendungen ableiten, bei dem dann doch wieder mehr Tech-Skills gefragt sind und weniger passgenaue Formulierungen.
Wenn wir nun am Beispiel des News-Agenten im Sim Studio bleiben, dann bin ich beim Aufbau des gesamten Systems wohl als Context-Engineer vorgegangen, der sich zudem im Vorfeld eine Struktur überlegen sollte, auch hinsichtlich des API-Kostenmanagements, da womöglich eine bestimmte Aufgabe von einem effizienteren Large Language Model (LLM) oder vielleicht doch eher günstigerem Small Language Model (SLM) ausgeführt werden könnte. Manche APIs verursachen umgehend Kosten (LLM API), andere hingegen gar nicht (YouTube API) oder erst ab einer bestimmten Anzahl an Useranfragen (Google Search API). Ein sehr interessantes Berufsbild, wie ich finde, mit unglaublich vielen Möglichkeiten der Anbindungen, aber auch einer beständigen Kontrolle. Also langweilig wird es nicht 😉
Nutzung des Beitrags mit Text & Screenshots
✅ Lizenz für eine Organisation (Zum Shop)
✅ Lizenz für eine Einzelperson (Zum Shop)
Ein Beitrag erstellt von








