Wie ChatGPT den „KI-Policy-Generator“ im Agentenmodus testet

Mit dem Agentenmodus von ChatGPT lässt sich eine Webseite vollständig durchgehen und analysieren. ChatGPT verwendet dabei den eigenen Browser. Um zu einem Button zu gelangen und dort draufzuklicken, werden die horizontalen und vertikalen Pixel gezählt und genau in diese Richtung bewegt sich auch die Maus. Um sich zu orientieren und den Inhalt einer Webseite zu überprüfen, macht das Sprachmodell mit Vision-Fähigkeit immer einen Screenshot, analysiert diesen und bereitet darauf basierend den nächsten Schritt vor.
Im Beispiel habe ich ChatGPT angewiesen, hier auf „Unidigital“ den per iFrame eingebundenen KI-Policy-Generator der Universität Bamberg zu testen und eine geeignete Vorlage für eine Lehrveranstaltung zu empfehlen.

Als Erstes gilt es, die geeigneten Settings bei ChatGPT einzustellen. Hierzu links unten auf das Plus-Symbol navigieren, anschließend im Menü auf „Mehr“ und dann rechts oben auf „Agentenmodus“ klicken. Nun ist der ChatGPT-Agent aktiv und dies wird wie im oberen Screenshot abgebildet unten an der Promptleiste in blauer Schrift (Agent) dargestellt.
PROMPT: Ich suche nach einer passenden Richtlinie für meine Lehrveranstaltung. Bis auf die abschließenden Klausuren soll alles mit KI erlaubt sein. Nutze das Tool KI-Policy-Generator (URL) und übernehme dies in deinem Browser. Präsentiere eine geeignete Richtlinie und erkläre dies.
URL: https://www.unidigital.news/ki-policy-generator-der-universitaet-bamberg-ein-tool-zum-erstellen-einer-ki-richtlinie-fuer-lehrveranstaltungen/
Das untere Video zeigt, wie sich ChatGPT innerhalb des KI-Policy-Generators orientiert. Nach einem Screenshot folgt die Analyse, die live mit beschreibendem Text angezeigt wird. So kann man den „Gedankengängen“ des Sprachmodells folgen.
Für meine Aufgabe, eine KI-Richtlinie zu finden, bei der KI-Anwendungen überall zum Einsatz kommen dürfen, bis auf die abschließenden Klausuren, wird die Policy „AI-DocShort v1″ empfohlen. Und dies ist genau die passende Richtlinie für meine fiktive Veranstaltung. Super!

Da es sich bei dem offenen Tool der Universität Bamberg um einen iFrame-Embed auf „Unidigital“ handelt und die Anwendung somit über die Server der Universität Bamberg läuft, kann es sein, dass ChatGPT vorab um Erlaubnis fragt, ob der Button „Externes Tool laden“ angeklickt werden soll, um weiterzuverfahren. Dies zeigt, dass das LLM wirklich alles an dieser Aufgabe verstanden und korrekt umgesetzt hat. Ich habe hierfür einen Versuch benötigt. Nach einem Klick oberhalb des Outputs auf „Worked for [XYZ]“ öffnet sich auf der rechten Seite eine Sidebar, die den gesamten Prozess mit den einzelnen Screenshots historisch anzeigt. Viel Erfolg!




