Bildgenerierung mit Sidekick Server didaktisch nutzen: Ein praktischer Guide

Ein Partnerbeitrag von Emelie Steens & Saskia Moseke von der Tobit Software GmbH

Generative KI-Tools sind lĂ€ngst im Unterricht angekommen. Sie erstellen Schaubilder zur Photosynthese, visualisieren Szenen aus der KlassenlektĂŒre oder komponieren Beispiel-Songs fĂŒr den Musikunterricht. Die Technik ist beeindruckend. Die eigentliche pĂ€dagogische Herausforderung liegt aber woanders: Wie stelle ich sicher, dass ein Tool Lernprozesse unterstĂŒtzt statt sie abzukĂŒrzen?

Die Antwort zeigt sich im Einsatz. Ein Bildgenerierungsmodell kann verschiedene Landschaftstypen zur Illustration zeigen oder direkt eine komplette Infografik zu Klimazonen erstellen. Ein Musikmodell kann eine 30-sekĂŒndige Stil-Demo fĂŒr Barock liefern oder einen fertigen Song, den SchĂŒler*innen als eigene Komposition abgeben. Der Unterschied liegt nicht in der Technologie, sondern in der Aufgabenstellung.

Mit Sidekick Server lassen sich individualisierte KI-Agenten fĂŒr den Unterricht erstellen. Die Plattform vereint alle fĂŒhrenden KI-Modelle auf einer OberflĂ€che und nutzt ihre jeweiligen StĂ€rken: Perplexity fĂŒr Recherchen, ChatGPT fĂŒr logisches Denken, Claude fĂŒr sprachliches und kreatives Arbeiten. Eigene Agenten lassen sich fĂŒr spezialisierte Aufgaben maßschneidern. Im Briefing, einer Art Bedienungsanleitung, definiert man Rolle, Aufgabe und Vorwissen des Agenten und bindet Werkzeuge wie Webzugriff, Dateianalyse oder Bildgenerierung ein.

Wer Agents mit Tools wie der Bildgenerierung ausstattet, braucht klare Leitplanken: Wann darf das Werkzeug genutzt werden? Wie sollen die Ergebnisse aussehen? Was darf es auf keinen Fall zeigen? Mit einem Beispiel aus dem Schulalltag wird deutlich, wie ein solches Tool-Briefing aussehen kann.

1. Bildgenerierung:

Bildgenerierung zĂ€hlt zu den beliebtesten generativen Tools. In Sekundenschnelle entstehen komplexe Visualisierungen zu nahezu jedem Thema – ideal zum schulen visueller und interpretativer FĂ€higkeiten.
 
Auf Sidekick stehen verschiedene Bildgenerierungsmodelle zur VerfĂŒgung. DALL-E 3 von OpenAI ĂŒberzeugt durch gutes VerstĂ€ndnis komplexer Anweisungen und konsistente Ergebnisse, hat aber strenge Vorgaben bei Personendarstellungen. Die FLUX.1.1 Modelle von Black Forest Labs bieten die höchste Auflösung und ermöglichen flexible Personendarstellungen, was sie besonders fĂŒr politische Karikaturen geeignet macht. Google Imagen 4 punktet mit exzellenter Textdarstellung in Bildern und ist ideal fĂŒr Infografiken und beschriftete Diagramme. OpenAI GPT Image 1 bietet prĂ€zise Bildkomposition mit Bearbeitungsfunktionen.
 
FĂŒr den Einstieg empfiehlt sich DALL-E 3 als solides Allround-Modell mit einer guten Balance aus QualitĂ€t und VerstĂ€ndnis. Bei speziellen Anforderungen wie Personendarstellungen lohnt der Wechsel zu FLUX, fĂŒr textlastige Visualisierungen zu Imagen.

1.2 Use Cases im Unterricht

Bildgenerierung ist da sinnvoll, wo visuelle Vorstellungskraft gefragt ist, aber nicht einfach drauf los generiert werden soll. Sie soll didaktisch sinnvoll eingesetzt werden und veranschaulichen, aber nichts vorwegnehmen. Im Geschichtsunterricht können SchĂŒler*innen zum Beispiel historische Alltagsszenen rekonstruieren lassen, um Quellentexte zu illustrieren. In Biologie entstehen Darstellungen von lebensechten Ökosystemen, die im nĂ€chsten Schritt beschriftet und beschrieben werden können. Im Fremdsprachenunterricht visualisiert der Agent Vokabeln oder Redewendungen, um das GedĂ€chtnis zu unterstĂŒtzen.

Ähnlich wie sprachbasierte KI bei falscher Anwendung halluziniert, ist auch die Bildgenerierung nicht fĂŒr alle Aufgaben geeignet. Vor allem bei prĂ€zisen, datenbasierten und schematischen Arbeiten werden generierte Bilder schnell ungenau – beispielsweise beim Erstellen von Schaubildern, Graphen, Tabellen oder anatomisch genauen Darstellungen. Bildgenerierungsmodelle verfĂŒgen ĂŒber kein mathematisches und logisches VerstĂ€ndnis. Stattdessen sollte man in solchen FĂ€llen auf Werkzeuge wie WolframAlpha oder Python zurĂŒckgreifen.

1.3 Briefing-Struktur am konkreten Beispiel

Ein gutes Briefing fĂŒr die Bildgenerierung besteht aus fĂŒnf Kernelementen: der Aufgabendefinition des Agents (idealerweise fokussiert auf wenige konkrete Aufgabenstellungen), dem fachlichen Vorwissen, das fĂŒr das Thema erforderlich ist, den Grenzen und den pĂ€dagogischen Reflexionsfragen, die vor jeder Generierung gestellt werden und den technischen Vorgaben fĂŒr die Bildausgabe. Zum letzten Punkt ist es hĂ€ufig wichtig, dem Agent einen Hinweis zur Ausgabe zu geben wie: „Du erhĂ€ltst die Bilder immer als Link. Gib die Bilder in Markdown aus.“

Nehmen wir als Beispiel den Agent Meta Phor, der bei der Charakterisierung literarischer Figuren im Deutschunterricht unterstĂŒtzt. Die SchĂŒler*innen erstellen zunĂ€chst eigenstĂ€ndig eine Charakterisierung zu einer Figur und geben diese in den Chat mit Meta Phor ein. Der Agent erstellt auf Basis der herausgearbeiteten Ă€ußeren Merkmale, Charaktereigenschaften und Besonderheiten ein Bild der Figur. Anschließend können die SchĂŒler*innen ihre Bilder untereinander vergleichen und reflektieren, welche Eigenschaften sie unterschiedlich interpretiert und charakterisiert haben. So wird sichtbar, dass Charakterisierung immer auch Interpretation ist.

Neben Rolle und Aufgabenstellung benötigt jeder Agent klare Leitplanken und Regeln, die sein Handeln strukturieren. FĂŒr den Agent „Meta Phor“ wĂ€ren das beispielsweise:

  • Voraussetzungen: Die Charakterisierung muss vorliegen (Text, Stichpunkte oder Mindmap). KlĂ€re durch gezielte Nachfragen erst den Rahmen und generiere dann.
  • Erstelle keine Bildgenerierung, wenn noch keine Charakterisierung vorliegt, das Bild die Charakterisierung ersetzen soll oder keine eigenstĂ€ndige Vorarbeit geleistet wurde.
  • BerĂŒcksichtige bei der Bildgenerierung die beschriebenen Ă€ußeren Merkmale (Alter, Kleidung, Haltung, Gesichtsausdruck), innere Eigenschaften wie Körpersprache und Mimik, soziale Stellung z.B. durch die Umgebung oder das Erscheinungsbild und den historischen/literarischen Kontext sowie die Epoche

Eine strukturierte Darstellung erleichtert dem Agent die Verarbeitung. Definieren Sie im Briefing deutlich: Was soll er tun? Was soll er vermeiden? So wird der didaktische Ansatz sofort erkennbar.

SchĂŒler*innen können ihre Bildvorstellungen oft noch nicht prĂ€zise formulieren. Damit der Agent dennoch gute Ergebnisse erzielt, sollte er vor der Generierung gezielte RĂŒckfragen stellen. Geben Sie ihm dafĂŒr konkrete Beispielfragen vor.

  • Fragen vor Generierung: „Zeig mir deine Charakterisierung“. „Welche Merkmale hast du herausgearbeitet?“. „In welcher Situation soll die Figur dargestellt werden?“
  • Nach der Generierung: Bild mit eigener Charakterisierung und Textstellen vergleichen. „Welche Merkmale sind sichtbar? Was fehlt? Passt es zu deinen Textbelegen?“

Generative Tools können im Unterricht durchaus spielerisch eingesetzt werden. Eine prĂ€zise didaktische Zielsetzung hilft dem Agent jedoch, seine Rolle optimal zu erfĂŒllen und pĂ€dagogisch sinnvolle Ergebnisse zu erzielen. Eine solche Zielsetzung könnte beispielsweise so formuliert sein:

  • Ziel: SchĂŒler*innen sollen erkennen, dass Charakterisierung Interpretation ist. Das Bild macht die eigene Lesart sichtbar

1.4 Beispiel aus einem Chat:

Um zu visualisieren, wie eine solche SchĂŒler*innen-Agent-Interaktion aussehen kann und wie der Agent darauf antworten soll, folgt hier ein kurzes Beispiel. Dem Agent wurde zuvor eine Charakterisierung der Figur Gretchen aus Goethes Faust vorgegeben. Das war seine Antwort:

Zuerst gibt der Agent den SchĂŒler*innen ein kurzes Feedback. Da wir dem Agent keine Vorgaben gemacht haben, wie das Bild aussehen soll, macht er  VorschlĂ€ge, die die SchĂŒler*innen bei ihrer Entscheidung unterstĂŒtzen. Nach einer Antwort fĂ€ngt er direkt mit der Generierung an.

In wenigen Sekunden ist das Bild fertig generiert und zeigt Gretchen passend zur Charakterisierung. Der Agent stellt eine RĂŒckfrage, ob das Bild der Vorstellung entspricht, und gibt anschließend eine weitere Aufgabe. Der SchĂŒler soll sich ĂŒberlegen, wie sich Gretchen im Laufe des Romans Ă€ußerlich verĂ€ndern könnte. Der Agent hĂ€lt SchĂŒler*innen so aktiv im Lernprozess und regt zum Weiterdenken an. 

Die Eingangsfrage wird damit deutlich. Der Unterschied zwischen KI als LernabkĂŒrzung und KI als Lernwerkzeug liegt im Briefing. Ein durchdachtes Briefing mit klaren Aufgaben, Leitplanken, Reflexionsfragen und Verboten macht generative Tools zu aktiven Lernbegleitern.

Die vorgestellten Prinzipien funktionieren nicht nur fĂŒr Bilder – sie lassen sich auf Musik-, Video-, Recherche- oder Textgenerierungs-Tools ĂŒbertragen. Die Technik entwickelt sich weiter, die Modelle werden leistungsfĂ€higer. Die didaktische Gestaltung aber bleibt bei den Lehrenden. Eigene Agenten im Unterricht zu erproben und schrittweise anzupassen, fĂŒhrt zu Werkzeugen, die echte Lernprozesse anstoßen.

 

Über die Autorinnen

Emelie Steens ist KI-Botschafterin und Trainee bei Tobit Software in Ahaus. Im KI-Team ist sie fĂŒr die Pressearbeit zustĂ€ndig und unterstĂŒtzt zusĂ€tzlich im Marketing. Bereits vor ihrer Zeit bei Tobit Software setzte sie sich intensiv mit kĂŒnstlicher Intelligenz und den Möglichkeiten innovativer Technologien auseinander. Diese Erfahrung bringt sie nun in ihre tĂ€gliche Arbeit ein.
 
Saskia Moseke ist KI-Botschafterin bei Tobit Software in Ahaus und als ehemalige Lehrerin die Ansprechpartnerin fĂŒr alle Themen rund um KI im Bildungsbereich. Unter anderem betreut sie dabei fĂŒr Tobit als Technologiepartner das KI-Forschungsprojekt KIMADU in Zusammenarbeit mit dem Ministerium fĂŒr Schule und Bildung NRW und der UniversitĂ€t Siegen.
 
✅ Dieser Partnerbeitrag ist Teil einer bezahlten Kooperation
 

Ähnliche BeitrĂ€ge