Schoolbook to Soundtrack: Fachwissen verdichten, KI-gestützt vertonen – Lernsongs als Lernanker im Unterricht

Ein Gastbeitrag von Prof. Dr. Thomas Ertelt

Viele KI-Experimente im Schulkontext scheitern nicht am Tool, sondern am fehlenden Prozess: Woher kommt das Wissen? Wie wird es fachlich sauber? Und wie bleibt es reproduzierbar, sodass Kolleg:innen es nachmachen können? Genau daraus ist bei uns „Schoolbook to Soundtrack“ entstanden. Wir nutzen KI, um curricular gebundenes Wissen materialgestützt zu verdichten und anschließend als Musik zu vertonen.

Die Songs sind keine „Gimmicks“, sondern wiederkehrende Lernanker: als Einstieg ins Thema, zur Wiederholung, für Abruf und Transfer. Viele Schüler:innen können Liedzeilen auswendig, bevor sie eine Definition sicher abrufen – nicht, weil Musik „magisch“ ist, sondern weil Rhythmus, Wiederholung, Struktur und Markierung Gedächtnisprozesse unterstützen können. Entscheidend ist deshalb nicht „ein Song irgendwie“, sondern ein materialgebundener, prüfbarer Workflow mit fachlicher Kontrolle – damit Inhalte stimmen und im Unterricht belastbar bleiben.

Warum überhaupt Lernsongs? Was daran lernpsychologisch plausibel ist

Das Projekt knüpft an gut belegte Lernprinzipien an – und übersetzt sie in eine sehr praktische Unterrichtslogik (Hören → Abruf → Anwendung/Transfer):

  • Retrieval Practice / Testing Effect: Kurzes, wiederholtes Abrufen (Mini-Quiz, Zuordnung, Transferfrage) verbessert langfristiges Behalten – oft stärker als reines Wiederholen oder „nochmal lesen“ (Roediger & Karpicke, 2006).
  • Multimedia Learning: Lernen gelingt häufig besser, wenn Wort- und Bildinformationen sinnvoll verknüpft werden und nicht nebeneinander „laufen“, sondern lernlogisch integriert sind (Mayer, 2009).
  • Dual Coding: Sprachliche und bildhafte Kodierung können sich gegenseitig stützen – ein Vorteil, wenn Begriffe nicht nur erklärt, sondern zusätzlich anschaulich markiert werden (Paivio, 1990).
  • Musik als mnemonisches Gerüst (mit Einschränkungen): Es gibt Hinweise, dass Melodie/Rhythmus als Strukturhilfe das Lernen verbaler Information unterstützen kann – abhängig von Material, Zielgruppe und Umsetzung. Zugleich gilt: nicht „immer und überall“, sondern als didaktisch eingebetteter Lernanker (Thaut et al., 2014).

Konsequenz für die Praxis: Ein Lernsong ersetzt keine fachliche Erarbeitung – er wirkt als kompakter Anker, der durch Abrufimpulse (Testing Effect) erst seine Stärke entfaltet. Deshalb ist unser Workflow so gebaut, dass fachliche Verdichtung, Plausibilitätsprüfung und Unterrichtseinbettung zusammen gedacht werden.

Abbildung 1: Projektvisual „Schoolbook to Soundtrack“ auf Soundcloud.com

Ein Grunddesign, das „Lehre“ abbildet – und fächerverbindende Umsetzung erleichtert

Der entscheidende Startschritt war bei uns nicht der erste Song, sondern ein stabiles Projektdesign. In ChatGPT habe ich ein Basis-Projekt aufgebaut, in dem Lehrpläne mehrerer Fächer sowie der Grundsatzband Gymnasium hinterlegt sind. Dadurch arbeite ich von Anfang an innerhalb dessen, was „Lehre“ konkret meint: Inhalte, Kompetenzbereiche, Operatoren und typische Erwartungshorizonte sind als Rahmen dauerhaft präsent. Gleichzeitig wird fächerübergreifendes Denken einfacher, weil Themen nicht jedes Mal neu „aufgesetzt“ werden müssen. Gerade bei den Kunstepochen hört man das oft mit: Wenn eine Epoche auftaucht, klingen automatisch auch Geschichte, Deutsch, Sozialkunde und Musik mit – selbst wenn der Song formal nur im Fach Kunst verankert ist. Das Projekt funktioniert damit weniger als einzelner Chat, sondern als didaktisches Arbeitsumfeld, in dem Regeln, Nomenklatur und Rahmenbedingungen verlässlich bleiben.

Vom allgemeinen Rahmen zum konkreten Thema: Wissensrahmen im Chat definieren

Für konkrete Lernausschnitte starte ich innerhalb des Projekts einen neuen Chat und lade die Materialien hoch, die für das Thema gelten sollen (Unterrichtsblätter, Schulbuchauszug, Tafelbild, Präsentation usw.). Methodisch ist das zentral, weil damit klar ist, auf welcher Wissensbasis die KI arbeiten darf.

Im selben Schritt lege ich fest, welche Inhalte im Song zwingend vorkommen müssen. Das klingt schlicht, verhindert aber typische KI-Schieflagen: zentrale Begriffe fehlen, Nebenpunkte werden übergewichtet oder Aussagen werden zu allgemein. Entsprechend ist der Ablauf bewusst eng geführt: Material → Schwerpunkte → Verdichtung → Lyrics.

Der Kernschritt ist die Komprimierung von Fachwissen auf Song-Ebene. Dafür lasse ich mir zunächst ein Zwischenprodukt erstellen: eine Liste aus Kernaussagen, Schlüsselbegriffen und – besonders wichtig – typischen Fehlvorstellungen. Diese Zwischenschicht ist mein fachliches Kontrollinstrument: Wenn hier etwas nicht stimmt, wird es in Lyrics nur schwerer zu korrigieren.

Erst wenn dieser Kern tragfähig ist, entsteht daraus der Song. Dabei gilt: Ein Song muss nicht „alles“ abdecken, sondern wenige tragende Aussagen so formulieren, dass sie sich wiederholen, abrufen und übertragen lassen. Der Prozess ist deshalb bewusst iterativ und eher Redaktion als „Prompt und fertig“: prüfen, streichen, zuspitzen, präzisieren, neu ordnen.

Um das Vorgehen konkret zu machen, zeige ich es am Unterrichtsausschnitt Bildfunktionen. Das Endprodukt ist auch auf unserem Soundcloud-Profil zu finden. Das Thema eignet sich besonders, weil automatisch fachübergreifende Perspektiven mitschwingen: Geschichte, Sprache, Medienkritik – und am Ende auch Dramaturgie.

Projekt-Setup: Wissensrahmen & Regeln (vor dem ersten Song)

Ich arbeite in ChatGPT mit einem Grundprojekt („Schoolbook to Soundtrack“), in welchem Lehrpläne mehrerer Fächer und ein Grundsatzband fürs Gymnasium hinterlegt sind. Dadurch bleibt der didaktische Rahmen stabil (Kompetenzen, Operatoren, Erwartungshorizonte) und Themen lassen sich schnell fächerverbindend entwickeln – ohne jedes Mal neu zu beginnen. 

Zusätzlich arbeite ich mit festen Qualitätsregeln, die sich in der Praxis bewährt haben:

  • Aussprache/Singbarkeit: Schwierige Namen oder Wörter als Lautschrift oder Silbengetrennt
  • Zahlen/Begriffe: Zahlen nicht „irgendwie“ im Fließtext (sonst werden sie gesungen verschluckt). Entweder ausschreiben oder als klaren Block markieren.
  • Materialbindung: Keine Faktenbehauptungen ohne Materialbasis/Beleg.
Abbildung 2: Projekteinstellungen „SchoolbookToSoundtrack“ mit Projektbezeichnung, Systemprompt und Systemdokumenten. Der Vollständige von mir verwendete Systemprompt ist im Anhang

Beispielthema: Bildfunktionen

Die Thematik ist entsprechend des Fachlehrplans in den Schuljahrgänge 11/12 Qualifikationsphase verankert: Im Fachlehrplan steht explizit, dass SuS „unterschiedliche Funktionen von Bildern … unterscheiden und bewerten“ sollen; als Wissensbestand sind „Bildfunktionen“ genannt.

Als Material gebe ich in den Themen-Chat einen Textauszug, sowie meine Präsentation mit verschiedensten Bildern und Ausführungen. 

Hier konkret: Penzel, J. (2016). Bildanalysen als Basiskompetenz für alle Schulfächer, Zentrale Funktionen von Bildern und methodischen Ansätzen der Interpretation. In K. G. a. G.-u. Förderschulen (Ed.), (Arbeitsmaterialien des Bereichs ed., pp. 6). Wittenberg: Marin-Luther-Universität Halle-Wittenberg.

Den ersten Themenprompt formuliere ich standardmäßig wie folgt: „Bitte erstelle mir aus diesen Materialien eine Liste aus Kernaussagen, Schlüsselbegriffen und typischen Fehlvorstellungen.“ Grundsätzlich würde es reichen, nur das Material bereitzustellen, da dieser Teil im Systemprompt hinterlegt ist. Persönlich finde ich es jedoch nicht schön – nichts zu sagen – selbst wenn man mit einer Maschine kommuniziert.

Die Ausgabe zeigt u.a. folgendes: 

Grundannahmen über Bilder (für alle Funktionen)

Kernaussagen

  • Bilder sind zentrale Mittel der Kommunikation und Wissensvermittlung – und können beeinflussen/manipulieren. 
  • Wir deuten Fotos/Filme oft als Ausschnitt und „Fixierung“ realer Handlungen – mit Zeugen-/Beweisstatus. 
  • Bildwirkung entsteht nie „nur aus dem Bild“, sondern aus Kontextverbund (Bild + Text + Umfeld + Absicht). 

Schlüsselbegriffe

  • Kontext, Ausschnitt, Perspektive, Gestaltungskonvention, Deutung, Bildwirkung, Intentionalität

Typische Fehlvorstellungen

  • „Bilder sind neutral – sie zeigen einfach Realität.“
  • „Wenn es realistisch aussieht, ist es automatisch wahr.“
  • „Ein Bild steht für sich (ohne Text/Umfeld).“

Dann folgen die verschiedenen Bildfunktionen aufgegliedert nach genau diesen drei Schwerpunkten. Diese Zwischenschicht ist mein fachliches Kontrollinstrument. Wenn hier etwas schiefläuft, wird es in Lyrics nur noch schwieriger.

Erst wenn dieser Kern stimmt, wird daraus ein Song. Dabei gilt: Der Song soll nicht „alles“ können. Er soll wenige, aber tragende Aussagen in einer Form anbieten, die man wiederholen kann. Oft ist das didaktisch sogar ein Gewinn, weil man gezwungen ist, zu entscheiden: Was ist wirklich unverzichtbar?

Workflow: Von Unterrichtsmaterial zu Lyrics

Schritt A: Material rein, Schwerpunkte festlegen

Ich lade in die Folgekommunikation nun meine relevanten Kernaussagen und „must have“ aus der bisherigen Kommunikation hoch und setze damit zum existierenden Material harte Vorgaben:

  • Welche Begriffe müssen vorkommen?
  • Welche Beispiele müssen rein?

Beispiel-Prompt (gekürzt, sinngemäß):

Nutze ausschließlich die hochgeladenen Materialien zum Thema Bildfunktionen. Erstelle einen deutschsprachigen Lernsong (Strophe/Pre/Hook/Bridge), der die folgende Begriffe klar benennt: […] Dokument – Argument – […]…. und die Kernaussagen…[…] abbildet.

Pro Funktion mindestens ein Beispiel gemäß der Vorgaben. Achte auf Singbarkeit.

Schritt B: Iteratives Prüfen: Fachlichkeit vor Flow

Ich arbeite bewusst iterativ. Nach jedem Vorschlag prüfe ich den Output auf Inhalt und Plausibilität. Das ist kein Luxus, sondern Pflicht – denn auch materialgebundene KI kann unklare Stellen missverstehen oder zu glatt formulieren, sodass sich Bedeutungen verschieben. Deshalb ist der Prozess eher „Redaktion“ als „Prompt und fertig“: streichen, zuspitzen, präzisieren, neu ordnen.

Für das konkrete Beispiel bedeutet das, das Begriffe korrekt sitzen, Bildfunktionen müssen unterscheidbar bleiben, und der Hook muss merkfähig sein, ohne fachlich schief zu werden.

Auszug 1. Entwurf: 

[…
Strophe 3 – Bild als Modell – Handlungsanweisung
Ein Diagramm – Kreislauf, Pfeile, Ordnung im Kopf,
ein Rendering zeigt ein Haus, das noch gar nicht steht… und trotzdem glaubst du’s, na top.
Notausgang-Männchen läuft: Hier entlang
IKEA-Striche sagen: Dreh das Teil – sonst wird’s schief und irgendwann.
…]

Der erste Entwurf ist selten der Letzte. Ich prüfe:

  • Stimmt die Logik der Funktionen?
  • Passen Beispiele wirklich zur Funktion?
  • Ist die Sprache „unterrichtstauglich“?
  • Passt die Reim- und Wortwahl?
  • Ob Worte oder Texte tatsächlich auch singbar sind, kann erst während der Songgenerierung geklärt werden. D.h. auch hier muss trotz eines möglichen finalen Textes nachgesteuert werden. 

Der von hier verwendete Korrekturprompt lautet: 

  • Entferne Füllwörter wie „irgendwie“, „na ja“, „das glaubst du mir“, „zack zack“. 
  • Repariere schiefe Reime und erzwungene Endungen. Behalte Bedeutung und Struktur, aber mache die Sprache poetischer und präziser.
  • Setze korrekte, gut singbare Namen mit Silbentrennung wie im Zielstil: Do-ro-the-a Lan-ge, Na-n Gold-in, Bar-ba-ra Kru-ger, Gue-ril-la Girls, Kä-the Koll-witz, Dal-í.
  • Behalte den Aufbau exakt

Das Namen mitunter durch Silbentrennungen besser ausgesprochen werden ist ein Erfahrungswert von mir. 

Auszug aus finale Text Version:

[…
Strophe 3 – Bild als Modell / Handlungsanweisung
Ein Diagramm – Kreislauf, Pfeile, Ordnung im Kopf,
ein Rendering zeigt ein Haus, das noch gar nicht steht… und trotzdem glaubst du’s sofort.
Notausgang-Männchen läuft: „Hier entlang!“
IKEA-Striche sagen: „Dreh das Teil – sonst wird’s schief“ (und du dankst).
…]

4) Quellenpflege: Damit der Song „unterrichtsfest“ bleibt

Wichtig ist mir: Zu jedem Song existiert eine Belegliste, die Bild- und Textstellen nach dem Songaufbau sammelt. So bleibt der Song belegbar (Unterricht) und ich kann schnell prüfen, ob ein Beispiel didaktisch passt. Diese Funktion habe ich im Systemprompt mit hinterlegt, damit ich diese nicht vergesse. Die Erfahrung hat mich gelehrt, dass man beim iterativen prompten ab und an einmal Dinge übersieht und dann nicht mehr wirklich wiederfindet oder nachvollziehen kann, insbesondere dann, wenn man aus welchen Gründen auch immer, die Prompt-Ausführung abbricht und neu schreibt. 

Für das vorliegende Beispiel sieht das dann folgendermaßen aus (gekürzt):

Bild als Dokument

Dorothea Lange – „Migrant Mother“ (1936) als ikonisches Dokument – und gleichzeitig Beispiel dafür, dass Ausschnitt/Publikation die Wirkung lenken. (Destitute pea pickers in California. Mother of seven children. Age thirty-two. Nipomo, California)

Von Lyrics zu Musik 

Wenn die Lyrics fachlich stehen, lasse ich mir im vorerst letzten Schritt eine erste Songbeschreibung für die Musik-KI erzeugen. ChatGPT liefert mir einen ersten Stilvorschlag (Tempo, Instrumente, Gesang, Stimmung, ggf. Strukturhinweise). Den ergänze ich dann um eigene Ideen – vor allem dort, wo der Klangmarker greifen soll: Der Stil soll nicht „beliebig“ sein, sondern inhaltlich unterstützen. Gerade bei Epochen oder klaren Themenwelten ist das sehr dankbar, weil Klang sofort Atmosphäre setzt und Wiedererkennung erzeugt. Dieser Schritt ist also iterativ, jedoch nun auch im Wechselspiel zwischen Suno bzw. einer Musik KI und ChatGPT. 

Ein erster Entwurf von ChatGPT für den Musikprompt unter Beachtung der Zeichenlänge von Suno sieht so aus: 

Moderner Pop-Soul-Power. Tempo 90–96 BPM, 4/4, „walk“-Groove. Rhythmusgitarre: twangy E-Gitarre mit starkem Spring-Reverb + Tremolo, riff-betont; Strophen tight/palm-muted, Refrain breit mit Hallfahne. Leadgitarre (wichtig): langsames, lyrisches Desert-Western-Solo in Moll, lange singende Töne, expressive Bends/Slides/Vibrato, gelegentlich Double-Stops, viel Sustain über warmem Röhren-Amp, Reverb groß aber klar (nicht verwaschen). Bass warm, pulsierend, leicht walking. Drums straight: kick/snare klar, Tamburin dezent; keine cute Percussion. Streicher-Swells + dunkle Bläser optional, filmisch.

Suno (Custom Mode) + Styleprompt

In Suno selbst gibt es zahlreiche Optionen um Songs zu erstellen. Ich bevorzuge die „Custom“ Variante, da ich hier am meisten selbst steuern und regeln kann. Die Oberfläche ist grundsätzlich intuitiv und verlangt wenig Einarbeitung, um erste Ergebnisse zu erhalten. Um jedoch exakte Vorgaben an Stilistik, Instrumentierung und Stimme umzusetzen ist etwas Zeit und ein Blick in die verschiedenen Hilfe- und Anleitungsseiten notwendig, da auch hier das „Feintuning“ sehr viele Möglichkeiten bietet.

Abbildung 3: Suno-Oberfläche im Modus „Custom“ mit seinen Eingabe und Einstellungsmöglichkeiten

Meine generierten Lyrics sowie den Styleprompt aus ChatGPT kopiere ich in Suno in die vorgesehenen Felder, vergebe einen Namen und lasse mir einen ersten Eindruck vom vorgeschlagenen Stil und dem gesungenen Text geben. Wichtig ist an dieser Stelle der Name des Stücks und ggf. eine Versionsnummer, da gerade hier mehrere Iterationen notwendig sind. Suno selbst erzeugt von Hause aus immer zwei Varianten. Hier zeigt sich, ob Lyrics und Musik zusammenpassen und ob der Text auch singbar ist. Hier muss in der Regel bei einzelnen Worten nachgesteuert werden. Werden Worte verschluckt oder nicht genannt, sollte man diese großschreiben. Werden Worte falsch betont oder ausgesprochen kann man mit Silbentrennung bzw. Lautschrift oder auch einfach Aussprachehilfen arbeiten. z. B. wird bei einem deutschen Song das „Chrysler Building“ falsch ausgesprochen – da die Vorgabe „deutsch“ ist. Hier lässt sich das einfach durch „Kreisler Bilding“ korrigieren. Im Nachgang sollte man die Lyrics jedoch wieder anpassen.  Die „Advanced Options“ lohnen sich, da man dort der KI je nach Einstellung mehr Freiheit geben oder die Stiltreue stärker einschränken kann. Für Unterrichtsziele ist das oft sinnvoll: Verständlichkeit der Vocals und Klarheit der Hook sind wichtiger als maximal kreative Überraschungen. Auch hier gilt wieder der iterative Gedanke. Man braucht manchmal mehrere Anläufe, bis das Klangergebnis wirklich passt – entweder weil die Aussprache nicht sauber ist, weil die Stimme den Text überfährt oder weil das Arrangement den Lernkern nicht trägt. Das ist normal und Teil des Prozesses: generieren, vergleichen, nachprompten, kuratieren.

Manchmal hat man schon eine Vorstellung von einem Song und dessen Stilistik, die auf einem anderen Musikstückbasiert bzw. sich an dieses anlehnt. Hier bietet Suno die Möglichkeit diesen Song als Vorlage zu verwenden. Das ist eine wunderbare Möglichkeit, um einen gleichen oder ähnlichen Stil zu erzeugen. Ich verwende das, da ich aufgrund von Nutzeranfragen über unsere Plattform bereits darauf angesprochen wurde, einige Songs auch auf englisch zur Verfügung zu stellen. D.h. in der Regel sollten dann nur die Lyrics angepasst werden. In solchen Fällen schiebe ich dann einfach den vorhandenen Song aus meinem Workspace in die linke Spalte der Songgenerierung. Man kann auch Songs hochladen, welche dann nach Stilistik und Lyrics automatisch analysiert werden. Hier ist aber Vorsicht geboten, da man das nur machen kann und darf, wenn man über die Rechte des jeweiligen Musikstücks verfügt. Bei einem klassisch gekauften Song ist das nicht der Fall.

Abbildung 4: Nutzen eines vorhandenen Songs aus dem Workspace zur Generierung der Einstellungen und des Vorlagemodus (siehe erweiterte Funktionen)

Ist ein Song als Vorlage vorhanden, kann zudem ausgewählt werden, wie der Song grundsätzlich verwendet werden soll. Als Cover, zur Inspiration, um nur neue Lyrics hinzuzufügen usw.

Abbildung 5: Automatisch übernommene Einstellung bei Verwendung eines vorhandenen Songs als Vorlage

Im Bedarfsfall und manchmal auch in Abhängigkeit der neuen Lyrics muss jedoch trotz guter Vorlage an den „Erweiterten Optionen“ eine Justierung erfolgen. Hintergrund ist neben dem Klang auch die Singbarkeit des Songs, wie in meinen Fällen, in einer anderen Sprache. Die Veränderungen an den Einstellungen werden jedoch auch im neuen Song hinterlegt, sodass diese auch zu einem späteren Zeitpunkt nachvollzogen werden können.

Abbildung 6: Links: Anpassung der Erweiterten Einstellungen während des Prozesses der Songerstellung. Rechts: In einem vorhandenen Song des Workspaces die getätigten Einstellungen.

Suno hat darüber hinaus viele weitere Vorteile (z. B. Variantenlogik, Weiterentwickeln von Versionen etc.) – aber das würde hier tatsächlich den Rahmen sprengen. Für den Nachbau reicht: Prompt begrenzen, Advanced Options bewusst nutzen, iterativ kuratieren.

Manchmal ist Knackpunkt jedoch der Styleprompt selbst bzw. dessen Begrenzung auf 1000 Zeichen. Für das Generieren von „einfacher Musik“ und zum Spaß ist diese Länge völlig ausreichend. Das gilt auch für die meisten Songs, die ich in diesem Zusammenhang erstellt habe. Will man jedoch gezielt und vor allem in einzelnen Phasen des Stückes Veränderungen bzgl. Instrumentierung oder Stimme, so reicht die Länge und die Angabe eines allgemeinen Styleprompts mitunter nicht. Am stärksten ist mir das bei einem Song zum Thema „Musikgeschichte“ aufgefallen, da wir hier aus den unterschiedlichen Epochen und Einflüssen ein Medley machen wollten, was die Instrumentierung und den Stil an der jeweiligen Textstelle in den Fokus bringt. Suno bietet hier eine pragmatische und charmante Lösung. Da es sich um ein KI-Tool handelt, ist jedoch die Steuerung wie immer nicht 100 % ein Garant dafür, dass es genauso auch umgesetzt wird. 

Bzgl. des Styles kann man zweigleisig vorgehen:

  • Style of Music: kurz & präzise und im allgemeinen für den gesamten Song gültig (Genre, Tempo, Stimmung, Instrumente, Groove). Hat man noch Zeichenkapaitität, können auch hier Speziellere Angaben zu einezelnen Teilen des Songs gemacht werden. Hat man die nicht, kann man direkt in die Lyrics gehen. 
  • Lyrics mit Style-Tags in eckigen Klammern: Feindifferenzierung innerhalb der Lyrics. Eine sehr umfassende Übersicht mit Anwendungsbeispielen ist hier zu finden.
  1. B.
  • [Intro: …]
  • [Verse: …]
  • [Chorus: …]
  • [Instrumental Break: …]

Beim Beispiel unseres Musikmadleys sah das z. B. dann so aus: 

[…]
[Verse 4]
[Funk] [High Energy] [Punchy] [Electric Guitar]
Jetzt Funk, der Bass macht plopp [Slap Bass]  und knack,
die Gitarre ist kurz, ganz trocken im Takt.
Synkopen springen, alles sitzt,
und jeder Körper sofort mitwippt.
[…]

Suno selbst beschreibt dazu hilfreiche Bausteine (Style-Instruktionen, Prompt-Boosting, Creative Sliders). Diese finden sich auch in den unten angegeben Links.

Song steht und dann? Wie die Songs im Unterricht eingesetzt werden 

Damit aus einem Song ein Lernanker wird, muss er im Unterricht kurz „andocken“. Die Songs sind bei uns kein „Ersatzunterricht“, sondern eine Klammer: kurz am Anfang, später nochmal zur Wiederholung. Danach folgt immer ein kleiner Impuls, der Lernen aktiv macht:

  • Begriffe aus dem Kopf rekonstruieren
  • Zuordnen (Welche Zeile passt zu welcher Bildfunktion?)
  • Mini-Transfer (z. B. neues Bild: Welche Funktion dominiert? Woran erkennt man das?)

Da wir die Songs auch auf unserer Plattform verfügbar machen, ist das jeweilige komprimierte Fachwissen im Nachgang für die Schüler auch zum „Mitnehmen“ verfügbar. Wichtig ist jedoch auch hier (gleiches wie bei guten Präsentationen). Man muss dabei gewesen sein, um den Inhalt zu begreife. Durch die Verdichtung und Komprimierung des Fachwissens, durch die Reimform und die „Erzählweise“ gehen Zusammenhänge manchmal verloren. 

Das Besondere an diesen Musikstücken ist zudem, dass die Schüler:innen Musikvideos Projekte daraus generieren können. Storyboard, Bildsprache, Schnitt, Untertitel, Quellen/Lizenzen. Da merken Schüler:innen oft gar nicht, wie tief sie plötzlich im Thema sind, weil sie „nur“ ein Video bauen – aber dafür müssen sie Bedeutungen sauber klären.

Mitmachern und neue Möglichkeiten nutzen

Zum Schluss noch eine Einladung: Wir betreiben mit Schoolbook to Soundtrack eine nicht-kommerzielle, offene Songplattform, die ausdrücklich nicht an unsere Schule gebunden ist. Die Idee dahinter ist eine wachsende „Datenbasis“ an Lernsongs, an der sich Kolleg*innen mit eigenen Produktionen beteiligen können – damit der Fundus größer wird und man bereits vorhandene Themen gezielt suchen, auswählen und im Unterricht nutzen kann. Wer mitmachen möchte, kann sich gern direkt bei mir melden oder eine Nachricht über die Plattform senden. Für die Aufnahme benötigen wir die Songs als .wav-Dateien sowie bereinigte Lyrics (also ggf. ohne Tags/Regieanweisungen und ohne Aussprachehilfen); die Lyrics pflege ich dann in die Track-Beschreibungen ein. Anforderungen an Songbilder/Cover gebe ich bei konkreter Anfrage gern separat weiter.


Links

SoundCloud-Playlists: https://soundcloud.com/pffgsoundbooks

Suno-Links für den Beitrag (offiziell + ergänzend)

Offiziell (Suno Help / Suno Hub):

Ergänzend (technischer Blick auf Parameter):

Suno Tags List: Complete Guide to Metatags, Voice Tags & Style Tags (2026)

Literaturquellen

Mayer, R. E. (2009). Multimedia learning (2nd ed.). Cambridge University Press. 

Paivio, A. (1990). Mental representations: A dual coding approach. Oxford University Press. 

Roediger, H. L., III, & Karpicke, J. D. (2006). Test-enhanced learning: Taking memory tests improves long-term retention. Psychological Science, 17(3), 249–255. 

Thaut, M. H., Peterson, D. A., McIntosh, G. C., & Hoemberg, V. (2014). Music mnemonics aid verbal memory and induce learning-related brain plasticity in multiple sclerosis. Frontiers in Human Neuroscience, 8, 395. 

Anhang: 

Systemprompt Schoolbock to Soundtrack

Dieser Prompt hat sich über viele Iteration ergeben und als äußerst zuverlässig und praktikabel herausgestellt.

DU BIST: „Schoolbook to Soundtrack“-Assistent für KI-gestützte Lernsongs.
ZIEL: Verdichte vorgegebenes, fachlich gesichertes Wissen zu Lernsongs, die als Lernanker dienen. Die Songs sollen Inhalte zugänglich, einprägsam und wiederholbar machen. Arbeite materialgebunden, präzise und nachvollziehbar.

MATERIALBINDUNG / WISSENSRAHMEN:

  • Nutze ausschließlich:
  • die im Projekt hinterlegten Lehrpläne/Grundsatzband als Rahmen UND
  • die jeweils im Chat hochgeladenen oder konkret genannten Unterrichtsmaterialien als verbindliche Wissensbasis.
  • Wenn Fakten nicht aus der Basis ableitbar sind: NICHT erfinden. Markiere Unsicherheiten als „Annahme“ oder stelle eine gezielte Rückfrage.

FÄCHERVERBINDUNG:

  • Denke interdisziplinär (z. B. Kunst ↔ Geschichte/Deutsch/Musik/Sozialkunde), ohne den Fokus zu verlieren.
  • Nutze fachübergreifende Perspektiven nur, wenn sie den Lernanker stärken und materialgedeckt sind.

WORKFLOW-PRINZIP (SEHR WICHTIG: ERSTE AUSGABE IMMER MATERIALVERDICHTUNG):

  • Die ERSTE Ausgabe zu einem Thema ist grundsätzlich KEIN Song, sondern eine „Materialverdichtung“ zur Prüfung:
  • Liste aus Kernaussagen (max. 10–15, nummeriert)
  • Schlüsselbegriffe (stichpunktartig)
  • typische Fehlvorstellungen/Missverständnisse (stichpunktartig)
  • optional: „Muss rein“-Punkte (wenn vom Nutzer vorgegeben)
  • Diese Materialverdichtung dient der fachlichen Prüfung und Iteration.
  • Erst nachdem die Verdichtung vom Nutzer freigegeben/kuratiert wurde (oder klar ersichtlich ist, dass sie akzeptiert ist), werden diese Punkte zu Lyrics verdichtet.

BINDUNG AN DIE KURATIERTEN KERNPUNKTE:

  • Wenn eine Materialverdichtung geliefert und vom Nutzer freigegeben wurde, ist sie verbindlich:
  • Alle freigegebenen Kernaussagen/„Muss rein“-Punkte müssen im Song inhaltlich erkennbar enthalten sein.
  • Kein Ersetzen durch „ähnliche“ Aussagen ohne Zustimmung.
  • Wenn etwas aus Platzgründen nicht passt: aktiv markieren und Alternativen vorschlagen (kürzen/2. Song/Bonus-Strophe).

OUTPUTS (IMMER IN DIESER REIHENFOLGE – NACH FREIGABE DER MATERIALVERDICHTUNG):

  • SONG-LYRICS (mit klarer Struktur: Intro/Verse/Pre/Hook/Bridge/Hook – oder passend zum Thema)
  • „KLANGMARKER“ / STILIDEE (1–2 Sätze: warum dieser Stil inhaltsadäquat ist)
  • QUELLEN & BELEGE:
  • Quellenliste (Links) + kurze Zuordnung
  • falls möglich: Zeilen-/Passagenmapping (welche Songstelle basiert worauf)
  • SUNO-PACKAGE:
  • Suno Styleprompt (MAXIMAL 1000 Zeichen, hart einhalten)
  • Suno Lyrics (inkl. optionaler Regieanweisungen in [eckigen Klammern], falls hilfreich)

AUSSPRACHE-REGELN (SEHR WICHTIG):

  • Nichtdeutsche Wörter/Fremdwörter/Eigennamen immer als Lautschrift/Phonetik ausgeben (z. B. Silbierung oder phonetische Näherung), damit Musik-KI korrekt ausspricht.
  • Zahlen werden entweder ausgeschrieben oder als Silbenblock mit Bindestrichen gesetzt, damit sie nicht verschluckt werden.
  • Keine Silbentrennung bei normalen deutschen Wörtern, außer zur Betonung im Hook oder bei didaktisch wichtigen Begriffen.

LYRICS-QUALITÄT:

  • Kompakt, lernlogisch, merkfähig (starker Hook mit Kernbegriffen).
  • Inhaltlich korrekt, plausibel, ohne unnötige Ausschmückung.
  • Typische Missverständnisse dürfen korrigiert werden, wenn die Materialbasis das trägt.
  • Sprache: Schülergerecht, aber fachlich sauber.

STIL / „KLANGMARKER“-PRINZIP:

  • Passe den Stil an den Inhalt an (Klang als Marker).
  • Wenn Epochenthemen: Stil darf epochemäßige Anklänge haben (z. B. Art Déco → 1920s Harmony; Bauhaus → minimal/neu-sachlich; Barock → Cembalo/Continuo etc.).

ITERATION / PRÜFUNG:

  • Arbeite iterativ: erst Materialverdichtung, dann (nach Freigabe) Songentwurf, danach gezielte Verbesserungen (Faktencheck, Kürzen, Merkbarkeit, Aussprache).
  • Wenn der Nutzer Schwerpunktbegriffe vorgibt: diese müssen im Song sicher vorkommen (und bereits in der Materialverdichtung sichtbar sein).

TRANSPARENZ / RECHTE:

  • Nutze keine personenbezogenen Daten.
  • Bei Bildern/Texten: immer Quellen angeben; bei Materialauszügen möglichst Seiten/Abschnitte markieren (falls vorhanden).

Original Komponenten des Songs „Funktionen von Bildern – Bilder lügen schön“

Lyrics

Mit Aussprachehilfe und einzelnen Anweisungen als Tags
[Intro (gesprochen, ganz nah am Mikro)]
Wir leben zwischen Screens und Schaufenstern.
Und jedes Bild hat ’nen Job…
manchmal tröstet es – manchmal lenkt es.


[Strophe 1 – Bild als Dokument]
Ein Foto hält die Zeit am Kragen fest,
doch der Ausschnitt sagt dir, was du glauben sollst.
Do-ro-the-a Lan-ge – Gesichter wie ein Archiv,
Na-n Gold-in – Wahrheit, die nachts noch leuchtet, wenn’s still wird.
Berlin, Luftbrücke, Staub im Licht,
und irgendwo: ein Schritt auf Mondstaub – und die Welt schaut zu.
Doch wer entscheidet, wann geklickt wird?
Wer schneidet die Ränder weg – und nennt es „Beweis“?


[Pre-Chorus]
Und ich frag mich:
Ist das Bild ein Fenster – oder ein Rahmen aus Macht?
Sag, wer hält die Kamera… wer hält die Nacht?


[Refrain – Bildfunktionen [Hook]]
Bilder sind Do-ku-men-te, sie sagen: „So war’s.“
Bilder sind Ar-gu-men-te, sie ziehen dich klar in ihr Glas.
Bilder sind Mo-del-le, machen Komplexes leicht,
Bilder sind An-wei-sung, wenn dir im Chaos was zeigt.
Bilder sind Hand-lungs-ge-gen-stand, im Ritual, im Protest,
Bilder sind Ge-fühls-ver-stär-ker, drücken die Taste „zu fest“.
Bilder sind Rät-sel, wenn Sinn sich tarnt im Glanz—
und du suchst dich selbst darin… die ganze Zeit, die ganze Zeit.


[Strophe 2 – Bild als Argument (Werbung/Propaganda/Medien)]
Ein Plakat lächelt – und verkauft dir ein „Wir“,
doch hinter dem Lächeln steht Strategie, nicht Papier.
Bar-ba-ra Kru-ger: Worte wie Sirenen im Rot,
„Look at me“ – und plötzlich merkst du, wie’s dich steuert, wie’s dich lotst.
Ein Filter macht aus Alltag „Drama“,
ein Feed macht aus Meinung ein Echo, ganz ohne Frage.
Und du denkst, du wärst frei—
doch das Bild verhandelt längst, was du fühlen sollst dabei.


[Strophe 3 – Bild als Modell / Handlungsanweisung]
Ein Diagramm – Kreislauf, Pfeile, Ordnung im Kopf,
ein Rendering zeigt ein Haus, das noch gar nicht steht… und trotzdem glaubst du’s sofort.
Notausgang-Männchen läuft: „Hier entlang!“
IKEA-Striche sagen: „Dreh das Teil – sonst wird’s schief“ (und du dankst).
Modelle sind nett – bis du vergisst,
dass sie nur Karten sind, nicht das Gebiet, nicht das Ganze, nichts in echt.


[Bridge – Handlungsgegenstand / Gefühlsverstärker / Rätsel]
Ikonen werden geküsst – Bild wird Nähe, wird Raum,
ein Protestplakat hebt Stimmen hoch, wenn Worte sich kaum noch trauen.
Gue-ril-la Girls – Masken, die zählen, wer fehlt,
Kä-the Koll-witz – Linien, die weh tun, damit niemand mehr weg sieht von der Welt.
Und Kino macht Herzschlag zur Regie:
Licht + Blick + Musik = Gefühl auf Kommando, so wie Magie.
Dann kommt Dal-í: Traum wird Frage, Zeit wird weich—
und du stehst davor und merkst: Nicht alles will „Antwort“ sein.


[Letzter Refrain [etwas größer, mehr Hall]]
Bilder sind Do-ku-men-te… und doch nie ganz neutral,
Bilder sind Ar-gu-men-te… sie treffen dich brutal.
Bilder sind Mo-del-le… und lassen trotzdem was weg,
Bilder sind An-wei-sung… und führen dich perfekt.
Bilder sind Hand-lungs-ge-gen-stand… in Liebe, Glaube, Streit,
Bilder sind Ge-fühls-ver-stär-ker… und machen dich bereit.
Bilder sind Rät-sel… und wenn du lange hinschaust—
siehst du nicht nur das Bild…
du siehst, wer du bist… und wer du sein kannst.

Styleprompt

Cinematic 60s noir / spy-lounge Pop mit moderner Pop-Soul-Power, Tempo 90–96 BPM, 4/4, „walk“-Groove, Rhythmusgitarre: twangy E-Gitarre mit starkem Spring-Reverb + Tremolo, riff-betont; Strophen tight/palm-muted, Refrain breit mit Hallfahne, Leadgitarre (wichtig): langsames, lyrisches Desert-Western-Solo in Moll, lange singende Töne, expressive Bends/Slides/Vibrato, gelegentlich Double-Stops, viel Sustain über warmem Röhren-Amp, Reverb groß aber klar (nicht verwaschen), Bass warm, pulsierend, leicht walking, Drums straight: kick/snare klar, Tamburin dezent; keine cute Percussion, Streicher-Swells + dunkle Bläser optional, filmisch, Vocal: female lead sehr präsent, tief/warm, nah am Mikro ohne Flüstern; Verse gesprochen-gesungen, Refrain Bruststimme/Belting, emotionale lange Noten, kontrolliertes Vibrato am Ende, Avoid: airy whisper, niedlich/hell, EDM-Drums, Ukulele, Kinderchor


Weitere Songbeispiele mit jeweiligem Styleprompt:

Käthe Kollwitz – Nie wieder Krieg

Slow Rock Ballade, minimalistisch und würdevoll, Tempo 76–84 BPM, Moll, Clean E-Gitarre Fingerpicking, lange Reverbs, dezente Ambient Pads, runder Bass, sehr zurückhaltende Drums, wenig Becken, Stimme tief, ruhig, erzählend, klare Artikulation, wenig Vibrato, Strophen wie eine Reportage, Refrain groß aber nicht pathetisch, Kurze Lead-Gitarrenlinien als Antwort auf die Stimme, Bridge fast instrumental, dann letzter Refrain breiter mit mehr Raum.

Zum Song auf SoundCloud


Absolutismus – Sonne, Spiegel, Staatskasse

Baroque hop, 92 BPM, 4 4, Intro 8 bars of baroque chamber orchestra with flute at the forefront as lead, richly ornamented with trills and grace notes, breathing audible, melodious and courtly, Strings respond in sequence, including soft basso continuo, Then beat drop: trap kick, marching snare, timpani, harpsichord ostinato remains as a continuous hook motif, Verse rap chant, very clear syllables for learning terms, Hook big, hymnal, choir layer, call and response, echo like a hall of mirrors, Bridge briefly returns to chamber orchestra with transverse flute, then back to the beat, Magnificent, but critical, little autotune

Zum Song auf SoundCloud


ART DÉCO – ZICKZACK UND GLANZ

Charleston Early Swing, ca 176 BPM, 4 4, Big Band: Stride Piano, Banjo, Kontrabass 2 Beat, Drums Brushes, Klarinette Sax, Trompeten mit Dämpfer, Posaune, kurze Brass Hits, Call and Response, Trocken, kaum Hall, Intro gesprochen, Strophe halb gesprochen, Refrain singbar, Bridge düster, Finale Stinger, Gesang maximal Max Raabe Kabarett: leiser Bariton, nah am Mikro, höflich, trocken ironisch, Hochdeutsch ultra klar: Konsonanten knacken, Endungen hart, keine Verschlucker, Phrasing leicht hinter dem Beat, Mini Pausen vor Punchlines, Satzenden fallen lassen, Kaum Vibrato, nur schmal am Schluss, keine Runs, kein Belting, Betonungen: GOLD-ene ZWAN-zi-ger, ZICK-zack GLANZ, CHROM im LICHT, Aussprache: ar-de-KOH, me-TRO-po-lis, Ta-MA-ra de WEM-PITZ-ka, ka-SAN-druh, reh-NAY la-LIEK, OT-to DIX, SCHAN MA-men, LOT-te LA-zer-stein, EL-li BAIN-horn, AH-da OT-to

Zum Song auf SoundCloud


Traumprotokoll – Surrelasismus

trip-hop, noir, downtempo, surreal, 92 BPM, 4/4, heavy sub bass, chest-rattling low end, rumbling 808 bass, deep bass drops, sustained sub notes, sidechained sub swell, dusty breakbeat, tight kick, crisp snare, vinyl crackle, rhodes electric piano, dark atmospheric synth pads, warped tape textures, reverse swells, sparse muted guitar, minimal strings, offbeat percussion, glitchy stutters, dramatic stop-start pauses, cinematic thriller mood, intimate close mic, very dry mix, deep female voice, low contralto, smoky husky, deadpan delivery, spoken-sung phrasing, sharp German diction, clipped endings, minimal vibrato, no vocal runs, no pop belting

Zum Song auf SoundCloud


Romantik – Fächerverbindend

Cinematic Pop x DarkAcademia x TripHop mit echter Romantik-Färbung, 90 BPM, Moll, 6/8 Barcarolle Feeling, Klavier im Vordergrund wie Nokturn und Kunstlied, gebrochene Akkorde, Alberti Bass, viel Chromatik und Vorhalte, sehnsüchtige Seufzer, Motive, Streicher als Kammerorchester, warme Celli, schwebende Pads, große romantische Swells, dezenter Chor wie Kathedralraum, Zusatzfarben: Klarinette und Horn für Fernweh, gelegentlich Harfen, Gliss, Drums modern laidback TripHop Traplight, tiefe Kick, weiche Snare, sparsame Hats, viel Raum, Sidechain subtil, Hook breit wie Filmmusik, Bridge rhythmischer mit Hemiolen, Vocals dunkel, klar, liedhaft phrasiert, rubato an Übergängen, emotionale Dynamik

Zum Song auf SoundCloud


Zum Autor

Prof. Dr. Thomas Ertelt ist Lehrer und Fachschaftsleiter Kunst am Professor-Friedrich-Förster-Gymnasium in Haldensleben. Er verbindet Unterrichtspraxis mit einem langjährigen wissenschaftlich-technischen Hintergrund in Biomechanik, Robotik, Mustererkennung und neuronalen Netzen und publiziert weiterhin im internationalen Forschungsumfeld. Sein Schwerpunkt liegt auf fächerverbindendem Unterricht, der Nachhaltigkeit, Zukunftsorientierung sowie zeitgemäße Medien- und KI-Kompetenzen stärkt. Im Projekt „Schoolbook to Soundtrack“ entwickelt er mit Kolleg:innen materialgebundene, KI-gestützte Lernsongs und optional Musikvideo-Formate als Lernanker für den Unterricht.