Der “Prompt Report” mit umfassenden Prompting-Techniken: Wie nutze ich Large Language Models (LLMs) am effizientesten?
„In diesem Artikel führen wir eine systematische Literaturrecherche zu allen Prompting-Techniken der Generativen KI (GenAI) durch (nur Präfix). Wir kombinieren menschliche und maschinelle Anstrengungen, um 4.797 Datensätze von arXiv, Semantic Scholar und ACL zu verarbeiten und extrahieren 1.565 relevante Artikel durch den PRISMA-Überprüfungsprozess. Aus diesem Datensatz präsentieren wir 58 textbasierte Techniken, ergänzt durch eine umfangreiche Sammlung multimodaler und mehrsprachiger Techniken. Unser Ziel ist es, ein robustes Verzeichnis von Prompting-Techniken bereitzustellen, die leicht verstanden und implementiert werden können.”
Quelle: Github.io
Die obere Abbildung zeigt, wie die Wissenschaftler rund um Sander Schulhoff (University Maryland) bezüglich der Betrachtung von Prompting-Techniken vorgegangen sind. Sowohl Text als auch multimodale Inputs wie Bild, Audio und Video wurden berücksichtigt. An dieser Stelle möchte ich direkt erwähnen, dass dieser Blogbeitrag nicht alle Details dieser Untersuchung berücksichtigt. Für genauere Analysen empfehle ich den Beitrag von The Decoder.
Unterteilung der Prompting-Techniken
- textbasiert (natürliche Sprache & Code)
- mehrsprachig (nicht-englisch)
- multimodal (Uploads wie Bilder, Audios…)
Prompting-Methoden zur Nutzung von LLMs
Der Kern dieser Studie liegt auf den verschiedenen Prompten-Techniken, also dem Input von Text, Code, Bildern & Co und wie damit Large Language Models (LLMs) am besten verwendet werden können bzw. wie Sprachmodelle die für eine Fragestellung geeignetsten Antworten als Output geben. Bislang gibt es diesbezüglich nur wenige Forschungsergebnisse, die etwa für Unternehmen und in den Bereichen der Wissenschaften sehr interessant sind. Dies ändert sich nun.
Bei der Papiersammlung folgten wir einem systematischen Überprüfungsprozess, der auf der PRISMA-Methode basiert. Zunächst durchsuchten wir arXiv, Semantic Scholar und ACL mit einer Stichwortsuche. Unsere Stichwortliste bestand aus 44 Begriffen, von denen jeder eng mit Prompting und Prompt Engineering verwandt war. Anschließend entfernten wir Duplikate aus unserem Datensatz anhand der Papiertitel, führten eine umfassende Überprüfung durch Menschen und KI auf Relevanz durch und entfernten automatisch nicht verwandte Papiere, indem wir die Papiertexte auf den Begriff „Prompt“ überprüften.
Quelle: Github.io
Die obere Grafik zeigt alle textbasierten Eingabetechniken aus dem Datensatz und stellt dar, wie viele unterschiedliche Methoden beim Prompting mit Textinput vorhanden sind. Auch zu den mehrsprachigen und multimodalen Inputs gibt es im Rahmen der Ergebnisse passende Abbildungen dazu, die z.B. für Blogbeiträge genutzt werden könen. Der untere PDF-Embed verfügt über alle notwendigen Darstellungen im Rahmen der Untersuchungen.
Few-Shot-Prompting, also Prompting mit Beispielen direkt im Prompt, ist in der Regel die effizienteste Prompting-Methode. Allerdings gibt es auch hier merkwürdige Fallstricke.
Quelle: The Decoder