SauerkrautLM: So macht Vago Solutions KI-Modelle fit für Deutschland

Ein Beitrag von Dr. Daryoush Vaziri

SauerkrautLM hat einen klugen Weg gefunden, um KI in Deutschland besser nutzbar zu machen. Statt eine komplett neue KI zu entwickeln, was sehr viel Energie und Zeit kosten würde, macht das Team von VAGO Solutions etwas Schlaueres: Sie nehmen die bereits gut funktionierenden KI-Modelle von bekannten Firmen wie Mistral, Google und Meta und passen diese speziell für Deutschland an. Dabei konzentrieren sie sich besonders darauf, dass die Modelle gut mit Deutsch und Englisch umgehen können. Das Ziel ist es, Unternehmen bei der Verwaltung von Wissen und der Vereinfachung von Arbeitsabläufen zu helfen.

sauerkraut
Offene Sauerkraut-Modelle auf HuggingFace verfügbar

Schlau sparen durch Wiederverwertung

SauerkrautLM geht einen besonderen Weg: Sie nutzen, was es schon gibt. Das ist wie beim Hausbau – statt ein komplett neues Haus zu bauen, nehmen sie ein gutes Grundgerüst und gestalten es nach deutschen Bedürfnissen um. Das bringt viele Vorteile:

  • Sie sparen sehr viel Energie, weil sie keine neue KI von Grund auf trainieren müssen
  • Sie können die Erfahrung der großen KI-Firmen nutzen
  • Sie können schnell eine Version für den deutschen Markt bereitstellen

Neue Anpassungsmethoden aus Deutschland

Das Team hat besondere Methoden entwickelt, um die KI-Modelle anzupassen. Diese Methoden sind so gut, dass sie es sogar in den offiziellen Leitfaden von Hugging Face (die international wichtigste Plattform für Open Source Sprachmodelle) für das Jahr 2025 geschafft haben. Mit diesen Methoden können sie:

  • Die KI-Modelle genau für die deutsche Sprache optimieren
  • Dabei sehr wenig Energie verbrauchen
  • Die ursprünglichen Fähigkeiten der KI beibehalten und für deutsche Anwendungen nutzbar machen

Praktischer Nutzen für Wissenschaft und Forschung

Universitäten und Forschungseinrichtungen können die angepassten KI-Modelle besonders gut nutzen. Verschiedene Studien zeigen, dass die Modelle sehr gut sind für:

  • Das Verstehen von deutschen wissenschaftlichen Texten
  • Die Unterstützung bei der Auswertung von domänenbezogenen Inhalten, bspw. Krankenakten
  • Das Erklären von schwierigen wissenschaftlichen Themen in einfacher Sprache

Inzwischen bieten deutschlandweit mehrere Universitäten SauerkrautLM-Modelle für ihre Mitarbeiter und Studierenden an, darunter bspw. die Universität Göttingen, die TU Berlin, die Uni Rostock, Uni Potsdam, die TU Augsburg und einige mehr.

sauerkraut
Beliebtes Modell “Llama-3.1-SauerkrautLM-8b-Instruct”

Sicherer Umgang mit Daten

Bei der Anpassung der KI-Modelle achtet das Team besonders auf Datenschutz und Sicherheit. Die angepassten Modelle:

  • Behalten die Sicherheitsvorkehrungen der ursprünglichen KI bei
  • Können direkt vor Ort oder auf eigenen Geräten laufen, sodass private Daten sicher bleiben
  • Sind darauf trainiert, gefährliche oder beleidigende deutsche Texte möglichst zu vermeiden

International erfolgreich

Die angepassten Modelle von SauerkrautLM schneiden in internationalen Vergleichen sehr gut ab. Auf der Plattform Hugging Face erreichen sie regelmäßig Spitzenplätze. Das ist besonders beeindruckend, weil:

  • Sie sehr ressourcenschonend trainiert werden
  • Sie speziell für Deutsch optimiert sind
  • Sie großen Wert auf den Erhalt von Sicherheitsmechanismen legen

Mit herkömmlichen Trainingsverfahren sinkt die Modellleistung unter diesen Randbedingungen in der Regel.

Blick in die Zukunft

SauerkrautLM zeigt, wie man in Deutschland klug mit KI umgehen kann. Statt alles neu zu erfinden, nehmen sie das Beste, was es schon gibt, und machen es für Deutschland noch besser. Andere könnten von diesem Ansatz lernen und ihn für weitere Sprachen nutzen. Die Kombination aus kluger Wiederverwendung von KI-Modellen, gezielter Anpassung an die deutsche Sprache und dem Erhalt von Sicherheitsfunktionen macht SauerkrautLM zu einem wichtigen Baustein für die KI-Entwicklung in Deutschland.

Alle frei verfügbaren Modelle können bei Hugging Face im VAGO Solutions Space heruntergeladen und genutzt werden https://huggingface.co/VAGOsolutions  

Auf LinkedIn erhält man regelmäßig Neuigkeiten zu Modellen und innovativen KI-Ansätzen https://www.linkedin.com/company/93597903

Mehr Infos zu Leistungen, Techniken, Verfahren und dem Team von VAGO findet man unter https://vago-solutions.ai

Autor des Beitrags

daryoush

Daryoush Vaziri ist gebürtiger Kölner und lebt seit 20 Jahren in Bonn. Er ist promovierter Wirtschaftsinformatiker und beschäftigt sich seit Jahren intensiv mit der Konzeption und Gestaltung von KI-basierten Systemen für Unternehmensprozesse. Sein Schwerpunkt liegt auf der Entwicklung agentenbasierter LLM-Systeme, sowie  der Vorbereitung und Durchführung von domänenspezifischen LLM-Trainings.

Auf LinkedIn

Weiterer Co-Founder von Vago Solutions

David Golchinfar ist in Siegburg geboren und lebt im Westerwald. Er ist studierter Informatiker und beschäftigt sich seit Jahren intensiv mit KI-Algorithmen und -Techniken. Sein Schwerpunkt liegt auf der Entwicklung innovativer und ressourcensparender Trainingsverfahren, dem Training, sowie der Optimierung von Large Language Modellen.

Auf LinkedIn

 

Ähnliche Beiträge