Open-Source-LLM von Hochschulen aus NRW als Alternative zu kommerziellen (geschlossenen) Sprachmodellen?

Die Landesregierung im größten deutschen Bundesland Nordrhein-Westfalen hat bekannt gegeben, dass sie mit 600 000 € Fördermitteln den Aufbau bzw. das Training eines großen Sprachmodells auf der Grundlage von Open Source unterstützen möchte. Im Mittelpunkt stehen die Ruhr-Universität Bochum und die Universität zu Köln, bei der ebenfalls das moderne Hochleistungsrechensystem RAMSES angesiedelt ist, auf dem das offene Large Language Model trainiert werden soll.

ramses
RAMSES: Hochleistungsrechensystem an der Universität zu Köln

Die Ruhr-Universität Bochum und die Universität zu Köln arbeiten jetzt an einem Pilotprojekt, um mittelfristig ein passgenaues Open-Source-Sprachmodell für eine große Hochschule – und perspektivisch mehreren Hochschulen – zu betreiben. Das Ministerium für Kultur und Wissenschaft des Landes Nordrhein-Westfalen fördert das Vorhaben mit rund 600.000 Euro. Quelle: land.nrw

Im oberen Zitat der Landesregierung ist herauszulesen, dass dieses LLM extra für mindestens eine oder im besten Fall je nach Erfolg wohl auch für mehrere Hochschulen eingesetzt werden könnte. Und erst einmal nicht darüber hinaus, etwa für Behörden in NRW.

Open-Source-LLM voll im Trend

Eine Alternative zur Nutzung von ChatGPT und anderen kommerziellen Anbietern ist die konsequente Weiterentwicklung von Open-Source-Sprachmodellen durch die Hochschulen selbst. Als „Open Source“ wird Software bezeichnet, deren Quellcode von Dritten eingesehen werden kann. Quelle: land.nrw

In Nordrhein-Westfalen möchte man den Weg eines offenen Sprachmodells gehen, bei dem der Quellcode für alle sichtbar ist. Zusätzlich ließe sich das LLM auch herunterladen und so für eigene Zwecke verwenden. Auch in Bayern mit der Initiative BayernGPT und in der Schweiz mit der “Swiss AI” Allianz gehen die Beteiligten ebenfalls diesen Weg, um ein potenzielles Gegengewicht zu den geschlossenen Models wie GPT von OpenAI, Anthropics Claude oder Googles Gemini darzustellen bzw. dies zumindest aktiv mit der Hilfe der Politik zu versuchen. Auch das europäische Vorhaben TrustLLM geht in diese Richtung der Unabhängigkeit von Großkonzernen mit ihren kommerziellen Angeboten, um schlussendlich mehr Datensicherheit zu gewährleisten.

Einsatz in der Lehre

Ein Ziel des potenziellen Open-Source-LLMs ist es, dieses auch in die Lehre zu integrieren, um auf dieser Grundlage im Rahmen eines Chatbots mit Studierenden kommunizieren zu können. Hierbei könnte es um einen 24/7-Support gehen, den schon die IU Hochschule mit dem an das Sprachmodell GPT von OpenAI angeschlossenen KI-Avatar “Syntea” den eigenen Hochschulbeteiligten anbietet, um eine stetige Kommunikation auf der Grundlage von künstlicher Intelligenz zu ermöglichen.

Das Projekt „Open-Source-KI.nrw“ wird dazu bis Ende 2025 erstmals den Aufbau einer vollständigen Infrastruktur eines Open-Source-Large Language Models (LLM) anhand eines konkreten Anwendungsfalls erproben. Im Fokus steht der Einsatz von Sprachmodellen in der Lehre: Studierende sollen in ausgewählten Kursen im Lernmanagementsystem über einen virtuellen Ansprechpartner („Chatbot“) mit dem Sprachmodell kommunizieren können. Quelle: land.nrw

Die Erprobung der Integration solch eines KI-Chatbots in der Lehre, um aktiv Studierende zu unterstützen, liefe dann über das Projekt ki.nrw. Dort wird sich dann auch zeigen, wie zuverlässig der Chatbot auf Grundlage des eigenen Large Language Models agiert bzw. wie hochwertig dessen Outputs sind.

Fazit

Ein spannendes Projekt, bei dem mal wieder Hochschulen ganz zentral eingesetzt werden, um ein Sprachmodell auf der Basis von Open Source zu trainieren. Am Ende wird entscheidend sein, wie effizient solch ein KI-Chatbot auf dieser Grundlage mit den Lernbeteiligten im Vergleich zu den Top-Modellen wie GPT, Claude, Llama & Co kommunizieren kann. Definitiv ist es wichtig, solche Vorhaben zu starten, um mehr KI-Kompetenzen in diesen Bereichen aufzubauen. Mal schauen, welches Bundesland als Nächstes in das KI-Training einsteigt. In Baden-Württemberg gäbe super Voraussetzungen dafür.. 😉

 

Ein Beitrag von

Ähnliche Beiträge