Apertus: Offenes Sprachmodell aus der Schweiz nun frei verfügbar

Apertus ist ein offenes Sprachmodell aus der Schweiz, das gemeinsam von Forschenden der ETH Zürich und EPFL Lausanne auf dem Supercomputer Alps trainiert und nun veröffentlicht wurde. Apertus steht in zwei frei verfügbaren Modellgrößen bereit – mit 8 Milliarden sowie mit 70 Milliarden Parametern. 

apertus
Bildquelle: ETH Zürich

Wer Apertus gerne testen möchte, der kann dies über die Initiative Public AI tun und schauen, was denn das neue LLM alles so kann. Der Chat ist ziemlich simpel ausgelegt. User können oben links zwischen Switzerland (Apertus) und Singapore (Gemma) auswählen und einen Prompt etwa hinsichtlich der Logikfähigkeiten eingeben oder Ähnliches. Dies kann gerne selbst getestet werden. Auch ein Internetzugriff über den Button „Websuche“ ist möglich.

apertus

Für einen Download bietet sich die Plattform Hugging Face an, auf der beide Modelle von allen Nutzern jederzeit kostenfrei heruntergeladen und auch für kommerzielle Zwecke genutzt werden können. Die Swiss AI Initiative hat dazu einen eigenen Account auf der sehr beliebten Plattform eingerichtet, um alle offenen LLMs frei zugänglich zu machen. Aktuell beläuft sich das Angebot auf die beiden Apertus-Modelle (8B & 70B), aber es kann gut sein, dass bei einer Weiterentwicklung dann noch weitere Versionen, also 1 bis X, hinzukommen, wie dies bei anderen Anbietern von Language Models ebenfalls der Fall ist.

apertus

Respekt vor dem Eigentum

Ein großer Unterschied zu den Top-Modellen aus den USA wie Llama, ChatGPT, Claude & Co ist der verwendete Datensatz, der ausschließlich frei verfügbare Quellen wie Wikipedia einschließt und nicht z.T. „wilde“ Datensammlungen (Downloads) von nicht selten fragwürdigen Quellen über Torrent-Netzwerke oder das konsequente Crawlen von Webseiten und die Entnahme der Inhalte in Textform, auch wenn ein Webseiten-Betreiber dies über die „robots.text“ ausdrücklich verbietet. Es wurden also legale Methoden verwendet, um das LLM zu trainieren. Dies soll auch die Einhaltung des EU AI Acts gewährleisten.

Die Entwicklung von Apertus erfolgte unter Berücksichtigung der Schweizer Datenschutzgesetze, des Schweizer Urheberrechts und der Transparenzanforderungen der EU KI-Verordnung (EU AI Act). Ein besonderes Augenmerk wurde auf Datenintegrität und ethische Standards gelegt: Das Trainingskorpus beruht ausschliesslich auf Daten, die öffentlich zugänglich sind. Quelle: ETH Zürich

 

Autor des Beitrags

matthias kindt

Matthias Kindt auf Linkedin