US-Plattform Hugging Face: Playground für kostenfreie KI-Tools, Download von offenen Sprachmodellen und vielem mehr!

Hugging Face ist eine US-Plattform, bei der nicht direkt ersichtlich ist, was denn “das” genau ist. Hier treffen sich unter anderem Entwickler mit Fokus Machine Learning, um etwa per Upload anderen Nutzern eigene Projekte zu demonstrieren und auch gemeinsam an diesen zu arbeiten und sich auszutauschen. Eine Art “GitHub für KI” wurde es schon genannt. In diesem Beitrag geht es vor allem, um die kostenfreie Nutzung von Chatbots wie Llama 2 oder weiteren diversen Open-Source-Anwendungen. Denn genau dies ist das Markenzeichen von Hugging Face, also die Bereitstellung von offenen KI-Programmen, die User in einem begrenzten Umfang völlig kostenfrei testen können. Ob Bilder-KIs wie Stable Diffusion, Large Language Modells wie Mixtral oder Übersetzungstools wie Seamless Streaming, es gibt im Rahmen der Spaces eine Vielzahl an Möglichkeiten, diese Plattform zu verwenden und es lohnt sich definitiv, dort ein wenig tiefer einzutauchen.

spaces hugging face
Übersicht von Tools in den Spaces von Hugging Face

Übrigens ist die Firma aus New York mittlerweile kein Insider-Tipp mehr, sondern mit einer Unternehmensbewertung von 4,5 Mrd. $ ein echtes Schwergewicht mit allerlei Top-Kooperationen wie zum Beispiel mit NVIDIA, Amazon oder Google. Da geht so einiges!

Hugging Face Spaces – Playground für KI-Tools

In den Spaces werden regelmäßig neue KI-Anwendungen im Rahmen eines Playgrounds zur Verfügung gestellt, die User zwischendurch mal ausprobieren können. Nicht selten werden Tools auch nur dort veröffentlicht, also ohne eigene Webseite, da bei Hugging Face direkt zu Beginn eine bestimmte Anzahl an Testpersonen gewährleistet ist. Jedoch wird nicht jedes x-beliebige Tool zugelassen, da die Plattform natürlich im Vorfeld das Programm selber testet, um einen bestimmten Qualitätsstandard zu gewährleisten. Auch Paper zu diesen Anwendungen etwa mit Benchmarks sind i.d.R. verfügbar.

seamless streaming
Seamless Streaming by Mata

Um zu demonstrieren, in welche Richtung es im Bereich der Live-Übersetzungen geht, hat der Konzern Meta AI die Anwendung Seamless Streaming auch über Hugging Face bereitgestellt, wo Meta schon viele frei nutzbare Programme hochgeladen hat, die sich jeder User herunterladen kann. Hierbei sollte immer auf die Lizenz geachtet werden. Nicht jedes Tool lässt sich z.B. für kommerzielle Zwecke verwenden. Im Beispiel Seamless Streaming einfach einen Room erstellen, den Code an weitere Nutzer weitergeben und schon lässt sich etwa von Deutsch ins Französische in Echtzeit in Audio übersetzen, mit zugehörigem Transkript. Also auch für den Bildungsbereich fernab von beliebten Bilder-KIs wird hier einiges geboten.

Llama 2 – Hosting von Large Language Models

Die US-Plattform bietet die Möglichkeit an, ganze Sprachmodelle wie Llama 2, Googles Gemma oder Falcon aus Abu Dhabi hochzuladen, mit zugehörigen Publikationen. Im Rahmen der Community werden neue Modelle dann direkt diskutiert, wodurch die Entwickler recht zügig hochwertiges Feedback erhalten. Alle verfügbaren KI-Programme können über den Bereich Models eingesehen und auch trainiert werden.

Im Beispiel des Models Llama 2, das mittlerweile neben Meta auch von Microsoft mitentwickelt wird, ist ein monatlicher Download des beliebten Open-Source-LLM von fast 900 000 hier auf Hugging Face erfolgt. Ein ziemlich hoher Traffic!  Hierbei handelt es sich um das Model Llama-2-7b-hf. Es werden i.d.R. unterschiedliche Sprachmodelle wie etwa neben dem Chat auch zum Coding und weiteren bereitgestellt. Dies können sich User dann selber auswählen.

llama huggingface
Llama 2 on Hugging Face

LAION LeoLM: Linguistically Enhanced Open Language Model

Am Beispiel LAION LeoLM wird gezeigt, wie Akteure, in diesem Fall da Hessian Center for Artificial Intelligence (Hessian.ai), ein offenes Language Model wie Llama 2 nutzen, um es auf dieser Grundlage mit eigenem Training selber zu verändern. Die abgeänderte Version von Llama 2, also LeoLM wird dann allen Nutzern kostenfrei auf dfieser Plattform zur Verfügung gestellt. So verbreiten sich dann trainierte Sprachmodelle unglaublich schnell, ohne dies mühselig in Eigenregie zu bewerben.

leolm

LeoLM ist frei testbar

Meet LeoLM, the first open and commercially available German Foundation Language Model built on Llama-2. Our models extend Llama-2’s capabilities into German through continued pretraining on a large corpus of German-language and mostly locality specific text. Quelle: Hugging Face

In der offiziellen Beschreibung zu LeoLM ist direkt sichtbar, dass jeder die Llama-Abwandlung auch für kommerzielle Zwecke verwenden darf. Zum Beispiel ließe sich nun auf dieser Basis ein ganz neues Tool erstellen, mit eigener Webseite und Premium-Abo. In diesem Fall haben die Beteiligten vom Hessian.ai, an dem auch die TU Darmstadt beteiligt ist, den Fokus beim Training auf eine möglichst Kommunikation mit der Sprache Deutsch gesetzt. Das Chat-Modell leo-hessianai-7b-chat kam im letzten Monat auf fast 30 000 Downloads, alleine nur über Hugging Face. Ohne solche Plattformen wären so hohe Download-Zahlen Insbesondere auch für die relativ kleinen Modelle  wohl kaum möglich.

leolm
leo-hessianai-7b-chat kommt auf fast 30 000 Downloads im letzten Monat

Mit eigenem Chat-Assistenten (Custom Bot) am Start

Hugging Face bietet seinen Nutzern nun ebenfalls wie OpenAI mit den GPTs kostenlos sogenannte “Custom Bots” an, die individuell angepasst werden können. Diese Bots basieren ausschließlich auf Open-Source-Sprachmodellen wie Llama, Open Chat und Mixtral aus Frankreich. Ein Wechsel zwischen diesen ist simpel per Mausklick im Drop-Down-Menü durchführbar. Bei den Bots gibt es ein breites Spektrum an Auswahlmöglichkeiten, etwa von Code Assistenten bis hin zur Empfehlung für spanische Weine. Jedoch stehen die Chat-Assistenten noch am Anfang bzw. die Anzahl der “KI-Buddys” hält sich im Vergleich zu den Plattformen wie Poe und OpenAI noch in Grenzen.

Erstellung von eigenen Custom Bots

Kooperation mit Amazon & Co

Ein zentraler Bestandteil der Partnerschaften von Hugging Face mit externen Unternehmen, ist die Kooperation mit Amazon über dessen Web Services mit Amazon Sagemaker.. 

Amazon SageMaker ist eine Everything-as-a-Service-Cloud-Maschinenlernplattform von Amazon Web Services, die im November 2017 auf den Markt kam. SageMaker ermöglicht es Entwicklern, Maschinenlern-Modelle (ML) in der Cloud zu erstellen, zu trainieren und einzusetzen. SageMaker ermöglicht es Entwicklern auch, ML-Modelle auf Embedded-Systemen und Edge-Geräten einzusetzen. Quelle: Wikipedia

Nun können User KI-Modelle auch über die Kapazitäten von Amazon erstellen und trainieren lassen. Generell steht die Erweiterung von solchen Rechenkontingenten im Zentrum der US-Plattform, um diese nicht kostenspielig selbstständig aufbauen zu müssen. Auch Google ist mit an Bord und bietet im Rahmen der Kooperation gleich das eigene Sprachmodell Gemma mit zum Download an. Im Allgemeinen geht es hier um die Förderung von “Open AI Colaboration” und offenen KI-Anwendungen für alle Nutzerinnen und Nutzer. Selbstverständlich pushen die US-Großkonzerne so auch ihre eigenen Aktivitäten und gewinnen stetig User hinzu, die nun so auch auf ihre Plattform gelangen.

Empfohlenes YouTube-Video

Verfasser des Beitrags

Ähnliche Beiträge