Das Allen Institute for Artificial Intelligence ist eine Non-Profit-Organisation bzw. gemeinnütziges Forschungsinstitut mit Sitz in Seattle (USA), das vom damaligen Mitgründer von Microsoft Paul Allen gegründet wurde. Es stellt Usern so allerlei offene Anwendungen wie z.B. das Sprachmodell “Olmo” zur Verfügung, das ohne Anmeldung im Playground getestet werden kann.
Chatoberfläche des Playgrounds
Im oberen Screenshot ist die Chatoberfläche mit der Auswahl diverser offener Language Models dargestellt. Im Beispiel wurde das Modell Olmo 2 32B Instruct verwendet um einen Textoutput generieren zu lassen und zwar zum Thema “AGI vs GenAI“. Nach eigenen Angaben ist das LLM das erste komplett frei zugängliche Language Model, da neben dem Code auch die Modellgewichte oder Trainingsdaten und weiteres offen einsehbar sind, also wohl zu 100 % transparent. Neben den Olmo-Modellen können User auch das multimodale Sprachmodell “Molmo” verwenden oder das Finetuning-Modell “Llama Tülu”. Chats lassen sich mit oder ohne Anmeldung öffnen und mehr ist da eigentlich nicht mehr zu erklären, da der Playground funktional recht simpel gehalten wird.
AI for Science: OCR & mehr
Für Wissenschaftler und Forscher bietet das Allen Institute for AI noch weitere offene Tools an. OCR, also Optical Character Recognition, ist ein Riesenthema, um etwa Inhalt wie Text, Tabellen und Bilder aus PDFs zu übertragen. olmOCR kann ebenfalls ohne Anmeldung getestet werden, indem man einfach ein PDF oder Ähnliches hochlädt und kurz die Analyse abwartet.
OCR ist bei PDFs besonders interessant, weil viele PDFs nur Bilder von Texten enthalten (z. B. gescannte Dokumente). Ohne OCR kann man den Text nicht durchsuchen, kopieren oder bearbeiten. Mit OCR wird der Text erkannt und in eine durchsuchbare, editierbare Form umgewandelt. Das macht PDFs barrierefreier und einfacher zu verarbeiten. Die obere Abbildung zeigt den Output mithilfe von olmOCR, also links das PDF und rechts den daraus erstellten Text, der sich dann auch anpassen ließe, falls man ihn weiter bearbeiten möchte.
Ai2 ScholarQA ist ein experimentelles KI-Tool, entwickelt vom Allen Institute for AI (Ai2), das Forschern dabei hilft, wissenschaftliche Literatur effizienter zu durchsuchen und zu analysieren.Es ermöglicht die Beantwortung komplexer wissenschaftlicher Fragen, die Informationen aus mehreren Dokumenten erfordern, und liefert dabei detaillierte, kontextbezogene Antworten.
Eingabemaske der Anwendung
Hauptfunktionen von Ai2 ScholarQA:
Tiefgehende Literaturrecherche: Das Tool durchsucht eine umfangreiche Sammlung von über 8 Millionen Volltext-Papieren und 108 Millionen Abstracts, um relevante Informationen zu extrahieren und umfassende Antworten zu generieren.
Strukturierte Ergebnisdarstellung: Die Antworten sind in übersichtliche Abschnitte unterteilt, die Unterthemen behandeln. Zudem werden Tabellen bereitgestellt, die den Vergleich von Studien erleichtern, und Zitate mit Auszügen aus den Originalarbeiten zur Verifizierung enthalten.
Evidenzbasierte Antworten: Durch die Verwendung eines Retrieval-Augmented-Generation (RAG)-basierten Ansatzes mit mehrstufiger Prompting-Strategie liefert ScholarQA evidenzbasierte Antworten, die auf mehreren wissenschaftlichen Quellen basieren.
Open-Source-Verfügbarkeit: Der zugrunde liegende Code von ScholarQA ist als Open-Source auf GitHub verfügbar, was es Entwicklern ermöglicht, das Tool anzupassen und weiterzuentwickeln.