GraphRAG: Aus privaten Datensätzen komplexe Wissensgraphen erstellen
Microsoft Research arbeitet am Projekt GraphRAG (Graphs + Retrieval Augmented Generation), das eine Erweiterung von Large Langauge Models über die RAG-Methode ermöglicht und so aus privaten Daten komplexe und sehr anschauliche Wissensgraphen generieren kann. Hierbei handelt es sich um eine Open-Source-Anwendung, die wohl bald allen Interessierten über GitHub frei verfügbar zum Download bereitstehen soll, so die Ankündigung von Microsoft.
Kontakt über teamgraphrag@microsoft.com
Im oberen Video wird dies eindrucksvoll demonstriert, in dem die Forscher von Microsoft alle Episoden des beliebten Podcasts “Berhind the Tech” mittels Transkript in Text umgewandelt und diese Textdateien im Anschluss auf das Top-Sprachmodell GPT-4 hochgeladen haben. Da der Inhalt aller Podcastfolgen nicht Teil des LLMs GPT-4 ist, müssen diese eben per Upload dem Sprachmodell extra hinzugefügt werden, damit dieses im Rahmen der Analyse und der Erstellung eines Wissensgraphen auch exakt diese Datensätze nutzen kann. Wie genau diese neue RAG-Methode funktioniert und welche Vorteile/Nachteile sie bietet, möchte ich an dieser Stelle nicht genauer erklären, da ich dies selber nicht zu 100 % verstehe 😉
Im Kern geht es um eine Umwandlung der Datensätze, damit ein Large Language Model diese überhaupt erst verstehen kann, um diese dann zu verarbeiten. Ein simpler Upload reicht nicht aus. Sind die Daten dann im Sprachmodell eingebettet, lässt sich mit diesen dann auch kommunizieren. Im Vorfeld kann festgelegt werden, wie denn der Graph aussehen soll und welche Thematiken hierbei im Vordergrund stehen bzw. welche Beziehungen zueinander aufgezeigt werden sollen.
Eine beispielhafte Visualisierung des Diagramms ist in Abbildung 3 dargestellt. Jeder Kreis ist eine Entität (z. B. eine Person, ein Ort oder eine Organisation), wobei die Entitätsgröße die Anzahl der Beziehungen dieser Entität darstellt und die Farbe Gruppierungen ähnlicher Entitäten darstellt . Die Farbpartitionierung ist eine Bottom-up-Clustering-Methode, die auf der Diagrammstruktur aufbaut und es uns ermöglicht, Fragen auf unterschiedlichen Abstraktionsebenen zu beantworten. Quelle: Microsoft
Jeder der einzelnen Punkte der Abbildung 3 zeigt eine Entität, also ein eigenes Informationsobjekt mit passender Bezeichnung. In der Mathematik würde man wohl von Parametern sprechen. Diese lassen sich auch in Verbindung setzen oder eben einzeln betrachten, etwa hinsichtlich der Größe und Farbe. Solche schicken Visualisierungen haben den Vorteil, dass bestimmte Zusammenhänge direkt erkennbar sind, ohne den gesamten Datensatz einzeln durchgehen zu müssen. Ebenfalls eher verborgene Zusammenhänge, die womöglich über die Daten nicht direkt erkennbar waren, sind nun sofort sichtbar gemacht. Hier geht es auch um zeiteffizientes Arbeiten bzw. Forschen.
Selbstverständlich müssen Forscher solche Graphen auch immer auf die Richtigkeit kontrollieren und sich nicht zu 100 % auf den korrekten Output von GPT-4 oder einem anderen Sprachmodell verlassen. Auch LLMs machen Fehler und dies wird wohl auch auf absehbare Zeit so bleiben. Spannend wird es, wenn solche Abbildungen auch noch interaktiv ausgegeben werden können, also per “Mausover” und es öffnet sich ein Kästchen mit Beschreibung und Zahlen oder Ähnlichem. Mal schauen.
Übrigens, vor allem die unendlichen Welten der Naturwissenschaften bieten wohl zahlreiche Einsatzmöglichkeiten für solche KI-generierten Darstellungen, auch um eher schwierige Topics visuell zu vereinfachen und so insgesamt für alle zugänglicher zu machen. Wissensgraphen zu betrachten ist dann aufregender, als Datensätze durchzugehen. Insbesondere in Lehre und Unterricht sollten solche modernen Visualisierungsmöglichkeiten zwingend verwendet werden, gerade wenn Top-Anwendungen auf der Basis von Open Source verfügbar sind.
Verwendete Quellen:
https://www.microsoft.com/en-us/research/project/graphrag/