Komplexe Forschungspapiere über einen Agent zusammenfassen
✅ Freie Nutzung von Text & Abbildungen & Video für Premium-User
Ein beliebter Use-Case im Rahmen der Nutzung von KI-Anwendungen wie Chatbots ist das Zusammenfassen von Texten und PDFs, um sich zeiteffizient in ein Thema einzuarbeiten. Man muss nicht mehr jede einzelne Seite durchgehen und den Inhalt zusätzlich aus dem Englischen ins Deutsche übersetzen, denn dies können KI-Systeme mittlerweile sehr zuverlässig. Im Beispiel wird ein Agent in Mistrals Chatangebot Le Chat erstellt, der auf das kompakte Zusammenfassen von komplexen Forschungspapieren spezialisiert ist. Die Entwicklung des KI-Assistenten ist kostenlos.
Zum Beitrag „Agenten & Bibliotheken“
Es geht direkt los, ohne step by step zu erklären, wie man einen Agenten entwickelt. Wenn jemand dies nachlesen möchte, so steht auf Unidigital ein umfangreicher Mistral-Leitfaden zur Verfügung. Gerne in die Thematik einlesen. Der obere Screenshot zeigt die Startoberfläche in Le Chat mit der zentralen Menüleiste. Links auf das Plus-Icon klicken und schon öffnet sich die Navigation, die unter anderem alle veröffentlichten Agenten wie auch den KI-Assistenten „Forschungspapiere zusammenfassen“ anzeigt.
Den Systemprompt für den Agent habe ich hier in Le Chat über das Sprachmodell Mistral generieren lassen und diesen dann 1:1 im Backend in das Feld Anweisungen eingefügt. Hat man Schwierigkeiten, die zentralen Instruktionen zu definieren, so geht dies wirklich gut über einen Chatbot, der gerne eine klare Struktur ausgibt, die sich beliebig ergänzen lässt.
Der obere Screenshot zeigt den Bereich Meine Agenten, den ich links über das Menü und den Punkt „Agenten“ aufrufen kann. Nun habe ich die Möglichkeit, direkt mit dem KI-Helfer zu chatten oder über den Button „Anpassen“ im Backend unterschiedliche Einstellungen vorzunehmen. Wir schauen uns erstmal das Agent-Backend an.
Auf der linken Seite ist der Systemprompt als Textinput dargestellt und auf der rechten Seite habe ich schon einen Vorschau-Chat gestartet, um zu überprüfen, ob der Agent „Forschungspapier zusammenfassen“ alle Anweisungen optimal umgesetzt hat. Man muss dazu nicht immer umständlich einen normalen Chat öffnen. Dies geht hier im Backend viel schneller.
Der Großteil der Anweisungen wurde von Mistral formuliert und ich habe darunter zwei Instruktionen hinzugefügt. Dies wurde mit einem Emoji kenntlich gemacht. Es ist aus meinen Erfahrungen sinnvoll, im Rahmen eines PDF-Chats stets die Seitenzahlen im Dokument ausgeben zu lassen, um den KI-Output direkt auf Korrektheit zu checken. Ein zeitintensives Hin-und-Her-Scrollen im PDF entfällt somit.
Zusätzlich wird ganz zum Schluss immer die offizielle externe Verlinkung zur Forschungsplattform arXiv ausgegeben, die als zentrale Sammelstelle für öffentlich zugängliche KI-Paper anzusehen ist. Dort auch gerne mal stöbern.
In diesem Blogbeitrag wird ein Forschungspapier der ETH Zürich verwendet, das sich mit einem vollautomatisierten KI-Bewertungsprozess von KI-generierten Übungsaufgaben beschäftigt. Die Veröffentlichung kann durchaus als anspruchsvoll angesehen werden und eignet sich daher gut für unseren Agenten „Forschungspapiere zusammenfassen“, der vor allem auf komplexe Arbeiten spezialisiert ist.
Das obere Video zeigt den KI-Assistenten in Le Chat im Einsatz, nachdem ich das PDF hochgeladen und den simplen Prompt „Los“ eingegeben habe. Da die Instruktionen sehr klar formuliert sind, würde theoretisch auch ein Enter-Klick ausreichen und der Agent wüsste genau, nach welcher Reihenfolge die Antwort ausgegeben werden soll. Dies spart Zeit und macht insgesamt mehr Spaß, da man nicht immer wieder denselben Prompt per Copy & Paste einfügen muss.
Ich könnte den Agenten auch im Backend auf der linken Seite über die drei Punkte „Duplizieren“ und durch die Änderung des Systemprompts die Antworten ausschließlich auf Expertenniveau ausgeben lassen.
Die KI-generierte Zusammenfassung hat mich überzeugt, und rechts oben über den Button „Neuen Chat öffnen“ startete ich diesen Prozess nun in einem gewöhnlichen Chat. Zu Beginn links über das Plus-Symbol ganz oben auf „Dateien hochladen“ klicken und ein PDF auswählen.
Im Anschluss lässt sich in Le Chat rechts unten über das Menü ein Sprachmodell festlegen, aber ich bleibe bei dem Modell „Ausgewogen“, da ich für diese Aufgabe kein Language Model mit „Thinking-Funktion“ benötige. Dies ist aber abhängig vom einzelnen Use Case.
Anschließend reicht wieder ein Prompt wie „Los“ oder ein Enter-Klick und die KI weiß dann genau, was sie zu tun hat. Das ist eigentlich immer die gleiche Vorgehensweise. Würde ich den Agent zum Beispiel ein Jahr lang täglich mit einer PDF-Zusammenfassung verwenden, so hätte ich zusammengerechnet 356 Mal auf „Enter“ geklickt und eben nicht jedes Mal aufs Neue einen geeigneten Userprompt im Stile eines Systemprompts eingegeben. Dies ist so auf Dauer „komfortabler“ 😉
Auch im normalen Chat gibt das Sprachmodell Mistral einen brauchbaren Output heraus, der die Thematik und alles weitere im Forschungspapier genau beschreibt. Mehr braucht es nicht. Hier stellt sich regelmäßig die Frage, ob ein sehr großes Sprachmodell wie Claude Opus 4.7 oder Gemini 3 nicht zu „groß“ für diese eher keine Aufgabe wäre und die Nutzung solcher Top-Modelle unterm Strich als ineffizient angesehen werden kann, da diese auch mehr Rechenleistung verbrauchen. Das Top-LLM Mistral Large 3 eignet sich aus meiner Sicht wirklich gut für die Analyse und Zusammenfassung von Dokumenten.
Wie in der obigen Abbildung ganz unten dargestellt, gibt der Agent sehr übersichtlich geeignete Seitenzahlen im PDF aus, um dort direkt nachschauen zu können, ob der KI-Output korrekt ist. Auch die externe Verlinkung wird wie gewünscht als Letztes angezeigt, um auf arXiv womöglich direkt nach dem nächsten KI-Paper zu suchen. Viel Erfolg!















