Manus: Ein Agent mit vielfältigen Fähigkeiten
Manus ist wohl einer der bekanntesten KI-Agenten weltweit, der von der Firma Monica entwickelt wird, die mittlerweile ihren Sitz in Singapur hat und davor in China ansässig war. Hierbei handelt es sich um ein Agenten-Framework, das die großen Sprachmodelle Claude Sonnet 3.5 von Anthropic (USA) sowie diverse Finetunings vom offenen LLM Qwen des Anbieters Alibaba (China) nutzt. Manus lässt sich in einem geringen Umfang kostenlos testen.
Vielfältige Einsatzmöglichkeiten für Manus
Im YouTube-Video der Digitalen Profis wird der Agent näher erläutert bzw. welche Aufgaben sich mit dem autonom agierenden Assistenten durchführen ließen. Er kann nämlich nicht nur eine tiefergehende Recherche im Rahmen eines Deep Research vornehmen, sondern zum Beispiel auch Slides für Präsentationen, diverse Grafiken oder auch ganze Webseiten erstellen, die sich über Manus direkt einsehen lassen. Das Team hinter dem Agenten hat nach und nach wie so viele andere Anwendungen stetig neue Funktionen integriert, die es dann den Usern im Chatinterface mit Promptleiste und allerlei eingebundenen Tools anbietet. Schaut im Video gerne unten in die Beschreibung, denn dort warten auf euch 1000 freie Credits, da dieses Video von der Firma hinter Manus gesponsert wurde.
Ich habe mich nun dafür entschieden, dass der AI Agent nach an Hochschulen entwickelten KI-Anwendungen suchen soll, die im Anschluss im Rahmen von Startups allen Usern zur Verfügung gestellt worden und zwar bezogen auf die USA, Europa und China.
Prompt:
***Conduct a comprehensive analysis of AI applications developed at universities that have achieved a significant market share in usage. Focus on the USA, Europe, and China. Are there different approaches, and what is the situation regarding government funding? Have successful startups been founded from these applications? Use tables for your representations with links. If available, also include suitable videos.***
„Manus Computer“ ermöglicht Browser-Aktivitäten
Nach ca. 8 Minuten war dann die KI-Recherche mit den Anwendungen und dazugehörigen Verlinkungen beendet. Der gesamte Vorgang lässt sich jederzeit einsehen. Klickt dazu einfach am Ende links neben der Promptleiste auf das kleine Bildchen und schon öffnet sich auf der rechten Seite Manus Computer und ganz unten kann der Zeitpunkt in der Leiste manuell eingestellt werden. Transparenz ist bei solchen Agenten-Aktivitäten definitiv sinnvoll, um auch Fehler im Nachgang besser analysieren zu können. Schaut ihr live zu, wie der Agent arbeitet, dann sieht man sofort, wie er das Internet hinsichtlich von Browser-Aktivitäten durchsucht und einzelne Webseiten öffnet. Mehr ist das schlussendlich nicht, also Webseite öffnen, orientieren, navigieren und klicken. Das machen die meisten Menschen ja auch so.
Die Ergebnisse der Recherche sehen auf den ersten Blick recht gut aus bezüglich Text, Struktur und passender Verlinkungen, aber es wundert schon etwas, warum die Schweiz so prominent in der Analyse vertreten ist und Deutschland überhaupt nicht, obwohl bei „uns“ an der LMU München der Top-Bild-Algorithmus Stable Diffusion und nebenan an der TU München der Avatar-Algorithmus zu Synthesia entwickelt wurde. Beide Anwendungen wurden kommerzialisiert, aber leider in London. Trotzdem hätte man dies mit einbeziehen können/müssen. Ansonsten sind da schon so einige tolle KI-Startups mit dabei, auf die ich jetzt nicht im Einzelnen näher eingehen möchte. Trotzdem bleibt aus meiner Sicht die Genauigkeit solcher Agenten-Analysen ein Problem. Falls man ganz konkret passende Quellen im Vorfeld in den Prompt hinzufügt, auf die sich Manus ausschließlich beziehen soll, würde dies natürlich anders aussehen. Mein Prompt war eher allgemein gehalten.
Die untere Abbildung zeigt, wie ich den Output als PDF auf ChatGPT hochgeladen habe, um mir dort sehr knapp die Links mit den Firmen präsentieren zu lassen. Dies geht bei ChatGPT auch kostenlos und wäre bei Manus eher als Verschwendung anzusehen, da dieser recht simple Prozess keine Agenten-Tätigkeit ist.
Von Deep Research zu Wide Research
Vor Kurzem präsentierte das Team rund um Manus eine komplexere Methode der Recherche mit der Bezeichnung Wide Research, die dann in Zukunft Deep Research ablösen könnte. Laut einem Blogbeitrag geht es dabei nicht mehr nur um einen einzigen Agenten, sondern um sehr viele parallel agierende Agenten-Frameworks, die auf die 100-fache Rechenleistung kommen sollen und schlussendlich solche Recherchen besser machen könnten. Aber der gesamte Prozess ließe sich so wohl auch weniger nachvollziehen, falls mal Fehler passieren sollten. Behält da noch einer den Überblick? 😉

PDF aus Deep Research mit Manus
Autor des Beitrags
Kennzeichnungspflicht: Das Beitragsbild wurde KI-generiert mit ChatGPT-4o





