Gem + Nano Banana: Custom Bot im Gemini-Chat mit Top-Bild-KI ausstatten
Gems sind individuelle KI-Assistenten, die im Gemini-Chat kostenlos entwickelt werden können. Als Standardtools lassen sich unter anderem ein Deep Research, die Canvas-Funktion oder die Top-Bild-KI Nano Banana nutzen. Auf dieser Grundlage arbeitet dann das Gem und gibt wie im folgenden Beispielbeitrag sehr einfach passende Bilder aus.
Im Gemini-Chat links auf Gems klicken und dann über den Gem-Manager ein neues Gem erstellen. Dies ist wirklich immer der selbe Prozess bei der Erstellung eines neuen KI-Assistenten. Es lassen sich auch mehrere Gems gleichzeitig kostenlos „bauen“ und jederzeit aktualisieren.
Nach einem Klick auf „Neues Gem“ können die einzelnen Einstellungen vorgenommen werden, wie zum Beispiel Name, Beschreibung, System-Prompt, PDF-Upload und die Auswahl des Standardtools, die im unteren Screenshot ganz unten dargestellt ist. Zu Beginn steht dort „Kein Standardtool“.
Dies ändert man mit einem Klick auf genau dieses Feld und wählt nun in der Liste die sehr beliebte Bild-KI Nano Banana aus. Wichtig ist hierbei der Unterschied zwischen der Top-Version Nano Banana Pro und dem Standardmodell Nano Banana. Wird Nano Banana als Standardtool eingestellt und gleichzeitig das Sprachmodell „Gemini Thinking“ verwendet, so wird die Pro-Version genutzt mit Bildern im Hoch- und Querformat. Es gibt auch ein Limit bei der maximalen Generierung von Bildern. Wird das Sprachmodell „Fast“ gewählt, so kommt die „normale“ Variante zum Einsatz und zwar mit Bildern im Quadratformat.
Die obere Abbildung zeigt das Gem schon im Einsatz. Auf der linken Seite lassen sich alle Settings setzen und auf der rechten Seite können User den Vorschau-Modus verwenden, um das Gem zu testen, bevor es veröffentlicht wird. So lässt sich die Zuverlässigkeit solcher KI-Assistenten im Vorfeld optimieren, um nicht hektisch im Nachgang verbessern zu müssen.
Ich habe ein Gem erstellt, das ausschließlich deutsche Redewendungen ausgibt, wie zum Beispiel „jemandem einen Korb geben„. Die Szene wurde ausschließlich mit dem Prompt „Next“ generiert. Die Nutzung von Shortcuts wurde über den System-Prompt festgelegt mit einem Satz wie
***Bei der Nutzereingabe von „Next“ gib immer eine weitere deutsche Redewendung aus***.
Im Weiteren werden von einer kulturell vielfältigen „Gruppe“ so einige „Eulen nach Athen getragen“. Auch die Darstellung der Personen kann man über den System-Prompt definieren. Bei den bislang generierten Bildern kam jeweils das Standardmodell Nano Banana in Kombination mit dem „Fast-Modell“ von Gemini zum Einsatz. Dies geht schneller und es bedarf nicht immer der Pro-Version.

Möchte man Nano Banana Pro verwenden, so lässt sich dies über den Wechsel hin zum „Thinking-Modell“ von Gemini festlegen. Wenn eine bestimmte Anzahl an Bildern erstellt wurde, wechselt Gemini wieder zum günstigeren Standard-Modell, jedenfalls im kostenlosen Plan des Gemini-Chats. Die Redewendung „mit dem Kopf durch die Wand“ wurde treffend dargestellt und der „Arbeitskollege“ hat sogar einen Helm auf, was bei dieser Szene schon zu empfehlen ist. Der Output lässt sich im Gemini-Chat zusätzlich mit „Daumen hoch“ und „Daumen runter“ bewerten, um das Gem anzupassen. Dies erfolgt direkt unterhalb der Abbildungen.
Ich hatte vor einiger Zeit über ChatGPT genau den gleichen Bot erstellt, in dem Fall einen CustomGPT, der wirklich gut in Kombination mit GPT-4o und der Bild-KI DALL-E3 lief. Solche KI-Assistenten können wirklich sehr sinnvoll eingesetzt werden, um Zusammenhänge zu visualisieren und generell beim Lernprozess zu unterstützen. Es gäbe da viele gute Einsatzmöglichkeiten. Gerne maximal kreativ sein 😉
Ein Beitrag von







