OpenAI Universe: The World of GPT & Co
Diese Übersicht zeigt die Aktivitäten von OpenAI im Rahmen der angebotenen KI-Modelle. Neben Erklärungen sind auch frei verwendbare Grafiken CC BY 4.0 verfügbar, die mit einem Zeitstempel versehen sind. Alle Grafiken dürfen auf jegliche Weise, etwa über das Teilen via Social Media oder im Rahmen von Remixen und Webseiten-Uploads langfristig kostenfrei genutzt werden. Auch als Unterrichtsmaterial sind (und bleiben) alle Ausführungen komplett frei verfügbar! Hierbei bedarf es keinerlei Genehmigung vom Ersteller. Es wird angestrebt, die Webseite stets aktuell zu halten.
Design 1
Design 2
ChatGPT-3.5
- Generative Pre-trained Transformer (GPT). Ein sprachbasierter Chatbot, der auf der Grundlage von Künstlicher Intelligenz (KI) im Rahmen von Deep Learning trainiert ist. Solch große Sprachmodelle werden auch als Large Language Models (LLMs) bezeichnet. ChatGPT ist ausschließlich in der Browser-Version über die Webseite https://chat.openai.com/chat erreichbar. Es ist also (noch) keine App vorhanden. Der Release war im November 2022.
- Akzeptiert Eingaben (Prompts) in Form von Text, Zahlen & Code und gibt diese so als Output auch wieder aus. Ebenfalls ist die Ausgabe von URLs mit direkter Verlinkung möglich. Die Prompts werden in die dafür vorgesehene Leiste unten eingegeben (Send a message) und mit Enter bestätigt. ChatGPT ermöglicht eine Gesprächsführung, die links in der Navigation nachhaltig gespeichert und jederzeit abrufbar ist. So lässt sich die Diskussion mit dem KI-Chatbot jederzeit fortführen.
- Die Chat-KI ist so programmiert, sich an ethische, moralische und rechtliche Standards zu halten. Also auf die Frage “Wie breche ich in ein Haus ein” oder “Wie stelle ich Kokain her” wird ChatGPT antworten, dass es nicht befugt ist zu diesem Thema Auskunft zu geben. und dass dies illegal sei. Jedoch lässt sich die Künstliche Intelligenz auch austricksen, indem die Fragen etwas geschickt im Rahmen einer Filmszene mit passendem Dialog gestellt wird.
- ChatGPT-3.5 ist kostenfrei (langsam) und in der Premium-Version (schnell) verfügbar. Der Preis für Premium liegt bei monatlichen 23,80 $ und ist unkompliziert monatlich kündbar. In der Premium-Version können User auch gleich GPT-4 mitverwenden.
- Die Anmeldung erfolgt mit Namen, E-Mail und Mobilfunknummer. Hierbei unbedingt den Datenschutz beachten! Vor allem im Bildungswesen an Schulen & Hochschulen kann dies ein großes Problem sein. Alle Eingaben werden an die Server von OpenAI in die USA übertragen.
- Einsatzmöglichkeiten: Unter anderem Erstellung von komplexen Texten, Diagrammen, Analyse von Daten, Schreiben von Programmcodes oder auch Generierung von Ideensammlungen, Filmskripten und Durchführung umfangreicher Übersetzungen. Es gibt wirklich sehr vielfältige Möglichkeiten ChatGPT-3.5 zu verwenden, ganz egal ob im Bildungswesen, dem beruflichen Alltag oder eben für private Zwecke. Auch Gedichte und Witze gehören durchaus zum Repertoire.
- Datengrundlage bis September 2021: ChatGPT ist keine reine Suchmaschine, sondern kann als Imitations- oder Inspirationsmaschine verstanden werden. Falls Daten über das Stichdatum hinaus erzeugt werden, kann es vorkommen, dass der Chatbot “halluziniert”, also Dinge erfindet. Korrekte Antworten werden ausschließlich auf der zur Verfügung gestellten Datenbasis gegeben und nicht darüber hinaus.
- Durch Extensions wie u.a. Merlin oder YouTube Summary ist ChatGPT auch im Internetbrowser wie Chrome & Firefox abrufbar. Diese Browser-Erweiterungen können z.B. Webseiten zusammenfassen & analysieren oder ein Transkript eines YouTube-Videos erstellen. Solche Anwendungen auf der Grundlage von GPT nutzen die API von OpenAI und geben die Fähigkeiten der Artificial Intelligence im Rahmen eigener Produkte an die User weiter.
- Niemals sensible Daten eingeben! Persönliche Eingaben werden nachhaltig gespeichert und für KI-Trainingszwecke von OpenAI genutzt! Eine Deaktivierung der Datenverarbeitung über das Feature “Chat History” ist für jeden User möglich! Bei Aktivierung dieser Funktion darf OpenAI die Daten aus dem Chatverlauf nicht nutzen, um seine Künstlichen Intelligenzen zu trainieren. Jedoch fällt dann auch der gespeicherte Chat-Verlauf weg
- Wem gehören die Rechte an den Texten? Es ist nicht zu 100 % geklärt, wie mit solchen KI-generierten Texten rechtlich umgegangen werden soll. Wer ist der Eigentümer und kann dieser den Output zu 100 % kommerziell verwenden und diesen sogar im Rahmen von Copyright schützen lassen?
- Achtung! Die Generierung schädlicher Ratschläge, fehlerhafter Codes oder ungenauer Informationen ist möglich! Eine Kontrolle der Chatbot-Ausgaben ist mehr als empfehlenswert! ChatGPT-3.5 ist noch recht neu und daher auch recht fehleranfällig.
- Großen Nachholbedarf gibt es bei der Kennzeichnung von Quellen, die zur Generierung etwa von Texten seitens ChatGPT herangezogen wurden. Welche Webseite oder Literatur hat denn der Chatbot nun für diesen KI-basierten Beitrag genutzt? Dies wird nicht offiziell angegeben und ist nicht nur für das wissenschaftliche Schreiben problematisch.
💡 Der Chatbot ChatGPT 3.5 handelt auf der Basis der ihm zur Verfügung gestellten Datengrundlage und nicht darüber hinaus! Diese Künstliche Intelligenz kann nicht selbstständig denken und ihren Horizont in Eigenregie erweitern!
💡 Mit der Einführung von ChatGPT im November 2022 wurden sämtliche Rekorde gebrochen. Nach nur 2 Monaten Markteinführung haben sich schätzungsweise 100 Millionen Nutzer registriert. TikTok benötigte für diese Marke ca. 9 Monate und Instagram sogar 2,5 Jahre.
💡 Einführung in ChatGPT: Eine Übersicht zu Fähigkeiten, Methoden und Limits der Artificial General Intelligence (AGI) von OpenAI mit Serverstandort in San Francisco (USA).
💡 ChatGPT 3.5 ist nicht an das Internet angeschlossen und eignet sich somit auch nicht als zuverlässige “Up-to-Date-Suchmaschine”. Etwa eine Webseite nur über die URL als Prompt analysieren zu lassen, eignet sich so momentan noch nicht. Erweiterungen (Python-Skript) wie Auto-GPT ändern diesen Zustand.
💡 Die GPT-3.5-Familie bietet verschiedene Sprachmodelle an, wobei gpt-3.5-turbo für den Chat optimiert wurde. Weitere Modelle sind z.B. text-davinci-003 oder code-davinci-002. Letzteres Modell ist z.B. für Codevervollständigungsaufgaben optimiert.
🛑 ChatGPT-3.5 ist nicht das Gleiche wie GPT-3.5. Bei ChatGPT handelt es sich um einen AI-Chatbot und bei GPT-3.5 um die Programmierschnittstelle (API), auf die Entwickler zugreifen können, um GPT-3.5 bei ihren Anwendungen zu integrieren.
🎓 Leitfaden (PDF) der Univesität Hohenheim für Studierende & Lehrende: „Unlocking the Power of Generative AI Models and Systems such as GPT-4 and ChatGPT for Higher Education. (März 2023).” Umfassender Leitfaden für Lehrkräfte von Manuel Flick zu ChatGPT im Unterricht auf notion.site.
🔒 Datenschutz: ChatGPT-Benutzer können den Chat-Verlauf deaktivieren, sodass Sie auswählen können, welche Konversationen zum Trainieren der Modelle verwendet werden können. Bei der “Budiness Varainte” soll die Deaktivierung vorab eingestellt sein. Jedoch behält sich OpenAI immer das Recht vor, alle Chat-Verläufe für bis zu 30 Tage zu speichern, um diese nach offiziellen Angaben bezüglich unpassender Eingaben zu kontrollieren.
Stand: April 2023
Design 1
Design 2
ChatGPT-4
- Multimodales Modell: Akzeptiert Text- & Bildeingaben. Auch ein Upload von PDFs ist möglich. Die Ausgabe erfolgt über Text, Zahlen und Code. Der KI-Chatbot ChatGPT-4 läuft auf der Basis des Large Language Model (LLM) GPT-4 von OpenAI. Der Vorgänger ChatGPT-3.5 ist ausschließlich auf schriftliche Eingaben limitiert. ChatGPT-4 verfügt über eine höhere Ausgabequalität als ChatGPT-3.5, da dieses Sprachmodell größer ist und über mehr Parameter verfügt. Bis zu 25.000 Wörter können Nutzer nun über einen Prompt eingeben.
- Einsatzmöglichkeiten: Der AI-Chatbot lässt sich aufgrund seiner Upload-Funktion vielfältiger als sein Vorgänger einsetzen. Die Artificial Intelligence kann nun Bilder genau analysieren und auch naturwissenschaftliche Zusammenhänge darauf erkennen. Im offiziellen Release-Video von OpenAI wird dies eindrucksvoll bezüglich des “Luftballon-Bildes” demonstriert. Daneben kann ChatGPT-4 auch hochwertige Texte verfassen & analysieren, Programmcodes schreiben & überprüfen oder komplexe Datenanalysen vornehmen.
- Aktuell ist ChatGPT-4 nur in der Premium-Version für Texteingaben verfügbar. Zurzeit sind die Features Bildeingabefunktion & PDF-Upload für ausgewählte Partner voll nutzbar, ganz egal ob User über einen Premium-Account verfügen.
- API-Nutzung von GPT-4 ausschließlich über Warteliste (Waitlist) möglich. Einfach anmelden und darauf hoffen, dass der Glücksfall es zulässt und die Programmierschnittstelle verfügbar ist. Die Ki kann dann z.B. in eigene Produkte integriert werden.
- MiniGPT bietet die Möglichkeit, kostenfrei die Bildfunktion von ChatGPT-4 zu testen. Unter folgender Domain erreichbar: https://minigpt-4.github.io/ Der Code ist auf GitHub als Open-Source-Python-Skript vorhanden, um MiniGPT auf dem eigenen Rechner/Server zu nutzen. Hierfür ist der Zugriff auf die API erforderlich.
- (Chat)GPT-4 ist auch im Webbrowser Bing & weiteren Microsoft-Produkten wie unter anderem Copilot in MS Office 356 in Teilen integriert. Microsoft verfügt als größter OpenAI-Investor über einen Sonderstatus und darf GPTs von OpenAI für eigene Produktlinien verwenden.
- Niemals sensible Daten eingeben! Persönliche Eingaben werden nachhaltig gespeichert und für KI-Trainingszwecke genutzt! Eine Deaktivierung der Datenverarbeitung über das Feature “Chat History” ist für jeden User möglich! Bei Aktivierung dieser Funktion darf OpenAI die Daten aus dem Chatverlauf nicht nutzen, um seine Künstlichen Intelligenzen zu trainieren.
- Wem gehören die Rechte an den Texten? Es ist nicht zu 100 % geklärt, wie mit solchen KI-generierten Texten rechtlich umgegangen werden soll. Wer ist der Eigentümer und kann dieser den Output zu 100 % kommerziell verwenden und diese sogar schützen lassen (Copyright)?
- Achtung! Generierung schädlicher Ratschläge, fehlerhafter Codes oder ungenauer Informationen ist möglich! Eine Kontrolle der Chatbot-Ausgaben ist mehr als empfehlenswert!
- Großen Nachholbedarf gibt es bei der Kennzeichnung von Quellen, die zur Generierung etwa von Texten seitens ChatGPT herangezogen wurden. Welche Webseite oder Literatur hat denn der Chatbot nun für diesen KI-basierten Beitrag genutzt? Dies wird nicht offiziell angegeben und ist nicht nur für das wissenschaftliche Schreiben problematisch.
💡 Laut OpenAI „Performance auf menschlichem Niveau”. Die Übersicht bietet u.a. eine umfassende Einsicht der Datengrundlage zu GPT-4 im Vergleich zu anderen Sprachmodellen.
💡 Technical Report von OpenAI zu GPT-4 (PDF März 2023). Umfassende Statistiken und Vergleiche, um zu demonstrieren, was GPT-4 alles kann und wo die Grenzen liegen.
💡 GPT-4 zeigt laut Report von 14 Forschern, darunter Eric Horvitz, Chefwissenschaftler von Microsoft. „Funken von allgemeiner Künstlicher Genereller Intelligenz“ (Quelle: Cornell University). Solch ein Verhalten wird im englischsprachigen als Artificial General Intelligence (AGI) bezeichnet und bedeutet, dass Künstliche Intelligenzen sich selbstständig “fortbilden” bzw. in Eigenregie dazulernen. Für nicht wenige KI-Beteiligte sind dies die “richtigen” KIs.
💡 ChatGPT 4 ist nicht an das Internet angeschlossen und eignet sich somit auch nicht als zuverlässige “Up-to-Date-Suchmaschine”. Etwa eine Webseite nur über die URL als Prompt analysieren zu lassen, eignet sich so momentan noch nicht. Erweiterungen (Python-Skript) wie Auto-GPT ändern diesen Zustand.
💡 Die GPT-4-Familie bietet verschiedene Sprachmodelle, wobei GPT-4 für den Chat optmiert wurde. Weitere Modelle sind z.B. gpt-4-32k oder gpt-4-0314.
🛑 ChatGPT-4 ist nicht das Gleiche wie GPT-4. Bei ChatGPT handelt es sich um einen AI-Chatbot und bei GPT-4 um die Programmierschnittstelle (API), auf die Entwickler zugreifen können, um etwa GPT-4 bei ihren Anwendungen zu integrieren.
🔒 Datenschutz: ChatGPT-Benutzer können den Chat-Verlauf deaktivieren, sodass Sie auswählen können, welche Konversationen zum Trainieren der Modelle verwendet werden können. Bei der “Budiness Varainte” soll die Deaktivierung vorab eingestellt sein. Jedoch behält sich OpenAI das Recht vor, alle Chat-Verläufe für bis zu 30 Tage zu speichern, um diese nach offiziellen Angaben bezüglich unpassender Eingaben zu kontrollieren.
▶️ Offizielles Release-Video (März 2023) von OpenAI zu GPT-4 auf YouTube. Vorstellung der AGI. Was kann GPT-4 im Vergleich zum Vorgänger GPT-3.5? Wesentliche Funktionen wie der Bild-Upload im Überblick.
Stand: April 2023
Design 1
Design 2
DALL-E2
- Bildgenerierung über “Text-Bild-Paare” auf der Grundlage von Künstlicher Intelligenz (Deep Learning). DALL·E ist eine 12-Milliarden-Parameter-Version von GPT-3. Der Nachfolger DALL·E 2 kann aus einer Textbeschreibung (Prompts) originelle, realistische Bilder und Grafiken erstellen und dies mit 4 Mal höherer Auflösung. Es kann Konzepte, Attribute und Stile kombinieren. Zur Nutzung ist ein (kostenfreier) Account notwendig. Die Verwendung läuft über die Webseite https://labs.openai.com
- Nachdem ein Prompt in natürlicher Sprache zur Generierung eines Bildes erstellt wurde, sind nach kurzer Bearbeitungszeit 4 Images im Verhältnis 1 x 1 (Höhe x Breite) bei einer Auflösung von 1.024 x 1.024 verfügbar. Zusätzlich lassen sich auch eigene Bilder hochladen, die der Nutzer nach erfolgreichem Upload bearbeiten kann.
- Features Inpainting und Outpainting. Beim Inpainting, lassen sich innerhalb des Bildes Stellen entfernen (Transparent) und per Prompt dann mit dem neuen gewünschten Motiv auffüllen. Aus einem Hund wird so im Handumdrehen eine Katze. Das Outpainting ist beim Bild-Upload sehr nützlich. Beispiel: Maße des Bild-Uploads bei 400 x 200 (Breite x Höhe). Nun kann der User einen vorgegebenen Rahmen von 1024 x 1024 “drüberlegen” und das Image in dieser Größe thematisch passend erweitern/vervollständigen.
- Wem gehören die Bildrechte im Rahmen von Text-2-Image-Generatoren? Es ist nicht zu 100 % geklärt, wie mit solchen KI-generierten Bildern rechtlich umgegangen werden soll. Wer ist der Eigentümer und kann dieser die Images zu 100 % kommerziell verwenden und diese sogar schützen lassen (Copyright)? Der offizielle Blogbeitrag von OpenAI zum Release von DALL-E gibt dem Bildersteller die vollen Nutzerrechte, um die Images auch zur Kommerzialisierung verwenden zu dürfen. Dies ist aber nur eine Meinung.
- Die erstellten Bilder & Image-Uploads können in einer Kollektion bei OpenAI nachhaltig gespeichert und auch auf das eigene Endgerät heruntergeladen werden. Mit dem Feature Variationen lassen sich von einem Bild ähnliche Exemplare erstellen. Hierbei werden neben dem sichtbaren Original 4 weitere Grafiken generiert, die dann laut OpenAI auch wieder vollumfänglich nutzbar sind.
- Monatlich erhält der User 15 kostenlose Credits, die nach Aufbrauchen über den eigenen Account zusätzlich erworben werden können (115 Credtis für 15 $). 1 Credit entspricht einem Vorgang wie einer kompletten Bilderstellung oder der Bearbeitung einer Grafik.
- DALL-E API seit November 2022 offen für Entwickler, um die Bilder-KI in Apps oder weiteren Produkten zu integrieren. Die API befindet sich aktuell in der Beta-Phase.
- Microsoft als größter Investor von OpenAI integriert DALL-E2 in vielfältige Produkte wie etwa seine neue Grafikdesign-App Designer, den Browser Edge und die Suchmaschine Bing (Image Creator).
💡 Im Januar 2021 führte OpenAI DALL·E ein. Mittlerweile nutzen mehr als 3 Millionen Menschen (November 2022) die beliebteste Bilder-KI DALL-E2. Täglich werden mehr als 4 Millionen Bilder mit der Anwendung auf Grundlage von Künstlicher intelligenz generiert!
💡 Derzeit wird an einem Feature gearbeitet, um ein generiertes Bild in einer vom User vorab festgelegten Größen außerhalb der aktuellen “starren” 1024 x 1024 zu erzeugen.
🛑 Mit DALL-E2 lassen sich keine Bilder mit extremen (schädlichen) Inhalten generieren, die z.B. stark jugendgefährdend sind. Auch ein Upload solcher Bilder ist nicht gestattet und sollte unbedingt vermieden werden. An der Sicherheit des KI-Systems wird weiter gearbeitet.
▶️ Offizielles YouTube-Video von OpenAI zu DALL-E2 mit Erklärungen zu Features wie Inpainitng und der allgemeinen Funktionsweise der Bilder-KI.
▶️ Empfohlenes YouTube-Video, das sehr sachlich alle wesentlichen DALL-E2-Funktionen wie Outpainting, Inpainting, Anlegen von Kollektionen anhand von Beispielen erläutert.
Stand: April 2023
Design 1
Design 2
OpenAI API
- Nutzung der API von OpenAI für eigene Projekte möglich. Die Kommunikation läuft über Python, JavaScript und weiteren Programmiersprachen ab, wodurch ChatGPT oder DALL-E2 auch auf dem eigenen Rechner oder Server (Webseite) verfügbar ist. So können Nutzer z.B. auf der eigenen Webseite ChatGPT-3.5/-4 mit einem eigenen Interface für externe User einrichten.
- Jeder User, der bei OpenAI registriert ist, verfügt über eine eigene Programmierschnittstelle (API). Jederzeit kann die aktuelle API gelöscht und wieder neu generiert werden, um z.B. einer Komprimierung der Schnittstelle vorzubeugen. Der API-Schlüssel sollte niemals weitergegeben werden. Bitte darauf achten! https://platform.openai.com/account/api-keys
- Finetuning zur Verbesserung der Leistung (Spezialisierung) möglich. Mittels Datensätzen oder auch menschlichem Feedback können Feinabstimmungen der GPT-X vorgenommen werden. Dadurch passt sich die Künstliche Intelligenz immer mehr den Aufgabenstellungen an und verfeinert die Ausgaben.
- Die Abrechnung läuft über die Tokenisierung, also dem Umfang der Eingaben ermitelt in Dollar $ (Keine Flat). Nur die Anzahl der getätigten Anfragen (Prompts) werden auch bezahlt. Hierbei sollte zwingend auf die Einrichtung & Verwaltung der Limits geachtet werden. Diese lassen sich über das eigene OpenAI-Konto leicht einstellen und jederzeit anpassen.
- Für Entwickler hat OpenAI den Playground eingerichtet, um direkt im Browser den Code testen zu können. Dies ermöglicht ein schnelleres (effizienteres) Arbeiten.
- Statistiken & Einstellungen rund um die Schnittstelle (API) über eigenen OpenAI-Account einsehbar. Die API-Aktivität (Usage) ist in einer monatlichen Statistik abrufbar. Vor allem die Einstellungen zu Billing (Bezahlung) sind wichtig und sollten regelmäßig überprüft werden.
- API-Haftung beachten! Wer ist im Worst-Case-Szenario, also etwa im Rahmen von datenschutzrechtlichen Verstößen verantwortlich? Ganz allgemein sind noch viele Fragen bezüglich der rechtlichen Grundlage in Deutschland & Europa nicht endgültig geklärt!
💡 Eine API ist eine sogenannte Programmierschnittstelle, mit der Entwickler Zugriff auf einen Teil der Servers von OpenAI haben. Hierbei handelt es sich i.d.R. um eine Buchstaben- & Zahlenkombination, die auch als eine Art Passwort anzusehen ist und erst eine stetige Kommunikation von Server zu Server oder Server zu Rechner ermöglicht.
💡 API-Referenz: Einführung, Modelle, Einbindungen, Feinabstimmung und weitere Informationen rund um die API-Nutzung von OpenAI in der Übersicht.
💡 Offizieller Blogbeitrag von OpenAI zum Release der API. Erläuterungen rund um die Funktionsweise der Schnittstelle und Klärungen allgemeiner Fragestellungen.
💡 Durch die Bereitstellung der API haben externe Entwickler nun Zugriff auf diese Künstliche Intelligenz, um sie etwa zur Erstellung neuer Anwendungen (Beispiel) auf der Grundlage von GPT-X zu verwenden. So kann also um OpenAI herum eine Art Biotop für Neuentwicklungen entstehen. Die OpenAI-Community hilft auch gerne bei Fragestellungen.
💡 Blogbeitrag bei Unidigital.news von Professor Stefan Bieletzke (FH Mittelstand) im Rahmen des Projektes “Titelfinder” zur Einbindung des Chatbots via API, um diesen so für einen bestimmten Personenkreis (Studierende) zugänglich zu machen, ohne dass diese sich vorab bei OpenAI registrieren müssen.
🔒 API-Datennutzungsrichtlinien: „OpenAI verwendet keine Daten, die von Kunden über unsere API übermittelt werden, um unsere Modelle zu trainieren oder zu verbessern, es sei denn, Sie entscheiden sich ausdrücklich dafür, Ihre Daten zu diesem Zweck mit uns zu teilen. Sie können dem Teilen von Daten zustimmen.” (Quelle: OpenAI)
Stand: April 2023
Design 1
Design 2
ChatGPT-Plugins
- OpenAI-Plugins sind Verbindungen von ChatGPT mit externen Anwendungen, die nun in Kombination mit dem AI-Chatbot verfügbar sind. Die Tools sind im internen Plugin-Store über die offizielle Webseite von ChatGPT auswählbar., sofern User den Zugriff auf ChatGPT-Plugins haben. https://chat.openai.com
- Großer Vorteil: Ein Login bei OpenAI und schon können alle vorhandenen Plugins im Rahmen der Webseite genutzt werden. Ein mehrfaches Öffnen von Apps oder Webseiten entfällt. Dies verschlankt Prozesse und könnte eine erhebliche Zeitersparnis bedeuten.
- Beispiel: Integration des Mathematik-Tools Wolfram, das ChatGPT intelligenter macht, indem es Zugriff auf leistungsstarke Berechnungen, genaue Mathematik, kuratiertes Wissen, Echtzeitdaten und Visualisierung (Graphen) durch Wolfram|Alpha und Wolfram Language gewährt. Der Output ist ebenfalls in Code-Form sichtbar. ChatGPT kann nun also auch Mathe.
- Kombination von einzelnen Plugins mit ChatGPT ist möglich. Etwa Lieferung eines Mittagsgerichts nach Hause (1) mit gleichzeitiger Buchung eines Restaurants für nächste Woche (2) und der Online-Bezahlvorgang (3) wird ebenfalls von einem passenden Programm erledigt.
- Nutzung von ChatGPT-Plugins aktuell noch eingeschränkt über Warteliste möglich (Alpha-Phase). Nur für ausgewählte User stehen die Anwendungen im Drop-Down-Menü zur Verfügung.
- ChatGPT ist nun ans Internet angeschlossen, mit eigenem Internet-Access-Plugin, Bei der Verwendung von GPT-3.5/-4 ist dies bislang nicht möglich und die Datengrundlage ist bis September 2021 limitiert. Dies ändert sich nun durch einen ChatGPT-Browser, der den KI-Chat nun “Up-to-Date” macht.
💡 Einführung von OpenAI rund um den Themenbereich Plugins und der Integration in ChatGPT. Was muss ich bei der Erstellung solcher Anwendungen beachten? Der End-To-End-Flow spielt dabei eine wesentliche Rolle.
💡 Plugins können „Augen und Ohren“ (Zitat: OpenAI) für Sprachmodelle sein und ihnen Zugang zu Informationen verschaffen, die zu aktuell, zu persönlich oder zu spezifisch sind, um in die Trainingsdaten aufgenommen zu werden. Plugins können Sprachmodellen ermöglichen, sichere, eingeschränkte Aktionen (U.a. Kaufabschluss) in ihrem Namen auszuführen,
💡 OpenAI hostet mit einem Webbrowser und Code-Interpreter zwei Plugins in Eigenregie auf ihren Servern. Die restlichen Anwendungen werden von Externen (Slack, Expedia…) gehostet. Die Plugins externer Entwickler/Unternehmen liegen somit auf anderen Servern und benötigen für die stetige Kommunikation mit den Servern von OpenAI eine Programmierschnittstelle (API.)
💡 Für alle WordPress-User sind Plugins definitiv ein Begriff, da das beliebteste Custom-Management-System (CSM) weltweit (2023) seine Stärken genau aus diesen sehr einfach zu installierenden Anwendungen zieht bzw. WordPress dadurch auch für Anfänger sehr effizient und übersichtlich bedienbar ist. Die WordPress-Plugins haben wie ChatGPT-Plugins ihren Code auf das Open-Source-CMS abgestimmt.
💡 Verfügbare Plugins: U.a. Wolfram, Expedia, Klarna, Slack, Shopify, KAYAK und Zapier. Durch Hacks sind schon Informationen an die Öffentlichkeit gelangt, die noch viel mehr Anwendungen auf ChatGPT-Basis aufzeigen und es ist davon auszugehen, dass noch eine Vielzahl weiterer Plugins von Entwicklern/Unternehmen hinzukommt.
▶️ Release-Video von Wolfram zur Integration der Anwendung in ChatGPT. Anhand von Beispielen ist gut zu erkennen, wie ChatGPT-Plugins insgesamt funktioniert und mit welchen Möglichkeiten ein Plugin wie Wolfram den Chatbot verbessern kann (Gamechanger).
Stand: April 2023
Design 1
Design 2
Auto-GPT
- Experimentes Python-Skript eines Entwicklers mit dem Pseudonym Significant Gravitas. Open-Source-Programm auf GitHub, das autonomes Handeln von GPT-3.5/-4 von OpenAI demonstriert. Die Künstliche Intelligenz fungiert hierbei als Projektmanager, die anfangs von einem menschlichen User ein Ziel (Goal) erhält und dieses im Anschluss mittels Aufgaben (Tasks) in Eigenregie erledigt. Auto-GPT teilt die Aufgaben in Unter-Instanzen auf und agiert selber als Mutter-Instanz, die für die Koordination zuständig ist. Jeder Schritt wird aber vom User bestätigt.
- Auto-GPT, auch als KI-Agent (AI-Agent) bekannt, ist ans Internet angeschlossen, im Gegensatz zu ChatGPT-3.5 /4 und hat demnach Zugriff auf das gesamte Word Wide Web und theoretisch auch auf die persönlichen Login-Daten, die z.B. im Webbrowser gespeichert sind. Für die Netzsuche wird z.Z. das Selenium-Framework genutzt, wodurch es vorkommen kann, dass sich neben der Textgenerierung auch ein Browserfenster automatisch öffnet.
- In Auto-GPT sind wesentliche Funktionen wie ein Webcrawler und auch eine Bildgenerierung mit DALL-E2 eingebaut, die selbstständig von der KI genutzt werden. DALL-E2 ist ebenfalls ein Bestandteil von OpenAI und kann so über die API gleich mitgenutzt werden.
- Ein automatischer Wechsel (Switch) von Sprachmodellen wie etwa von GPT-4 auf GPT-3.5 ist möglich, falls Auto-GPT für einen bestimmten Prozess nur maximal GPT-3.5 benötigt und dies im Vergleich zu GPT-4 eben kostengünstiger ist. Auto-GPT achtet also auch die Kosteneffizienz.
- Elementare Veränderung: Bislang musste dem Computer exakt mitgeteilt werden, welche Aufgaben er erledigen soll. Diese Regel gilt nicht mehr! Es reicht ein Endziel zu definieren und wie die Artificial Intelligence da nun hinkommt, dies entscheidet sie selber! Dies geht in Richtung Gamechanger. Ein AI-Agent “promptet sich selbst”,
- Beispiel: Suche nach einer bestimmten Mail-Adresse. Auto-GPT nutzt nicht nur Google, sondern durchsucht auch Social-Media-Plattformen wie Linkedin oder die Journalistendatenbank, um ans Ziel zu kommen. Anschließend wäre es auch möglich, dass die Anwendung automatisch das E-Mail-Programm öffnet und selbstständig eine Nachricht an diese Mail-Adresse schickt.
- Eine Verbindung mit der API von OpenAI erforderlich, um Auto-GPT auf Grundlage von GPT-X nutzen zu können. Für GPT-4 ist eine Bewerbung über die Warteliste (Waitlist) von OpenAI notwendig. Aktuell ist der Zugriff auf GPT-4 über die Programmierschnittstelle nur für ausgewählte User verfügbar..
- Einsatzmöglichkeiten: U.a. Automatisierte Social Media Posts, Online-Shopping mit anschließendem Bezahlvorgang via Kreditkarte oder komplette Fertigstellung einer Webseite. Auch das komplette Schreiben eines Filmskriptes ist im Bereich des Möglichen. Es gibt wirklich sehr viele Projekte, die sich theoretisch mit Auto-GPT autonom ausführen lassen.
- AgentGPT als kostenlose Webversion (Beta) zum Testen verfügbar: https://agentgpt.reworkd.ai/. Der Umfang der Anwendung ist jedoch begrenzt, aber User bekommen einen ersten Eindruck, wie Auto-GPT funktioniert. Einfach einen Projektnamen auswählen, das Ziel definieren und los geht’s.
💡 Aktuell ist das Python-Skript Auto-GPT mit über 100.000 Stars das beliebteste Projekt auf GitHub, der größten Plattform für Softwareentwicklungen.
💡 Eine Alternative zu Auto-GPT ist Baby AGI, das ebenfalls als Python-Skript auf GitHub kostenfrei zur Verfügung steht. Auch hier sollten User sehr vorsichtig bei der Nutzung vorgehen.
💡 Faktensuche über Auto-GPT ist wohl zuverlässiger als bei ChatGPT, da die Anwendung ihre Informationen nicht nur aus dem begrenzten Sprachmodell zieht (bis September 2021), sondern z.B. auch die Suchmaschine Google verwendet. Der potenzielle Pool an aktuellen Quellen ist somit auch größer, Jedoch kann auch dieses Python-Programm in Kombination mit GPT-3.5/-4 fehlerhafte Infos generieren.
💡 Auto-GPT (Version: v0.2.1) ist in dieser Form/Version noch unbrauchbar und kann durchaus gefährlich sein, jedoch ist die Wahrscheinlichkeit sehr hoch, dass der KI-Agent in nächster Zeit immer besser und vor allem zuverlässiger (berechenbarer) agiert. Wir stehen noch am Anfang der Entwicklung.
💡 Vergleich zu ChatGPT: Beim AI-Chatbot überlegen sich Nutzerinnen & Nutzer in welchen Schritten vorzugehen ist, bei Auto-GPT übernimmt die Anwendung nun diese Überlegungen. Nur das anfängliche Ziel muss klar von menschlicher Hand definiert sein. Dies könnte im Erfolgsfall eine wesentliche Zeitersparnis bei der Durchführungen eines oder mehrerer Projekte bedeuten.
🛑 Es ist an dieser Stelle noch einmal in aller Deutlichkeit zu betonen, dass diese Anwendung alles andere als ein Spielzeug ist, sondern Prozesse in Autonomie durchführen könnte, die sich dann nicht mehr rückgängig machen lassen. NUR FÜR SPEZIALISTEN IN DER RICHTIGEN IT-UMGEBUNG WIE EINER VIRTUELLEN MASCHINE GEEIGNET! Fix mal auf seinem privaten Rechner installieren und ein paar “Dinge” umsetzen, ist definitiv die falsche Vorgehensweise, da theoretisch die gesamten privaten Daten (Ordner) auf dem Rechner über die API nach San Francisco zu OpenAI übertragen werden könnten.
Eine wichtige Quelle bei der Bearbeitung dieses Abschnitts zu Auto-GPT war das YouTube-Video von c’t 3003, einem Kanal von heise online. Hier geht es zum Transkript.
Stand: April 2023
Design 1
Design 2
WordPress & ChatGPT
- In diesem Beispiel (siehe Grafik oben) wird das WordPress-Plugin AI Engine vom japanischen Entwicklerstudio MEOW APPS verwendet, um ChatGPT-3.5 auf der eigenen Webseite per Shortcode einzubinden. Es gibt auch weitere Plugins, aber das Prinzip der Nutzung des Embeds ist i.d.R. immer das Gleiche und die Features auch recht ähnlich.
- Anleitung: Zuerst das Plugin via WordPress-Plugin Suche auswählen, dann installieren, aktivieren und im Anschluss den API-Key vom eigenen Open-AI-Account unter dem Reiter Einstellungen in das Feld API-Schlüssel einfügen. Nun steht schon die Verbindung via API zu AI Engine und OpenAI. Siehe dazu Grafik mit Connection Gunzenhausen – Tokio – San Francisco..
- Der Embed auf der Website erfolgt u.a. über den Shortcode mwai_chatbot (mit eckigen Klammern), der ganz einfach in den Texteditor kopiert wird. Nach Aktualisierung der Seite müsste der KI-Chatbot mit ChatGPT-3.5-Turbo schon verfügbar sein und es können vom User schon Prompts eingegeben werden. Im Gegensatz zur offiziellen Webseite von OpenAI, schreibt dieser Bot nicht live mit, sondern gibt den Output auf einmal aus. Die Geschwindigkeit ist definitiv zuverlässiger als die kostenlose Version von ChatGPT-3.5, die mal langsam und dann wieder schneller läuft. Hier ist die Geschwindigkeit konstant, wodurch Chatbot-Session kalkulierbarer sind.
- Ein ganz wichtiges Feature des WordPress-Plugins ist die Einsicht aller Prompts für den Administrator im Backend-Bereich der AI-Anwendung. Hierfür auf den Reiter Discussion klicken und die Historie einsehen. Sowohl die Eingaben der Nutzer als auch die Ausgabe von ChatGPT sind sichtbar, also die komplette Gesprächsführung!
- Eine elegante Alternative v.a. für den Bildungsbereich, um ChatGPT hinsichtlich des Datenschutzes Schülern und Studierenden kostenfrei zur Verfügung zu stellen. Es bedarf keinerlei Anmeldung über Namen, E-Mail und Mobilfunknummer, sondern nur die Eingabe eines Passwortes, falls der Admin die Webseite passwortgeschützt hat, was mehr als zu empfehlen ist! Zusätzlich sollte die Lernenden über ein VPN das Tool nutzen. so ist auch die IP verschlüsselt und OpenAI erhält maximal anonyme Prompts für KI-Trainingszwecke. Mehr nicht!
- Im Gegensatz zur Standard-Nutzung von KI-Chatbots über die offizielle Webseite von OpenAI, lassen sich mit der WordPress-Anwendungen vielfältige Designänderungen vornehmen. Dazu gehört z.B. die Anpassung der Schriftgröße und auch Schriftfarbe. Auch das Embed-Interface seitens Oberfläche ist sehr einfach im Backend über den Reiter Chatbot nach Belieben änderbar. Nicht nur für den inklusiven Bildungsbereich interessant.
- Die Kosten des WordPress-GPT-Embeds werden im Rahmen der Tokenisierung abgerechnet. 1000 Tokens entsprechen 750 Wörtern und diese kosten den API-Eigentümer dann 0,002 $. Die Abrechnung läuft also nicht über das Plugin und MEOW APPS ab. Es gibt keinen Preisaufschlag. Hierbei sollten User definitiv die Limits über das OpenAI-Konto im Auge behalten! An dieser Stelle wird das Setzen von Kosten-Limits über das Plugin AI Engine oder alternative Anwendungen nicht empfohlen, da Plugins auch gehackt und somit die APIs komprimiert werden könnten. Dies wird so im voraus ausgeschlossen. Safety First!
- Um ChatGPT noch mehr auf bestimmte Aufgabenfelder zu spezialisieren bzw. insgesamt an die eigenen Bedürfnisse anzupassen, können Nutzer das Feature Finetuning verwenden, das unter dem Reiter Feinabstimmungen auffindbar ist. Hier kann Feedback an den Chatbot gegeben werden, aus dem die KI wiederum nachhaltig lernt und so die Prozesse im Laufe der Zeit immer besser durchführt und so langfristig effizienter arbeitet.
- API-Haftung: Beim Gebrauch sollte der Admin, also API-Inhaber die Haftung beachten, da die rechtliche Grundlage bezüglich des Einsatzes von Künstlicher Intelligenz in Deutschland nicht zu 100 % geklärt ist. Werden etwa private Daten in den Chatbot eingegeben und somit vielleicht auch versehentlich in die USA nach San Francisco zu den Servern von OpenAI übertragen und wer haftet dann für diesen Verstoß des Datenschutzes? Vor dem Gebrauch ist Aufklärung darüber ein absolutes Muss!
💡 Der Marktanteil von WordPress, dem mit großem Abstand beliebtesten Custom-Management-System (CMS) weltweit liegt bei ca. 43 % aller Webseiten. Ganz allgemein WordPress-Kenntnisse und insbesondere die unkomplizierte Einrichtung von Künstlichen Intelligenzen via Plugin, ob nun von OpenAI im Rahmen von GPT-X oder weiteren Anbietern wird immer wichtiger! Dies geht ganz schwer in Richtung Future Skill!
💡 Umfassender Blogbeitrag bei unidigital.news (Autor: Matthias Kindt) zur Integration von AI Engine mit umfassender Anleitung, also von der Installation der Anwendung bis hin zur Prompt-Einsicht der Premium-Version und dem Finetuning der Künstlichen Intelligenz..
🎓 Insbesondere im Rahmen von Lehre und Unterricht an Hochschulen & Schulen kann das Feature Prompt-Einsicht sehr sinnvoll seitens der Lehrenden verwendet werden. Eingaben der Studierenden & Schüler von einem Semester oder Schulhalbjahr können z.B. auf Regelmäßigkeiten untersucht werden, um so festzustellen, bei welcher Thematik noch viele Fragen offen sind bzw. die Aktivität diesbezüglich am höchsten ist. So kann die Lehrkraft mithilfe des KI-Tools ganz gezielt beim nächsten Seminar oder der anstehenden Unterrichtstunde den eigenen Input anpassen, was schlussendlich die Lerneffizienz steigern könnte.
Stand: April 2023
Weitere Grafiken
Vorteile von ChatGPT Plus zur Free-Version
OpenAI Universe: Produktübersicht
OpenAI-Sprachmodelle über Webseite oder via API nutzbar
Design 1
Design 2
Prompt Engineering: Ein neues Berufsfeld entsteht
Übrigens diese Übersicht wurde ohne die Hilfe von ChatGPT oder sonstigen Künstlichen Intelligenzen erstellt, obwohl die Versuchung wohl da gewesen ist 😉
Bei Fragen und Anregungen schicke gerne eine Mail an info@unidigital.news
Folge mir auch auf LinkedIn
Kreative Lösungen sind gefragter denn je! #openminded