3. Oktober 2024
tts

Text-to-Speech: Ohne Anmeldung Top-Anwendungen über HuggingFace Space in TTS-Arena testen

Ohne Anmeldung Top-Anwendungen im Rahmen von Text-to-Speech-Tools testen, dies geht in der TTS-Arena der US-Plattform HuggingFace und in einem bestimmten Umfang völlig kostenfrei. Ob kommerzielle TTS-Anwendungen wie ElevenLabs und Play.HT oder offene Tools wie MetaVoice und WhisperSpeech, User können vielfältige Audios abspielen und diese dann bewerten.

Weiterlesen
newsletter

PDF2Podcast nun auch auf Deutsch | LAION darf urheberrechtlich geschützte Bilder nutzen | Wissensgraphen & LLM | Helmholtz & Max-Planck unter Top 10

Die 60. Ausgabe von KI & Bildung beschäftigt sich zu Beginn wieder mit Anwendungen, die u.a. aus einem PDF einen Podcast erstellen und zwar nun auch auf Deutsch. Hierfür können die Spaces der US-Plattform HuggingFace verwendet werden, auf denen sich so allerlei sinnvolle Open-Source-Tools befinden.

Weiterlesen
storm

STORM: Tool der Stanford University ermöglicht mit LLM das Erstellen von Wikipedia-ähnlichen Beiträgen mit Quellenangaben

Mit der Open-Source-Anwendung STORM, die Entwickler der US-Hochschule Stanford University entwickelt haben, können User nun kostenfrei mithilfe eines Language Models zu beliebigen Themen mit einem Prompt einen professionell strukturierten Beitrag mit Quellen im Stile von Wikipedia-Artikeln generieren.

Weiterlesen
pdf2

PDF2Audio: Open-Source-KI zur Wandlung von PDF in Podcasts und Zusammenfassungen

Nachdem Google vor Kurzem sehr eindrucksvoll über das Tool NotebookLM die Funktion Audio Overview vorgestellt hat, mit dem sich aus einem PDF oder einer URL ein interessanter englischsprachiger Podcast KI-generieren lässt, können User nun die Open-Source-KI PDF2Audio nutzen, um PDFs in deutschsprachige Podcasts und weitere Sprachen zu transformieren.

Weiterlesen
flux lora

Flux LoRa: Eine eigene Bilder-KI auf der Grundlage von Flux [dev] trainieren und Images generieren

Nun gibt es mit Flux LoRa die Möglichkeit, eine ganz eigene Bilder-KI zu trainieren und zwar auf der Grundlage der Top-Anwendung Flux [dev], die allen Usern “Open Source” zur Verfügung steht. Sehr häufig wurden in diversen Beispielen via Social Media zum Training Selifes verwendet, um sich dann etwa als Superman oder Bergsteigerin darstellen zu lassen.

Weiterlesen
newsletter

Newsletter KI & Bildung #59 | GPT-4o korrigiert Mathe-Klausuren | Echtzeit-Dialoge mit Moshi | Uni Bochum “GPT-connected” | KI-Schule des Jahres | Mit KI gegen Verschwörungen

Die ETH Zürich hat eine Studie zur “automatisierten KI-Bewertung von handschriftlichen Mathe-Klausuren” publiziert, die mit einer vorab trainierten GPT-4-Variante bewertet werden. Dies könnte alle Prüfer nachhaltig entlasten und so Kapazitäten freisetzen.

Weiterlesen
studie

Studie: Handschriftliche Mathematik-Klausuren mit GPT-4 korrigieren lassen

Gert Kortemeyer & Team von der ETH Zürich haben eine Studie zur automatischen Bewertung von handschriftlichen Mathematik-Klausuren auf Universitätsniveau mithilfe eines vorab trainierten GPT-4-Modells veröffentlicht. Eine wirklich tolle Publikation, die mit 17 Seiten Umfang sehr kompakt ist und u.a. auf die Vorgehensweise etwa bezüglich der Technik “Optical Character Recognition (OVR)” eingeht.

Weiterlesen

KI + Bildung Newsletter #58 | Podcast aus PDF generieren | KI-Leuchttürme in Niedersachsen | OpenAI “o1” kann Mathe & Physik | KI-Prüfkatalog vom Fraunhofer

Flux aus einem PDF einen interessanten Podcast mit KI-Hosts und anregender Diskussion erstellen? Dies geht nun kostenfrei und in wenigen Minuten über die Anwendung NotebookLM von Google und dem Feature Audio Overview, das auf der Grundlage von Googles Sprachmodelle Gemini basiert.

Weiterlesen

Audio Overview: Aus einem PDF einen interessanten Podcast mit “KI-Hosts” erstellen lassen

Ein Forschungspapier hochladen, nur einen Button drücken und nach wenigen Minuten wird daraus automatisch ein englischsprachiger Podcast mit süffisant-kritischer Diskussion etwa zum Thema “Custom Chatbots in der Hochschullehre” generiert? Und das alles kostenlos? Ja, dies geht aktuell über NotebookLM von Google und dem neuen Feature Audio Overview und zwar unglaublich einfach!

Weiterlesen
newsletter

Coding Skills von LLMs | Klett mit Chatbot | Napkin im Sprachunterricht | Yale investiert 150 Mio $ | UNESCO Framework | Technostress

Der 57. Newsletter von KI & Bildung blickt unter anderem auf die Coding-Skills von Language Models im Vergleich zu menschlichen Entwicklern und thematisiert auch weiterhin die Top-Bilder-KI Flux, mit der User nun im Rahmen von “Flux LoRa” eigene Bilder trainieren können.

Weiterlesen