AI Images5 min read
Wie KI-Bildgeneratoren funktionieren: Vom Text zum Pixel

KI-Bildgeneratoren können fotorealistische Bilder, digitale Gemälde und abstrakte Kunst aus einer Textbeschreibung erzeugen. Die Technologie hat sich seit 2022 rasant verbessert.
Wie Diffusionsmodelle funktionieren
Diffusionsmodelle werden trainiert, indem echten Bildern schrittweise Rauschen hinzugefügt wird. Das Modell lernt, diesen Prozess umzukehren: Es beginnt mit reinem Rauschen und entfernt es Schritt für Schritt, wobei erst grobe Formen, dann feine Details entstehen.
Die Rolle der Textcodierer
Der Textprompt wird durch Codierer wie CLIP übersetzt, der auf Hunderten Millionen Bild-Text-Paaren trainiert wurde. Die numerische Darstellung des Prompts leitet den Entrauschungsprozess und stellt sicher, dass das generierte Bild die beschriebenen Konzepte widerspiegelt.


