
Meinung
Künstlichkeit der Kunst. Wie KI den Kunstmarkt aufmischt
von Michelle Brändle
KI-Generatoren, die aus einem Text ein Bild erstellen, gibt es inzwischen einige. Bei der Nutzung ist immer Geduld gefragt, denn bis zu einem Ergebnis dauert es oft mehrere Minuten. Stability AI ändert das.
Stability AI ist ein Unternehmen, das Text-, Bild- und Video-Generatoren auf Basis von Deep-Learning-Modellen erstellt. Ihren Text-zu-Bild-Generator nennen sie Stable Diffusion. Dieser spuckt anhand eines Beschreibungstexts, Prompt genannt, ein Bild aus. Die erste Version gibt es seit über einem Jahr, mit einer verbesserten Nachfolge, dem Stable Diffusion XL.
Doch sowohl bei der ersten Version als auch bei der Nachfolge benötigt es von der Texteingabe bis zum Ergebnis einige Minuten. Nun hat Stability AI eine neue Version ihres Bild-Generators als Demo herausgebracht. Das sogenannte Stable Diffusion XL Turbo (SDXL-Turbo) basiert auf dem Modell Stable Diffusion XL und liefert im Gegensatz zum grösseren Bruder Ergebnisse in Sekundenschnelle.
Wie die Generatoren funktionieren, habe ich bereits in früheren Artikeln genauer abgehandelt. Das Prinzip als User ist simpel: Du gibst einen Text ein, Prompt genannt, und das Programm spuckt dir anhand dieser Beschreibung eines oder mehrere Bilder aus. Das ist beispielsweise toll zur Inspiration für Kreativschaffende.
Da ein solches Programm für ein Ergebnis auf eine ziemlich grosse Datenbank zurückgreifen muss, erfordert es eine enorme Rechenleistung. Und nimmt viel Zeit in Anspruch. Wenn dir das Ergebnis anschliessend nicht gefällt, musst du deinen Text ergänzen, ändern oder gar neu schreiben. Das Prozedere beginnt von vorne. Das kann ermüdend sein.
Mit dem SDXL-Turbo hat Stability AI ein Programm geschaffen, dass so schnell Bilder aus den Prompts liefert, dass sie es selbst als Echtzeit-Ergebnis betiteln. Die entstandenen Bilder sind nicht ganz so detailreich wie bei der langsameren Version, aber immer noch von recht guter Qualität. Allerdings sind sie schon alleine durch die Geschwindigkeit ihres Entstehens beeindruckend.
Normalerweise gehören zum Prozess eines Bild-Generators 20 bis 50 Schritte. Die Innovation beim SDXL-Turbo liegt darin, dass das Programm lediglich bis zu vier Schritte für den Output benötigt. Diese Vorgehensweise nennt Stability AI «Adversarial Diffusion Distillation». Sie ist recht komplex, nicht umsonst hat Stability AI die Theorie dahinter ausführlich erklärt.
Spannend ist, dass für das Ergebnis nicht nur Zeit eingespart wird, der Vorgang benötigt laut Stability AI auch weniger Rechenleistung. So hat auch mein Macbook Air mit M1-Chip genügend Leistung für ein paar witzige Ergebnisse. Die Demo-Version findest du auf dieser Webseite. Nach etwa 10 Sätzen und Ergebnissen ist die Gratisversion allerdings aufgebraucht. Die Bilder lassen sich mit einem Editor-Button noch weiter bearbeiten. Beispielsweise lässt du per Knopfdruck den Hintergrund entfernen oder drei weitere, ähnliche Ergebnisse anzeigen. Diese Bearbeitungen dauern wiederum etwas länger.
Seit ich einen Stift halten kann, kritzel ich die Welt bunt. Dank iPad kommt auch die digitale Kunst nicht zu kurz. Daher teste ich am liebsten Tablets – für die Grafik und normale. Will ich meine Kreativität mit leichtem Gepäck ausleben, schnappe ich mir die neuesten Smartphones und knippse drauf los.