Mit Bilder-KI «DALL-E» kurzerhand vom Feenland zum Horrorszenario
Neben ChatGPT bietet OpenAI auch eine Bilder-KI an. Die Software namens «DALL-E» kann neu Bilder per Markierungen und Beschreibungen anpassen.
Mit DALL-E kannst du über die kostenpflichtige Version von ChatGPT schon länger Bilder erstellen. Nun lassen sich die Bilder von DALL-E weiterbearbeiten. Nicht alles klappt dabei nach Wunsch. Du brauchst immer noch Geduld und Musse, um ein gewünschtes Ergebnis zu erzielen.
Die Bedienung selbst ist einfach. Entweder du beschreibst DALL-E im Chatfenster, was verändert werden soll – dieser Beschreibungstext nennt sich Prompt (Aufforderung). Oder du gehst über das neue Markierungswerkzeug. Jenes wählst du mit dem Pinselsujet-Button oben im Chatfenster. Damit hast du drei Möglichkeiten:
- beim markierten Bereich/Objekt etwas hinzufügen
- markierte Objekte entfernen
- den markierten Bereich verändern
Die Bearbeitung klappt ausschliesslich mit Bildern von DALL-E. Du kannst aber auch ein Bild hochladen, welches DALL-E in eine eigene Version interpretiert. Ich erstelle meine Vorlage mit der Bilder-KI selbst.
Mit folgendem Prompt – sind nur in Englisch möglich – generiert mir DALL-E innerhalb einer Minute eine Illustration:
In meiner Muttersprache ist mein Wunsch eine rosa Feenlandschaft mit Einhörnern, Schmetterlingen, Blumen und einem Schloss.
DALL-E antwortet unter dem erstellten Bild mit einem längeren Text auf Englisch, der meinen Wunsch etwas umschreibt und mir sagt, ich könne weitere Anpassungen gerne mitteilen:
«Here's the fairy world you envisioned, brought to life in hues of pink with majestic unicorns, delicate butterflies, a whimsical castle, and a sea of flowers. I hope this matches the magical scene you had in mind! If you'd like any changes or additional elements, feel free to let me know.»
Das Bild ist mir noch zu rosalastig. Und zeigt mir zu viele Schmetterlinge. Die Schmetterlinge will ich ausradieren. Dazu nehme ich das Auswahlwerkzeug, markiere einige Schmetterlinge und sage der KI, sie solle diese entfernen.
DALL-E brauchte zwei Versuche. Beim ersten Mal verkleinert mir die KI die Schmetterlinge statt sie zu entfernen. Sie benötigt für Veränderungen jeweils etwa eine halbe Minute Berechnungszeit.
Um die Farben anzupassen, beschreibe ich DALL-E diesen Wunsch in einem Satz. Mehr Farbe, weniger Pink. Interessanterweise verändert die KI nicht nur die Farben, sondern das ganze Bild:
Schloss und Einhörner sind unterschiedlich. Das ist schade und ungewollt. Sogar das Bildformat ist weniger breit. Ich habe genug vom bunten Treiben und versuche eine radikale Anpassung mit einem düsteren Horror-Szenario:
Auch hier verändert DALL-E alles am Bild. Nichts ist, wie es war. Einige Versuche zeigen unerwartete Veränderungen, wie eine düstere Feen-Armee vor dem Schloss. Irgendwann bin ich glücklich mit dem Ergebnis: düstere Skelett-Einhörner. Perfekt.
Was, wenn ich nun die düstere und die fröhliche Idee kombiniere? Ich befehlige die KI, ein pinkes Einhorn in die Mitte zu setzen. Dafür habe ich an der gewünschten Stelle eine Markierung angebracht:
Das entstandene, lieblose Farbklecks-Einhorn gefällt mir nicht. Eine Anpassung klappt nach mehreren Versuchen nicht. Die Stelle bleibt leer, als ich DALL-E auffordere, ein realistisch aussehendes Einhorn zu generieren. Falsch ist das nicht, denn ein realistisches Einhorn bedeutet tatsächlich gar kein Einhorn. Auch mit anders formulierten Prompts bleibt die Stelle leer. Ich befehlige DALL-E mehr Einhörner einzufügen. Die KI macht auch hier nicht, was ich mir wünsche. Bevor ich oder DALL-E es noch schlimmer machen, höre ich besser auf.
Fazit: inspirierend, ja, zielführend, nein
Auf den ersten Blick erscheint es praktisch, dass ich Bilder nach Wunsch über die KI DALL-E anpassen kann. Allerdings hat sie mehrere Schwachpunkte. Will ich ein Objekt entfernen, ersetzt mir die KI jenes häufig durch ein neues Objekt. Will ich ohne Markierungstool etwas verändern, passt die KI gleich das ganze Bild an. Ein Schloss sieht nach einer Farbanpassung etwa anders aus. Mit Geduld erhalte ich dennoch brauchbare Bilder. Wenn auch in jedem Fall mit unerwarteten Bestandteilen.
Mein Fazit zu Bilder-KI im Allgemeinen verändert die neue Bearbeitungsfunktion von DALL-E nicht: Sie sind unausgereifte Werkzeuge und dienen als Inspirationsquelle für eigene Bilder. Mehr muss und soll eine Bilder-KI auch nicht können – für mich zumindest.
Hier findest du weitere KI-Tools, die ich bereits für dich getestet habe:
Seit ich einen Stift halten kann, kritzel ich die Welt bunt. Dank iPad kommt auch die digitale Kunst nicht zu kurz. Daher teste ich am liebsten Tablets – für die Grafik und normale. Will ich meine Kreativität mit leichtem Gepäck ausleben, schnappe ich mir die neuesten Smartphones und knippse drauf los.