Comics mit KI erstellen: So schnell werden Künstler nicht arbeitslos
Ich habe versucht, mit einem Chatbot und einem Bildgenerator ein eigenes Comic zu kreieren. Mir ist Erstaunliches gelungen, gescheitert bin ich aber trotzdem.
Da sind doch überhaupt keine Wissenschaftler? Und meine Antiheldin Scarlet Shadow sieht überhaupt nicht wie eine Kreuzung zwischen Mensch und Dämon aus. Schon nach einem Tag beende ich mein Projekt, ein Comic mit Hilfe Künstlicher Intelligenz (KI) zu erschaffen. Dabei war der Anfang so vielversprechend.
Chatbots und intelligente Bildgeneratoren sind faszinierend und unheimlich zugleich. Sie wirken überraschend kreativ und kreieren scheinbar aus dem Nichts Inhalte. Scheinbar, weil die Infomations-, respektive Bildvorlagen aus einem bestehenden Fundus stammen und Dinge wie Quellenangabe und Bildrechte noch viele Fragen aufwerfen. Einigen davon gehen meine Kolleginnen Michelle Brändle und Coya Vallejo nach. Ich beschränke mich bei meinem Projekt auf die Machbarkeit und nicht auf rechtliche Aspekte oder die Frage, was Kunst ist.
Ich brauche eine Figur
Ich bin ein grosser Comic-Fan. Leider fehlt mir das Talent, respektive die Motivation, selber welche zu zeichnen. Vielleicht kann ich meinen Traum dank neuen Tools wie Midjourney und ChatGPT doch noch wahr werden lassen. Bei Midjourney handelt es sich um ein Programm, das mit Hilfe Künstlicher Intelligenz aus Worteingaben Bilder erschafft. Das Tool befindet sich derzeit in der Betaphase und wird über die Chat-Software Discord bedient. Dort kann ich in einem Chat-Fenster mit dem Befehl /imagine gefolgt von beliebigen Wörtern Bilder generieren lassen.
Zuerst brauche ich aber eine Geschichte. Und jede Geschichte braucht eine Hauptfigur. Die soll mir der Chatbot ChatGPT liefern. Weil die Doku «Mike Mignola: Drawing Monsters» meine Liebe zu «Hellboy» neu entfacht hat, nehme ich den roten Dämonen als Vorlage. Ich tippe also ein:
ich brauche eine Figur für ein Comic-Heft, sie soll eine Mischung aus Mensch und Monster sein und sich an Mike Mignolas Hellboy orientieren
Als Antwort erhalte ich Scarlet Shadow. Eine Mischung aus Mensch und Dämon, mit scharlachrotem Fell, langen spitzen Ohren und einer Rute. Sie wurde von einem bösen Zauberer beschworen, um ihm als Waffe zu dienen. Sie hatte jedoch einen eigenen Willen und beschloss, sich gegen den Zauberer zu wenden und sich dem Guten anzuschliessen. Sie wurde von einem Team von paranormalen Ermittlern gefunden und half ihnen bei der Bekämpfung von übernatürlichen Bedrohungen.
So weit, so Hellboy. Immerhin gibt es bei den Fähigkeiten mit übernatürlichen Sinnen und der Möglichkeit, die Gestalt zu ändern ein paar interessante Abweichungen. Als Ausgangspunkt reicht das. Kommen wir zur Geschichte. Ich versuche es mit der folgenden Eingabe:
Erzähl mir eine Geschichte mit Scarlet Shadow, die in einem Comic von 15 bis 20 Seiten erzählt werden kann. Sie soll in den 80er-Jahren spielen und übernatürliche sowie Science-Fiction-Elemente enthalten und in der Schweiz spielen
Den Titel: «Die Ewige Alpen» ändere ich in «Die Ewigen». Der Rest der Geschichte ist herrlich trashiger Comic-Blödsinn. Sie dreht sich um eine Gruppe Wissenschafter, die in den Schweizer Alpen ein übernatürliches Phänomen untersucht. Dabei werden sie von Unbekannten angegriffen und entführt. Scarlet Shadow, die in der Nähe auf Patrouille ist, hört den Lärm und geht der Sache auf den Grund. Dabei entdeckt sie eine Geheimorganisation namens «Die Ewigen», die glauben, Nachkommen einer alten alpinen Zivilisation zu sein und die in einen Konflikt mit Ausserirdischen verstrickt sind.
Durch weiteres Nachfragen liefert mir ChatGPT bei Bedarf Details zu den genauen Abläufen, wie Scarlet Shadow die Wissenschaftler befreien und die Aliens zusammen mit den Ewigen besiegen kann.
Bitte ein Bild
Die gesammelten Informationen sollten mehr als ausreichend sein, um damit die ersten Bilder kreieren zu lassen. Beim Bildgenerator Midjounrney kann ich sehr experimentierfreudig sein. Ich starte mit einer Stichwortartigen Beschreibung der von ChatGPT vorgeschlagenen Scarlet Shadow.
imagine/ woman with scarlet fur instead of skin, she is a mixture of human and demon, the woman has long, pointed ears and a long tail. She also has powerful claws and teeth as weapons
Beim Stil verlasse ich mich auf meine eigenen Vorlieben. Ich ergänze die Eingabe wie folgt: 80s retro sci-fi future art style, scarlet, graphic novel, --ar 3:2. Der letzte Teil ist ein Parameter für das Bildformat.
Bis dieses Bild entstanden ist, hat es mindestens eine halbe Stunde gedauert. Ein Task dauert schätzungsweise ein bis zwei Minuten. Ich habe drum für 30 Dollar ein Abo gelöst, mit dem kann ich bis zu drei schnelle Tasks gleichzeitig in Auftrag geben. In den dreissig Minuten habe ich mit verschiedenen Wörtern und in verschiedener Reihenfolge experimentiert. Mir ist nicht ganz klar, wie Midjourney welche Wörter priorisiert. Was mir nicht gelingen will, ist, dass Scarlet Shadow ein scharlachrotes Fell bekommt. Im besten Fall zeichnet Midjourny eine Frau mit einem Pelzschal um den Hals oder einer Katze auf der Schulter. Naja, was solls. Mit dem Coverbild bin ich schon mal zufrieden.
Bitte den gleichen Stil
Die Herausforderung ist nun, ein ganzes Comicheft im gleichen Stil und mit der gleich aussehenden Hauptfigur zu machen. Dieses Problem hatte auch ein US-amerikanischer Designer), der mit denselben Werkzeugen ein Kinderbuch entworfen und bei Amazon zum Verkauf angeboten hat. Identisch sehen seine Figuren nicht aus und er hat sich dabei mehrheitlich auf ein Bild pro Seite beschränkt. Mein Ziel ist es, ein richtiges Comic mit mehreren Panels pro Seite zu kreieren.
Damit der Stil so gut wie möglich erhalten bleibt, kann bei Midjourney der Befehl «Seed» gefolgt von der Seednummer eines kreierten Bildes verwendet werden. Mein Ankerpunkt soll das Cover sein, was den folgenden Parameter ergibt: --seed 4187562391.
Für meine weiteren Bilder verwende ich also neben den jeweiligen Begriffen immer zusätzlich diese Zeile:
80s retro sci-fi future art style, scarlet, graphic novel, --ar 3:2 --seed 4187562391
Jetzt habe ich eine Heldin, eine Story und den Stil. Als Nächstes frage ich ChatGPT, wie die erste Seite aussehen soll. Der Chatbot gibt Vorlagen wie ein Einstiegs-Panel mit Panoramablick auf die Alpen mit bedrohlichem Himmel. Daneben kommt ein kleineres, das eine Gruppe von Wissenschaftlern zeigt, mit Ausrüstung auf dem Rücken, bereit loszulaufen. Auf einem weiteren kleinen Panel ist Scarlet Shadow zu sehen, wie sie in menschlicher Gestalt auf Patrouille geht. Soweit so gut. Beim Übertragen auf Midjourney fangen jedoch die Probleme an. Das Panoramabild bekomme ich noch relativ gut im gleichen Stil wie das Coverbild hin.
Für das Panel mit den Wissenschaftlern benötige ich schon deutlich mehr Versuche, bis mir die Perspektive und das Aussehen der Personen passt.
Als nächstes weiche ich etwas von ChatGPTs Vorschlägen ab und will ein weiteres Bild der Wissenschaftler. Dieses Mal ein Close Up, wo ich eine Sprechblase erzeugen könnte. Nun müssen neben dem Zeichnungsstil auch Aussehen und Farben der Personen stimmen. Eine Sprechblase zu generieren funktioniert überhaupt nicht, aber die könnte ich auch nachträglich manuell einfügen. Nach etlichen Eingaben liefert mir der folgende Befehl ein passendes Bild:
swiss scientists, with futuristic equipment, hiking up the mountain, close up of two scientists, sky is dark, cold, eerie, Scary 80s retro sci-fi future art style, scarlet, graphic novel, --ar 3:2 --seed 4187562391
Das «Swiss» vor Scientist lasse ich künftig weg, da es nie, wie von mir erhofft, ein Schweizerkreuz auf die Anzüge malt. Auch beim nächsten Panel improvisiere ich. Der Geschichte zufolge untersuchen die Wissenschaftler geheimnisvolle Phänomene, bevor sie entführt werden. Ich möchte daher ein Bild, auf dem sie etwas übernatürlich leuchtendes entdecken. Bis es mir endlich gelingt, dass die Wissenschaftler von hinten zu sehen sind, ungefähr gleich aussehen, wie in den Bildern zuvor und etwas Leuchtendes anschauen, vergehen fast zwei Stunden.
Endgültig beende ich das Projekt beim nächsten Panel. Mein Ziel ist es, Scarlet Shadow aus mittlerer Distanz zu zeigen, wie sie versteckt die Wissenschaftler beobachtet, welche sich dem UFO nähern. Egal, was ich probiere, es gelingt mir einfach nicht, dass Scarlet Shadow so aussieht wie auf dem Cover, geschweige denn, dass sie aus der Distanz auf die Wissenschaftler blickt. Die tauchen überhaupt nicht mehr auf. Vielleicht wurden sie von den Ausserirdischen entführt – was weiss ich.
Zwischendurch wechselt der Stil auch mal auf 50er-Jahre Schwarz-Weiss-Postkarten-Fotografie mit einem roten UFO am Himmel. Ich geb’s auf.
Doch kein Meister von der Cloud gefallen
Mein Experiment hat mir schnell die Möglichkeiten, aber auch die Grenzen von KI als Künstler-Werkzeug aufgezeigt. Mir sind wirklich schicke Bilder gelungen, von denen einige direkt in meine Hintergrundbild-Sammlung gewandert sind. Im Detail halten viele Kreationen aber nicht stand. Mal ist ein Ohr nicht vollständig, ein Licht scheint, wo kein Licht sein sollte und auch sonst sind regelmässig kleine Artefakte zu erkennen.
Das Hauptproblem bei der Bildgenerierung ist aber die fehlende Konsistenz. Es ist mir nicht gelungen, den Zeichnungsstil konsequent weiterzutragen. Schon gar nicht, wenn es darum geht, die gleich aussehende Person mehrfach zu verwenden und eine Szene auch noch nach Wunsch zu gestalten. Zu viele Eingaben scheinen den Bildgenerator Midjourney zu überfordern.
ChatGPT kann ich dagegen kaum einen Vorwurf machen. Zwar gewinnt die geschriebene Vorlage sicher keinen Eisner Award, aber sie liefert eine brauchbare Vorlage für eine kurzweilige Comic-Geschichte.
Künstliche Intelligenz in Verbindung mit Kunst und Plagiarismus wird uns noch lange beschäftigen. Als jemand, der selber zu den Content Creators gehört, finde ich die Technologie trotz gescheitertem Versuch weiterhin enorm spannend, aber auch weiterhin besorgniserregend.
Als Kind durfte ich keine Konsolen haben. Erst mit dem 486er-Familien-PC eröffnete sich mir die magische Welt der Games. Entsprechend stark überkompensiere ich heute. Nur der Mangel an Zeit und Geld hält mich davon ab, jedes Spiel auszuprobieren, das es gibt und mein Regal mit seltenen Retro-Konsolen zu schmücken.