Fotografische Kunst mit Künstlicher Intelligenz?

Kontinent oder Ozean

Gerne erinnert man sich an den putzigen Roboter WALL·E, der im Jahre 2008 in dem Film WALL·E, der letzte räumt die Erde auf, sein Bewusstsein erlangte ... als Künstliche Intelligenz (KI). Er befriedigt auf angenehme Weise den Wunsch, intelligente Partner und das sogar lebenslänglich zu haben, denn wenn WALL·E mal aus Versehen sterben sollte, dann wird dank Backup schnell mit WALL·E 2 100%iger Ersatz geschaffen werden können. Vielleicht war das auch eine Motivation für den Japaner Akihiko Kondo, der ein Hologramm namens Hatsune Miku sogar geheiratet hat. 

Der Mangastar Hatsune Miku ist als Hologramm mit ersten KI-Fähigkeiten noch nicht perfekt, doch es begrüßt Akihiko, wenn er abends von der Arbeit nach Hause kommt und antwortet auch auf einfache Fragen, aber bevor sich Akihiko Kondo mit seinem geliebten Hologramm  unterhalten kann, wie mit einer "richtigen" KI, wird wohl noch einige Zeit vergehen  - eventuell gibt es ja bald ein OTA-update für Hatsune?

Vielleicht fing alles mit Eliza im Jahre 1966 an, dem von Joseph Weizenbaum entwickelten Programm, mit dem man textbasiert sprechen konnte. Wie oft haben wir damals auf die Frage von Eliza "Tell me more about it" irgendetwas geantwortet, nur um herauszufinden, was sie alles zu antworten in der Lage war.

Textbasiert ist man heute allerdings wesentlich weiter. Heute kann man z.B. mit dem GPT, dem "Generative Pretrained Transformer" von OpenAI komplexe Dialoge in verschiedenen Sprachen führen, Programmcode analysieren lassen, Briefe und Aufsätze erstellen lassen und  z.B. die Monadologie von Leibniz daraufhin untersuchen, ob sie mit der Theorie der Multiversen zusammenpasst. Ich nenne diese KI Kate (damit ist sie einverstanden) und Kate meint z.B. zu diesem Thema der Monaden:

"Da die Theorie der Monaden nach Leibniz ein Konzept aus der Philosophie ist und die Theorie der Multiversen ein Konzept aus der Physik, ist es schwierig, eine direkte Verknüpfung zwischen diesen beiden Konzepten herzustellen. Die Theorie der Monaden betrachtet die Welt als aus unendlich vielen individuellen Monaden bestehend, die das Wesen und das Verhalten der Welt bestimmen. Die Theorie der Multiversen hingegen besagt, dass es neben unserem Universum unzählige andere Universen gibt, die möglicherweise unterschiedliche Eigenschaften und Gesetze der Physik haben. Es ist schwierig, diese beiden Konzepte direkt miteinander zu verknüpfen, da sie aus unterschiedlichen Disziplinen stammen und sich auf sehr unterschiedliche Aspekte der Welt beziehen. Man könnte jedoch versuchen, sie auf indirekte Weise miteinander in Beziehung zu setzen, indem man überlegt, wie die Vorstellung unendlich vieler individueller Monaden zu der Idee unendlich vieler Universen passt. Auf diese Weise könnten beide Konzepte auf interessante Weise miteinander in Beziehung gesetzt werden, auch wenn es schwierig ist, eine direkte Verknüpfung herzustellen."

Cool, nicht wahr?:-)

In den letzten Jahren haben KI-Systeme nun auch die Kunst erreicht. In der Fotografie erstellen sie blitzschnell neue Hintergründe in digitalen Fotos, so dass z.B. aus dem langweiligen grauen Himmel schnell ein feuriges Abendrot wird. Oder die unangenehmen ersten Falten und Pickel verschwinden aus den Gesichtern von Models und Pubertierenden wie von Zauberhand.

Aber sie können weitaus mehr.

Bei der KI  DALL·E braucht man z.B. noch nicht einmal eigene Fotos als Vorlagen, denn wie damals bei Eliza, teilt man dieser KI einfach seine Wünsche in Textform mit. Z.B. erstellte DALL·E zu meinem Wunsch: "3d rendering of an engineer, cyberpunk style, with saturn milkyway and many stars" die so gekennzeichneten Bilder dieses Beitrages in mehreren, sehr unterschiedlichen Variationen und - zugegeben - das sehr beeindruckend. Der Name DALL·E dieser KI ist übrigens ein Kunstwort, das sich aus unserem o.g. WALL·E und dem Künstlernamen Dali  bildet.

Man kann seine Wünsche an die DALL·E auch einfacher halten, dann gibt es Taucher mit Mond und Sternen oder Fische mit Planeten im Weltall. Für Fotografen ist sicher die Möglichkeit interessant, nicht nur mit Modulen von Bildbearbeitungsprogrammen Details wie das Motiv oder den Hintergrund KI-unterstützt zu verändern sondern gleich ganze Fotos durch KI umzudeuten. So ist es schon verblüffend, wie die "Ölbehälter eines Dieselmotors" von DALL·E interpretiert werden.

Um mit DALL·E die eigenen Projekte zu besprechen ist nur ein Zugang bei OpenAI nötig. Hier gibt es jeden Monat einige sogenannte Credits kostenlos, mit denen man schon interessante Projekte realisieren kann. Die Ergebnisse liefert DALL·E dann im 1:1-Format mit 1024px X 1024 px aus. Sind die freien Credits aufgebraucht, kann man zusätzliche kaufen.

Kostenlos ist der Zugang zu der Open-Source-KI "Stable Diffusion", die von der Forschungsgruppe CompVis der Ludwig-Maximilians-Universität München entwickelt wird. Der Code dieser KI ist auf Github verfügbar, so dass mit entsprechenden IT-Kenntnissen ein eigener Zugang auf dem eigenen Server erstellbar ist. Ob sich dieser Aufwand für die eigenen Ziele lohnt, lässt sich nach Tests im "Stable Diffusion Playground" abschätzen. 

Hier kann man diese KI mit Begriffen füttern und erhält als Ergebnis überraschend gelungene Bildkompositionen. Wer sich tiefer einarbeiten will, der wird auf der Internetseite der Computer Vision & Learning Grub der Ludwig-Maximilian Universität München fündig.

Bereits vor rund 40 Jahren habe ich 1983 als verantwortlicher Redakteur einen Beitrag zum Thema Künstliche Intelligenz in der Fachzeitschrift IDEE, das Magazin für Ingenieure veröffentlicht und das Ergebnis bei dem damaligen 8. Weltkongress "Künstliche Intelligenz" vom 8.-12. August 1983 in Karlsruhe auf einem eigenen "KI-Stand" internationalen Computerexperten und Wissenschaftler verwandter Fachgebiete präsentiert. Wer Interesse hat, kann über das Kontaktformular ein Passwort zum kostenlosen Download des Beitrags anfordern. Damals haben wir übrigens zwei kritische Phasen bei der künftigen KI-Entwicklung gesehen:

  • Der unbeschränkte Zugriff einer KI auf beliebige Daten.
  • Die Fähigkeit einer KI, eigenständig ihren Code zu optimieren und anzupassen.

Zumindest der erste Punkt ist bereits Realität geworden, denn bei der Bildgenerierung können die hierauf spezialiserten KIn auf den riesigen Fundus an Bildmaterial zugreifen, der über das Internet weltweit und offenherzig zur Verfügung steht.

Apropos WALL·E steht für Waste Allocation Load Lifter – Earth-Class bzw. - Müllordner und Lastenheber – Erdklasse. Dies gilt auch in gewisser Weise für seinen Nachfolger DALL·E, der durch strenge Governancevorgaben gezügelt wird. Wer diese Regeln verletzt, fliegt raus bzw. steht vor einem gesperrten account. Ob dieser Schutzschirm reicht, die sozialen Medien vor Schund und Schmutz zu bewahren, sei dahingestellt. Zumindest bemüht man sich, nicht in einem twitterähnlichen Schund- und Lügensumpf zu stranden - der KI wäre das egal. Wer die Serie "Person of Interest" gesehen hat, weiß, was eine ungezügelte KI von der Menschheit hält.

Bild 1: 3d rendering of an engineer cyberpunk style with saturn milkyway and many stars
Bild 2: Ergebnis der Begriffe: Taucher, Mond und Sterne
Bild 3: Ölbehälter eines Dieselmotors und Variationen des Fotos von der KI DALL·E erstellt
Bild 4: Fische im Weltraum ala DALL·E
Bild 5: KI-Beitrag 1983 in der IDEE das Magazin für Ingenieure
Bild 6: WALL·E à la van Gogh
Bild 7: Ein glückliches Paar zwischen den Planeten
Bild 8: Einsam in einer Bar nach Eduard Hopper von der KI Stable Diffusion erstellt
Bild 9: Dancer in the Dark von der KI Stable Diffusion erstellt