Lange erwartet und heiß ersehnt, hält mit dem letzten Update von Midjourney auf Version 5.2 endlich ein revolutionäres Feature Einzug in den Werkzeugkasten der generativen Text-to-Image KI: Outpainting.
Outpainting bezeichnet die Möglichkeit, Bilder mittels KI zu erweitern - sprich über die Grenzen der Bildränder hinaus weitere, passende Bildinhalte hinzuzufügen. Ein Feature, das nicht gänzlich neu ist, in Midjourney leider aber bis jetzt fehlte. In Dall-E2 und Stable Diffusion sowie seit kurzem auch Adobe‘s Photoshop Beta konnte man die Funktion schon nutzen und teils auch bewundern (mal mehr, mal weniger – wirklich beeindruckend wurde es erst in der Photoshop Beta).
Was macht diese Funktion so besonders und warum ist sie so wichtig?
Midjourney ist nach aktuellem Stand die leistungsfähigste Text-to-Image-KI, die öffentlich verfügbar ist. Es ist inzwischen nahezu unmöglich, KI generierte Fotos noch von echten Aufnahmen zu unterscheiden. Allerdings tat sich Midjourney bisher bei der Darstellung von Personen, die nicht nah und Hauptfokus der Szenerie waren, noch sehr schwer. Gesichter wurden auf dieser Art von generierten „Fotos“ teilweise fast zu Karikaturen. Der Zauber und die Begeisterung über die Möglichkeiten von Midjourney litten spürbar unter diesem Umstand der Limitierung. Folglich ging die Tendenz bei regelmäßiger Nutzung eher dazu, Nahaufnahmen von Menschen anstatt Ganzkörperportraits zu erstellen. Ob bewusst oder unbewusst, so ließ sich die Problematik jedenfalls umgehen.
Hier zeigt Outpainting in Midjourney sein Potenzial
Man kann im ersten Schritt ein perfektes Portrait erstellen. Im zweiten Schritt kann man über das Midjourney Outpainting nach und nach „Herauszoomen“ und immer mehr Umgebung zum Bild hinzufügen. Im Gegensatz zu den bis dato ungelenken Darstellungen, jetzt sogar bei beeindruckender Bildqualität. Hier hat man die Möglichkeit, die KI im Autopilot arbeiten zu lassen. Mann kann aber auch individuelle Eingaben tätigen, um das Outpainting zu steuern.
Ersteres funktioniert bereits so gut, dass es kaum notwendig ist, weitere Vorgaben zu machen. Bildstil, Color Grading und sämtliche sonstigen wichtigen optischen Faktoren werden hierbei perfekt aus dem Ursprungsbild übernommen. Wie bei Midjourney üblich, werden bei jeder Zoomstufe vier verschiedene Bilder generiert. Es gibt also eine gute Auswahlmöglichkeit, welches Ergebnis man nutzen möchte. Bei Bedarf kann man auch den ganze Prozess nochmal neu anstoßen, falls einem die Ergebnisse nicht zusagen.
Weiteres Plus: Seitenverhältnis einfach anpassen
Eine weitere interessante Möglichkeit, die das Outpainting bietet, ist die Veränderung des Seitenverhältnisses. Man kann jetzt sehr einfach und bequem Bildinhalte hinzufügen lassen und auf diese Weise z.B. aus einer Querformat-Aufnahme ein Hochformat erstellen.
Ein Wermutstropfen bleibt
Im Gegensatz zu den oben genannten, alternativen Tools der Mitbewerber, wird das Bild nicht insgesamt größer gerechnet. Midjourney baut das Bild bei jeder weiteren Zoomstufe neu auf und behält die originäre Dateigröße bei. Wenn man also drei bis vier Mal herausgezoomt hat, leidet die Auflösung der Gesichter spürbar. Die gute Nachricht: Dem kann man mit den gängigen Upscalern wie z.B. Topaz Photo AI - oder auch kostenfreien Alternativen - gut entgegenwirken.
Fazit zu Outpainting
Insgesamt ist Outpainting also ein wirklich nützliches Feature, das die Limitierungen im Einsatz von generativer Bild-KI weiter aufhebt.
Comments