Midjourney v5 ist da! Hierbei handelt es sich um die neueste Version des beliebten Text-zu-Bild-Generators, der für seine realistischen Kreationen bekannt ist.

Nachdem das neueste Update am Mittwoch an die zahlenden Kunden von Midjourney ausgeliefert wurde, haben viele von ihnen, darunter die Grafikdesignerin Julie Wieland, damit begonnen, ihre neuen KI-generierten Kunstwerke bzw. die Ergebnisse von Midjourney v5 zu teilen. Zu den KI-Details, die das Sprachmodell v5 mit sich bringt, gehören verbesserte “Effizienz, Kohärenz und Qualität”, so Midjourney auf seiner Website.

Midjourney v5

Viele Benutzer haben vor allem die Verbesserungen bei den Details der menschlichen Hand bemerkt, bei der es nun viel wahrscheinlicher ist, dass die generierten Körperteile die korrekten fünf Finger pro Hand haben. In früheren Modellen von Midjourney wurden menschliche Hände oft mit einer falschen Anzahl von Fingern generiert. Diejenigen, die in den letzten Tagen die Gelegenheit hatten, Midjourney v5 zu testen, waren von den visuellen Verbesserungen beeindruckt.

“Die neueste Version von Midjourney ist sowohl extrem überwältigend als auch faszinierend. Die Fähigkeit, komplexe Details und Texturen wie realistische Haut-/Gesichtstexturen und Beleuchtung zu reproduzieren, ist unübertroffen und jetzt noch besser.”, sagte Wieland

Obwohl Midjourney ein einzigartiges Sprachmodell ist, funktioniert es ähnlich wie andere Text-zu-Bild-Generatoren wie Stable Diffusion und DALL-E, indem es wörtliche Prompt-Deskriptoren verwendet, um Bilder zu erzeugen.

Mit dem Update auf v5 ist die anhaltende Debatte um die Legalität und ethische Vertretbarkeit von KI-generierter Kunst erneut aufgeflammt. Denn Experten und auch Midjourney-Nutzer sind der Meinung, dass es mit nur wenigen weiteren Upgrades nicht mehr möglich sein wird, von Midjourney generierte Kunst von echter Kunst oder Fotografie zu unterscheiden. Trotzdem sehen Profis wie Wieland in Midjourney nur eine Ergänzung und keinen Ersatz für Fotografen.

Aber auch das neue Midjourney v5 ist nicht frei von Schwächen und Fehlern. Im Netz kursiert eine faszinierende Aufnahme von jungen Frauen im Streetstyle der 60er Jahre, die Nick St. Pierre generiert hat und die an ein Outdoor-Fashion-Shooting erinnert. Doch bei genauerem Hinsehen erkennt man auch hier die schwebenden Hände, die nicht mit dem Körper verbunden sind, und die entstellten Gesichter im Hintergrund.

 

David Holz, Gründer von Midjourney, empfiehlt für Version v5 übrigens die Verwendung von “längeren, expliziteren Texten”, um bessere Ergebnisse zu erzielen. Je kürzer die Prompts, desto ungenauer und fehlerbehafteter sind die Ergebnisse. Die Entwicklung im Bereich der künstlichen Intelligenz schreitet stetig voran, Fehler werden ausgemerzt und Systemprobleme behoben. Dennoch wird es wohl noch lange dauern, bis eine KI-Grafik den Ansprüchen eines menschlichen Profis gerecht werden kann.