4 Minuten Lesezeit
17 Dec
17Dec

In der sich stets weiterentwickelnden Welt der künstlichen Intelligenz (KI) stossen wir immer wieder auf Überraschungen – einige faszinierend, andere lehrreich. 

Ein jüngstes Erlebnis eines meiner LinkedIn-Kontakte mit Midjourney v5, einem fortschrittlichen Tool zur Generierung von Bildern mittels KI, wirft ein Licht auf die Grenzen und unerwarteten Wendungen der generativen KI.

1. Was ist Midjourney?

Für diejenigen unter Ihnen, die mit Midjourney noch nicht vertraut sind: Es handelt sich um ein Tool, das auf künstlicher Intelligenz basiert und dazu in der Lage ist, aus Textbeschreibungen Bilder zu erzeugen. 

Sie geben einfach eine Beschreibung ein – sei es ein Produkt, eine Landschaft oder sonst ein Konzept – und Midjourney zaubert ein Bild, das Ihrer Beschreibung entspricht.


1.1. Das LinkedIn-Erlebnis: Eine unerwartete Wendung

Ein faszinierendes Beispiel für die Möglichkeiten und Grenzen von Midjourney bot sich kürzlich, als ein Kontakt auf LinkedIn die KI herausfordern wollte. Sein Ziel: ein Bild einer "Shor Platinum Melting Torch", einem spezialisierten Werkzeug zur Platinverarbeitung, zu erhalten. 

Das Ergebnis war allerdings eher eine künstlerische Interpretation als eine technisch präzise Darstellung des gesuchten Werkzeugs – ein deutlicher Hinweis darauf, dass Midjourney's Fähigkeiten ihre Grenzen haben, wenn es um spezifische, technisch komplexe Anforderungen geht.

Der Prompt verwendete Prompt wurde nicht im LinkedIn-Beitrag kommuniziert. Deshalb erstellte ich einen Prompt, um das Ereignis nachvollziehen zu können.


Prompt: A photograph of an Shor Platinum Melting Torch, set in a workshop, using a 50mm lens, cool color temperature, peaceful atmosphere --v 5.0 --stylize 1000 


Shor_Platinum_Melting_Torch_Fantasie


1.2. Die Elefanten-Herausforderung: Eine Frage der Differenzierung


Ein weiteres Experiment zielte darauf ab, die Fähigkeit von Midjourney zu testen, zwischen einem afrikanischen und einem asiatischen Elefanten zu unterscheiden – eine Aufgabe, die feine biologische Unterscheidungsmerkmale erfordert. 

Die Ergebnisse illustrierten, dass Midjourney Schwierigkeiten hat, subtile Unterschiede zwischen Spezies zu erkennen, was die Grenzen der aktuellen Trainingsdaten der KI unterstreicht.

 

Der Prompt zur Ausgabe eines asiatischen Elefanten: A photograph of an Asian elephant, set in a dramatic mountain landscape, using a 50mm lens, cool color temperature, natural facial expression, gentle morning light, peaceful atmosphere --v 5.0 --stylize 1000 


asiatischer elephant



Der Prompt zur Ausgabe eines afrikanischen Elefanten: A photograph of an African elephant, set in a dramatic landscape, using a 50mm lens, cool color temperature, natural facial expression, gentle morning light, peaceful atmosphere --v 5.0 --stylize 1000


afrikanischer elephant midjourney


1.3. Die Analyse der Ergebnisse: Werkzeug und Elephanten

Die Analyse der Ergebnisse, die Midjourney v5 bei der Anfrage nach einem Bild der "Shor Platinum Melting Torch" und bei der Unterscheidung zwischen afrikanischen und asiatischen Elefanten lieferte, offenbart Einsichten in die Grenzen der generativen KI. 

Diese Beispiele illustrieren, dass Midjourney, obwohl es ein mächtiges Werkzeug für kreative Bildgenerierung ist, bestimmte Einschränkungen hat, wenn es um die Reproduktion von spezifischen, technisch komplexen Objekten und die Erkennung feiner biologischer Unterschiede geht.

Spezifische und technisch komplexe Objekte:

Die Erfahrung mit der "Shor Platinum Melting Torch" unterstreicht eine wesentliche Herausforderung in der generativen KI: die Fähigkeit, spezifische technische Details korrekt zu interpretieren und umzusetzen. 

Dieser Fall zeigt, dass Midjourney dazu neigt, eine künstlerische Interpretation anstatt einer technisch präzisen Darstellung zu liefern, wenn es mit Anfragen konfrontiert wird, die außerhalb seiner üblichen Trainingsdaten liegen. 

Solche Ergebnisse deuten darauf hin, dass die generative KI derzeit besser für Aufgaben geeignet ist, die kreative Freiheit und Interpretation erlauben, als für solche, die exakte technische Genauigkeit erfordern.

Biologische und spezies-spezifische Unterschiede:

Die Schwierigkeit von Midjourney, zwischen einem afrikanischen und einem asiatischen Elefanten zu unterscheiden, betont eine weitere Limitation: die Fähigkeit, subtile biologische und spezies-spezifische Merkmale zu erkennen und darzustellen. 

Obwohl es klare Unterscheidungsmerkmale zwischen diesen Elefantenarten gibt, wie die Ohrgrösse oder die Form des Rückens, scheint Midjourney nicht in der Lage zu sein, diese feinen Unterschiede adäquat zu verarbeiten und visuell umzusetzen. 

Dies legt nahe, dass die aktuelle Generation von KI-Modellen noch Herausforderungen in der genauen Wiedergabe von spezifischen biologischen Eigenschaften und Unterschieden zwischen eng verwandten Spezies hat.


2. Anwendungsbereiche von Midjourney

Trotz dieser Grenzen bietet Midjourney unzählige Möglichkeiten für kreative Anwendungen in Bereichen wie Grafikdesign, Kunst, Werbung und darüber hinaus. 

Von der Visualisierung einzigartiger Ideen bis hin zur Inspiration für neue Kunstwerke – die Einsatzmöglichkeiten sind so vielfältig wie die Kreativität ihrer Nutzer.


  • Grafikdesign und Illustration: Kreative Ideen visualisieren oder Inspiration für neue Kunstwerke liefern.
  • Architektur und Innenarchitektur: Entwürfe und Konzepte für Gebäude, Räume oder Möbelstücke visualisieren, die anschliessend weiterentwickelt werden.
  • Mode- und Textildesign: Muster, Stoffe und Kleidungsstücke entwerfen. 
  • Werbung und Marketing: Poster, Flyer oder Social-Media-Grafiken generieren. Auffällige und innovative Designs entwickeln, die Aufmerksamkeit erregen.
  • Film- und Videospielindustrie: Visualisierungen für Charaktere, Umgebungen und Objekte, um schneller zu konkretisieren und kreative Entscheidungen zu treffen.
  • Bildung und Forschung: Konzepte und Daten visuell darstellen, zum Beispiel für wissenschaftliche Publikationen oder um  Informationen verständlich und ansprechend zu präsentieren.
  • Persönliche Projekte und Hobby: Fotografie, Buchgestaltung, TShirt-Design, Tapeten- und Geschenkpapier-Muster, Blog-Bilder und vieles mehr.


3. Häufige Fehler und Tipps für bessere Ergebnisse

Midjourney zu meistern erfordert ein gewisses Mass an Experimentierfreudigkeit und Feingefühl in der Formulierung der Prompts.

Durch Anpassungen und Präzisierungen in den Eingabeaufforderungen können Nutzer die Ergebnisse verfeinern und den Output der KI besser auf ihre Wünsche abstimmen.


4. Ethische Überlegungen 

Die Nutzung von Midjourney und generativer KI im Allgemeinen wirft wichtige ethische Fragen auf, die von Urheberrechtsbedenken bis hin zu potenziellen Missbräuchen für die Erstellung von Fehlinformationen reichen. 

Es ist von entscheidender Bedeutung, dass wir diese Technologien verantwortungsbewusst einsetzen und dabei sowohl kreative als auch ethische Standards wahren.

Empfehlung: Verzicht auf die Nachahmung von Stilen bekannter Künstler. Die Verwendung von Stilen berühmter Künstler kann rechtliche Probleme nach sich ziehen, insbesondere wenn diese Werke urheberrechtlich geschützt sind. Es zeigt auch Respekt gegenüber den originalen Künstlern und deren Schaffenswerk, indem man vermeidet, deren Stile unerlaubt zu kopieren oder zu imitieren.


Fazit

Die Erfahrungen mit Midjourney v5 verdeutlichen die Notwendigkeit, die Fähigkeiten und Grenzen generativer KI-Systeme realistisch einzuschätzen.

Während sie beeindruckende und innovative Lösungen für kreative Herausforderungen bieten können, bleibt die Präzision in der Darstellung spezifischer Anforderungen eine Herausforderung. 

Dennoch öffnet Midjourney Türen zu neuen kreativen Ausdrucksformen und lädt dazu ein, die eigene Kreativität auf unerforschte Weise zu erkunden.

Teilen Sie Ihre Erfahrungen mit Midjourney oder ähnlichen Tools in den Kommentaren. Lassen Sie uns gemeinsam die Möglichkeiten und Grenzen dieser faszinierenden Technologien erkunden.

Hinweis: Mit Midjourney V6 ist es möglich auch asiatische Elefanten zu erstellen. Stand, 06.02.2024