KI-Tools für Bildbearbeitung – das sind die Besten

Geschätzte Lesezeit 8 Minuten

Künstliche Intelligenz ist in aller Munde, es tauchen unendlich viele Programme auf, die KI nutzen. Sich in diesem Dschungel zurechtzufinden, ist nahezu unmöglich. Denn Programme, die heute gut sind, sind morgen überholt. Programme, die gestern überholt waren, sind heute aufgrund neuer Features wieder State-of-the-Art. Eine Übersicht über unsere aktuellen Lieblings-Programme haben wir im Blogbeitrag KI Tools – die Besten für Text, Bild, Audio und Video

In diesem Beitrag erkläre ich dir, welche KI-Tools für Bildbearbeitung aktuell die besten sind. Ich stelle dir diese KI-Tools für Bildbearbeitung vor:

  • Midjourney – keine Angst vor Chatprotokollen
  • Firefly – Adobes neue Funktion
  • Generative Fill – Photoshops Power Tool
  • Dall-E - Open AIs Wunderwuzzi
  • Playground AI - Firefly Alternative?
  • Clipdrop – Midjourney goodbye?
  • Ideogram
  • Canva Text-zu-Bild

Starten wir los mit den KI-Tools für Bildbearbeitung:

Midjourney – keine Angst vor Chatprotokollen

Midjourney ist DAS go-to Tool unter den KI-Tools für Bildbearbeitung und Erstellung. Es ist einfach das Beste, ich kann es nicht eleganter formulieren. Zwei Hürden hat Midjourney: Es ist eine Funktion in Discord und es ist kostenpflichtig. Das sollte dich aber nicht davon abhalten, es zu probieren!

Discord ist eine kostenlose Kommunikationsplattform, die es Benutzern ermöglicht, miteinander über Text-, Sprach- und Videoanrufe zu kommunizieren. Ursprünglich für Gamer:innen entwickelt, hat sich Discord zu einer beliebten Plattform für alle Arten von Gruppen und Gemeinschaften entwickelt. Mit Funktionen wie Bildschirmfreigabe, Dateiübertragung und der Integration von Bots und Apps von Drittanbietern ist Discord ein Alleskönner. Darin versteckt sich auch Midjourney.

Mehr Infos rund um die Plattform Discord haben wir in diesem Artikel für dich.

Zum Datenschutz von Midjourney ist zu sagen, dass Midjourney das Recht hat, alle deine Prompts und Bildausgaben zu veröffentlichen und selbst zu nutzen oder weiterzugeben. Du besitzt die Assets, die du mit Midjourney erstellst, wenn sie in Übereinkunft mit den Nutzungsbedingungen sind.

Wie funktioniert es also? Gehen wir davon aus, dass du Midjourney schon hinzugefügt hast. Wie du ein Konto erstellst und den Midjourney Bot findest und dir alles einrichtest, kannst du hier nachlesen. Ich empfehle dir, nicht in einem öffentlichen Chat mit Midjourney zu kommunizieren, sondern in einer Direktnachricht. Das hat den Vorteil, dass du deine Prompts und die generierten Bilder besser wiederfindest, wenn du sie zu einem späteren Zeitpunkt wieder suchst.

Gib in deinem Chatfeld “/imagine” ein, dann vervollständigt Midjourney automatisch mit “Prompt” und du kannst deinen Prompt schon eingeben. Gib deinen Prompt am besten auf Englisch ein, es ist das Sicherste, um Missverständnisse zu vermeiden. 

Wir probieren es mit dem sehr allgemein formulierten Prompt: “A person standing in front of a screen with code in an office.”

Schaut schon einmal relativ gut aus, etwas dunkel für meinen Geschmack und ein bisschen zu futuristisch. Beachtet, dass eine der vier “person” eine Frau ist, dass alle Personen von hinten zu sehen sind und alle lockere Kleidung tragen. Verfeinern wir den Prompt: 

“A midaged woman with blond short hair standing in front of two samsung screens that are showing code in a sunlit office with light grey floor and white walls.”

Du siehst, das Bild hat sich deutlich verändert. Die vier Frauen sind alle mit Gesicht sichtbar, der Look and Feel ist sehr freundlich und wie gewünscht hell, die kurzen Haare wurden berücksichtigt und die Kleidung ist jetzt Business Style. Das mit den zwei Screens hat nur in einem Bild funktioniert und Code wird eigentlich nirgendwo gezeigt. 

Wir wollen jetzt noch ein 16:9 Verhältnis haben und das Bild noch etwas realer: “A midaged woman with blond short hair standing in front of two samsung screens that are showing code in a sunlit office with light grey floor and white walls. She is looking at the screens away from the photographer. She is wearing a blue T-Shirt and Jeans. –aspect 16:9 –style raw” 

Du kannst dich mit deinem Prompt spielen, man kann mit bestimmten Parametern seinen Prompt verfeinern. Eine Anleitung, wie das geht, gibt es von Midjourney selbst. Und du kannst verschiedene Stile, wie etwa National Geographic oder Pixar ausprobieren.

Hast du einen Prompt gefunden, der dir ein zufriedenstellendes Ergebnis liefert, kannst du ihn noch weiter verfeinern, indem du dir mit Klick auf zum Beispiel “V1” Versionen davon ausgeben lassen kannst. Wenn dir keines der vier neuen Ergebnisse gefallen sollte, klicke einfach auf den Refresh Button und du bekommst vier neue Bilder ausgespuckt.

Hast du ein dein Bild gefunden, klicke auf zum Beispiel “U2” (steht für “upscale”) für das zweite Bild und du kannst an dem Bild weitere Anpassungen vornehmen, wenn du das möchtest. Du hast die Möglichkeit Midjourney eine Variation machen zu lassen, oder du gibst gewisse Regionen vor, die du angepasst haben möchtest. Du kannst hinein oder herauszoomen oder den Bildausschnitt verschieben.

Das ist mein auserwähltes Bild:

Ich habe dir jetzt die Basisfunktionen von Midjourney gezeigt. Was das Programm noch alles kann, darfst du selbst testen. Ich wünsche dir viel Spaß dabei.

Firefly – Adobes neue Funktion

Für alle supernerdy Nerds, nein es geht nicht um Joss Whedon’s einmalig coole Miniserie Firefly, sondern um Photoshops neue KI Funktion. Was sie kann? So allerhand. Text zu Bild zum Beispiel, aber vor allem, Bilder anpassen und verändern. Es gibt die online Version Firefly, die man nutzen kann, wenn man den Nutzungsbedingungen zustimmt.

Wir nehmen wieder unseren Prompt und schauen, was Firefly daraus macht.

Die Ergebnisse sind nicht berauschend, muss man ehrlicherweise sagen, eigentlich unbrauchbar. Aber Firefly ist gut in etwas anderem: es heißt “generative fill”

Sagen wir, ich möchte in meinem Bild etwas entfernen. Ich markiere den Bereich und klicke in Firefly auf “entfernen” und schwups, ist es passiert. Man kann zwischen mehreren Ergebnissen auswählen, oder neue generieren lassen, solange, bis man mit dem Ergebnis zufrieden ist.

Ich versuche nun den Bildschirm durch Blumen zu ersetzen. Auch hier habe ich mehrere Auswahlmöglichkeiten. Ich entscheide mich dafür:

Generative Fill – Photoshops Power Tool

Adobe hat die “generative fill” Funktion auch in sein Produkt Photoshop integriert. Ich habe subjektiv den Eindruck, dass das in Photoshop besser funktioniert, als in der Online-Version Firefly. 

Du kannst eine Fläche in deinem Bild markieren, dazu hast du unterschiedliche Möglichkeiten, wie das Lasso-Werkzeug, das Auswahl-Rechteck oder das Objektauswahlwerkzeug. Automatisch öffnet sich daraufhin in der Photoshop 24 Version ein kleines Fenster mit einem Promptfeld, in dem du dein gewünschtes Kommando eingeben kannst.

And then let Photoshop do the magic. Voilà, wir haben einen Blumenstrauß und ein Bücherregal in das Bild eingefügt. 

Mir ist übrigens aufgefallen, dass bei der linken Hand der Frau ein Fehler ist und der kleine Finger abgeschnitten ist. Hände sind der Pferdefuß aller KI generierten Bilder. Midjourney schafft das eigentlich recht gut, vor allem im Verhältnis zu den anderen Tools. Aber trotzdem: Aufgepasst auf die Hände!

Datenschutzrechtlich verhält es sich übrigens so: Die Nutzungsrichtlinien regeln die Nutzung von Adobes generativen KI-Funktionen und betonen die Qualität der generierten Inhalte sowie die Einhaltung ethischer Standards. Sie verbieten kommerzielle Nutzung während der Beta-Phase, das Trainieren von KI-Modellen und das Erstellen von missbräuchlichen oder rechtswidrigen Inhalten. Respekt gegenüber Dritten, Authentizität und Urhebernachweise sind ebenfalls wichtig, und Verstöße können Kontosuspendierungen zur Folge haben. Weitere Informationen finden sich im Adobe-Vertrag.

Adobes generative KI ist inzwischen übrigens für die kommerzielle Nutzung freigegeben. Yey!

Der Generative Fill in Photoshop kann noch so allerhand mehr, das war nur ein kleiner Vorgeschmack. Probiere es einfach selbst.

Dall-E - Open AIs Wunderwuzzi

Dall-E aus dem Hause Open AI, ist ChatGPTs integrierte generative KI, die als großer Player Midjourney Konkurrenz machen möchte. Schauen wir einmal, wie Dall-E mit unserem Prompt umgeht: 

"A raw photograph of a midaged woman with blond short hair standing in front of two Samsung screens that are showing code, in a sunlit office with light grey floor and white walls. She is looking at the screens away from the photographer, wearing a blue T-Shirt and Jeans. Bright sunlight streams through large windows, casting soft shadows. Captured using a high-resolution camera, shallow depth of field, natural light, realistic color grading, hdr quality, natural look --ar 16:9 --v 6.0"

Im direkten Vergleich mit Midjourney fällt mir auf, dass das Ergebnis von Dall-E sehr stark stilisiert ist, fast comicartig. Die Befehle aus dem Prompt werden bis auf den "natural look" alle gut umgesetzt und trotzdem "fehlt" dem Bild das realistische Detail. Das kann Midjourney mittlerweile bedeutend besser. Angenehm bei Dall-E ist zweifelsohne die Tatsache, dass es direkt in ChatGPT genutzt werden kann, im Vergleich zu Midjourney, für das man sich in Discord reinfuchsen muss, also wesentlich nutzerfreundlicher ist.

Nutzungsbedingungen sind ähnlich allen anderen Tools: Nutzer:innen besitzen die Rechte an den Bildern, die sie mit Dall-E erstellen, einschließlich der Rechte zur Reproduktion, zum Verkauf und zur Vermarktung, unabhängig davon, ob die Bilder mit kostenlosen oder bezahlten Credits generiert wurden.  Hier geht's zu den EU Nutzungsbedingungen von OpenAI: https://openai.com/de-DE/policies/eu-terms-of-use

Du merkst schon, ich bin nicht überzeugt von Dall-Es Genialität. Wenn man sich einmal mit Discord angefreundet hat und mit der Art des Promptings bei Midjourney, gibt es eigentlich keinen Grund, nicht bei dem meiner Meinung nach besten generativen KI-Tool zu bleiben. Aber es gibt noch mehr Tools, die ganz vorne mit dabei sein wollen, die schauen wir uns jetzt auch noch an.

Playground AI – Firefly Alternative?

Playground AI, ein neues Tool unter den KI-Tools für Bildbearbeitung, rühmt sich, DIE Alternative zu Firefly zu sein. Kann es meinen Test bestehen?

Ich verwende unseren Prompt: “A midaged woman with blond short hair standing in front of two samsung screens that are showing code in a sunlit office with light grey floor and white walls. She is looking at the screens away from the photographer. She is wearing a blue T-Shirt and Jeans. –aspect 16:9 –style raw”

Mal sehen, was Playground AI daraus macht?

Erklär mir mal eine:r, warum bei den ersten Versuchen drei Menschen in den generierten Bildern sind. Ich habe anschließend versucht, den Prompt anzupassen, mit Erfolg. 

Nun kann Playground AI aber noch mehr. Ähnlich wie mit dem “generative fill” kann es Gegenstände ersetzen, hinzufügen, entfernen. Ich habe dazu das vorherige Bild von Playground als Basis genommen. Let’s see:

Ok. Das ist für mich Kategorie creepy und fail. Dieses Feature kann mich nicht überzeugen, lasse mich aber gerne eines Besseren belehren. Wenn du also gute Erfahrungen damit gemacht hast, gib mir Bescheid!

Die Nutzungsbedingungen bergen keine großen Überraschungen. Datenschutzrechtlich verhält es sich bei Playground AI so: Du musst alle Rechte an den von dir bereitgestellten Inhalten besitzen. Die Dienste können öffentlich einsehbare Inhalte ermöglichen. Playground AI kann die Dienste nach eigenem Ermessen ändern und dein Zugriff kann eingeschränkt oder beendet werden. Es gelten Haftungsbeschränkungen und Schiedsklauseln. Beachte die Datenschutzbestimmungen und das Mindestalter von 13 Jahren. Mehr dazu erfährst du hier: https:// https://playground.com/terms

Clipdrop — Midjourney goodbye?

Clipdrop gilt als ernst zu nehmende Alternative zu Midjourney unter den KI-Tools für Bilderstellung. Gratis Login, es kann Text zu Bild erstellen, und Gegenstände entfernen. Man kann das Bild neu belichten, den Hintergrund in der Pro-Version ersetzen, das Bild neu interpretieren lassen und einiges mehr. Es verspricht seinen Features nach sehr umfangreiche Anpassungen an Bildern vornehmen zu können.

Ich habe mir ausreichend Zeit genommen, alle Features zu testen. Dafür habe ich mein Referenzbild von Midjourney hochgeladen und anschließend mit Clipdrop adaptiert. Zusammenfassend kann ich sagen, ich war nicht beeindruckt von den Ergebnissen, einige waren ganz passabel, aber es gab nichts, was nicht Photoshop besser könnte. Insofern ist es sicherlich weder eine Alternative zu Midjourney, noch zu Photoshop.

Was meinst du dazu? Überzeugt dich Clipdrop?

Was es da draußen noch so gibt

KI-Tools für Bildbearbeitung gibt es in Hülle und Fülle. Herausstreichen möchte ich noch Ideogram, super zum Texte stilisieren und Canva Text zu Bild, was praktisch ist, wenn du Designs erstellst und die Plattform nicht wechseln musst. 

Klar ist, ich habe mich an einem besonders schwierigen Prompt gesucht, Menschen sind eine große Herausforderung für die KI. Wenn du etwas verwendest wie: “generate a frog on a leaf that is swimming on the water”, erhältst du auf allen Plattformen wesentlich bessere Ergebnisse. 

Fazit: jedes Tool hat seine Stärken und Schwächen. Je nachdem, wofür du es verwenden möchtest, funktioniert es besser oder schlechter. Meine Empfehlung sind ganz klar Midjourney und Photoshop. Es sind aber beides kostenpflichtige Tools. Daher: probiere ruhig gratis Tools aus, wenn du mit den Nutzungsbedingungen einverstanden bist. Aber beachte: wenn du eigene Bilder auf AI Plattformen hochlädst, werden sie in den meisten Fällen für das Trainieren der KI benutzt und zur öffentlichen Nutzung freigegeben. 

Ich wünsche dir viel Spaß beim Selbertesten. Und wenn wir vom datenwerk diesbezüglich etwas für dich tun können, melde dich!

Elisabeth Pausz
Elisabeth Pausz

Wer wissen will, wie man seine Botschaft so rüberbringt, dass sie nicht falsch verstanden wird, ist bei Elisabeth richtig. Die gelernte Kommunikationsmanagerin und KI-Expertin stapft gerne in den Schuhen ihrer Kund:innen, um deren Bedürfnisse besser zu verstehen und zu übersetzen, welche Antworten auf welche Probleme gefunden werden müssen.