Foodfotografie mit Midjourney

Foodfotografie mit Midjourney

Mittels generativer KI lassen sich mittlerweile Text, Bilder, Musik und Videos erzeugen. Der Burda-Verlag hat vorgemacht, wie sich mittels ChatGPT und Midjourney sogar Magazine gestalten lassen. Die 99-Pasta-Rezepte gingen bereits skandalös durchs Netz und hat Redakteure und Foodfotografen schon um ihre Jobs bangen lassen.

In diesem Beitrag liefere ich Dir eine kleine Anleitung, wie Du Midjourney selbst kreativ für KI-Foodfotografie nutzen könnt. Bereits in meinem vorherigen Beitrag Fake Food Fotos: Food-Fotografie mit künstlicher Intelligenz (KI) habe ich einen Überblick über verschiedene Techniken und Tools gegeben, die Food Stylisten helfen können. Dieser Beitrag konzentriert sich im Detail auf Midjourney.

Bevor es losgeht: Was ist Midjourney?

Midjourney ist ein KI-Bildgenerator. Also, eine künstliche Intelligenz, die Bilder generieren kann. Die Benutzung des Tools ist kostenpflichtig. Es gibt jedoch ein Probekontingent (reicht für ca. 20 Bilder).

Zur Benutzung benötigt man außerdem das Chatprogramm Discord (und einen entsprechenden Account). Damit kann man mit Midjourney chatten, d. h. der KI Kommandos zu Erstellung von Bildern erteilen.

Mach Dich mit dem Quick Start Guide von Midjourney vertraut. Du solltest bereits über einen Discord Account verfügen und schon erste Erfahrung mit dem imagine-Kommando von Midjourney gesammelt haben, bevor Du dem Tutorial im Anschluss folgst.

Prompt-Baukasten für Foodfotografie mit Midjourney

Ich baue meine Prompts für Essen mit Midjourney nach einem recht einfachen Schema.

/imagine food photograph of <mein Gericht>, <eine Reihe von Schlüsselwörtern>, <zusätzliche Optionen für Midjourney> 

Beispiel:

/imagine food photograph of italian penne all'arrabbiata, top-down shot --ar 16:9, --v 5

Hier weise ich Midjourney an, mit ein Food-Foto von Penne all’arrabbiata anzufertigen, und zwar top-down von oben. Zudem soll das Bild im 16:9 Format (Breitbild) ausgegeben werden und mit der fünften Version der Midjourney-Engine erzeugt werden.

Du kannst Midjourney auch mit Fließtext prompten. Es gibt sogar ein Plugin für ChatGPT Plus (die kostenpflichtige Variante). Dieses Plugin namens Photorealistic spuckt in Windeseile ziemlich viel Text aus. Bisher haben mich die Ergebnisse nicht so sehr überzeugt.

/imagine Picture a plate of Penne all'arrabbiata, a traditional Italian pasta dish. The pasta is cooked to perfection, coated in a spicy tomato sauce with a generous sprinkling of freshly grated Parmesan cheese. A sprig of fresh basil rests on top, adding a pop of green to the vibrant red of the sauce. The dish is served on a rustic wooden table, with a glass of red wine and a loaf of crusty Italian bread in the background. The lighting is warm and inviting, casting soft shadows and highlighting the steam rising from the hot pasta. The colors are rich and appetizing, with the red of the sauce, the white of the pasta, and the green of the basil creating a beautiful contrast. The shot is taken from a high angle, using a Canon EOS 5D Mark IV DSLR camera with an EF 50mm f/1.8 STM lens. The resolution is 30.4 megapixels, with an ISO sensitivity of 32,000 and a shutter speed of 8000 second. The style is raw and authentic, capturing the essence of Italian cuisine in all its glory. --ar 16:9 --v 5.1 --style raw --q 2 --s 750

Tiefenschärfe

Tiefenschärfe bezieht sich auf den Bereich in einem Bild oder Video, der scharf und deutlich fokussiert ist. Die Wahl der Tiefenschärfe kann dazu dienen, den Fokus auf ein bestimmtes Motiv zu lenken, indem der Hintergrund unscharf gehalten wird:

  • bokeh
  • depth of field, DOF,
  • tilt blur, tilt shift

Kameraposition

Verschiedene Kamerapositionen können verwendet werden, um unterschiedliche Perspektiven und visuelle Effekte zu erzeugen:

  • low-angle, dutch angle / tilt, front
  • top-down, top-angle shot, high angle shot, overhead shot
  • close-up
  • total shot
  • macro lens
  • product shot
  • pull back shot, long shot,
  • telephoto

Keywords

Verwende verschiedene beliebte Schlüsselwörter, die Bilder von Essen beschreiben:

  • savory
  • indulgent
  • mouth-watering
  • delicious
  • stunning
  • gourmet
  • michelin gourmet food photograph
  • professional
  • food photograph
  • editorial food photograph
  • cinematic
  • captivating
  • exiting
  • intricate details
  • highly detailed
  • vivid

Arrangement

Beschreibe, wie die Gerichte, Props (Zeug außenrum … Servietten, Gabeln etc.) und Zutaten angeordnet sein sollen, z. B. als line-up in einer Reihe:

  • knolling, flatlay (recht winkliges Arrangement)
  • Line-up
  • two shot
  • three shot
  • action shot

Licht

Folgende Schlüsselwörter können einen Einfluss auf die Lichtstimmung in eurem Bild haben:

  • bright
  • ascent lighting
  • dark
  • dim lighting
  • backlight
  • soft lighting, diffused light
  • dramatic light
  • daylight, natural light
  • warm light
  • high key, bright
  • low key, dark

Farbe

Color Grading ist ein Prozess der Anpassung und Manipulation der Farbgebung in einem Video oder einer Bildsequenz, um eine bestimmte Stimmung, Atmosphäre oder ästhetische Wirkung zu erzeugen.

  • natural
  • cool
  • warm
  • vintage
  • high contrast
  • desaturated

Qualität

Mit folgenden Schlüsselwörtern lässt sich eine bessere Bildqualität erreichen.

  • 4K, 8K
  • high resolution
  • photorealistic
  • super resolution
  • octane render

Hands-On Beispiele

Lasst uns Penne all’arrabiata mal mit Midjourney in Szene setzen. Midjourney liefert standardmäßig immer einen Vorschlag von vier Bildern. Sofern mir ein Bild gefällt, kann ich es in einem weiteren Schritt hoch-skalieren oder Varianten erzeugen. Ich habe zur Einfachheit für das Tutorial alle vier initialen Vorschläge angehängt, aber keine hoch-gerechnete Variante erzeugen lassen.

Starten wir mit Penne all’arrabbiata von oben:

/imagine food photograph of italian penne all'arrabbiata, top-down shot

Lasst uns nun mal die Kamera-Perspektive und die Farbanpassung etwas modifizieren. Gehen wir in den Low-Angle und verpassen dem Bild eine etwas de-saturierte bzw. ausgeblichene Vintage-Optik.

/imagine food photograph of italian penne all'arrabbiata , low-angle shot, vintage color grading, desaturated, cinematic

Gehen wir jetzt mit der Kamera etwas näher ran und lasst uns mehr Details zeigen. Das erreichen wir mit den Schlüsselwörtern macro lens und close-up. Außerdem wollen wir einen schönen Bokeh-Effekt, d.h. einen unscharfen Hintergrund.

/imagine professional food photograph of italian penne all'arrabbiata, macro lens, close-up, bokeh, depth of field, tilt blur, intricate details, highly detailed, super resolution, vivid, stunning, 8k

Gehen wir wieder etwas weiter weg mit der Kamera und zeigen etwas mehr von der Umgebung. Lasst uns das Licht auch etwas abkühlen.

/imagine food photograph of italian penne all'arrabbiata on a table next to the window in an old kitchen, tele shot, pull back shot, long shot, super resolution, cool color grading, cinematic

Bringen wir jetzt etwas Action auf den Teller. Bei Action-Shots wird z. B. etwas Sauce auf von oben das Gericht gegossen oder mit dem Löffel oder einer Gabel eine Portion entnommen.

/imagine food photograph of italian penne all'arrabbiata, action shot, product shot, cinematic, dramatic lighting, vivid, colorful, captivating, exiting, indulgent, mouth-watering, super resolution

Schauen wir uns das Spiel mit dem Arrangement etwas genauer an. Nehmen wir also italienischen Käse als Protagonisten.

Lasst uns zunächst ein frontales Line-up verschiedener Käsesorten erzeugen.

/imagine professional food photograph showing a line-up of different italian cheese variations side-by-side, mozzarella, parmiggiano, bel paese, grana padano, fontina

Danach wollen wir uns mal ein sogenanntes Knolling bzw. Flatlay erzeugen lassen.

/imagine professional food photograph showing a knolling, flatlay of different italian cheese variations, mozzarella, parmiggiano, bel paese, grana padano, fontina

Grenzen / Limitations

Midjourney funktioniert perfekt mit „weltweit“ bekannten Gerichten, für die im Trainingsdatensatz garantiert viele Beispiele vorhanden waren. Solche Gerichte sind z. B.:

  • Hamburger
  • Steaks
  • Pasta
  • Sushi

Je individueller Dein Motiv, umso schlechter wird vermutlich das Ergebnis sein. Und umgekehrt: Je bekannter und geläufiger das Motiv, desto bessere Ergebnisse wirst Du erwarten können.

Wie geht es weiter? Schafft KI die traditionelle Foodfotografie ab?

Ich glaube nicht, dass künstliche Intelligenz gute Autoren und Foodfotografen in jüngerer Zukunft abschaffen wird. Vielmehr ist künstliche Intelligenz ein Werkzeug, das, richtig eingesetzt, kreative Prozesse unterstützen und viel Zeit sparen kann.

Ich finde die Ergebnisse durchaus beeindruckend, würde aber eher Abstand davon nehmen, die Bilder für Rezepte zu verwenden. Zur Illustration bzw. als Begleitung von informativen Beiträgen, z. B. „Tipps für die beste Pasta“ oder „Tipps für das perfekte Steak“ ohne konkrete Rezepte, sind die Bilder meines Erachtens durchaus geeignet. Rezept-Bilder schaffen dagegen aber eine gewisse Erwartungshaltung, die schnell zur Enttäuschung wird, je mehr das Resultat beim Nachkochen vom Idealbild abweicht.

Bei genauem Hinsehen fällt außerdem noch recht leicht auf, dass die generierten Bilder nicht ganz echt sind. Verwendet man die Bilder allerdings als Thumbnails (kleine Größe), so fällt dieser Umstand nicht so sehr auf. Zur Illustration und Auflockerung im Fließtext sind die KI-generierten Bilder also enorm hilfreich.

Mehr informative Beiträge über KI und Kochen

In Kochen mit KI: Wie ChatGPT das Foodbloggen verändert! tauche ich in die aufregende Welt der künstlichen Intelligenz ein und wie sie das Foodblogging revolutionieren könnte. Ich erkläre, was ChatGPT ist und wie es die Art und Weise, wie wir Foodblogger Rezepte erstellen und mit anderen teilen, verändern kann. Von der Generierung personalisierter Rezepte über die Planung von Bloginhalten bis hin zur Verbesserung von Rezepten – die Möglichkeiten sind endlos.

In Smarter essen! Mit dem Chatbot zum ausgewogenen Speiseplan zeige ich, wie man künstliche Intelligenz, insbesondere Chatbots wie ChatGPT, nutzen kann, um einen personalisierten und ausgewogenen Speiseplan zu erstellen. Ich führe durch den Prozess, wie man durch gezielte Anweisungen, sogenannte Prompts, den Chatbot dazu bringt, einen Speiseplan zu erstellen, der auf individuelle Vorlieben und Bedürfnisse zugeschnitten ist. Dabei gehe ich auf die Herausforderungen ein, die bei der Erstellung eines solchen Plans auftreten können, und zeige, wie man durch Feedback und Anpassungen ein zufriedenstellendes Ergebnis erzielen kann.

In KI meets Kulinarik: Produktivitäts-Booster für Foodblogger und Kochbuchautoren zeige ich, wie KI bei der Umformatierung, Umformulierung und dem Tagging von Artikeln für Social Media hilft und als Inspirationsquelle für neue Artikel oder Erweiterungen dient. Ich gebe einige praktische Beispiele und Tipps, wie Autoren ChatGPT für verschiedene Aufgaben und Automatisierungen einsetzen können.

Auch andere Blogs befassen sich ebenfalls mit dem Thema:

  • Oliver Wagner von Kochfreunde stellt Midjourney und ChatGPT eher aus Sicht der Gourmetküche auf die Probe
  • Denise von Foodlovin stellt sich ebenfalls der Frage, ob Midjourney oder Dall-E die Food-Fotografie ersetzen wird
  • SHOOTLAB stellt die Ergebnisse einiger Experimente für Food-Fotografie mittels Midjourney zur Verfügung. Wirklich beeindruckend!
  • ai.plainenglish.io liefert auch ein paar Beispiele, wie man Midjourney mit Food Prompts befüttern kann. Die Autorin schlägt ebenfalls ein einfaches Pattern vor, dem man folgen kann, um Bilder zu erzeugen. Es gibt sogar eine nützliche Prompt-Datenbank für allerlei andere Aufgaben.


4 Gedanken zu “Foodfotografie mit Midjourney”

  • Hallo, ich verstehe noch nicht wie ich dort ein Foto speichern kann. es entstehen ja immer 4 als Collage 😳 kannst du mir da helfen?

    • Hi Kristin,

      danke für deine Frage! Klar helfe ich dir!

      Gefällt dir eines der vier Bilder aus der Collage, so musst du es erst hochskalieren (upscale).
      Dafür stehen dir die nummerierten Buttons U1, U2, U3 und U4 zur Verfügung. U1 ist link-oben, U2 ist rechts oben, usw.
      Die Buttons V1 bis V4 verwendest du, um eine Variation des Bildes zu erzeugen. Dann erhältst du wieder vier Varianten.

      Zum Speichern eines Bildes auf dem Computer gehst du so vor:

      • Ein Rechtsklick auf das Bild öffnet ein Kontext-Menü. Dann „Save Image“ auswählen und du kannst das Bild speichern.
      • Linksklick auf das Bild öffnet eine größere Anzeige. Links unten kannst du dann per „Open Browser“ das Bild in einem Browser öffnen und darüber dann speichern. Wie genau, hängt dann vom Browser ab. Aber sehr wahrscheinlich Rechtsklick → Grafik speichern unter …

      Auf Mobilgeräten ist es etwas anders:

      • Das Bild lange antippen öffnet ein Kontext-Menü. Dann „Save Image“ auswählen und du kannst das Bild speichern.
      • Das Bild kurz antippen öffnet eine größere Anzeige. Lange antippen öffnet dann ein Kontext-Menü. Über das kannst du direkt speichern oder wieder den Umweg über den Browser gehen.

      Guter Hinweis außerdem. Das könnte ich in den Beitrag aufnehmen und ein paar Screenshots dazu machen.

      Grüße
      Dennis

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert