Mittlerweile haben glaube ich alle mitbekommen, dass das beste Bildmodell Nano Banana heisst – jedenfalls im Frühherbst 2025.
Man findet es im Chatbot Google Gemini unter Bildbearbeitung. Schlauerweise hiess das Modell nur in der Beta Nano Banana – jetzt ist es als langweiliges 2.5 Flash Imagen integriert worden.
Der Clou: Im Gegensatz zu ChatGPT, verändert Google nur die Bildteile, die man wirklich bearbeiten will – und bleibt so nahe am Original. Eine Art Photoshop fürs AI-Zeitalter.
Beim obigen Bild habe ich die Attribute aus dem berühmten Steve-Jobs-Porträt ausgelesen und dann über mein Foto gestülpt – mit einem blauen Touch.
Ihr kennt mich. Meine Heimat im Netz war Twitter. Dann kam Musk und das ganze Chaos und ich suchte eine neue Heimat. Bluesky sah zwar verlockend aus – aber fristet immer noch ein Mauerblümchendasein.
Und während ich wegen der weltweiten Breaking News nicht von Twitter bzw. 𝕏 wegkomme, ist die Interaktion mit Menschen doch gegen null gesunken.
Darum versuche ich es mal auf LinkedIn. Bisher war ich nur sporadisch aktiv. Nun ziehe ich es einen Monat lang durch, jeden Tag was zu posten. Mal gucken, was der Algo dann mit mir macht.
Bisher gab es grob zwei Arten von Bilderstellung mit künstlicher Intelligenz. Entweder eine gute, aber kompliziertere, wie mit Midjourney. Oder eine einfachere, aber grafisch dürftigere wie mit DallE auf ChatGPT.
Mit der Lancierung der «4o Image Generation» von ChatGPT/OpenAI ist nun quasi das beste aus beiden Welten zusammen gekommen: Endlich ist es mit einfachen Textprompts möglich, grafisch ansprechende Bilder zu erstellen – die übrigens auch Text wunderbar generieren können.
Es ist quasi ein AGI-Moment für Fotos. AGI steht aber hier weniger für «Artificial General Intelligence», sondern augenzwinkernd für «All Ghibli Images». Denn nach der Lancierung des Tools gab es einen Riesen-Hype, alle Bilder im Stile des japanischen Studio Ghibli.
Natürlich machte auch der Bö mit – und Ghibli-fizierte sein Profildbild (und ja, mir ist die Kontroverse um AI-Kritiker und Ghibli-Gründer Hayao Miyazaki bewusst).
Der Prompt für das Bild war übrigens:
Bild erstellen von diesem Mann auf einem Fahrrad. Selfie-Perspektive. Quadratisch. Kopf im Vordergrund. In die Kamera lachend. Stil Studio Ghibli
Momentan scheint OpenAI die Sache ein wenig in den Griff bekommen zu haben und auch Gratis-User können Bilder der neusten Generation erstellen – wenn auch nur eine beschränkte Anzahl pro Tag. Also los, ausprobieren!