Silhouette von Rotkäppchen im roten Umhang, die vor einem schattenhaften, furchterregenden bösen Wolf durch einen nebligen Wald mit hängenden kupfernen Laternen läuft, die blau leuchten.
Ein kampferprobter Held drückt gegen eine leuchtende magische Barriere und kämpft in einer dunklen, zerstörten Halle. Hinter der Barriere sind ein geisterhafter Lich-Zauberer und die bewusstlose Frau des Helden zu sehen.
Vier-Panel-Comic zeigt eine blauhaarige Frau, die einem traurigen Axolotl vorwirft, keine echte Kunst zu sein, und stattdessen auf eine beklebte Banane, einen Ventilator und eine Statue am Times Square zeigt, während der Axolotl weint und zustimmt.
Courage der Feige Hund zeigt seinen ikonischen Schrei-Ausdruck vor einem wirbelnden, lebendigen Hintergrund, inspiriert von Edvard Munchs Gemälde Der Schrei.
Farbenfrohe Szene von außerirdischen Kreaturen, die sich an einem futuristischen rosa Eiswagen mit gelber Markise in einem Märchenbuchstil mit psychedelischen CMYK-Farben und klarer Linienführung anstellen.
Eine weibliche Steampunk-Androidin mit gealterten Messing- und Kupferoberflächen im malerischen Ölgemälde-Stil, die einen großäugigen, erstaunten Ausdruck vor einem dunklen, strukturierten Hintergrund zeigt.
Silhouette eines Karatekämpfers, der einen Sprungkick vor einer kräftigen roten Sonne ausführt, dargestellt mit Tuscheklecks-Pinselstrichen im minimalistischen japanischen Sumi-e-Stil.
3D Kartonfigur von Pyramid Head, die eine große Klinge zieht, eine Spalte mit leuchtend orangem Licht und unheimlichen Händen erzeugt, auf einem Holztisch mit einer Miniatur des nebligen Silent Hill Städtchens und Schild.
Dreidimensionales Minecraft Höhlen-Diorama aus Pappe mit realistischen Erzen, geschichteten Feinden einschließlich Creeper, Schleim, Skelett und Enderman, beleuchtet von kleinen Fackeln.
Silhouette eines Tiefling Schurke Zauberers, der eine leuchtende Kugel hält, stehend in einer entsättigten postapokalyptischen Umgebung mit gedämpfter Beleuchtung und zerstörten Strukturen.
Hyperrealistisches Ölgemälde einer Gothic-Punk-Heldin mit stacheligen schwarzen Haaren, smaragdgrünen Augen und verspieltem Trotz, die Lederarmbänder und Netzstrümpfe trägt.
Ein niedliches Pinguin-förmiges Sushi aus Reis, Nori-Algen, Lachsscheiben und gelben Eistücken, präsentiert auf einem Holzbrett.

Tipps

Nutzen Sie GPT-4os mehrstufige Generierung, um Bilder durch natürliche Konversation für konsistente Design-Iterationen zu verfeinern.

Nutzen Sie GPT-4os Fähigkeit, präzise Symbole mit Bildern zu verbinden, um die visuelle Kommunikation zu verbessern.

Verwenden Sie In-Context-Lernen, indem Sie Bilder hochladen, um neue Bildgenerierungen zu informieren und zu verbessern.

Beziehen Sie sich auf den Leitfaden zur Nutzung von GPT Image 1 für zusätzliche Anwendungstipps.

Ersteller-Sponsoren

Ursprünglich detailliert unter - https://openai.com/index/introducing-4o-image-generation/

Update 5/8: Wir haben einen Qualitätsauswahl-Mechanismus veröffentlicht und Preise angepasst! Bilder mit mittlerer Qualität kosten jetzt 100 Buzz ⚡

Siehe unser Leitfaden zur Nutzung von GPT Image 1!

Ursprünglich detailliert unter - https://openai.com/index/introducing-4o-image-generation/

Update 5/8: Wir haben einen Qualitätsauswahl-Mechanismus veröffentlicht und Preise angepasst! Bilder von mittlerer Qualität kosten jetzt 100 Buzz ⚡

Siehe unser Leitfaden zur Nutzung von GPT Image 1!

Nützliche Bildgenerierung

Von den ersten Höhlenmalereien bis zu modernen Infografiken haben Menschen visuelle Bilder verwendet, um zu kommunizieren, zu überzeugen und zu analysieren – nicht nur zur Dekoration. Heutige generative Modelle können surreale, atemberaubende Szenen erzeugen, haben aber Schwierigkeiten mit den Alltagsbildern, die Menschen zum Teilen und Erstellen von Informationen nutzen. Von Logos bis zu Diagrammen können Bilder präzise Bedeutungen vermitteln, wenn sie mit Symbolen ergänzt werden, die sich auf gemeinsame Sprache und Erfahrung beziehen.

Die GPT‑4o Bildgenerierung zeichnet sich durch präzises Textrendering, genaue Befolgung von Eingaben und Nutzung der inhärenten Wissensbasis und des Chat-Kontexts von 4o aus – einschließlich der Transformation hochgeladener Bilder oder deren Nutzung als visuelle Inspiration. Diese Fähigkeiten erleichtern es, genau das Bild zu erzeugen, das Sie sich vorstellen, unterstützen eine effektivere visuelle Kommunikation und entwickeln die Bildgenerierung zu einem praktischen Werkzeug mit Präzision und Kraft.

Verbesserte Fähigkeiten

Wir haben unsere Modelle auf der gemeinsamen Verteilung von Online-Bildern und Text trainiert und nicht nur gelernt, wie Bilder mit Sprache zusammenhängen, sondern auch untereinander. Kombiniert mit aggressivem Post-Training besitzt das resultierende Modell überraschende visuelle Sprachkompetenz und ist in der Lage, nützliche, konsistente und kontextbewusste Bilder zu erzeugen.

Textrendering

Ein Bild sagt mehr als tausend Worte, aber manchmal kann das Erzeugen weniger Worte am richtigen Platz die Bedeutung eines Bildes erhöhen. 4o’s Fähigkeit, präzise Symbole mit Bildern zu verbinden, verwandelt die Bildgenerierung in ein Werkzeug zur visuellen Kommunikation.

Mehrstufige Generierung

Da Bildgenerierung jetzt nativ in GPT‑4o integriert ist, können Sie Bilder durch natürliche Konversation verfeinern. GPT‑4o kann auf Bildern und Text im Chat-Kontext aufbauen und so Konsistenz gewährleisten. Beispielsweise bleibt das Aussehen einer Spielfigur bei mehreren Iterationen kohärent, während Sie diese verfeinern und experimentieren.

Befolgung von Anweisungen

Die Bildgenerierung von GPT‑4o folgt detaillierten Eingabeaufforderungen mit hoher Detailgenauigkeit. Während andere Systeme mit etwa 5-8 Objekten Schwierigkeiten haben, kann GPT‑4o bis zu 10-20 unterschiedliche Objekte handhaben. Die engere Bindung der Objekte an ihre Eigenschaften und Beziehungen ermöglicht eine bessere Kontrolle.

In-Context-Lernen

GPT‑4o kann hochgeladene Bilder analysieren und daraus lernen, ihre Details nahtlos in den Kontext integrieren, um die Bildgenerierung zu unterstützen.

Sicherheit

In Übereinstimmung mit unserer Model Spec zielen wir darauf ab, kreative Freiheit zu maximieren, indem wir wertvolle Anwendungsfälle wie Spieleentwicklung, historische Erkundung und Bildung unterstützen – gleichzeitig aber strenge Sicherheitsstandards einhalten. Es bleibt zudem nach wie vor wichtig, Anfragen, die diese Standards verletzen, zu blockieren. Unten finden sich Bewertungen zusätzlicher Risikobereiche, in denen wir daran arbeiten, sichere, nützliche Inhalte zu ermöglichen und breitere kreative Ausdrucksmöglichkeiten für Benutzer zu unterstützen.

Herkunft via C2PA und interne reversible Suche
Alle generierten Bilder enthalten C2PA-Metadaten, die ein Bild als von GPT‑4o stammend kennzeichnen, um Transparenz zu gewährleisten. Außerdem haben wir ein internes Suchwerkzeug entwickelt, das technische Merkmale der Generierungen verwendet, um zu überprüfen, ob Inhalte von unserem Modell stammen.

Blockierung unerwünschter Inhalte
Wir blockieren weiterhin Anfragen für generierte Bilder, die gegen unsere Inhaltsrichtlinien verstoßen könnten, wie beispielsweise Missbrauchsmaterialien von Kindern und sexuelle Deepfakes. Werden Bilder von realen Personen im Kontext verwendet, gelten strengere Einschränkungen hinsichtlich der Art der erzeugbaren Bilder, mit besonders robusten Schutzmaßnahmen bei Nacktheit und expliziter Gewalt. Sicherheit ist bei jeder Einführung ein fortlaufendes Engagement. Wenn wir mehr über die reale Nutzung dieses Modells erfahren, passen wir unsere Richtlinien entsprechend an.

Mehr zu unserem Vorgehen finden Sie in der Bildgenerierung Ergänzung zur GPT‑4o Systemkarte⁠.

Einsatz von Reasoning zur Förderung der Sicherheit
Ähnlich wie bei unserer deliberativen Ausrichtung⁠ haben wir ein Reasoning-LLM trainiert, das direkt aus menschlich verfassten und interpretierbaren Sicherheitsvorgaben arbeitet. Dieses Reasoning-LLM wurde während der Entwicklung verwendet, um Unsicherheiten in unseren Richtlinien zu erkennen und zu beheben. Zusammen mit unseren multimodalen Fortschritten und bestehenden Sicherheitstechniken für ChatGPT und Sora ermöglicht dies, sowohl Eingabetext als auch Ausgabebilder gemäß unseren Richtlinien zu moderieren⁠.

Zurück
"Delicate Balance" Halbrealistischer Stil [Flux.1 D] von AutoPastel - V1
Weiter
Pflanzenmilch 🌿 - Modell Suite - Walnut

Modell-Details

Modelltyp

Checkpoint

Basismodell

OpenAI

Modellversion

4o Image Gen 1

Modell-Hash

2a6b480dca

Ersteller

Diskussion

Bitte log in um einen Kommentar zu hinterlassen.

Bilder von OpenAIs GPT-image-1 - 4o Image Gen 1

Silhouette von Rotkäppchen im roten Umhang, die vor einem schattenhaften, furchterregenden bösen Wolf durch einen nebligen Wald mit hängenden kupfernen Laternen läuft, die blau leuchten.
Ein kampferprobter Held drückt gegen eine leuchtende magische Barriere und kämpft in einer dunklen, zerstörten Halle. Hinter der Barriere sind ein geisterhafter Lich-Zauberer und die bewusstlose Frau des Helden zu sehen.
Vier-Panel-Comic zeigt eine blauhaarige Frau, die einem traurigen Axolotl vorwirft, keine echte Kunst zu sein, und stattdessen auf eine beklebte Banane, einen Ventilator und eine Statue am Times Square zeigt, während der Axolotl weint und zustimmt.
Courage der Feige Hund zeigt seinen ikonischen Schrei-Ausdruck vor einem wirbelnden, lebendigen Hintergrund, inspiriert von Edvard Munchs Gemälde Der Schrei.
Farbenfrohe Szene von außerirdischen Kreaturen, die sich an einem futuristischen rosa Eiswagen mit gelber Markise in einem Märchenbuchstil mit psychedelischen CMYK-Farben und klarer Linienführung anstellen.
Eine weibliche Steampunk-Androidin mit gealterten Messing- und Kupferoberflächen im malerischen Ölgemälde-Stil, die einen großäugigen, erstaunten Ausdruck vor einem dunklen, strukturierten Hintergrund zeigt.
Silhouette eines Karatekämpfers, der einen Sprungkick vor einer kräftigen roten Sonne ausführt, dargestellt mit Tuscheklecks-Pinselstrichen im minimalistischen japanischen Sumi-e-Stil.
3D Kartonfigur von Pyramid Head, die eine große Klinge zieht, eine Spalte mit leuchtend orangem Licht und unheimlichen Händen erzeugt, auf einem Holztisch mit einer Miniatur des nebligen Silent Hill Städtchens und Schild.
Dreidimensionales Minecraft Höhlen-Diorama aus Pappe mit realistischen Erzen, geschichteten Feinden einschließlich Creeper, Schleim, Skelett und Enderman, beleuchtet von kleinen Fackeln.
Silhouette eines Tiefling Schurke Zauberers, der eine leuchtende Kugel hält, stehend in einer entsättigten postapokalyptischen Umgebung mit gedämpfter Beleuchtung und zerstörten Strukturen.
Hyperrealistisches Ölgemälde einer Gothic-Punk-Heldin mit stacheligen schwarzen Haaren, smaragdgrünen Augen und verspieltem Trotz, die Lederarmbänder und Netzstrümpfe trägt.
Ein niedliches Pinguin-förmiges Sushi aus Reis, Nori-Algen, Lachsscheiben und gelben Eistücken, präsentiert auf einem Holzbrett.

Bilder mit Basismodell

Fotorealistische Szene untoter Charaktere, darunter Zombies und Skelette, die durch einen unheimlichen Friedhof gehen, beleuchtet von leuchtenden Jack-O'-Lanterns unter einem dunklen, bedrohlichen Himmel.