Eine dunkle Figur trägt eine Gasmaske und einen flammend orangefarbenen Hoodie, hält ein Katana mit leuchtenden Sternen, vor einem lebendigen Spraypaint-Stil apokalyptischen brennenden Stadt-Hintergrund mit Bewegungsunschärfe-Effekten.
Porträt eines Grashüpfer-Mannes in einem Tanktop, der auf einem Sofa sitzt, Bier trinkt und mit gekreuzten Beinen leuchtende Musiknoten erzeugt.
Eine Brokkoli-themenbasierte Figur, die Shrek ähnelt, steht neben einer blätterbedeckten Hütte in einem üppigen Brokkoli-Sumpf, umgeben von grünen Bäumen und Pflanzen.
Eine dunkle, schattige Silhouette einer menschlichen Figur mit leuchtenden Augen und einem schreienden Gesicht, die ihre Brust öffnet und zahlreiche Spinnen unter einer Straßenlaterne herausströmen.
Ein auffällig gekleideter Mann in einem grünen Anzug und Zylinder steht mit offenen Armen lächelnd in einem Gewächshaus voller Bäume und Pflanzen, die abstraktem Brokkoli ähneln, mit gelbem Text 'Willkommen im Brokkolarium!'
Eine realistische Kirschblüten-Schlange mit einem Körper, bedeckt von rosa Kirschblüten, leuchtenden neonvioletten Augen, die sich am Fuß eines dunklen Kirschbaums inmitten von Herbstblättern kringelt.
Zweipaneliger Comic mit dem Titel Civitai's Bewertungssystem zeigt einen niedlichen Pinguin, der glücklich einen Laptop benutzt, und einen besorgten blauen Roboter mit der Aufschrift Civita, der auf einen Computerbildschirm schaut.
Eine lebhafte digitale Darstellung eines orangefarbenen Hirsches mit großen Geweihen, auf denen vier bunte Astronautenvögel sitzen, vor einem tiefblauen kosmischen Hintergrund voller Sterne und Galaxien.
Ein wildäugiger, rosa-bärtiger Dämonenjäger mit großen, geschwungenen Hörnern und leuchtend grünen Augen hockt in einem düsteren Wald und hält eine tropfende Honigwabe, bedeckt mit klebrigem Honig.

Tipps

Nutzen Sie GPT-4os mehrstufige Generierung, um Bilder durch natürliche Konversation für konsistente Design-Iterationen zu verfeinern.

Nutzen Sie GPT-4os Fähigkeit, präzise Symbole mit Bildern zu verbinden, um die visuelle Kommunikation zu verbessern.

Verwenden Sie In-Context-Lernen, indem Sie Bilder hochladen, um neue Bildgenerierungen zu informieren und zu verbessern.

Beziehen Sie sich auf den Leitfaden zur Nutzung von GPT Image 1 für zusätzliche Anwendungstipps.

Ersteller-Sponsoren

Ursprünglich detailliert unter - https://openai.com/index/introducing-4o-image-generation/

Update 5/8: Wir haben einen Qualitätsauswahl-Mechanismus veröffentlicht und Preise angepasst! Bilder mit mittlerer Qualität kosten jetzt 100 Buzz ⚡

Siehe unser Leitfaden zur Nutzung von GPT Image 1!

Ursprünglich detailliert unter - https://openai.com/index/introducing-4o-image-generation/

Update 5/8: Wir haben einen Qualitätsauswahl-Mechanismus veröffentlicht und Preise angepasst! Bilder von mittlerer Qualität kosten jetzt 100 Buzz ⚡

Siehe unser Leitfaden zur Nutzung von GPT Image 1!

Nützliche Bildgenerierung

Von den ersten Höhlenmalereien bis zu modernen Infografiken haben Menschen visuelle Bilder verwendet, um zu kommunizieren, zu überzeugen und zu analysieren – nicht nur zur Dekoration. Heutige generative Modelle können surreale, atemberaubende Szenen erzeugen, haben aber Schwierigkeiten mit den Alltagsbildern, die Menschen zum Teilen und Erstellen von Informationen nutzen. Von Logos bis zu Diagrammen können Bilder präzise Bedeutungen vermitteln, wenn sie mit Symbolen ergänzt werden, die sich auf gemeinsame Sprache und Erfahrung beziehen.

Die GPT‑4o Bildgenerierung zeichnet sich durch präzises Textrendering, genaue Befolgung von Eingaben und Nutzung der inhärenten Wissensbasis und des Chat-Kontexts von 4o aus – einschließlich der Transformation hochgeladener Bilder oder deren Nutzung als visuelle Inspiration. Diese Fähigkeiten erleichtern es, genau das Bild zu erzeugen, das Sie sich vorstellen, unterstützen eine effektivere visuelle Kommunikation und entwickeln die Bildgenerierung zu einem praktischen Werkzeug mit Präzision und Kraft.

Verbesserte Fähigkeiten

Wir haben unsere Modelle auf der gemeinsamen Verteilung von Online-Bildern und Text trainiert und nicht nur gelernt, wie Bilder mit Sprache zusammenhängen, sondern auch untereinander. Kombiniert mit aggressivem Post-Training besitzt das resultierende Modell überraschende visuelle Sprachkompetenz und ist in der Lage, nützliche, konsistente und kontextbewusste Bilder zu erzeugen.

Textrendering

Ein Bild sagt mehr als tausend Worte, aber manchmal kann das Erzeugen weniger Worte am richtigen Platz die Bedeutung eines Bildes erhöhen. 4o’s Fähigkeit, präzise Symbole mit Bildern zu verbinden, verwandelt die Bildgenerierung in ein Werkzeug zur visuellen Kommunikation.

Mehrstufige Generierung

Da Bildgenerierung jetzt nativ in GPT‑4o integriert ist, können Sie Bilder durch natürliche Konversation verfeinern. GPT‑4o kann auf Bildern und Text im Chat-Kontext aufbauen und so Konsistenz gewährleisten. Beispielsweise bleibt das Aussehen einer Spielfigur bei mehreren Iterationen kohärent, während Sie diese verfeinern und experimentieren.

Befolgung von Anweisungen

Die Bildgenerierung von GPT‑4o folgt detaillierten Eingabeaufforderungen mit hoher Detailgenauigkeit. Während andere Systeme mit etwa 5-8 Objekten Schwierigkeiten haben, kann GPT‑4o bis zu 10-20 unterschiedliche Objekte handhaben. Die engere Bindung der Objekte an ihre Eigenschaften und Beziehungen ermöglicht eine bessere Kontrolle.

In-Context-Lernen

GPT‑4o kann hochgeladene Bilder analysieren und daraus lernen, ihre Details nahtlos in den Kontext integrieren, um die Bildgenerierung zu unterstützen.

Sicherheit

In Übereinstimmung mit unserer Model Spec zielen wir darauf ab, kreative Freiheit zu maximieren, indem wir wertvolle Anwendungsfälle wie Spieleentwicklung, historische Erkundung und Bildung unterstützen – gleichzeitig aber strenge Sicherheitsstandards einhalten. Es bleibt zudem nach wie vor wichtig, Anfragen, die diese Standards verletzen, zu blockieren. Unten finden sich Bewertungen zusätzlicher Risikobereiche, in denen wir daran arbeiten, sichere, nützliche Inhalte zu ermöglichen und breitere kreative Ausdrucksmöglichkeiten für Benutzer zu unterstützen.

Herkunft via C2PA und interne reversible Suche
Alle generierten Bilder enthalten C2PA-Metadaten, die ein Bild als von GPT‑4o stammend kennzeichnen, um Transparenz zu gewährleisten. Außerdem haben wir ein internes Suchwerkzeug entwickelt, das technische Merkmale der Generierungen verwendet, um zu überprüfen, ob Inhalte von unserem Modell stammen.

Blockierung unerwünschter Inhalte
Wir blockieren weiterhin Anfragen für generierte Bilder, die gegen unsere Inhaltsrichtlinien verstoßen könnten, wie beispielsweise Missbrauchsmaterialien von Kindern und sexuelle Deepfakes. Werden Bilder von realen Personen im Kontext verwendet, gelten strengere Einschränkungen hinsichtlich der Art der erzeugbaren Bilder, mit besonders robusten Schutzmaßnahmen bei Nacktheit und expliziter Gewalt. Sicherheit ist bei jeder Einführung ein fortlaufendes Engagement. Wenn wir mehr über die reale Nutzung dieses Modells erfahren, passen wir unsere Richtlinien entsprechend an.

Mehr zu unserem Vorgehen finden Sie in der Bildgenerierung Ergänzung zur GPT‑4o Systemkarte⁠.

Einsatz von Reasoning zur Förderung der Sicherheit
Ähnlich wie bei unserer deliberativen Ausrichtung⁠ haben wir ein Reasoning-LLM trainiert, das direkt aus menschlich verfassten und interpretierbaren Sicherheitsvorgaben arbeitet. Dieses Reasoning-LLM wurde während der Entwicklung verwendet, um Unsicherheiten in unseren Richtlinien zu erkennen und zu beheben. Zusammen mit unseren multimodalen Fortschritten und bestehenden Sicherheitstechniken für ChatGPT und Sora ermöglicht dies, sowohl Eingabetext als auch Ausgabebilder gemäß unseren Richtlinien zu moderieren⁠.

Zurück
"Delicate Balance" Halbrealistischer Stil [Flux.1 D] von AutoPastel - V1
Weiter
Pflanzenmilch 🌿 - Modell Suite - Walnut

Modell-Details

Modelltyp

Checkpoint

Basismodell

OpenAI

Modellversion

4o Image Gen 1

Modell-Hash

2a6b480dca

Ersteller

Diskussion

Bitte log in um einen Kommentar zu hinterlassen.

Bilder von OpenAIs GPT-image-1 - 4o Image Gen 1

Bilder mit Basismodell