modelli/GPT-image-1 di OpenAI - 4o Image Gen 1

GPT-image-1 di OpenAI - 4o Image Gen 1

7/2/2025

1:12:34 AM

Parole Chiave e Tag Correlati

4o image gen 1,modello base,checkpoint,generazione immagini gpt-4o,modello di generazione immagini,apprendimento contestuale,seguire le istruzioni,generazione multi-turno,openai,openai's gpt-image-1,renderizzazione del testo,theally,comunicazione visiva

Una figura oscura con maschera a gas e felpa arancione fiammeggiante brandisce una katana infusa di stelle luminose, su uno sfondo vivace di città apocalittica in stile spray paint con effetti di sfocatura.

Ritratto di un uomo cavalletta con canottiera seduto su un divano, che beve birra, strofinandosi le gambe incrociate per creare note musicali luminose.

Un personaggio a tema broccoli che ricorda Shrek sta accanto a una capanna di foglie in una ricca palude di broccoli circondata da alberi e piante verdi.

Una sagoma umana scura e ombrosa con occhi luminosi e un volto urlante che apre il petto, rivelando numerosi ragni che si riversano sotto un lampione.

Un uomo vestito in modo stravagante con completo verde e cilindro sta a braccia aperte sorridendo all'interno di una serra piena di alberi e piante che assomigliano a broccoli astratti, con testo giallo che dice 'Benvenuti a Broccoliarium!'

Un serpente realistico di fiori di ciliegio con il corpo coperto da fiori rosa di ciliegio, occhi violetti al neon luminosi, arrotolato alla base di un albero di ciliegio scuro tra foglie autunnali.

Fumetto a due pannelli intitolato Sistema di valutazione di Civitai con un pinguino carino che usa felicemente un laptop e un robot blu preoccupato etichettato Civita che guarda uno schermo di computer.

Una vivace rappresentazione digitale di un cervo arancione con grandi corna che ospitano quattro uccelli astronauta colorati, sullo sfondo di un profondo cielo cosmico blu pieno di stelle e galassie.

Un cacciatore di demoni dagli occhi selvaggi con barba rosa, grandi corna ricurve e occhi verdi luminosi si accovaccia in una foresta fioca, tenendo un favo gocciolante ricoperto di miele appiccicoso.

Suggerimenti

Usa la generazione multi-turno di GPT-4o per perfezionare le immagini attraverso conversazioni naturali per iterazioni di design coerenti.

Sfrutta la capacità di GPT-4o di combinare simboli precisi con immagini per migliorare la comunicazione visiva.

Utilizza l'apprendimento contestuale caricando immagini per informare e migliorare nuove generazioni di immagini.

Consulta la guida all'uso di GPT Image 1 per ulteriori consigli su come utilizzare il modello.

Sponsor del Creatore

Originariamente dettagliato su - https://openai.com/index/introducing-4o-image-generation/

Aggiornamento 8/5: Abbiamo rilasciato un selettore qualità e adeguato i prezzi! Ora le immagini di qualità Media costano 100 Buzz ⚡

Consulta la nostra Guida all'uso di GPT Image 1!

Originariamente dettagliato su - https://openai.com/index/introducing-4o-image-generation/

Aggiornamento 8/5: Abbiamo rilasciato un selettore qualità e adeguato i prezzi! Ora le immagini di qualità Media costano 100 Buzz ⚡

Consulta la nostra Guida all'uso di GPT Image 1!

Generazione di immagini utile

Dalle prime pitture rupestri agli infografiche moderne, gli esseri umani hanno usato immagini visive per comunicare, persuadere e analizzare, non solo per decorare. I modelli generativi odierni possono evocare scene surreali e mozzafiato, ma hanno difficoltà con le immagini operative che le persone usano per condividere e creare informazioni. Da loghi a diagrammi, le immagini possono trasmettere significati precisi quando arricchite con simboli che si riferiscono a un linguaggio e a un'esperienza condivisi.

La generazione di immagini GPT‑4o eccelle nel rendere accuratamente il testo, nel seguire con precisione i prompt e nel sfruttare la base di conoscenze intrinseca di 4o e il contesto chat, inclusa la trasformazione di immagini caricate o il loro uso come ispirazione visiva. Queste capacità facilitano la creazione esatta dell'immagine che si immagina, aiutando a comunicare più efficacemente attraverso i visual e portando la generazione di immagini a uno strumento pratico con precisione e potenza.

Capacità migliorate

Abbiamo addestrato i nostri modelli sulla distribuzione congiunta di immagini online e testi, imparando non solo come le immagini si relazionano al linguaggio, ma anche come si relazionano tra loro. Combinato con un post-addestramento aggressivo, il modello risultante presenta una fluente capacità visiva sorprendente, capace di generare immagini utili, coerenti e consapevoli del contesto.

Rendering del testo

Un'immagine vale mille parole, ma a volte generare poche parole nel posto giusto può elevare il significato di un’immagine. La capacità di 4o di fondere simboli precisi con le immagini trasforma la generazione di immagini in uno strumento per la comunicazione visiva.

Generazione multi-turno

Poiché la generazione di immagini è ora nativa in GPT‑4o, puoi perfezionare le immagini attraverso conversazioni naturali. GPT‑4o può costruire su immagini e testi nel contesto della chat, garantendo coerenza in ogni fase. Ad esempio, se stai progettando un personaggio per un videogioco, l’aspetto del personaggio rimane coerente attraverso molteplici iterazioni mentre lo perfezioni e sperimenti.

Seguire le istruzioni

La generazione di immagini di GPT‑4o segue i prompt dettagliati con attenzione ai particolari. Mentre altri sistemi hanno difficoltà con circa 5-8 oggetti, GPT‑4o può gestire fino a 10-20 oggetti diversi. Il legame più stretto tra oggetti, loro attributi e relazioni consente un controllo migliore.

Apprendimento contestuale

GPT‑4o può analizzare e apprendere dalle immagini caricate dagli utenti, integrandone senza soluzione di continuità i dettagli nel proprio contesto per informare la generazione di immagini.

Sicurezza

In linea con le nostre Specifiche Modello, puntiamo a massimizzare la libertà creativa supportando casi d’uso preziosi come lo sviluppo di giochi, l’esplorazione storica e l’educazione, mantenendo al contempo alti standard di sicurezza. Allo stesso tempo, è sempre importante bloccare richieste che violano tali standard. Di seguito sono riportate valutazioni di aree di rischio aggiuntive dove stiamo lavorando per abilitare contenuti sicuri e di alto valore e supportare una più ampia espressione creativa per gli utenti.

Provenienza tramite C2PA e ricerca interna reversibile
Tutte le immagini generate dispongono di metadati C2PA, che identificano un’immagine come proveniente da GPT‑4o, per garantire trasparenza. Abbiamo anche sviluppato uno strumento di ricerca interno che utilizza attributi tecnici delle generazioni per aiutare a verificare se il contenuto provenga dal nostro modello.

Blocco dei contenuti nocivi
Continuiamo a bloccare richieste di immagini generate che potrebbero violare le nostre politiche sui contenuti, come materiale di abuso sessuale di minori e deepfake sessuali. Quando ci sono immagini di persone reali nel contesto, abbiamo restrizioni più rigorose riguardo al tipo di immagini che possono essere create, con protezioni particolarmente robuste per la nudità e la violenza grafica. Come per ogni lancio, la sicurezza non è mai completa, ma una continua area di investimento. Man mano che impariamo dall’uso reale di questo modello, adatteremo le nostre politiche di conseguenza.

Per maggiori informazioni sul nostro approccio, visita l’addendum alla scheda di sistema di GPT‑4o sulla generazione di immagini.

Utilizzo del ragionamento per la sicurezza
Simile al nostro lavoro di allineamento deliberativo, abbiamo addestrato un LLM di ragionamento per lavorare direttamente da specifiche di sicurezza scritte e interpretabili dall’uomo. Questo LLM di ragionamento è stato utilizzato durante lo sviluppo per aiutarci a identificare e affrontare ambiguità nelle nostre politiche. Insieme ai nostri progressi multimodali e alle tecniche di sicurezza esistenti sviluppate per ChatGPT e Sora, questo ci permette di moderare sia i testi di input che le immagini generate rispetto alle nostre politiche.

Contributore

Luca Bianchi

Ciao! Sono Luca Bianchi, editor visivo con un debole per l’estetica minimal. Seleziono e rifinisco immagini AI per trasformarle in piccole opere d’arte.

"Delicate Balance" Stile Semi-realistico [Flux.1 D] di AutoPastel - V1

Plant Milk 🌿 - Suite Modello - Walnut

Usa questo modello