フル装備のモトクロスライダーが病院のベッドをバイクで飛び越え、患者が歓声を上げる病室でフィルム粒子効果がかかっている様子。

推奨プロンプト

d1g1cam, amateur photo, low-lit, Low-resolution photo, shot on a mobile phone

推奨パラメータ

samplers

DPM++ 2M

steps

40

cfg

3

ヒント

滑らかで安定した出力のためにDPM++ 2Mサンプラーを使用してください。

過剰処理を避けつつ細部を捉えるために30~50ステップを目標にしてください。

このチェックポイントではBeta Schedulerが最良の選択です。

明確でコンマ区切りの複雑なプロンプトを使用し、簡潔かつ説明的に保ちましょう。

CFGを0.1または0.2下げると詳細が改善することがありますが、生成時間が増加する可能性があります。

画像の過剰処理を防ぐため、このチェックポイントではUltraRealPhoto LoRAを使用せず、代わりにRealism Amplifierを使ってください。

プロンプトに高解像度指定を入れると低解像度出力のアーティファクト回避に役立ちます。

バージョンのハイライト

美的感覚を高め、解剖学はやや減少させました。

V4
さて、このバージョンの新機能は?美的感覚のダイヤルを上げ、年齢層の多様性を追加し、アジア人の特徴の扱いを改善しました。しかし、いつものように問題もあり、手が少し不自然になったことに気づきました。まあ、全部うまくいくわけではありません。

このチェックポイントはスタイライズされたLoRAのベースとして最適なので、realism amplifierや2000s analog coreなどの私のLoRAと組み合わせることを強く推奨します。あともう1バージョン作るかもしれません(正直v3とv4は少し詰めが甘いところがあります)が、まずはFlex.Alphaのファインチューニングに取りかかっています。
今回利用可能なバージョン:bf16、fp8、q8_0(プルーニング済みfp16名)、q4_k_m(プルーニング済みfp8名)
追伸:このチェックポイントではUltraRealPhoto LoRAを使用しないでください。スタイルに大きな影響があり、画像が過剰処理されてしまいます。UltraReal Fine-Tuneを使用する場合、Realism Amplifierを代わりに使用すると最良の結果が得られます。UltraRealPhoto LoRAは影や光、顔の問題修正用ですが、これらはすでにチェックポイントに組み込まれているため、より良いリアリズムのためにAmplifierを追加するだけで十分です。

V3アップデート(実験的)
このリリースは前進を示していますが、まだ作業中の段階です。ヌード、足、下半身の解剖学の改善に注力しました。結果は以前より良くなっていますが、目標とするレベルには達していません。それでも、このバージョンは以前より鮮明で詳細な質感を提供しています。

推奨設定:

  • CFGスケール:3(以前のバージョンで使用されていた2.5の代わり)

  • ステップ数:50(安定性向上に寄与しますが、手や指のわずかな不安定さは残ります)

  • CFG 0.9 vs. 1.0:CFGを0.1や0.2下げると詳細が改善することがあります(改善しない場合もあるので試してみてください)、ただし生成に時間がかかる可能性があります。

ヌードについて:まだ完全には意図どおりに機能していませんが、問題に取り組んでおり、次のバージョンでの修正を目指しています。

良いニュースとしては、V3.5のデータセットはすでに準備済みで、V2V3の間の期間よりも早くリリースできる予定です。このバージョンからの経験とフィードバックで、次のアップデートは大幅な改善をもたらすと確信しています。

いつもありがとうございます。皆さんのサポートとフィードバックは本当に貴重で、プロジェクト改善の大きな助けになっています❤️

追伸:Fluxをファインチューニングすればするほど他の部分の品質が下がる気がします。また、Flex Alphaのファインチューニングにも挑戦しようと思っています(プロジェクトは非常に期待できます)。


v2.0の新機能は?

  • 解剖学の強化:手、足、姿勢が大幅に改善され、より自然で正確な結果を提供します。過度に歪んだ四肢とはおさらばです!

  • テクスチャと品質の向上:肌のディテールが向上し、より豊かな質感とシャープな結果に。ぼやけた画像はまだ稀にありますが、前バージョンやLoRA単体使用時よりも頻度は低くなっています。

  • テキストレンダリングの改善:画像中のテキスト生成が大幅に向上しましたが、まだアーティファクトや読みにくい文字が出ることがあります。これは引き続き改善中です。

  • データセットの拡充:より大きく多様なデータセット(1800枚)を導入し、スタイル、照明、構図のバランスを向上させました。


追加されたチェックポイントバリエーション

異なるワークフローに対応するため、複数のチェックポイントバリエーションを用意しました:

  • BF16

  • FP8

  • Quant 8 (Q8)

  • Quant 4 (Q4)
    NF4

私のテストでは、Quant 8 (Q8)がFP8よりやや良い品質で、細かいディテールを保ちながらリソース要求も管理可能ですが、他のバージョンも良好です。環境に最適なものを選択してください。


既知の制限事項

  • NSFW機能:このバージョンではまだ弱点ですが、NSFWコンテンツ専用の軽微なファインチューニングを進行中です。

  • テキストレンダリング:生成は改善しましたが、奇妙な文字や不完全な単語のアーティファクトが時々発生します。t5xxl fp16の使用がfp8よりテキストに良い影響を与えることに気づいています。


最適な結果を得るためのヒント

  • サンプラー:滑らかで安定した結果のためにDPM++ 2Mサンプラーを使用してください。

  • ステップ数:過剰処理を避けつつ細部を捉えるために30~50ステップを目標に。

  • スケジューラー:Beta Schedulerはこのチェックポイントで最適な選択です。

    プロンプトのコツ

    最良のプロンプトは、明確なコンマ区切りのフレーズを持つ複雑なプロンプトです。ストーリーテリング的なプロンプトで創造的になることは可能ですが、「このクソが彼女のスタイルによりヴィンテージ感を加えた」といった不要な説明は結果を改善しません。簡潔で説明的に保ち、重要な視覚詳細に焦点を当てることが最良の結果をもたらします。


今後の計画

このファインチューニングのさらなる開発に取り組んでおり、次のアップデートでは以下に注力する予定です:

  • NSFW機能の拡充

  • 動的ポーズや照明シナリオなどのエッジケースの改善

  • より鮮明で正確な結果のためのテキストレンダリングの改良

    追伸:もしリアリスティックな効果がまだ不足している場合は、私のultrareal loraを追加すると通常大いに役立ちます。




    Ultra-Realistic Flux Fine-Tune v1

これは私の初のチェックポイントファインチューニング実験で、UltraReal LoRAを基にし、拡張データセットで展開しました。目的はリアリズムを次のレベルに押し上げ、アマチュア感覚とプロの高品質ビジュアルの間の絶妙なバランスを見つけることです。

これはまだ第一版で、さらなる改善余地を感じています。結果は良好ですが理想的ではありません(手や足が時に破綻することがありますが、状況は重大ではなく、標準Fluxよりは良いです)。このファインチューニングはアマチュア品質の出力に留まらず、素晴らしいディテール、生き生きとした影と照明を伴うプロフェッショナルグレードの画像を提供します。多様なリアルな画像生成の可能性を開く多用途モデルです。

まだ作業中の段階で、フィードバックを集め創造的な使い方を知るために共有しています。テストしたら、感想や成果をぜひ聞かせてください!
また、fp16(ComfyUIではe5m2と併用すると良い)とfp8とQ4_0の両バージョンをアップロードしました。


🌟 このファインチューニングの新機能は?

  • データセットの拡大:元のLoRAのほぼ倍のサイズの多様で多ジャンルなスタイルや照明、構図をカバーしています。

  • リアリズムの改善:よりシャープなディテール、豊かなテクスチャ、より自然な照明で、AI生成画像と実世界画像のギャップを埋めます。

  • 多用途性:カジュアルなアマチュア風スナップショットからシネマティックでプロフェッショナルな品質のレンダリングまで、多様なクリエイティブニーズに適応します。

  • 解剖学の強化:ベースFluxモデルに比べて、より良い手、四肢、自然なポーズを実現しています。


💡 最高の結果を得るためのヒント

  • DPM++ 2Mサンプラーを使用し、滑らかで安定した出力を実現してください。

  • 30~50ステップを目標にして、細部を細かく捉えつつ過剰処理を避けてください。

  • Beta Schedulerを選択し、最適なレンダリング性能を得てください。


なぜファインチューニングするのか?

このファインチューニングは標準のFluxモデルの限界を克服するために作られました。複雑なシーン処理能力を強化し、多様なプロンプトに安定した品質を提供します。目的はシンプルで、超リアルな画像生成を調整不要で手軽かつ魅力的にすることです。

追伸:解剖学とリアリズムで最高のチェックポイントを作るためにさらにトレーニングを続ける予定です。このバージョンはNSFWに関してはあまり良くありません(次バージョンで修正予定)。
追伸2:ランダムに低解像度画像が生成されることがあります(原因不明ですが修正を探しています)。ただし、プロンプトに高解像度指定を入れると改善します。

前の画像
Flux カオティックエクスプレッシブラインアート - v1.0
次の画像
Sherri Belassen - V1

モデル詳細

モデルタイプ

Checkpoint

ベースモデル

Flux.1 D

モデルバージョン

v4

モデルハッシュ

8d817e129c

作成者

ディスカッション

コメントを残すには log in してください。

モデルコレクション - UltraReal Fine-Tune

「UltraReal Fine-Tune - v4」による画像

フル装備のモトクロスライダーが病院のベッドをバイクで飛び越え、患者が歓声を上げる病室でフィルム粒子効果がかかっている様子。

2000年代画像

薄暗い路地でパーチメントを持つ黒い魔女の衣装を着たゴス少女。
ピクシーカットとスモッジアイライナーの若い女性が、迷彩のクロップトップとブートカットジーンズを着て、グラフィティが描かれた路地に立っている2000年代スタイルの写真。

フィルム画像

都市の明かりとモーションブラーを伴い夜間に走行するチャージャーヘルキャットSRTのシネマティックな35mmスタイルの写真
健康的なサーモンスライスを黒皿に盛り、レモンスライスのガーニッシュと上にディルをのせ、側にフォークが置かれたトップビュー。暗く質感のある表面にドラマチックな光が当たっている。
長いアッシュブロンドの髪と紫色に光る目を持ち、エルドリッチテックパブの内装に座っている少女のシュールな肖像。フィッシュネットの袖と黒いドレスを着ている。
黒いボディスーツに発光する黄色い線と曲がった角を持つ超リアルな悪魔の姿が、ドラマチックなシネマティックライティングの中、暗い背景に立っている。
雨に覆われた窓にそっと触れる女性のフォトリアリスティックなモノクロクローズアップポートレート。高い詳細と質感で撮影されています。
濡れて汚れた下水道のトンネルで、鋭い歯とオレンジ色に輝く目を持つ怪物が低く劇的なPOVアングルから前に飛びかかる様子。
シネマティックライティングの下で光沢のある唇と精緻な目を持ち、ネオンレッドの輪郭を持つ未来的なサイバーグラスをかけた美しい女性の超リアルなデジタルクローズアップポートレート。
装飾的な金属製ハーフマスクと露出度の高い黒いローブを身に着け、霧と不気味な影から現れる悪魔的な女性像のフォトリアリスティックな白黒画像。
オレンジ色の火星の砂漠が電話ボックスの背面窓から見える中、古く風化した電話ボックスの中でビンテージの受話器を耳に当てているエイリアンのハイパーディテールなシネマティック写真。
未来的な宇宙船の床に横たわる壊れた亀裂の入った人型サイボーグ女性の写実的な画像。周囲には幽玄なネオンブルーの霧が漂い、窓越しに光る銀河が見える。

フォトリアリスティック画像

煙がかったヴィンテージ映画スタイルのファッションショーの舞台で、ハイヒールを履いた翼のあるモデルが劇的にポーズをとるフォトリアリスティックな画像。
暗い背景の中、ジャングルの葉の間に立つ、そばかすのあるジンジャーヘアの女性の全身肖像。マスタードイエローのロングドレスを着ており、フリルの短い袖が特徴。
光のきらめきが差し込む雪の松林に立つ、雪の迷彩スペックオプス装備を着たフォトリアリスティックなシベリアンハスキー。
暗く煙った1940年代ノワール都市景観の中で、鮮やかな赤いバスローブを着て侍の刀を二本持つ半人半サイボーグの女性のフォトリアリスティックなクローズアップ。
大きなオレンジの夕日を背景に、ボケた光の球体が散りばめられたシルエット状の野花の茎を写したマクロ写真。
暗い青色の背景に対して紫色の光を放つ生物発光する光る茨の冠をかぶった男性のシルエット。
豪華な寝室の上に青みがかった宇宙をテーマにしたキャラクターのホログラフィック投影を特徴とするフォトリアリスティックなデジタルイラスト。青い壁と都市の景観を背景にした未来的な装いの女性がベッドに座っている。
縫い目のある手足、ボタンの目、黒いリボンで結ばれたツインのピンク髪を持つ不気味でかわいい人形キャラクター。緑の衣装と大きなピンクの蝶ネクタイを着用し、手を頭の後ろに置き、質感のあるティールとベージュの背景に立つ姿。

リアリズム画像

編み込み髪の若い金髪のプリンセスが、森林の空き地での部族のパーティー中に焚き火のそばにしゃがみ込み、背景には焚き火の近くにいる人々がいる。
黒い氷河洞窟の中で、繊細なクリスタルの断片でできた冠をかぶり、凍った滝のようなガウンをまとった、鮮やかなエメラルドグリーンの瞳を持つ女性のリアルな描写。氷青色と銀色の光の屈折で照らされている。
頭を抱え机に座るオフィスワーカー、光るノートパソコンの画面に照らされ、報告書の山と金色の杯のようなエナジードリンク缶に囲まれ、豪華なバロックのカーテンの下にいる。
詳細なSergey Krasovskiy風のスタイルで描かれた、吠えるティラノサウルスが深いジャングルを歩く若い女性を追いかけている様子。
暖かいキャンドルの光で顔の半分が照らされた真っ暗な背景で灯火したキャンドルを持つ女性。
錆びた軍用プロペラ機が海上の空中を飛ぶ詳細なデジタルペイント。回転するプロペラと開いたコックピットに乗客が見え、澄んだ青空に雲が浮かんでいます。
強烈な日差しの中、背の高い草の間に立つそばかすと青い目を持つ赤毛の少女のクローズアップ写真。詳細な自然の特徴とアナログフィルムの粒子効果を示す。
ジャングルの葉と光る植物から現れる光る目を持つ超自然的な女性の顔。彼女の口からは輝く滝が流れ出る、デジタルファンタジーアート。
白髪で黄く光る目を持つ老人の劇的なクローズアップ肖像。詳細な暗色の鎧を着用し、無地の黒背景で丸い盾を持っている。
錆びつき故障したヴィンテージコーヒーメーカーが合成蒸気を放出し、ロボットアームが痙攣しながら染みのあるカウンタートップの上に置かれ、点滅する蛍光灯の下にあります。

セクシー画像

長い黒髪と鮮やかな緑色の瞳を持ち、黒い衣装と赤い花の刺青が施された太ももまでのストッキングを着用し、赤い背景に対して刀を持つスタイライズされたアニメ少女。
魔法の森の中で長い金髪、緑の目、尖った耳を持ち、緻密な緑と金の衣装と冠を身につけた美しいエルフの少女
ミニマリストの反転背景に赤い血が滴るフラットデザインスタイルで、滑らかで光沢のある質感とスポットカラーのハイライトを備えています。
フラットデザインとネオンハイライトを施した、鈍いグレーの背景に光沢のある赤の魅惑的なブラッドソーサレスのシルエット。
鮮やかなオレンジと黒の装飾的な羽毛と装飾で飾られた部族の先史時代の恐竜の詳細な横顔、フラットカラーのスタイルで背景は反転しています。
緑のタイトドレスとティアラを身に着け、満月の下の神秘的な森に立つ銀色の髪の妖精。黄色く輝く翼と彼女を囲む小妖精がいます。
オレンジ色の複雑なフラクタル模様が暗い反転背景に描かれ、パールのようなネオン効果があるフラットデザインスタイルの水中に浮かぶ人魚のイラスト。
暗い反転背景の前で、ネオンオレンジのフラクタルの触手が頭から放射状に伸びるシルエットの罪の女神。フラットでラインアートなしのスタイル。
鮮やかな赤い花のヘッドピースと精巧な装飾品を身に着けた魅惑的な花の女神の肖像。フラットカラーと三色色相の配色で、緑の背景が特徴。
白い編み込み髪を持ち、詳細な青銅の装甲をまとい、三叉槍と斧を持って古代の石造遺跡に立つ凶暴なアマゾン戦士。容積照明の中で。