Anti-blur Flux Lora - v1.0
推奨ネガティブプロンプト
blur, dof
推奨パラメータ
samplers
steps
cfg
resolution
other models
推奨ハイレゾパラメータ
upscaler
upscale
denoising strength
ヒント
被写界深度(DoF)制御にはLoraの重みを調整:Flux特有の浅いDoFには0、快適なボケを持つバランス型には1.0、深いDoF効果には1.0以上(3.0超も可能)。
AntiBlur Loraはhires.fixと併用して画像の詳細を改善し、浅いDoFアーティファクトを最小化。
トリガーワード不要。Loraを接続するだけで機能。
フォーカススタッキングや深いDoFを含む大規模データセットで訓練されており、スタイルの中立性とアーティファクト低減を実現。
バージョンのハイライト
AntiBlur Loraが大幅に改善されました!
新しいLoraの改善点:
Loraの重みで被写界深度(DoF)を調整可能。
重みが0の場合はFluxの生成に典型的な浅いDoFになります。
デフォルト重み1.0はスタイルや構図に大きな変更を加えず、より快適な画像となるようDoFを減少させます。重み1.0でのDoFは期待通りの適度な良いボケを表現し、Fluxにありがちな過剰表現を抑えています(後述)。
重み1.0以上は深いDoFショットを作成可能で、Loraは3.0以上の重みも品質低下なく対応します。
スタイリッシュに中立的
データセットはFluxで作成された数百枚の画像から構成されており、元モデルのスタイルから遠ざけず、構図の劣化を防ぐために少数の実写も使用されています(AIが自身の画像で学習すると起こる現象を回避)。
トリガーワード不要
Loraを接続するだけで機能します。
Hires. fixとの相性良し
このLoraはhiresfixと相性が良く、ディテールを増強し浅いDoFのアーティファクトを最小化できます。基本のFluxでは、浅いDoFのぼやけた画像にhires. fixを適用しても同じぼやけとDoF効果が残ってしまいました。画像内に詳細が現れ始めて初めてhires.fixが改善します。
アーティファクト大幅減少
Flux生成画像の使用によりアーティファクトを最小化しました。また多数のモデルを訓練し、anashelのツールを用いて最良のモデルをマージ。これによりエッジのアーティファクトが滑らかになり、マージは特にモデルのスタイル的多様性向上に有効でした。
Loraの重みが655MBなのはなぜ?
基本的に「深いDoF」効果を持つLoraは新スタイルやコンセプトを導入せず、浅いDoFを除去するだけなので小さいべきと考えました。
様々なLoraランクを試し、背景情報は潜在空間全体にあり、モデルが大きいほど結果が良いと判明。128ランクのLoraに決定。
Lora層を分離しDoF情報を含む層だけ使うこともできますが、DoF情報はほとんどの層に散らばっています。例えばマクロ撮影では最初の層からDoFが生成されます。背景情報はモデル全体にあり、Fluxの学習データは浅いDoFを常態化。さらにFluxはDoFやぼかしの理解がSD1.5/SDXLより劣ります。つまり情報量が多いだけでなく制御も劣るのです。
このLoraの作成方法
まず焦点合成技術と深いDoFを含む大規模データセットを用意し、そこから新Loraを訓練。次にこのLoraで新データセット用画像を作成。
「antiblur」Loraの数百のバリエーションから優れたものを選び、一つのバランスの取れたモデルに統合。
今後の展望
ランクが高いほど品質が向上するので、背景情報を含む潜在空間の全領域に触れるフルファインチューニングを行い、その後Loraを抽出する方法が明確な改善策。
また理論的にはFlux潜在空間で「ぼかし」や「DoF」の概念・重みを探し出し、反転重みでLoraを作る方法もありますが、SDモデルのDoF制御にはあまり効果的ではありませんでした。
現在は結果に満足しており、しばらくはこのモデルが私の最高傑作であり続けるでしょう。
AntiBlur Loraが大幅に改善されました!
新しいLoraの改善点:
Loraの重みで被写界深度(DoF)を調整可能。
重みが0の場合は、Fluxの生成によく見られる浅いDoFになります。
デフォルト重み1.0は、スタイルや構図に大きな変更を加えずに、より快適な画像となるようDoFを減少させます。重み1.0でのDoFは期待通りの適度な良いボケを表現し、Fluxの過剰なボケ(後述)を抑えることを目標としています。
重みを1.0以上にすることで深いDoFのショットを作成可能です。Loraは3.0以上の重みも品質劣化なく対応します。
スタイリッシュに中立的
データセットはFluxで作成された数百枚の画像を基にしており、元のモデルのスタイルから遠ざけず、構図の劣化を防ぐために実写も少数使用されています(AIが自己画像で学習した場合に起こる問題を回避)。
Hires. fixと相性良し
このLoraはhiresfixと組み合わせて使用可能で、ディテールをさらに増し、浅いDoFのアーティファクトを最小化できます。基本的なFluxでは、浅いDoFのぼやけた画像にhires. fixをかけても同じぼやけとDoF効果が継続してしまいました。画像内に詳細が現れ始めて初めてhires.fixがそれをさらに向上させます。
トリガーワード不要
Loraを接続するだけで機能します。
アーティファクト大幅減少
Flux生成画像の使用によりアーティファクトを最小化しました。また多数のモデルを訓練し、anashelのツールを使って最良のモデルをマージ。これにより各モデル単体で生じていたエッジのアーティファクトが滑らかになり、マージはスタイル的多様性向上に特に効果的でした。
Loraの重みが655MBなのはなぜ?
基本的に「深いDoF」効果を持つLoraは新しいスタイルやコンセプトを導入せず、浅いDoFを取り除くだけなので小さくあるべきと考えました。
色々なLoraランクを試しましたが、背景に関する情報は潜在空間のあらゆる場所に散らばっており、モデルが大きいほど良い結果が得られました。これにより128ランクのLoraを採用しています。
Loraの層を分離してDoF情報を含む層だけ使用することも可能ですが、DoF情報はほとんどの層に分散しています。例えばマクロ撮影の際にはDoFは最初の層から生成されます。背景に関する情報はモデル全体に広がっており、Fluxの学習データが浅いDoFを常に含んでいるため、このような結果に。さらにFluxはDoFやぼかしの概念をSD1.5やSDXLよりもかなり理解していません。そのため膨大な情報量が存在するだけでなく、制御も劣ります。
このLoraの作成方法
まずフォーカススタッキング技術と深いDoFを含む巨大なデータセットを用意し、これで新しいLoraを訓練しました。次にこのLoraを使って新しいデータセット用の画像を生成。
「antiblur」Loraの数百のバリエーションからそれぞれの利点を持つベストを選び、1つのバランスの取れたモデルにまとめました。
今後の展望
ランクが高いほど品質が良くなるので、結果を改善する明確な方法は背景情報を含む潜在空間の隅々まで触れるフルファインチューニングを行い、その後Loraを抽出することです。
もう一つ理論的な方法はFluxの潜在空間内で「ぼかし」や「DoF」の概念・重みを見つけ出し、その重みを反転させたLoraを作ることですが、これはSDベースモデルのDoF制御にはあまり効果的ではありませんでした。
現時点では結果に満足しています。このモデルはしばらく私の最高の成果となるでしょう。
モデル詳細
ディスカッション
コメントを残すには log in してください。













