Flux.1 D - 落ち着いた雰囲気 - v1.0
推奨パラメータ
samplers
steps
cfg
resolution
other models
推奨ハイレゾパラメータ
steps
ヒント
不要な触手のような歪みを避けるために低い強度設定を使用してください。
LoRAのファインチューニングで学習画像の特定特徴を選択でき、ユニークな画像の組み合わせが可能になります。
フルトレーニング済みチェックポイントは偏りや解剖学的誤りが多いため、より良い結果のためにはLoRAスタイルのモデルを使用してください。
一般的なテーマキーワードは、atmospheric、moody、calm、soothing、serene、mysteriousで、最良の結果を得られます。
V.2.0
画像を増やし、ステップ数も増加しました。
低強度の使用を推奨します。でないと何らかの理由で全てが触手モンスターになってしまいます。
FluxのPro版をぜひ出してほしいです。この蒸留版はコントロールが難しく、柔軟性も制限されています。プロンプトをいじっても、特定の画像やトレーニング済みの良いものに必ず行き着き、Flux特有の無菌的な外観(シネマティック、写真、特定の動物や人など)になります。
また、トレーニング済みのフルチェックポイントはおそらくほとんど機能しません。ほぼ全て試しましたが、必ず解剖学的におかしかったり、強いバイアスがあり、Fluxはネガティブプロンプトやプロンプトの重み付けを使わないため回避できません。例えば、服をお願いしても常に裸の人物画像など。SDXLでそれが効果があったかは疑わしいですが、私自身ネガティブプロンプトはあまり使いませんでしたが、回避する効果はありました。
不思議なことに、スタイル(例えばアニメ)のついたトレーニング済みやLoRA化されたチェックポイントは、リアルな画像でもよく機能します。私は基本的に全ての画像に使用しています(ここでは基本のFP8チェックポイントをショーケース用に使用)…混乱しますね。
SDXL用に使う予定だったデータセットでトレーニングしましたが、満足のいく結果は得られませんでした。少数の画像(とりあえずの基本的なキャプション)と800ステップのみの小テストです。後で自然言語に変更予定です。
よく使う単語は、atmospheric、moody、calm、soothing、serene、mysterious、そして assorted(キャプションのない画像、キャプションとしてカウントされることを忘れていました。Kohyaは.txtファイルがない場合フォルダ名を名前に取るので :D)です。
順序:最初の2枚はLoRAあり/なし、その後は逆順です
特定のケースで影響が大きい/小さいことがあります(現時点)
これまでに作ったFlux LoRAでかなりのテストを行い、非常にクレイジーな結果が得られました。100〜200ステップ程度でもコンセプトが掴め、基本の強度1を上下することは常に大きな影響を与えますが、何かが常に残っていて、学習した画像の特定部分だけを選べる感じがします(例えば黄色の衣服だけが欲しいけど他は含まないなど)
これまでに約30のLoRAを作成しました(テスト目的のみ)少数の画像でできることが驚異的です。
単なる偶然かもしれませんが、誰にも分かりません。
モデル詳細
ディスカッション
コメントを残すには log in してください。