Flux.1 D - Kojąca atmosfera - v2.0
Powiązane słowa kluczowe i tagi
Zalecane parametry
samplers
steps
cfg
resolution
other models
Wskazówki
Używaj niskiej siły, aby uniknąć zamiany obrazów w potwory z mackami.
Eksperymentowanie z promptami prowadzi zazwyczaj do znanego, kinowego lub sterylnego wyglądu Flux.
Flux nie obsługuje negatywnych promptów ani ważenia promptów, co ogranicza kontrolę nad niechcianymi uprzedzeniami.
Połączenie LoRA z Flux daje świetne wyniki nawet przy realistycznych obrazach po zaledwie 100–200 krokach.
Regulacja siły LoRA od bazy 1 pozwala wybrać konkretne części obrazów bez stosowania całego stylu.
Najważniejsze informacje o wersji
Więcej obrazów
Więcej kroków
eXtReMe!
V.2.0
Dodano więcej obrazów i wyższą liczbę kroków.
Zaleca się używanie niskiej siły, inaczej z jakiegoś powodu wszystko zamieni się w potwora z mackami.
Naprawdę chciałbym, aby wydano wersję Pro Flux, ponieważ ta destylowana wersja jest trudna do kontrolowania i ma ograniczoną elastyczność. Jeśli eksperymentujesz z promptami, zawsze prowadzi to do pewnego obrazu lub czegoś, co model dobrze zna i na czym był trenowany, co skutkuje typowym sterylnym wyglądem Flux (kinematograficznym, fotograficznym, pewnymi zwierzętami lub ludźmi itp.)
Wątpię też, czy jakiekolwiek pełne checkpointy dostępne w sieci naprawdę działają. Przeszedłem przez niemal każdy z nich, ale zawsze kończy się to zepsutą anatomią lub silnym uprzedzeniem, którego nie da się wyeliminować negatywnymi promptami ani ważeniem promptów, ponieważ Flux ich nie używa. Obraz osoby, która jest zawsze naga, nawet jeśli na przykład poprosisz o ubranie. Wątpię, czy to coś dało/robiło to w SDXL, nigdy nie używałem zbyt wielu negatywnych promptów, ale wystarczyło, by pozbyć się rzeczy, których chciałeś uniknąć.
Co dziwne, wszystkie checkpointy trenowane lub LoRAfied z określonym stylem (jak anime) działają świetnie, nawet dla realistycznych obrazów, które używam praktycznie do wszystkich moich zdjęć (nie tutaj, podstawowy checkpoint FP8 do celów pokazowych)... całkiem mylące.
Trenowany na zbiorze danych, który planowałem użyć do SDXL, ale nigdy nie uzyskałem zadowalających wyników. To tylko mały test z kilkoma obrazami (na razie podstawowe podpisy) i tylko 800 kroków. Później zmienię to na język naturalny.
Najczęściej używane słowa to nastrojowy, melancholijny, spokojny, kojący, pogodny, tajemniczy ... oraz różnorodny (obrazy bez podpisu... no cóż, to jest podpis, zapomniałem, że Kohya wybiera nazwę folderu, jeśli nie ma pliku .txt :D)
Kolejność: pierwsze 2 obrazy z LoRA / bez LoRA, potem odwrócona kolejność
Ma większy/mniejszy wpływ w konkretnych przypadkach (na razie)
Przeprowadziłem sporo testów z LoRA Flux, które stworzyłem i uzyskałem naprawdę szalone wyniki. Nawet po 100-200 krokach model rozumie koncepcję, a niższa/wyższa siła od bazowej 1 zawsze robi dużą różnicę, ale coś zawsze zostaje i daje wrażenie, że możesz wybrać konkretne części obrazów, na których był trenowany, bez używania całego obrazu (np. chcesz tylko żółte ubrania, ale nic więcej)
Jak dotąd zrobiłem około 30 LoRA (tylko do testów) i to, co można osiągnąć z zaledwie kilkoma obrazami, jest zdumiewające.
Może to przypadek, kto wie.
Szczegóły modelu
Dyskusja
Proszę się log in, aby dodać komentarz.
