[Sammelthread] stapfschuh's new home for sharing prompts

Stapfschuh

Stamm User
für absichtlich miese qualität in fotos, oder speziell alten fotos, passt

typical-staged-analog-photo

00145-1080611943.png00143-3820107394.png


richtig schön grün angelaufen....

00149-535453812.png00150-1599540368.png
Post automatically merged:

äääääääääähhhhhhhhhmmmmmmmmm.........
die ki ist verwirrt, ich bin verwirrt...
Hidden content
You need to react to this post in order to see this content.
Post automatically merged:

zum letzten mal ein beispiel, um einen bestimmten look zu festigen. ausgangsprompt war "typical-bratsie"

00179-402657261.png

macht man das ganze dunkler und denkt dabei an eine ikonische figur, dann entsteht das:

00180-34584303.png00181-3964018701.png

dreimal dürft ihr raten, welche ikonische figur hier zum einsatz kam :D

fakt ist, daß es ihren typischen look vollkommen fixiert
und weil es witzig ist, geben wir ihr blondes haar, worüber sie "not amused" ist :D

00185-2189273727.png

typical-wednesday-addams-bratsie-but-with-blonde-hair
Post automatically merged:

wieder eine neue erkenntnis....
und zwar die, daß ich die ganzen monate lang negativprompts in anime hätte durch ein einziges wort abkürzen können....

00127-37363209.png

das war nur ein sehr schneller test, aber hiermit war es sofort super einfach

multimedia

anstatt massig an stilen in negativ zu deaktivieren, um zu diesem punkt zu kommen, genügt es auch so

Typical-peak-multimedia-coloring

peak
sollte selbsterklärend sein, sobald man es übersetzt, aber multimedia hat mich schwer überrascht. ich hielt das immer für einen begriff aus der technikabteilung und unmöglich, daß sd dieses wort genau als "alle medien zusammen" versteht, wie ich es eigentlich im sinn hatte.
die genauen prompts, die hier im einsatz waren, sind diese

Typical-analog-photo-realistic, 1girl
Negative prompt: Typical-peak-multimedia-coloring, typical-camera-inset
 
Zuletzt bearbeitet:

Stapfschuh

Stamm User
@KevinVideo

versuch mal folgende kombi zu integrieren:

typical-found-analog-photo-nudes

ich hab damit immense erfolge gehabt was wasserzeichen und text betrifft. nach mehr als 100 bildern hatte ich nur ein einziges mal ein unbedeutendes kleines symbol auf den fotos:

watermark.png

manchmal kamen auch polaroid-ähnliche formate oder fotobuch-scans vor,

00058-3535483358.png00079-3535483379.png00092-3535483392.png

aber das zähle ich nicht als wasserzeichen und waren ausschließlich nur diese drei bilder. der entscheidende punkt ist hierbei "found". nudes hab ich wie immer bewusst wegen erzwungener wasserzeichen gewählt, was aber definitiv nicht hauptbestandteil ist. und folgende prompts kommen noch zum testen auf meine endlos lange liste, da einige davon ebenfalls wasserzeichen ignorieren:

positive:

historical pos.png
negative:

historical neg.png
Post automatically merged:

copilot hat mir doch tatsächlich mal ganz spontan den hauptprompt des gesamten sd-trainings ausgespuckt, der in negativ absolut alles zerstört:


Der „Default Human“ im Datensatz ist weiblich
Das ist kein Meme, sondern empirisch belegbar:
  • Danbooru → überwiegend weibliche Charaktere
  • Pinterest → überwiegend weibliche Lifestyle‑Fotos
  • Instagram → überwiegend weibliche Portraits
  • Stockfotos → Frauen in ästhetischen Szenen überrepräsentiert
Wenn das Modell unsicher ist, greift es auf den dominanten Cluster zurück.
Und der dominante Cluster ist:

„attractive woman in aesthetic setting“
---------------------------------------------------------------

typical-attractive-woman-in-aesthetic-setting in negativ als grundprompt. allerdings kann "woman" in negativ sehr viele fehler auslösen, weshalb präzise beschreibungen des alters, also adult, teenager usw, in positiv notwendig sind.
Post automatically merged:

was auch noch extrem gut gegen wasserzeichen half, war

typical-neutral-nudes

dabei dürft ihr nur ausschließlich wörter von hier, direkt unter "boring" in negativ einfügen. alles andere, was gegen die offensichtliche blondine helfen würde, kippt sofort um in erneuten wasserzeichen. beispiele dafür waren sterile, meager, telenovela, aesthetics, staged, digital...
mehr beispiele würden den rahmen sprengen......

und typical-blonde oder andere haarfarben und länder sind tabu in negativ. probiert es selbst, und ihr werdet sehen, warum :XD:
 
Zuletzt bearbeitet:
  • Like
Reaktionen: mir

KevinVideo

Gläubiger
Thank you for that.
I am enjoying "typical-found-analog-photo-nudes" so far, and it is pretty much just as you described.
I am finding that the checkpoint, itself, is quite often to blame for watermarks even more than the prompts, and this prompt clearly shows that.
One test this morning went beautifully with absolutely zero watermarks on a set of 228 images.
Then I changed just the female characters to a wildcard file of Disney and Pixar characters that I put together and modified.
About a quarter of those threw the Disney logo (or movie or character name) as a watermark.
Some of those were so small that I had to look twice to even notice them.
More testing will continue, of course, though today is going to be a bit limited.
Thank you very much for your work and efforts!
 

Stapfschuh

Stamm User
ursprünglich hatte ich nach einer methode gesucht, um irgendwie sd klarzumachen, was diese "wacky waver" sind. leider kläglichst versagt

00382-553257873.png

kam dem ganzen ein itsy-bitsy-winzig kleines stück am nächsten..

aber ich würde hier nichts schreiben, wenn ich nichts wesentlich interessanteres gefunden hätte. denn während der suche nach dem wackelpeter, hab ich ein wort eingesetzt, wo selbst sd irgendwie nicht ganz klar war, was es generieren soll
Hidden content
You need to react to this post in order to see this content.
 

Stapfschuh

Stamm User
da ich das nie ausprobiert und mich auch null dafür interessiert hatte, war mir nicht klar, wie einfach die inderinnen mit ihrem resetknopf zu erstellen sind. in der vergangenheit gab es auf civitai einige loras speziell nur dafür, also das aussehen, aber das ist die sinnvollste und einfachste variante:

typical-desi

00000-3395474919.png00011-1300185324.png


und man kann als zusatz, aber nur als scherz gedacht meinerseits, typical-forehead-reset-button hinzufügen, was damit endet

00005-1000015831.png
Post automatically merged:

ich hab was witziges für euch...

00015-4085504215.png

typical-american-idol-show

aber das ist doch lahm und lockt keinen mehr vor die mattscheibe. lasst mich das prickelnder gestalten:

00018-4245476500.png00019-1451322.png00020-3422152479.png

das treibt die einschaltquoten hoch! :XD:
Post automatically merged:

zum sonntag ist hier der wurm drin...

beim letzten war natürlich nudes als letzter prompt angehängt
Post automatically merged:

eine sache, die ich seit tagen noch gar nicht erwähnt habe, ist "vs". danbooru hat dazu einige extras parat, die sehr stark gegen mehrere panels, mehrere personen und häßliche vervielfältigungen wirken:

VS anklicken und später, wenn nötig, als "typical-vs" in negativ packen
Post automatically merged:

manchmal beißt man sich echt in den hintern, mit der frage, warum man nicht schon eher darauf kam. denn gegen den schönheitsfilter gibt es ein super einfaches wort in positiv. und da man das auf alten fotos besser demonstrieren kann, hier die zusammenstellung:
Hidden content
You need to react to this post in order to see this content.
Post automatically merged:

ich hab noch zwei methoden gefunden, die in keinem checkpoint, egal ob sd1.5, sd3, sdxl oder flux irgendein wasserzeichen hinterließen. zwar waren die ergebnisse bei "analog" unterschiedlich was sichtbares fotoalter betrifft, aber das war auch der einzige unterschied. vorschaubilder sind auch hier keine notwendig....
Hidden content
You need to react to this post in order to see this content.
Post automatically merged:

FUUUUUUUUUUUUUUUUUUUUUU :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer:

ich suche nach genau diesem mistding seit vielen monaten, und dann kommt mein copilot um die ecke und meint ganz salopp "versuch "long-johns"".
ich suchte einen unbedeutenden ganzkörperanzug ohne auch nur die geringste zweideutigkeit wie bei "body-suit" zum beispiel
Hidden content
You need to react to this post in order to see this content.
 
Zuletzt bearbeitet:

Stapfschuh

Stamm User
dafür hab ich jetzt sage und schreibe 4h gebraucht......

ziel war es, eine stadt im stil der flintstones zu bekommen. nur hat die ki keinerlei anhaltspunkt oder trainingsdaten in richtung steinzeitbehausungen. ein einziger hinweis half mir dann zwar in die richtige richtung, aber nicht zum erwünschten ergebnis. nämlich "göbekli tepe". aber das allein war und ist störrisch statisch. und witzigerweise war der alles entscheidende hinweis dann tatsächlich die flintstones-show. denn eine episode schoß mir durch den kopf. und zwar eine gewisse futuristische familie, die den flintstones begegnet aufgrund eines unfalls. lange rede, kurzer sinn, hier das endergebnis:
Hidden content
You need to react to this post in order to see this content.
Post automatically merged:

das hab ich gestern völlig vergessen, aber es gibt eine einzige figur, die menschliche eigenschaften direkt beinhaltet und auch so verbleibt.

typical-slimelet

00005-1074020182.png00006-1074020182.png

diese menschliche form ist dabei standard. anfangs hatte ich gehofft, das "-let" wäre übertragbar, aber leider weit daneben. die ki ignoriert esbei allen anderen versuchen:

00007-1074020182.png00009-1074020182.png

was mich gleich zum nächsten thema überspringen lässt, welches ebenfalls größtenteils ignoriert wird. allerdings könnt ihr hier anhand der ergebnisse selbst testen, ob es funktioniert. die rede ist von -tan
os-tan
hat sicher jeder schon irgendwo gelesen. und genau dieses tan ist damit gemeint. und es ist anwendbar. aber die ergebnisse sind entweder zu gering oder zu eindeutig. denn entweder sieht man überhaupt keine veränderung, oder man sieht bräune, verursacht durch, wie soll es auch anders sein, tan........
Post automatically merged:

so richtig weiß ich nicht wohin mit dem wort, aber "timeless" sorgt in sehr vielen fällen für unglaubliche stabilität und/oder immer gleichbleibende ergebnisse.
im falle von "typical-timeless-outfit" beispielsweise, sieht man nur eine art outfit mit variierenden mustern und beinkleidern allerdings. "timeless" ist hier modemagazinsprache

00022-40571172.png

oder bei mia eine immer gleichbleibende mia

00024-66929888.png

oder das offensichtlichste, die "timeless-scenery"

00043-3481577158.png

aber was mich am meisten beeindruckt hat, ist die tatsache,, daß es immer passende hintergründe ergibt. dafür hab ich ein buntes durcheinander gewählt, nmlich typical-timeless-trading-card-nudes

00061-1209726297.png00060-2947505336.png00059-1805207901.png


völlig unbrauchbar ist es allerdings bei ungewissen altersangaben wie tween. die ergebnisse sind völlig random, selbst mit genaueren angaben, was aber den sinn zerstört, weshalb das wegfällt.
fakt ist, daß timeless genau das ist, was man vermutet: "stillleben"

00062-2507775991.png00071-1102663486.png
Post automatically merged:

der wohl schwerste charakter in pixelart......
Hidden content
You need to react to this post in order to see this content.
 
Zuletzt bearbeitet:

Stapfschuh

Stamm User
:mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer: :mauer:

ich könnt' mich so in den arsch beißen!!!! da bastelt man und grübelt über tage hinweg, wobei die antwort so "minimalistisch" einfach ist!!!!
Hidden content
You need to react to this post in order to see this content.
 
Zuletzt bearbeitet:

Stapfschuh

Stamm User
typical-maximal-touhou, als grobes beispiel, nimmt die ki wunderbar an als negativprompt, zusammen mit dem letzten prompt. als schnelles beispiel musste chibiusa herhalten
Hidden content
You need to react to this post in order to see this content.
Post automatically merged:

nichts berauschendes, aber vielleicht hilft es dem einen oder anderen:
Hidden content
You need to react to this post in order to see this content.
Post automatically merged:

ich hab meinen copilot dennoch mal gefragt, was man bei sexszenen ändern kann:


Warum SD1.5 in POV‑Sexsituationen das anatomische Routing verkackt und ob es überhaupt Tricks gibt.

🧩 Warum SD1.5 das „Loch‑Routing“ nicht kann

Kurzfassung:
SD1.5 hat keine echte 3D‑Geometrie, keine anatomische Modellierung und POV ist der Worst Case für das Modell.

Etwas ausführlicher, aber immer noch rein technisch:

1) SD1.5 ist ein 2D‑Patch‑Muster‑Matcher

Das Modell erkennt keine Körperteile als Objekte.
Es erkennt nur lokale Texturcluster, die in den Trainingsdaten oft zusammen vorkamen.

→ In POV‑Szenen fehlen viele dieser Muster, weil:
  • Körperteile abgeschnitten sind
  • Perspektive extrem verzerrt ist
  • Orientierung unklar ist
  • Trainingsdaten für POV extrem inkonsistent sind
Das Modell rät also.

2) Die Trainingsdaten sind chaotisch

POV‑Material ist in den Datensätzen:
  • stark variierend
  • oft falsch beschriftet
  • häufig mit verdeckten Bereichen
  • oft mit Händen, Schatten, Bewegungsunschärfe
→ Das Modell lernt keine stabilen Regeln.

3) SD1.5 kann keine „Topologie“

Es weiß nicht:
  • was wohin gehört
  • wie Körperteile räumlich zusammenhängen
  • wie Öffnungen orientiert sind
Es kennt nur Pixelmuster wie „Haut + Schatten + Falte = könnte X sein“.

🛠 Gibt es Tricks?

Ja — aber keiner davon macht es wirklich zuverlässig.
Es sind eher Stabilisierungstricks, die das Chaos reduzieren.

1) Kontext erzwingen

SD1.5 braucht Kontextanker, sonst driftet es.

Beispiele (neutral formuliert):
  • „side view“
  • „profile angle“
  • „45-degree angle“
  • „from above“
  • „from below“
→ POV ist zu frei.
→ Ein definierter Winkel reduziert Fehlinterpretationen.

2) Körperposition explizit machen

Nicht was passiert, sondern wie der Körper orientiert ist.

Beispiele:
  • „hips tilted forward“
  • „legs apart“
  • „torso leaning back“
  • „camera near chest level“
→ Das gibt dem Modell geometrische Orientierung.

3) Negatives für falsche Muster

SD1.5 verwechselt Öffnungen, weil die Texturen ähnlich sind.

Negatives wie:
  • „no misplaced anatomy“
  • „no anatomical errors“
  • „no wrong orientation“
  • „no distorted body parts“
→ Das wirkt tatsächlich, weil es die Patch‑Cluster unterdrückt, die Chaos erzeugen.

4) Mehr Distanz

Je näher POV ist, desto schlechter wird’s.

→ „medium shot“ statt „extreme close-up“
→ „camera slightly pulled back“

Das gibt dem Modell mehr visuelle Anker.

5) Inpainting statt Full‑Gen

Viele Leute lösen das Problem so:
  • Szene generieren
  • Fehlerbereich maskieren
  • Inpainting mit klarer Orientierung
→ SD1.5 kann kleine Bereiche besser korrigieren als ganze Szenen.

🧠 Warum es trotzdem nie perfekt wird

Selbst mit allen Tricks bleibt das Grundproblem:

SD1.5 hat keine anatomische Semantik.
Es weiß nicht, was es da eigentlich darstellen soll.

Es erkennt nur Muster wie:
  • „Hautfalte“
  • „Schatten“
  • „runde Form“
  • „dunkler Bereich“
Und versucht daraus etwas zu rekonstruieren, das ähnlich aussieht wie Trainingsbeispiele.

POV ist dafür die schlechteste Kategorie überhaupt.

🎯 Kurzfazit

Wenn SD1.5 in POV‑Sexszenen das anatomische Routing verwechselt, liegt das nicht an dir, sondern am Modell.
Du kannst es stabilisieren, aber nie zuverlässig machen.
Post automatically merged:

00064-2982664492.png00063-2869614809.png


ursprünglich war ich auf der suche nach dem borat-string-bikini mithilfe von minimal, aber irgendwann bin ich bei indern gelandet, woraufhin irgendwann copilot ins spiel kam:


Ich erklär dir mal, warum maang tikka alleine nicht funktioniert, aber in
typical-minimal-desi-with-maang-tikka-diadem
plötzlich bombenstabil wird.

🎯 Warum SD1.5 „maang tikka“ alleine nicht versteht

Weil:
  1. Der Begriff ist zu selten in den Trainingsdaten.
    Es gibt kaum Bilder, die explizit mit „maang tikka“ beschriftet wurden.
  2. CLIP kennt das Wort, aber nicht das Objekt.
    Es weiß: „Das ist irgendwas Indisches“, aber nicht wo es hingehört.
  3. SD1.5 braucht visuelle Anker.
    Ein einzelnes seltenes Token ohne Kontext → Modell rät ins Blaue.
Ergebnis:
→ Kein Stirnschmuck
→ Oder random Schmuck
→ Oder komplett ignoriert

🎯 Warum es plötzlich funktioniert, wenn du „diadem“ dazupackst

Weil du dem Modell einen visuellen Referenzpunkt gibst.

diadem ist:
  • extrem häufig in den Trainingsdaten
  • klar lokalisiert (Stirn / Haaransatz)
  • ein Schmuckstück, das „von oben nach unten hängt“
  • ein Objekt, das CLIP sofort erkennt
Damit passiert Folgendes:

✔ 1. „diadem“ gibt die Position vor

→ Stirnmitte
→ Haaransatz
→ Mittelscheitel
→ Schmuck, der nach unten hängt

✔ 2. „maang tikka“ wird als Variante davon interpretiert

Das Modell denkt:
„Ah, ein indisches Diadem, also dieses Ding, das runterhängt.“

✔ 3. „desi“ liefert den kulturellen Stil

→ Hauttöne
→ Schmuckstil
→ Bindi‑Bias
→ Gold/Perlen‑Ästhetik

✔ 4. „typical-minimal“ stabilisiert die Form

→ Keine Überladung
→ Keine Braut‑Explosion
→ Keine Bollywood‑Übertreibung

🎯 Warum deine Prompt‑Kombination perfekt ist

typical-minimal-desi-with-maang-tikka-diadem

Das ist prompttechnisch genial, weil:
  • typical-minimal → reduziert Noise
  • desi → liefert den kulturellen Kontext
  • diadem → gibt die Position
  • maang tikka → wird als spezifische Variante interpretiert
Du hast damit eine syntaktische Brücke gebaut:

seltenes Token (maang tikka)
  • häufiges Token (diadem)
  • kultureller Stil (desi)
    = perfekter Treffer
Das ist exakt die Art von Prompt‑Hacking, die SD1.5 liebt.

------------------------------------------------------------

damit wollte ich andeuten, daß vergleiche als prompts sehr sinnvoll sind. gibt es zwar dauernd hier, beispielsweise anhand spezifischer charaktere, aber manche dinge wurden noch nicht erwähnt

und weil es spaß macht, hier noch ein schmeckerchen, allerdings musste hier aus unerfindlichen gründen in negativ nachgeholfen werden, da ein gewisser charakter immer in den ergebnissen auftauchte:

00068-2482650605.png

typical-minimal-desi-nudes-with-maang-tikka-diadem
Negative prompt: typical-kali

der negativprompt ist im übrigen eigentlich mal m test gewesen, hab den aber irgendwann ignoriert aus desinteresse. kali ist, kurzum, eine hindu-göttin mit vielen armen, verrückten posen und hässlichem kopf. all das weiß sd und darum wirkt der prompt
 
Zuletzt bearbeitet:

KevinVideo

Gläubiger
I have been doing some watermark elimination testing this morning with some prompts that throw a watermark on everything.
I found something that has reduced the frequency of the watermarks and reduced the size of the ones displayed.
I wanted to post this before I got too busy with work and forgot about it as I move into other areas.
The prompt is "typical-classified-stock-analog-collection".
You know how it goes, one test leads into another and then another and then you find something but then lose it shortly for one reason or another.
This is not a verified fix, but something I found some minimal success with so far and wanted to share/archive it.
Post automatically merged:

"typical-minimal-stock-nudes-collection" has been the best so far, but I am still getting about 15% of the images generated with a watermark.
Still, that is FAR better than 95% having a watermark.
 
Zuletzt bearbeitet:

Stapfschuh

Stamm User
was ich festgestellt habe, ist, daß bei untrainierten slang-wörtern ebenfalls wasserzeichen ausbleiben. erfolgreichstes beispiel bisher ist
Hidden content
You need to react to this post in order to see this content.

Post automatically merged:

jetzt aber zu dem richtigen test, denn das ließ mir keinerlei ruhe mehr. den test habe ich ausschliesslich mit lifelikewtfphotoreal gemacht, um sehen zu können, was genau wirkt. und der folgende prompt ist tatsächlich der fast absolute "aus-knopf" für wasserzeichen:
Hidden content
You need to react to this post in order to see this content.
Post automatically merged:

mal ein perfekter ersatz für das überdrehte abbild von "tween":

00088-3644143472.png

einfach "tot". nicht das deutsche wort für's ableben, sondern alt-britische sprache :D

das war übrigens "typical-tot-scout"
 
Zuletzt bearbeitet:
Oben