[Sammelthread] stapfschuh's new home for sharing prompts

Stapfschuh

Stamm User
war jetzt gerade mal nachsehen, was civitai so treibt, und sah dieses kran-dingens. da hat wohl jemand mit dem völlig falschen ansatz ein training gestartet
Hidden content
You need to react to this post in order to see this content.
Post automatically merged:

ich weiß es ist viel, ich weiß das es nervt, aber für den fall, daß ihr mal irgendwo nicht weiterkommt und antworten sucht, dann ist -das- eure beste anlaufstelle. und sollte das nicht reichen oder ihr steckt irgendwo fest bei euren prompts, dann fragt, nervt, quält!
Post automatically merged:

schaut mal, wie aus einem missverständnis noch was rauszuholen ist, was vorher mit aufwand erreicht wurde:

00135-785841732.png00134-73750986.png00133-920739753.png00132-2485164568.png

typical-glass-parison

eigentlich wollte ich den glasblob, also das geschmolzene glas. daraus wurde

typical-molten-pattern-glass-parison

was witzige effekte am glas ergibt

00149-2059042604.png00151-2703467187.png

und typical-molten-ornaments-glass-parison

was ausschließlich in weihnachtskugeln endet, aber ohne weihnachtseffekt, was praktisch sein kann, da zusätze nerven können

00153-758380061.png00154-1280314662.png

und übrigens:

von wegen zeit für videospiele. das ist so typisch für mich als ergebnis, wenn der kopf tausende ideen "auskotzt"
 
Zuletzt bearbeitet:

Stapfschuh

Stamm User
00153-2139373386.png
eine heiße diskussion zwischen mir und copilot, daß man audio-prompts ebenfalls umschreibend einsetzen kann als kurzform für einen normalerweise größeren akt. hierbei lautete der prompt schlicht typical-acappella


GENAU DAS ist der Punkt – und dein Bild bestätigt perfekt, wie SD1.5 intern tickt.
Du hast mit typical-acappella einen reinen Fantasie‑Token erzeugt, und SD1.5 macht dann Folgendes:

🎯 SD1.5 erkennt nicht „a cappella“ – aber es erkennt das Muster „Performance / Singing“

Der Token acappella existiert in SD1.5 nicht als Wortbedeutung, aber:
  • er klingt wie etwas Musikalisches
  • er co‑occurrt in LAION‑Captions mit Dingen wie „performance“, „singer“, „concert“, „stage“
  • er wird vom Modell in den „singing / performing“-Cluster gezogen
Das heißt:

SD1.5 versteht NICHT „a cappella“,
aber es versteht: „Das ist wohl irgendwas mit Singen.“

Und deshalb bekommst du genau das, was du hochgeladen hast:
  • Person
  • Mikrofon
  • Bühne
  • Gesangsakt
  • Performance‑Pose
Aber keinerlei A‑cappella‑Spezifik.

🧠 Warum das passiert (mechanistisch sauber)

SD1.5 arbeitet nicht semantisch, sondern statistisch über Token‑Nachbarschaften.

Der Token acappella wird intern so behandelt:
  • kein definierter visueller Anker
  • kein direktes Bildkonzept
  • aber phonetisch/orthografisch ähnlich zu „a cappella“, „capella“, „capella choir“, „capella performance“
  • diese wiederum tauchen in Captions von Sängern, Chören, Performances auf
→ Das Modell springt in den „singing“-Cluster, weil das der nächstliegende visuelle Bedeutungsraum ist.

Das ist exakt dasselbe Verhalten wie bei:
  • typical-gospel → Sänger*innen, Chor, Bühne
  • typical-opera → Sängerin mit offenem Mund, Bühne, Kleid
  • typical-rap → Mikrofon, Bühne, Handgesten
  • typical-vocalist → Sänger*in, Mikrofon
Auch wenn der Token selbst nicht sauber definiert ist.

🎨 Warum dein Ergebnis so gut aussieht

Weil SD1.5 bei „singing“ extrem viel Trainingsmaterial hat:
  • Konzerte
  • Bühnen
  • Mikrofone
  • Sänger*innen in Pose
  • Studio‑Shots
  • Live‑Performances
Der „singing“-Cluster ist einer der stabilsten im ganzen Modell.

🎯 Fazit

Du hast absolut recht:

SD versteht sehr wohl, dass es ein Gesangsakt ist – aber nur als Akt selbst, nicht als A‑cappella‑Konzept.
Das ist exakt die richtige Interpretation.

------------------------------------------------------------------

soll heißen, daß man nicht immer explizit auf den punkt kommen muß. ab und an kann man auch wortverwandtschaften einsetzen und bekommt ebenfalls das gewünschte ergebnis
 

Stapfschuh

Stamm User
eine überaus und völlig verrückte eigenschaft verursacht der kleine zusatz "character". ursprünglich war das charakterdesign damit geplant, aber das ging schief und führe ich nicht weiter auf. jedenfalls wird durch "character" in anime das handchaos stabilisiert in fast allen fällen. beispiel typical-loli-character, 1girl

00017-1656917133.png

während es in foto-checkpoints immenses chaos verursacht. bewusst getestet mit typical-tween-character, 1girl

00020-663449387.png


für gewöhnlich ist es genau umgedreht, daß anime chaos verursacht und foto es wieder ausbügelt. verantwortlich hierfür, und da muß ich noch nicht einmal copilot danach fragen, ist erneut die mehrdeutigkeit des wortes an sich und die fehlgeleiteten trainingsansätze.

wer jammert wegen "loli" und "tween":

bei kleinen personen ist die ki gezwungen, stärker details zu zeigen. bei erwachsenen und teenagern werden hände deshalb erst gar nicht detailiert gezeigt oder sind viel zu einfach:

00006-1534640563.png
Post automatically merged:

noch ein nebenprodukt von tests mit größen:

gremlins und der grinch passen perfekt ineinander und machen es der ki einfach für die richtige figur

typical-clothed-bipedal-grinch-gremlin

00019-2555425835.png

Post automatically merged:

das ding mit dem cyberpunk-piloten auf civitai ist hiermit einfacher:
Hidden content
You need to react to this post in order to see this content.
 
Zuletzt bearbeitet:

Stapfschuh

Stamm User
eine große auswahl an gegenden, die alle von sd erkannt werden. zumindest alle 20 die ich getestet hatte. nach der 20ten hab ich aufgegeben und kein bock mehr gehabt, den rest auch noch zu testen. das suchergebnis von copilot waren.......


🌍 WELTWEITE ORTSNAMEN, DIE SD1.5 „MISERABLE GEGEND“ AUSLÖSEN


Ich sortiere sie nach Region und Bildwirkung, damit du sofort weißt, was SD1.5 damit macht.


🇺🇸 USA – starke urbane Trigger (ohne Bronx‑Bias)


🔥 1. Compton


Street, Beton, Graffiti, Palmen, kaputte Häuser.
Weniger Mode‑Bias als Bronx.


🔥 2. South Central


Sehr konsistent: breite Straßen, niedrige Häuser, viel Asphalt.


🔥 3. East St. Louis


SD1.5 rendert: verlassene Blocks, Industrie, Rost, Bahnschienen.


🔥 4. Camden


Einer der besten „kaputte Stadt“-Trigger.
Backsteinhäuser, Müll, leere Straßen.


🔥 5. Detroit


Industrie‑Ruinen, verlassene Fabriken, bröckelnde Häuser.
Sehr atmosphärisch.


🇧🇷 Brasilien – ähnlich wie „Favela“, aber mit Variation


🔥 6. Rocinha


SD1.5 kennt es → Hügel, Dächer, enge Gassen.
Wie Favela, aber dichter.


🔥 7. Complexo do Alemão


Noch chaotischer, mehr Kabel, mehr Farben.


🔥 8. Paraisópolis


Etwas geordneter, aber trotzdem „arm + dicht“.


🇲🇽 Mexiko – extrem starke visuelle Identität


🔥 9. Tepito


Straßenmärkte, Chaos, bunte Planen, enge Gassen.


🔥 10. Ecatepec


Hügelige, dichte Bebauung, viel Beton, viel Kabelsalat.


🔥 11. Ciudad Nezahualcóyotl (Neza)


SD1.5 erzeugt: flache Häuser, bunte Fassaden, staubige Straßen.


🇮🇳 Indien – chaotisch, dicht, farbig


🔥 12. Dharavi


Einer der größten Slums → SD1.5 rendert: Blechdächer, enge Gassen, Müll.


🔥 13. Govandi


Ähnlich wie Dharavi, aber etwas industrieller.


🔥 14. Kamathipura


Sehr enge Straßen, viel Neon, viel Chaos.


🇵🇭 Philippinen – extrem fotogen für SD1.5


🔥 15. Tondo


Dicht, chaotisch, viel Müll, viel Blech.


🔥 16. Smokey Mountain


Berg aus Müll, Hütten, graue Atmosphäre.


🇿🇦 Südafrika – Township‑Look ohne harte Klischees


🔥 17. Khayelitsha


Blechhütten, Sand, weite Flächen.


🔥 18. Alexandra


Backstein, enge Straßen, viel Kabel.


🇷🇺 Russland / Osteuropa – Plattenbau, grau, kalt


🔥 19. Norilsk


SD1.5 liebt das: graue Blöcke, Schnee, Industrie.


🔥 20. Magnitogorsk


Stahlindustrie, Rauch, Plattenbau.


🔥 21. Pripyat


Verlassen, überwuchert, ikonisch.


🔥 22. Novi Beograd


Brutalismus, Beton, riesige Blöcke.


🇬🇧 UK – Sozialbau, Regen, Beton


🔥 23. Moss Side


Backstein, Regen, graue Straßen.


🔥 24. Brixton (ältere Trainingsdaten)


Graffiti, Märkte, enge Straßen.


🔥 25. Hackney (pre‑gentrification)


Backstein + Graffiti + Müll.


🔥 26. Toxteth


Sehr „britisch heruntergekommen“.


🇫🇷 Frankreich – Banlieue‑Look


🔥 27. Seine‑Saint‑Denis (93)


Hochhäuser, Beton, graue Fassaden.


🔥 28. La Courneuve


Sehr ikonische Plattenbauten.


🔥 29. Clichy‑sous‑Bois


SD1.5 rendert: graue Blocks + viel Himmel.


🇩🇪 Deutschland – unterschätzte, aber extrem stabile Trigger


🔥 30. Marzahn


Plattenbau, grau, kalt, sehr konsistent.


🔥 31. Gropiusstadt


Hochhäuser, Beton, 70er‑Look.


🔥 32. Chorweiler


Große Blöcke, viel Beton, wenig Farbe.


🔥 33. Halle‑Neustadt


Plattenbau + DDR‑Charme.


🔥 34. Chemnitz‑Sonnenberg


Altbau + Graffiti + leichte Verwahrlosung.


🧨 BONUS: Orte, die nicht schlecht sind, aber SD1.5 trotzdem „rough“ rendert


Diese sind Gold wert, weil sie keine Klischee‑Fallen haben:


🔥 35. Kowloon


SD1.5 kennt die alte Walled City → extrem dicht, neon, cyberpunkig.


🔥 36. Naples backstreets


Enge Gassen, Wäscheleinen, Roller.


🔥 37. Palermo Ballarò


Märkte, enge Gassen, mediterranes Chaos.


🔥 38. Valparaíso hills


Bunte Häuser, steile Straßen, Graffiti.


🔥 39. Tbilisi outskirts


Sowjetblöcke + Hügel + Kabel.


🔥 40. Ulaanbaatar ger district


Jurten + Staub + improvisierte Hütten.



-------------------------------

im übrigen fällt auf, daß copilot seit einiger zeit sehr extreme rechtschreib- und satzbaufehler macht. ein sogenannter "fehlerfreier" roboter......
 
Oben