{"id":166,"date":"2026-06-02T01:24:35","date_gmt":"2026-06-01T23:24:35","guid":{"rendered":"https:\/\/www.brunzel.info\/?p=166"},"modified":"2026-06-02T01:43:35","modified_gmt":"2026-06-01T23:43:35","slug":"acht-drei-ein-3d-comic-und-ein-joint-gegen-die-tuecken-der-video-ki-ltx-2-3","status":"publish","type":"post","link":"https:\/\/www.brunzel.info\/index.php\/2026\/06\/02\/acht-drei-ein-3d-comic-und-ein-joint-gegen-die-tuecken-der-video-ki-ltx-2-3\/","title":{"rendered":"Acht-Drei: Ein 3D-Comic und ein Joint gegen die T\u00fccken der Video-KI LTX 2.3"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Manchmal muss man kreativ werden \u2013 nicht nur beim Schreiben von Texten, sondern auch beim Austricksen von Algorithmen. Mein neuer Track <strong>\u201eAcht-Drei\u201c<\/strong> ist eine emotionale Zeitreise zur\u00fcck in mein Geburtsjahr 1983. Es geht um die \u00c4ra der Kassetten, die man mit dem Bleistift wieder fit gemacht hat, um eine Jugend ohne Smartphones und das Gef\u00fchl, die Br\u00fccke zwischen der analogen Vergangenheit und dem digitalen Jetzt zu sein<sup><\/sup>.<\/p>\n\n\n<div id=\"audioigniter-180\" class=\"audioigniter-root \" data-player-type=\"full\" data-tracks-url=\"https:\/\/www.brunzel.info\/?audioigniter_playlist_id=180\" data-display-track-no=\"true\" data-reverse-track-order=\"false\" data-display-tracklist-covers=\"true\" data-display-active-cover=\"true\" data-display-artist-names=\"true\" data-display-buy-buttons=\"true\" data-buy-buttons-target=\"true\" data-cycle-tracks=\"false\" data-display-credits=\"false\" data-display-tracklist=\"true\" data-allow-tracklist-toggle=\"true\" data-allow-tracklist-loop=\"true\" data-limit-tracklist-height=\"true\" data-volume=\"100\" data-tracklist-height=\"50\" ><\/div>\n\n\n\n<p class=\"wp-block-paragraph\">Das Besondere an diesem Projekt: Nicht nur das Video ist KI-generiert, das gesamte Werk ist eine Co-Kreation mit k\u00fcnstlicher Intelligenz. Die Grundidee und die emotionalen Eckpunkte des Songtexts stammen komplett von mir, aber das Finetuning und das Schreiben der finalen Zeilen hat Google Gemini \u00fcbernommen. Doch damit nicht genug \u2013 Gemini hat im Anschluss auch direkt die hochspezialisierte Prompt-Optimierung f\u00fcr die Musik-KI <strong>suno.com<\/strong> ausgespuckt, mit der am Ende die komplette Audiospur generiert wurde.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">F\u00fcr diesen ehrlichen Vibe wollte ich ein ganz besonderes Musikvideo auf die Beine stellen: Ein echtes, ungeschnittenes <strong>One-Take-Video<\/strong>. Die Kamera sollte im Musikstudio bleiben und die pure Performance vor dem Mikrofon einfangen<sup><\/sup>. Als Ausgangspunkt f\u00fcr dieses Experiment diente ein einfaches Foto von mir im Profil.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large is-resized\"><img fetchpriority=\"high\" decoding=\"async\" width=\"1024\" height=\"1024\" src=\"https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/FB_IMG_1691431416833-1024x1024.jpg\" alt=\"\" class=\"wp-image-175\" style=\"width:370px;height:auto\" srcset=\"https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/FB_IMG_1691431416833-1024x1024.jpg 1024w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/FB_IMG_1691431416833-300x300.jpg 300w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/FB_IMG_1691431416833-150x150.jpg 150w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/FB_IMG_1691431416833-768x768.jpg 768w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/FB_IMG_1691431416833-560x560.jpg 560w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/FB_IMG_1691431416833.jpg 1080w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Technisch umgesetzt wird das Mammutprojekt mit der Video-KI <strong>LTX 2.3<\/strong>. Der Plan war simpel: Mein echtes Gesicht nehmen und mittels Image-to-Video in eine professionelle Studio-Umgebung versetzen. Dieses erste Studio-Startbild wurde ebenfalls mit Gemini editiert, um mich perfekt in Szene zu setzen. Das klappte im ersten Standbild auch \u00fcberraschend gut.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"572\" src=\"https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/Gemini_Generated_Image_snkgqsnkgqsnkgqs-1024x572.png\" alt=\"\" class=\"wp-image-168\" srcset=\"https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/Gemini_Generated_Image_snkgqsnkgqsnkgqs-1024x572.png 1024w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/Gemini_Generated_Image_snkgqsnkgqsnkgqs-300x167.png 300w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/Gemini_Generated_Image_snkgqsnkgqsnkgqs-768x429.png 768w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/Gemini_Generated_Image_snkgqsnkgqsnkgqs-1536x857.png 1536w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/Gemini_Generated_Image_snkgqsnkgqsnkgqs-2048x1143.png 2048w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">Doch wer schon einmal mit Bild-zu-Video-Modellen gearbeitet hat, kennt das Frustpotenzial: Die visuelle Kontinuit\u00e4t bei fotorealistischen Gesichtern ist \u00fcber l\u00e4ngere Zeitr\u00e4ume eine absolute Katastrophe. Bewegt sich der Rapper zu wild oder dreht den Kopf auch nur minimal weg, vergisst die KI die Identit\u00e4t. Sobald man sich zur\u00fcckdreht, erfindet das Modell pl\u00f6tzlich ein v\u00f6llig neues Gesicht.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Nach etlichen Fehlversuchen habe ich das Konzept komplett umgeworfen: Wir gehen weg vom Realfilm und wechseln auf einen <strong>dreidimensionalen Comic- und Graphic-Novel-Stil<\/strong>. Das Geniale daran? Die KI versteht die klaren Geometrien, Kanten und Schattierungen eines 3D-Comic-Charakters viel besser und bleibt \u00fcber das gesamte Video hinweg visuell stabil. Zudem erlaubt mir dieser Look, mich viel dynamischer wie ein Rapper vor dem Mikrofon zu bewegen, ohne dass die KI mein Gesicht verzerrt.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"572\" src=\"https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic-1024x572.png\" alt=\"\" class=\"wp-image-172\" srcset=\"https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic-1024x572.png 1024w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic-300x167.png 300w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic-768x429.png 768w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic-1536x857.png 1536w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic-2048x1143.png 2048w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-video\"><video height=\"704\" style=\"aspect-ratio: 1280 \/ 704;\" width=\"1280\" controls src=\"https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/83_szene1_00004-audio.mp4\"><\/video><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">Das Video wird \u00fcber die <strong>Last-Frame-Methode<\/strong> in insgesamt 19 Segmente (je 10 Sekunden, das Finale 2 Sekunden) unterteilt. Das jeweils letzte Standbild einer Szene ist immer der Startpunkt f\u00fcr die n\u00e4chste. Da ich f\u00fcr den eigentlichen Videoschnitt und das Rendering auf eine <strong>lokale Software-Alternative<\/strong> auf meinem eigenen Rechner setze, muss ich bei der Prompt-Erstellung f\u00fcr LTX 2.3 extrem pr\u00e4zise sein, um keine kostbare Rechenzeit zu verschwenden. Auch hier greife ich auf Gemini zur\u00fcck: Ich f\u00fcttere die KI im Chat mit dem jeweiligen Last-Frame sowie den exakten Songtext-Zeilen f\u00fcr die n\u00e4chste Szene. Gemini \u00fcbersetzt das Ganze in hochgradig optimierte, englische LTX-Prompts, die genau steuern, welche Worte gelippensynchronisiert werden und welche LoRA-St\u00e4rken (f\u00fcr Static-Control, Detailer oder Talkvid) aktiv sein m\u00fcssen.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Doch schon bei der allerersten Szene gab es ein riesiges Problem: In den ersten sechs Sekunden laufen nur Adlibs und der Beat, bevor der echte Text einsetzt<sup><\/sup>. Die Lipsync-KI versucht in solchen Phasen aber krampfhaft, jedes Hintergrundger\u00e4usch in Mundbewegungen zu \u00fcbersetzen. Das sah extrem unnat\u00fcrlich aus. Meine L\u00f6sung? Ein visueller Trick, den ich wieder mit Gemini ins Bild editiert habe: Ich habe meinem animierten Ich einen glimmenden Joint in die Hand gedr\u00fcckt.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"571\" src=\"https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic_joint-1024x571.png\" alt=\"\" class=\"wp-image-176\" srcset=\"https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic_joint-1024x571.png 1024w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic_joint-300x167.png 300w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic_joint-768x428.png 768w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic_joint-1536x857.png 1536w, https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/szene1_comic_joint-2048x1142.png 2048w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-video\"><video height=\"704\" style=\"aspect-ratio: 1280 \/ 704;\" width=\"1280\" controls src=\"https:\/\/www.brunzel.info\/wp-content\/uploads\/2026\/06\/83_szene1_00008-audio.mp4\"><\/video><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">\u00dcber den lokalen LTX-Prompt habe ich eine strikte zeitliche Abfolge erzwungen: In den ersten sechs Sekunden bleibt der Mund f\u00fcr den Lipsync komplett zu. Der Charakter f\u00fchrt stattdessen den Joint zu den Lippen, nimmt einen tiefen Zug, w\u00e4hrend er l\u00e4ssig zum Beat nickt, und atmet den Rauch aus. Erst in den letzten vier Sekunden wechselt er in die Rap-Performance und setzt zum pr\u00e4zisen Lipsync f\u00fcr das erste echte Wort \u201eAcht-Drei\u201c an<sup><\/sup>. Aus einem technischen Problem wurde so ein verdammt cooles Style-Element, das perfekt zum Vibe des Tracks passt.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Insgesamt rechne ich mit rund <strong>20 Stunden reiner Generierungszeit<\/strong> auf meiner lokalen Maschine, in denen unz\u00e4hlige Clips wegen kleiner Fehler oder neuer Ideen im Papierkorb landen werden<sup><\/sup>. Es ist ein st\u00e4ndiges Iterieren und Verfeinern. Aber genau das ist echtes Commitment und Leidenschaft f\u00fcr die Kunst \u2013 damals wie heute<sup><\/sup>. Seid gespannt auf das fertige Video!<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Manchmal muss man kreativ werden \u2013 nicht nur beim Schreiben von Texten, sondern auch beim Austricksen von Algorithmen. Mein neuer Track \u201eAcht-Drei\u201c ist eine emotionale Zeitreise zur\u00fcck in mein Geburtsjahr 1983. Es geht um die \u00c4ra der Kassetten, die man mit dem Bleistift wieder fit gemacht hat, um eine Jugend ohne Smartphones und das Gef\u00fchl, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":172,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,16],"tags":[33,32,24,29,21,22,31,25,17,23,18,26,20,28,27,30,34,19],"class_list":["post-166","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-allgemein","category-ki","tag-80s","tag-90s","tag-bild-zu-video","tag-comic","tag-gemini","tag-google","tag-hiphop","tag-i2v","tag-ki","tag-local","tag-ltx","tag-ltx-2-3","tag-musik","tag-novel","tag-prompt","tag-rap","tag-suno","tag-video"],"_links":{"self":[{"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/posts\/166","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/comments?post=166"}],"version-history":[{"count":11,"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/posts\/166\/revisions"}],"predecessor-version":[{"id":191,"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/posts\/166\/revisions\/191"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/media\/172"}],"wp:attachment":[{"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/media?parent=166"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/categories?post=166"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.brunzel.info\/index.php\/wp-json\/wp\/v2\/tags?post=166"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}