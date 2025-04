1/7 Der Ostschweizer Pasquale de Sapio (52) hat mit Hilfe von KI eine Kurzfilm-Trilogie geschaffen. Die Story startet in den Bergen. Foto: AMA AI Media Agency

Tobias Bolzern

Strickendes Schaf, kochende Kuh, rappender Stier: Die Hauptfiguren der Kurzfilm-Trilogie «The Secret of the Mountain Hut» sind skurril – und vollständig künstlich. Der Ostschweizer Pasquale de Sapio (52) hat die Filme mit generativer künstlicher Intelligenz (KI) realisiert. Die Stimmen, Bilder und Musik: alles KI-generiert. Sein Projekt wurde bereits auf Festivals in Paris, Seattle und Tianjin in China nominiert.

Die Idee kam de Sapio beim Experimentieren mit KI-Animationen. Er schuf 2024 einen Kurzfilm, in dem zwei Katzen in eine Sardellenfabrik einbrechen: «Anchovy Bandits» kam gut an und erzielte 50'000 Aufrufe auf Youtube in wenigen Wochen. Für die Trilogie wollte er nun technisch und erzählerisch einen Schritt weitergehen.

Die Geschichte beginnt in den Bergen, wo Wanderer auf eine kauzige Hütte stossen. Dort trifft das Wanderpaar auf Alpöhi und seine Tiere, die sich für einen Musikwettbewerb qualifizieren wollen. «Meine Geschichte erzählt von Leidenschaft, Rückschlägen und Zusammenhalt», sagt de Sapio. Die Dramaturgie ist klassisch, das technische Verfahren nicht.

Zwischen Prompt und Pixel

De Sapio, zuvor in der Musik-, Fernseh- und Werbebranche tätig, sieht KI als Werkzeug zur Effizienzsteigerung. «Fünf bis acht Tage hatte ich pro Kurzfilm», sagt er. «Das ist wenig im Vergleich zu konventionellen Filmproduktionen.» Verschiedene KI-Werkzeuge kamen zum Einsatz: Midjourney für Standbilder, die mit Image-to-Motion-Tools animiert wurden, Elevenlabs für Geräusche und die Stimmen und Suno für die Musik. Das Drehbuch schrieb er selbst.

De Sapio beschreibt es als interdisziplinären Vorgang, der missverstanden wird, wenn man denkt, es sei alles «nur Knopfdruck». Nicht alles im Film ist perfekt. Wenn man genau hinschaut, verfliegt der Zauber in manchen Szenen. So steigt etwa Rauch aus einem Buch aus und Gabeln werden plötzlich zu Löffeln – Beständigkeit ist ein bekanntes Problem der KI.

Nachdem die KI-Kurzfilme auf Englisch erschienen sind, gibt es jetzt eine Version in Mundart. Mit einer Neuerung: Die Stimmen sind echt – nicht mehr von der KI erzeugt. Zu hören sind Sprecher wie Schauspieler Walter Andreas Müller (79) und Sänger Michael von der Heide (53). Auch Moderatoren, darunter Reto Scherrer (49), sowie einige Laien wurden engagiert. Sie alle leihen den KI-Tieren ihre Stimmen. Damit die Lippenbewegungen weiterhin passen, entwickelte de Sapio ein Verfahren, um die Mundbewegungen der KI-Tiere an die Stimmen anzupassen. Auf das Klonen der Sprecher verzichtete er. «Dialekt lebt von Nuancen, Emotion und Identität – das schafft KI nicht überzeugend», sagt er.

Für Walter Andreas Müller war es die erste Begegnung mit dem «Phänomen KI». Für Sprecher und Schauspieler ergeben sich neue Dimensionen – «auch wie mit ihrem Arbeitsinstrument, der Stimme, umgegangen wird, und wie weit sich die Persönlichkeit des Künstlers schützen lässt», sagt er.

Kritik aus Hollywood

Die Trilogie sieht de Sapio als Beispiel für Demokratisierung der Filmproduktion. «Was früher grosse Budgets und umfangreiche Produktionsteams erforderte, ist heute mit kleinem Setup machbar», sagt de Sapio, der sich das Know-how in den letzten zwei Jahren beigebracht hat. Abgesehen von den Sprecherstimmen setzte er die Trilogie im Alleingang um. Die Teile lädt der Ostschweizer in den nächsten Tagen auf seinen Youtube-Kanal.

Neben Chancen sieht er auch Risiken: rechtliche Grauzonen und die Fragen der Urheberschaft. Der Trend um KI-generierte Bilder im Stil von Studio Ghibli sorgte jüngst weltweit für Furore. Und: In Hollywood protestieren Schauspielerinnen und Synchronsprecher gegen den Einsatz synthetischer Stimmen – aus Sorge, verdrängt zu werden. De Sapio sieht Handlungsbedarf und er plädiert für neue Regeln: «Es braucht Lizenzmodelle, bei denen Urheber die Kontrolle behalten, auch über ihre Stimme.» Er schlägt ein Modell nach dem Vorbild von Youtubes Content-ID vor: «Ein Fingerabdrucksystem für Stimmen und Bilder könnte Rechte sichern und Urheber entschädigen.»

Doch wie echt ist ein Film, der aus Algorithmen besteht? «Technologie ist ein kreativer Verstärker», sagt de Sapio. «Sie ersetzt nicht die Idee – sie hilft, sie umzusetzen.» Träumen muss man noch selbst.