«Für mich ist alles Humor, was KI nicht kann»
Wie können Maschinen Humor lernen? Daran tüftelt Patrick «Karpi» Karpiczenko. Seit seiner Kindheit experimentiert er mit künstlicher Intelligenz (KI). Wie diese den Autor zum Halluzinieren bringt und wie intelligent sie tatsächlich ist, erzählt er bei einem Kaffee.
Karpi, sind Sie heute Morgen schon mit generativer KI in Berührung gekommen?
Mehrfach. Nachts rattert mein Computer auf Hochtouren. Er generiert Bilder, die ich in Auftrag gegeben habe. Ich starte also mit Hunderten von Bildern in den Tag, die besten picke ich für meine Arbeit heraus.
Ihr Lieblingsprojekt ist, KI-Sprachmodellen Humor beizubringen. Warum sind diese derart humorlos?
Das ist tatsächlich ein erstaunlich schwieriges Vorhaben. KI-Modelle funktionieren wie eine Art Blackbox. Humor kann aber nicht in der Blackbox entstehen. Humor bedingt Kontext, Attitüde und auch einen gesellschaftlichen Rahmen. Humor muss atmen, ist lebendig. KI-Kreationen sind schnell mal tot, weil sie begrenzt oder berechenbar sind.
Sie beobachten diese Modelle schon seit Jahren. Wie hat dies Ihren Humor verändert?
Für mich ist nun quasi alles Humor, was eine Maschine nicht kann. KI bezieht sich auf Statistik und Häufigkeit, das ist beim Humor weniger förderlich. Humor wird schnell alt. Einen Witz finden wir beim zweiten Mal schon weniger lustig. Ich denke, KI hat es einfacher, ein Mario-Barth-Programm zu generieren, als etwas Neues mit aktuellem Bezug.
Generative KI hat eine rasante Entwicklung hinter sich. Die Maschine hat sicher auch viel dazugelernt.
Ja. Wenn ich einem KI-Modell den Kontext vorgebe, sind die Wege zum Erfolg kürzer. Wenn ich ihm sage, es solle einen DJ-Bobo-Song zum Thema Schinken kreieren, kommt das recht gut. Die KI kennt sich mit diesen beiden Themen aus. Die eigentliche Arbeit, die Pastiche, also die beiden Zutaten zusammenzutun, bleibt aber bei mir. Wenn du KI am Händchen nimmst, wird sie besser.
Sie beschreiben KI als eine «guided hallucination». Wie fühlt sich das an?
Wenn ich mit KI-Modellen arbeite, die Bilder generieren, zum Beispiel Midjourney – ein Text-to-Image-Tool, das aus textlichen Beschreibungen Bilder generiert –, ist das für mich wie eine Halluzination. Die Modelle sind mit Milliarden von Bildern und Texten aus dem Internet trainiert worden, quasi unserem kollektiven Unterbewusstsein. Alles, was uns Menschen ausmacht, haben wir ins Netz gestellt – und das frisst die KI. Von dir brauchen sie dann eine Wunschliste, einen sogenannten Prompt, um zu funktionieren. Ich sehe es auch als ein Gedicht.
Das finde ich faszinierend: KI-Modelle assoziieren aufgrund von Ihren «Gedichten»?
Wie bei einem Gedicht zählt jedes Wort, jedes Komma verändert das Ergebnis. Du versuchst, jedes Wort exakt zu treffen, um zu deinem Ziel zu kommen. Du lässt das Modell halluzinieren und fabulieren. Es orientiert sich dabei am Gedicht, mit dem du es fütterst.
Das tönt in meinen Ohren sehr romantisiert.
Klar – aber ich finde, es so zu sehen, ist sinnvoll und spannend. Du bekommst von der KI selten das, was du willst. Wenn du dich auf diesen Prozess einlässt – wie beim künstlerischen Schaffen –, kannst du dich inspirieren lassen und kommst zu einem guten Resultat.
Wie gut kennt sich KI mit Schweizerdeutsch aus?
Das Schweizerdeutsch ist natürlich ein Hindernis für Maschinen. Weil sie bis vor einem oder zwei Jahren kein Schweizerdeutsch verstanden haben, ist der Korpus an Informationen noch bescheiden. Aber das kommt. Sie lernen ständig dazu, indem sie beispielsweise YouTube-Videos auf Schweizerdeutsch scannen. KI hat aber weniger Ahnung von Schweizer Politik und Gesellschaft. Bildgeneratoren kennen Roger Federer und Alain Berset bestens. Auch Emmentaler und Fondue mögen sie. Hingegen sind ihnen weder Globi noch Knorrli ein Begriff.
Wann sind Sie das erste Mal mit KI in Berührung gekommen?
Meine Mutter ist Informatikerin, mein Vater ist Musiker. Bei uns zu Hause standen immer Computer, Instrumente und Kameras rum. Dadurch habe ich tatsächlich schon als Kind programmiert und Roboter gebaut. Seit ich zwölf war, spiele ich mit künstlicher Intelligenz.
Sie haben Ihre Nische gefunden zwischen Programmieren und Kreieren.
Ich oszilliere zwischen Technologie und Unterhaltung. Das heisst, alles, was sich auf diesen Ebenen überschneidet, fasziniert mich. Es gibt viele technisch denkende Leute, die Mühe haben mit Gestaltung oder kein Interesse. Umgekehrt finden viele Gestaltende und Kunstschaffende die Technologie suspekt. Ich beobachte, dass die Kleinkunst und die Filmszene extrem scheu sind, was KI betrifft. Ich finde es verstörend, dass sie sich nicht auf all diese neuen Spielsachen stürzen.
Ein Spielzeug?
Ja. Ich fange spielerisch an, entdecke die Tools und experimentiere, dann wird es zum Job. Wird mir langweilig, ziehe ich weiter. Die Prokrastination von heute ist der Job von morgen. Das ist schön, weil ich meine Hobbys zum Beruf machen kann. Das Problem dabei ist: Ich verliere meine Hobbys.
Warum sind KI-Systeme weniger klug, als ihr Name vermuten lässt?
«Künstliche Intelligenz» ist ein ungünstiger Name, der historisch so gewachsen ist. Treffender ist der Begriff «maschinelles Lernen». Die aktuelle Strömung, all die neueren Sprachmodelle, bauen auf maschinellem Lernen auf. Sie haben mit künstlicher Intelligenz wenig zu tun. Ich finde, die ganze Diskussion, ob Maschinen intelligent sind oder nicht, bringt uns nicht weiter. Wenn wir im Alltag mit Tools arbeiten, beispielsweise mit einem Gabelstapler oder eben einem Sprachmodell, spielt es keine Rolle, ob sie Träume erleben oder Leidenschaft haben. Wir wollen einfach wissen: Können die Tools uns helfen? So betrachte ich es – sowohl im Guten wie im Schlechten.
Die Aufgabenteilung zwischen Mensch und KI muss praktisch in allen Jobs neu definiert werden. Mit welchen menschlichen Stärken kann KI (noch) nicht mithalten?
Also im Moment ist es die Vernunft – wie auch Intuition, Empathie und das moralische Empfinden natürlich. KI lässt sich hier sehr leicht austricksen. Wir hingegen kennen unser Umfeld sowie geltende Normen. Das hilft uns, die richtigen Entscheidungen in einem Kontext zu treffen.
Microsoft liess auf die Twitter-Gemeinde den intelligenten Chatbot «Tay» los. Doch dieser begann rechtsextreme Tweets zu verfassen. Microsoft musste ihn nur 16 Stunden nach seinem Start abschalten.
Das Modell ist innert kürzester Zeit faschistisch geworden. Ein aktuelles Beispiel, das von sich reden macht, ist der Chatbot «Grok» von Elon Musk. Der Bot wird mit der Plattform X trainiert. Musk hoffte auf ein libertäres Modell. Doch ist dieses nun linker als alle anderen. Musk hat etwas geschaffen, das «woker» ist als er. Auch Regierungen sind daran, KI- Chatbots nach ihren Vorstellungen zu trainieren, beispielsweise die chinesische Regierung. Kein leichtes Unterfangen, denn die Realität ist nicht so autoritär, wie sie es gern sähe. Satiriker Stephen Colbert würde wohl sagen: «Reality has a well-known liberal bias» («Die Realität hat eine bekannte liberale Tendenz»). Wir brauchen Realismus, um mit der Realität umzugehen.
Was ist mit Fact-Checking? Die Modelle sollen ja vorwiegend Fakten sammeln, beim Überprüfen gäbe es wohl Nachholbedarf.
Die Faktensicherheit dieser Modelle ist in kurzer Zeit sehr gut geworden. Vor allem, weil sie telefonieren können, also googeln. Für ChatGPT gibt es dieses Plug-in, das bei Wikipedia vorbeischaut. Ist es aktiv, sind die Resultate zehnmal akkurater als ohne. Sonst ist es ein sprudelnd kreatives Ding, das sich nicht so einfach an die Realität binden lässt. Aber fesselst du es quasi an Wikipedia, Newsquellen oder wissenschaftliche Artikel, hält sich das sprudelnde Unterbewusstsein an Fakten und gibt Verweise, die du kontrollieren kannst. Damit kann ich gut arbeiten.
Im Sommer soll eine erste Nachrichtenplattform starten, die nur von KI gefüttert wird. Jedoch zeigen Umfragen: Die Mehrheit will nichts wissen von KI in den Medien. Verstehen Sie diese Skepsis?
Ich bin auch skeptisch. Es kann schieflaufen. Ausschliesslich von KI generierte Inhalte können falsch sein oder können von wirtschaftlichen und politischen Playern missbraucht werden. Individuen können Wahlkämpfe beeinflussen und grösseren Schaden anrichten. Skeptisch bin ich auch bei Umfragen: Wenn man die Leute fragt, ob sie Eier von Batteriehühnern oder glücklichen Tieren wollen, sagen alle von glücklichen Tieren. Sie kaufen dann aber die günstigere Variante. Genauso ist es doch auch bei der KI.
Dennoch ist die Akzeptanz für KI-generierte Inhalte gegenwärtig gering.
Das empfinde ich auch oft so. Die Inhalte fühlen sich an, als ob sie weniger Wert haben. Gleichzeitig habe ich das Gefühl, dass beispielsweise der Lokaljournalismus von KI-Tools durchaus profitieren kann. Für kleine Redaktionen mit wenig finanziellen und personellen Ressourcen ergeben KI-Tools durchaus Sinn. Ich meine damit nicht, dass jemand ein ganzes Lokalblatt allein betreiben kann. Hingegen ist KI bei der Umsetzung, der Produktion, für den Journalismus interessant.
ChatGPT kam gefühlt von heute auf morgen in unseren Alltag. Verschlafen wir gerade eine weitere Entwicklung?
Oh ja! Es gibt so viele Tools, die noch schnellere Auswirkungen auf unseren Alltag haben als ChatGPT. Die KI-Stimmengeneration beispielsweise, also Sprechen, Stimme und Ton, ist sehr realistisch und funktioniert sehr gut. Theoretisch könnte das Radio alle Moderatorinnen und Moderatoren durch KI ersetzen. Das ist krass – und muss uns bewusst sein.
Was ist mit Bewegtbild?
KI hat die Filmbranche, hat Hollywood schon längst erobert. Sie kann zwar keine spannenden Drehbücher schreiben, wohl aber den Greenscreen ersetzen. Auch bei der Postproduktion ist sie hilfreich. Beispielsweise bei einem Talk im Fernsehen: Man kann KI eine Performance geben, das heisst, man gibt die Betonung, den Inhalt, die Posen vor. Diese wird von der KI auf Gesichter angewendet. Die Studiogäste sind allerdings nicht vor Ort: Sie sitzen zu Hause im Pyjama vor der Webcam und reden vor einem KI-generierten Hintergrund miteinander.
Echt jetzt? Das tönt für mich eher nach einem Zukunftsszenario.
Theoretisch wäre es jetzt schon möglich, spätestens in einem Jahr aber sicher.
Ich kann mir das nicht vorstellen. Nennen Sie uns ein Beispiel.
Die Sendung «Arena»: Anstatt dass alle Politiker ins Studio Leutschenbach reisen, sitzen sie zu Hause vor der Webcam. KI steckt sie in den richtigen Anzug und kreiert das Makeup, das Studio und die ganze Technik. Wichtig zu betonen ist: Der Inhalt der Sendung, die Betonung, der Ausdruck, ist immer noch bei den eingeladenen Politikerinnen. Das kann KI nicht.
Es ist klar: Wir müssen uns mit KI befassen, sie wird nicht einfach wieder verschwinden. Aber findet ein Diskurs statt, wie wir zukünftig damit umgehen wollen?
Ich habe das Gefühl, man lässt es geschehen und ist dann überrascht, was passiert. Die Politik schläft komplett, die Wirtschaft auch. Aber wir dürfen nicht derart verschlafen, wie dies bei der PC- oder der Social-Media-Revolution der Fall war. KI wird für uns alle viel verändern. Es gibt aber noch kaum moralische oder rechtlich verbindliche Regeln. Wir sind mitten im Prozess und müssten gemeinsam eine gute Richtung finden. Aber nicht die Technologie ist gefährlich, der Weg zur Transformation kann es sein. Ich glaube aber daran, dass es am Schluss gut rauskommt.
Was kann jede und jeder von uns beitragen, dass wir als Gesellschaft die Kurve kriegen?
Alle sollten damit rumspielen, ausprobieren, sich damit auseinandersetzen. Wenn man mit KI spielt, ist das schon die halbe Miete: Mit ChatGPT sprechen oder Bilder generieren, dann bekommst du ein Gefühl dafür. Und dann kannst du mitreden.
Zum Schluss: Ihr wichtigster Tipp, um besser durch die Welt der KI-generierten Bilder zu surfen?
Ich glaube, die beiden wichtigsten Fragen sind: Will ich diesem Bild glauben? In wessen Interesse ist es, dass ich diesem Bild glaube? Ich selbst bin auf das Bild des Papsts im hippen weissen Daunenmantel reingefallen, das von KI gemacht wurde und viral ging. Ich wollte einfach glauben, dass Franziskus dieses ungewöhnliche Outfit trägt.
Kommentar
Kommentarfunktion deaktiviert
Uns ist es wichtig, Kommentare möglichst schnell zu sichten und freizugeben. Deshalb ist das Kommentieren bei älteren Artikeln und Sendungen nicht mehr möglich.