Der Blaue Brief - 20. 09. 24

Wortspaß im Betreff gemerkt, liebe/r Freund/in der Blauen Maschine ? Jener Satz von Obi-Wan Kenobi ist durchaus doppeldeutig, wenn auch George Lucas damals sicherlich noch keine AI im Hinterkopf hatte. Und darum soll es heute gehen:

AI und Roboter - weg damit?
Neues aus dem Maschinenraum

AI und Roboter - weg damit?

Nein. Wir sprechen nicht über die Intelligenz von R2D2 und Co. Tatsächlich geht es um die Frage, wie die verschiedenen Modelle generativer KI (dazu zählen ChatGPT ebenso wie Midjourney und andere) eigentlich trainiert werden - und was man dagegen tun kann.

Mittlerweile wissen wir, dass sie in den vergangenen Jahren fröhlich das Netz nach verwertbaren - und damit im strengen Sinne - kopierbaren Informationen abgegrast haben. Nicht jeder war damit einverstanden, und darum haben verschiedene Anbieter AI-gestützter Bildgeneratoren mittlerweile entsprechende Klagen am Hals.

Gefunden haben die Unternehmen die Inhalte mit kleinen Programmen, die seit Beginn des Internets das Web durchsuchen: Die sogenannten Crawler. Über die haben sich Seitenbetreiber:innen in der Regel gefreut, haben sie doch dafür gesorgt, dass Suchmaschinen die jeweiligen Seiten in ihren Index aufgenommen haben und sie so auffindbar gemacht haben.

Dass Crawler allerdings auch Daten sammeln, um KI-Modelle zu trainieren, ohne die Seitenbetreiber:innen zu fragen, war bislang kein Teil der Abmachung. waren. So ist Microsoft mit dem sozialen Netzwerk Reddit aneinandergeraten, weil sich die Redmonder ohne Rücksprache an dessen Inhalte bedient haben. Und zwar nicht nur für die Microsoft-eigene Suchmaschine Bing, sondern auch für die eigene KI namens CoPilot, der wiederum OpenAI und Dall-E zugrundeliegen. Die Konsequenz: Immer häufiger wehren sich Seitenbetreiber:innen gegen den Crawler-Besuch ihrer Seiten.

"Wo sind die Roboter?"

Jüngstes Beispiel ist Apple: Facebook, Instagram, aber auch Websites wie Craigslist, Tumblr, The Financial Times und Vox Media verweigern dem Apple-Crawler den Zugriff auf ihre Seiten. Apples KI-Modell "Apple Intelligence" (sinnigerweise "AI" genannt) muss bis auf weiteres ohne diese Inhalte auskommen. Ein Schelm, wer dahinter monetäre Absichten vermutet. Denn schon länger gibt es Gerüchte, dass die Medienanbieter den Zugriff auf ihre Seiten wieder zulassen werden - sobald sie dafür finanziell kompensiert werden.

Die zugrundeliegende Technik ist fast so alt wie das Netz selbst. Erdacht hat sie Martijn Koster im Jahr 1994: Mit einer kleinen Datei namens robots.txt können Websitenbetreiber:innen festlegen, welcher Crawler auf seine Seiten Zugriff haben soll und welcher nicht. Sollten Sie also verhindern wollen, dass Ihre Inhalte dazu genutzt werden, um KI-Modelle zu trainieren, wäre dies eine Möglichkeit. Zur Umsetzung fragen Sie einfach Ihren freundlichen Dienstleister. Ob Apple, OpenAi und andere Ihnen daraufhin eine Kompensation anbietet, ist natürlich eine andere Frage.

Mehr zum Thema finden Sie unter anderem im entsprechenden Artikel von The Verge.

The Verge: Robots.txt

Neues aus dem Maschinenraum

Viele kleine Dinge - und ein fataler Besuch auf dem Kamera-Flohmarkt in Wunsiedel. Die Folgen werden auch die Leserinnen und Leser des Blauen Briefe zu sehen bekommen. Ein Versprechen. Keine Drohung.

Überraschung!

Ein humanes Wochenende wünscht

Die Blaue Maschine

Daniel Wagner

„Wir funktionier'n Automatik
Jetzt woll′n wir tanzen: Me'kanik

Die Roboter - Kraftwerk

Austragen | Verwalte dein Abonnement | Die alten Ausgaben des Blauen Briefes gibt es hier
Die Blaue Maschine
Schellenbergweg 24
95028 Hof