S-CTS: So will Google KI-Spam besser erkennen

22 Juni, 2026
22 Juni, 2026
5 Min. Lesedauer
0 Kommentar(e)

Inhaltsverzeichnis

Google testet neues System gegen massenhaften KI-Spam im Internet.

Google-Forscher stellen S-CTS vor

Ein Forscherteam von Google hat in einer neuen Arbeit das neue S-CTS (Scalable Cluster Termination System) vorgestellt. Dieses soll gegen großflächig generierten KI-Spam in den SERPs und auf Plattformen wie YouTube helfen. Das S-CTS zielt auf ein häufiges Muster: Angreifer schreiben ein Basisskript und lassen daraus tausende leicht variierte Versionen erzeugen, die über viele Konten verteilt veröffentlicht werden. So entsteht eine Flut von Beiträgen, die sich im Wortlaut unterscheiden, inhaltlich aber nahezu identisch sind. Die meisten Filter stufen sie dennoch als unterschiedliche Texte ein. S-CTS setzt bei der Bedeutung des Textes und beim Verhalten der beteiligten Konten an.

Besonders zum Tragen kommt das Verfahren bei reinem Text-Spam. Anders als bei Video oder Audio entfällt hier der Zwischenschritt über Transkripte, da der Inhalt schon in Textform vorliegt. Um die Bedeutung der Inhalte zu verstehen und zu differenzieren, nutzten die Forscher in ihrer Arbeit Text-Embeddings, wie sie ein Modell vom Typ Sentence-BERT (SBERT) liefert.

Die SBERT-Modelle können Inhalte in mehreren Sprachen gemeinsam analysieren lassen. Internationale Website- oder Plattform-Betreiber können damit ähnliche Spam-Muster über Sprachgrenzen hinweg erkennen - ohne für jede Sprache ein eigenes, vollständig getrenntes System pflegen zu müssen.

Wie funktioniert das?

Das Verfahren basiert auf dem Sprachmodell BERT, das den Wortsinn aus dem Kontext folgert. Statt reine Wortketten zu vergleichen, präsentiert SBERT jeden Beitrag in einem Vektorraum. Texte, die inhaltlich sehr ähnlich sind, liegen dort nah beieinander und werden in Clustern zusammengefasst. Parallel analysiert das System, ob mehrere auffällige Beiträge von einem Verbund verbundener Accounts stammen oder andere gemeinsame Muster zeigen.

Nicht gegen KI, Fokus auf Cluster

Die Google-Forscher betonen, dass S-CTS nicht entscheiden soll, ob ein Text generell "von KI geschrieben" ist oder gegen die Google Webmaster Guidelines verstößt. Das Modell beantwortet lediglich die Frage, ob zwei Inhalte semantisch ähnlich sind. Allein das ist aber noch kein Beweis für Spam: Texte seriöser Nachrichten-Portale, die über dieselben Ereignisse berichten, liegen im Embedding-Raum ebenfalls nah beieinander.

S-CTS kombiniert deshalb zwei Ebenen: Erst werden inhaltlich ähnliche Beiträge gruppiert, dann wird geprüft, ob ein verdächtiges Verhaltensmuster vorliegt – etwa eine große Zahl nahezu bedeutungsgleicher Texte aus einem Geflecht von Accounts. Die Schwellen für automatische Maßnahmen sind laut Team bewusst konservativ gewählt, um Fehlalarme gering zu halten und legitime Inhalte zum gleichen Thema nicht zu blockieren.

Umgang mit neuen KI-Modellen

Ein häufiges Problem vieler KI-Detektoren ist ihre Abhängigkeit von bestimmten Modellgenerationen: Wird ein Filter auf typische Muster eines konkreten Generators trainiert, verliert er mit dem nächsten Modellwechsel schnell an Wirkung.

S-CTS geht anders vor. Weil es nicht nach der Signatur eines bestimmten Modells sucht, sondern nach wiederkehrenden Bedeutungsstrukturen im Text. Ob ein Skript von einem älteren oder neueren Sprachmodell stammt, spielt dann keine Rolle.

Gleichzeitig hat der Ansatz Grenzen: Je stärker künftige Modelle Inhalte thematisch streuen oder gezielt Rauschen einbauen, desto kleiner und unauffälliger werden die Cluster. Angreifer könnten das ausnutzen, indem sie irrelevante Elemente mischen, um die Embeddings auseinanderzuziehen. Das Forscherteam reagiert darauf nach eigener Darstellung mit kontinuierlichen Anpassungen an neue Spam-Trends und prüft zusätzliche Signale – etwa kryptografische Herkunftsnachweise (C2PA) oder Wasserzeichenverfahren wie SynthID – als ergänzende Bausteine.

Unsere Einschätzung

"Meaning over wording" gewinnt an Relevanz. Für SEO bzw. GEO bedeutet das: Lieber wenige, wirklich differenzierte Seiten mit klaren Zusatzinfos statt zahlreiche nahezu identische KI-Textklone. Für AI Overviews und Co. sind hochwertige, eigenständige Informationen wertvoller denn je.

Manu Magno

Manu ist seit Oktober 2020 Teil des Backlinked-Teams und leitet seit Oktober 2022 die Redaktion. Der gelernte Technik-Journalist hat in den vergangenen Jahren vor allem Erfahrung in den Bereichen (Automobil)Versicherung, Buchhaltung/Inkasso und Jobvermittlung gesammelt. Er schreibt für User, nicht für Suchmaschinen: Seine SEO-Texte haben immer den Mehrwert der Nutzer im Fokus.

Kommentar hinzufügen

Ihre E-Mail-Adresse wird nicht veröffentlicht.

S-CTS: So will Google KI-Spam besser erkennen

Inhaltsverzeichnis

Google-Forscher stellen S-CTS vor

Wie funktioniert das?

Nicht gegen KI, Fokus auf Cluster

Umgang mit neuen KI-Modellen

Unsere Einschätzung

Kommentar hinzufügen

Antwort abbrechen

Das könnte dich auch interessieren:

Reddit Ads: wenn die Community zur Anzeige wird

Heimliches Google-Update bringt LLMS.txt in den PSI-Report

Google-Abstrafung trifft jetzt auch ChatGPT & Co.