S-CTS: So will Google KI-Spam besser erkennen

Manu Magno
  • 22 Juni, 2026
  • 22 Juni, 2026
  • 5 Min. Lesedauer
  • 0 Kommentar(e)
Inhaltsverzeichnis

Google testet neues System gegen massenhaften KI-Spam im Internet.

Google-Forscher stellen S-CTS vor

Ein Forscherteam von Google hat in einer neuen Arbeit das neue S-CTS (Scalable Cluster Termination System) vorgestellt. Dieses soll gegen großflächig generierten KI-Spam in den SERPs und auf Plattformen wie YouTube helfen. Das S-CTS zielt auf ein häufiges Muster: Angreifer schreiben ein Basisskript und lassen daraus tausende leicht variierte Versionen erzeugen, die über viele Konten verteilt veröffentlicht werden. So entsteht eine Flut von Beiträgen, die sich im Wortlaut unterscheiden, inhaltlich aber nahezu identisch sind. Die meisten Filter stufen sie dennoch als unterschiedliche Texte ein. S-CTS setzt bei der Bedeutung des Textes und beim Verhalten der beteiligten Konten an.

Besonders zum Tragen kommt das Verfahren bei reinem Text-Spam. Anders als bei Video oder Audio entfällt hier der Zwischenschritt über Transkripte, da der Inhalt schon in Textform vorliegt. Um die Bedeutung der Inhalte zu verstehen und zu differenzieren, nutzten die Forscher in ihrer Arbeit Text-Embeddings, wie sie ein Modell vom Typ Sentence-BERT (SBERT) liefert.

Die SBERT-Modelle können Inhalte in mehreren Sprachen gemeinsam analysieren lassen. Internationale Website- oder Plattform-Betreiber können damit ähnliche Spam-Muster über Sprachgrenzen hinweg erkennen - ohne für jede Sprache ein eigenes, vollständig getrenntes System pflegen zu müssen.

Wie funktioniert das?

Das Verfahren basiert auf dem Sprachmodell BERT, das den Wortsinn aus dem Kontext folgert. Statt reine Wortketten zu vergleichen, präsentiert SBERT jeden Beitrag in einem Vektorraum. Texte, die inhaltlich sehr ähnlich sind, liegen dort nah beieinander und werden in Clustern zusammengefasst. Parallel analysiert das System, ob mehrere auffällige Beiträge von einem Verbund verbundener Accounts stammen oder andere gemeinsame Muster zeigen.

Nicht gegen KI, Fokus auf Cluster

Die Google-Forscher betonen, dass S-CTS nicht entscheiden soll, ob ein Text generell "von KI geschrieben" ist oder gegen die Google Webmaster Guidelines verstößt. Das Modell beantwortet lediglich die Frage, ob zwei Inhalte semantisch ähnlich sind. Allein das ist aber noch kein Beweis für Spam: Texte seriöser Nachrichten-Portale, die über dieselben Ereignisse berichten, liegen im Embedding-Raum ebenfalls nah beieinander.

S-CTS kombiniert deshalb zwei Ebenen: Erst werden inhaltlich ähnliche Beiträge gruppiert, dann wird geprüft, ob ein verdächtiges Verhaltensmuster vorliegt – etwa eine große Zahl nahezu bedeutungsgleicher Texte aus einem Geflecht von Accounts. Die Schwellen für automatische Maßnahmen sind laut Team bewusst konservativ gewählt, um Fehlalarme gering zu halten und legitime Inhalte zum gleichen Thema nicht zu blockieren.

Umgang mit neuen KI-Modellen

Ein häufiges Problem vieler KI-Detektoren ist ihre Abhängigkeit von bestimmten Modellgenerationen: Wird ein Filter auf typische Muster eines konkreten Generators trainiert, verliert er mit dem nächsten Modellwechsel schnell an Wirkung.

S-CTS geht anders vor. Weil es nicht nach der Signatur eines bestimmten Modells sucht, sondern nach wiederkehrenden Bedeutungsstrukturen im Text. Ob ein Skript von einem älteren oder neueren Sprachmodell stammt, spielt dann keine Rolle.

Gleichzeitig hat der Ansatz Grenzen: Je stärker künftige Modelle Inhalte thematisch streuen oder gezielt Rauschen einbauen, desto kleiner und unauffälliger werden die Cluster. Angreifer könnten das ausnutzen, indem sie irrelevante Elemente mischen, um die Embeddings auseinanderzuziehen. Das Forscherteam reagiert darauf nach eigener Darstellung mit kontinuierlichen Anpassungen an neue Spam-Trends und prüft zusätzliche Signale – etwa kryptografische Herkunftsnachweise (C2PA) oder Wasserzeichenverfahren wie SynthID – als ergänzende Bausteine.

Unsere Einschätzung

"Meaning over wording" gewinnt an Relevanz. Für SEO bzw. GEO bedeutet das: Lieber wenige, wirklich differenzierte Seiten mit klaren Zusatzinfos statt zahlreiche nahezu identische KI-Textklone. Für AI Overviews und Co. sind hochwertige, eigenständige Informationen wertvoller denn je.

Kommentar hinzufügen

Ihre E-Mail-Adresse wird nicht veröffentlicht.

Das könnte dich auch interessieren:

reddit ads: wenn die community zur anzeige wird

Reddit Ads: wenn die Community zur Anzeige wird

Reddit will Marken dorthin bringen, wo Kaufentscheidungen wirklich fallen: und zwar mitten in die Community-Gespräche. ...

  • 24 Juni, 2026
  • 0 Kommentare

Heimliches Google-Update bringt LLMS.txt in den PSI-Report

Als ich eben den Page Speed Insights Report von backlinked.com gecheckt habe, ist mir im Bereich der Scorings ein neuer Wert aufgefallen. Google scheint die llms.txt nun ...

  • 17 Juni, 2026
  • 0 Kommentare
google-abstrafung trifft jetzt auch chatgpt und co

Google-Abstrafung trifft jetzt auch ChatGPT & Co.

Wer von Google manuell abgestraft wird, verliert nicht nur Rankings in der klassischen Suche, sondern auch Sichtbarkeit in KI-Tools wie ChatGPT. Das zeigt ein aktueller F...

  • 17 Juni, 2026
  • 0 Kommentare
📅 Kostenlose Marktplatztour