2.5 Blacklisten -- Wie Suchmaschinen Inhalte auschliessen
Wie Suchmaschinen unzulässige Begriffe mit Blacklisten ausschliessen
Manche Suchmaschinen führen Listen mit Worten welche die Suchmaschinen nicht indexieren möchten
da diese Begriffe für die jeweilige Suchmaschine als unzulässig gelten.
So genannte Blacklists.
So werden vor dem Speichern eines (durch Crawler) eingelesenen Dokuments, dessen Daten mit den Wörtern
einer Blacklist verglichen. Sind auf der eingelesenen Seite Wörter vorhanden die in der Blacklist stehen
wird das Dokument nicht zur Aufnahme in den Index der Suchmaschine freigegeben. So versuchen Suchmaschinen
unerwünscht Inhalte aus Ihrem Datenbestand fernzuhalten.
Eine abgeschwächte Version einer Blacklist benutzen Suchmaschinen um die Treffergenauigkeit zu erhöhen.
Bei dieser Version werden die Wörter welche im Text einer eingelesenen Seite sind ebenfalls mit einer
Wortliste verglichen.
Bei Übereinstimmungen mit Wörtern in der Liste, werden allerdings nur die einzelnen Wörter aus dem Datenbestand
der Suchmaschine gelöscht und nicht gleich das ganze Dokument.
So können z.B. Wörter ausgeschlossen werden, die Inhaltlich nicht zum Thema eines Dokuments passen.
Auf diese Weise können Suchmaschinen auch sehr einfach unwichtige Worte beim einlesen erkennen.
Dies wird zum Beispiel oft bei Bindeworten oder Artikeln (bestimmt und unbestimmt) von angewandt.
Dieses System erhöht die Treffergenauigkeit der Suchmaschine und hält den Index der Suchmaschine klein.
Das spart Suchmaschinen Rechenressourcen und Speicherplatz.
weiterführende Links
nächstes Thema - RelevanzStichwortverzeichnis
Inhaltsverzeichnis
Zur Startseite:
Suchmaschinen
copyright© by ranking-abc.de