|

Seitenstruktur und Stichwörter
Interessant
ist dabei insbesondere die Suche im Titel, die fast alle
Suchmaschinen unterstützen. Die entscheidenden Aspekte hierbei
sind:
1. Viele
Amateurwebseiten enthalten keinen Titel oder einen von
Homepage-Editoren vorgegebenen Titel wie 'No Title' oder
'Homepage'.
Testanfrage
bei Google:
|
intitle:"no title" |
1.200.000 |
|
allintitle:"no title" |
1.190.000 |
|
intitle:title |
26.400.000 |
|
intitle:homepage |
48.700.000 |
|
allintitle:"my homepage" |
468.000 |
2. Wenn Sie
ein Stichwort über den Titel eingrenzen, entfallen damit viele
schlampig gemachte Webseiten. Seriöse Webseiten haben in der
Regel einen aussagekräftigen Titel, der sich zur Suche eignet.
3. Rechtlich
gesehen sind Markennamen, eingetragene Warenzeichen etc. Wörter,
für die gilt, daß der Rechteinhaber dagegen vorgehen kann, wenn
jemand anderes diese Wörter an prominenter Stelle (insbesondere
im Titel der Webseite) verwendet. Sie finden über den Titel
deshalb besonders gut Herstellerwebseiten.
Auch die
Suche in der Webadresse führt teilweise zu interessanten
Möglichkeiten.
Dazu ist zunächst wichtig zu wissen, daß zur Webadresse (URL)
nicht nur die Domainangabe (www.tagesschau.de etc.)
gehört, sondern auch die angehängten Namen und Angaben von
Verzeichnissen, Dateinamen und gegebenenfalls auch angehängten
Suchstrings.
Ein Beispiel
zeigt das Prinzip: Zahlreiche handelsübliche Webcams binden sich
in den Server, auf dem sie betrieben werden über eine Webadresse
ein, die je nach Kameramodell unterschiedlich, aber für die
einzelnen Hersteller feststehend sind. Weist ein Link auf eine
solche Kamera, während Google die betreffene Webseite indexiert,
wird auch der Link auf die Kamera aufgenommen. So finden Sie
Webcams zum Beispiel über:
inurl:indexFrame.shtml Axis
inurl:"MultiCameraFrame?Mode="
inurl:"view/index.shtml"
Aber auch
weniger spektakuläre Abfragen sind interessant: Die meisten
Websites geben ihrer Startseite im Haupt- bzw. in
Unterverzeichnissen den Namen index.htm (bzw.
index.php etc.). So finden Sie zahlreiche Start- und
Basisseiten der Tagesschau über:
site:tagesschau.de inurl:index
Trunkieren
Insbesondere
Google weist eine erhebliche 'Eigenintelligenz' bei der Suche
auf:
- Wortgrenzen
werden häufig erkannt und auch die zugehörigen, häufig
unterschiedlichen Getrennt- bzw. Zusammenschreibungen in die
Anfrage einbezogen. (donau-dampfschiff als Stichwort
findet auch donaudampfschiff).
-
Unterschiedliche Schreibweisen (insbesondere bei Umlauten und im
Hinblick auf alte und neue Rechtschreibung) werden erkannt und
auch die anderen Schreibweisen bei der Suche berücksichtigt (nurnberg
und nuernberg führen auch zur Anzeige von Nürnberg,
delphin und delfin finden jeweils auch die andere
Schreibweise – in beiden Fällen allerdings jeweils mit
geringfügig anderen Trefferzahlen).
|