Robots.txt Robots.txt Robots.txt Robots.txt Robots.txt

Presentationsdatei robots.txt

die Datei robots.txt ist eine Textdatei, die Aufträge nach den Robotern der Indexierung der Forschungsmotoren enthält, um ihnen die Seiten festzulegen, die können oder können nicht indexiert werden. So beginnt jeder Forschungsmotor die Erforschung eines Netzstandortes, indem er die Datei sucht robots.txt der Haupsitz der Homepage

Dateiformat robots.txt

die Datei robots.txt geschrieben in kleinen Buchstaben und an den Plural), ist eine Datei ASCIIbefindet sich im Haupsitz der Homepage und kann die folgenden Aufträge enthalten :

  • User-Agent: erlaubt, den Roboter festzulegen, der von den folgenden Richtlinien betroffen ist. Der Wert * bedeutet "alle Suchmotoren".
  • Disallow: erlaubt, die von der Indexierung auszuschließenden Seiten anzugeben. Jede Seite oder auszuschließender Weg muß auf einer Sonderlinie sein und muß beginnen mit /der Wert / bedeutet allein "alle Seiten der Homepage".

Attention die Datei robots.txt es darf keine weisse Linie enthalten sein!

Hier Dateibeispiele robots.txt :

  • Ausschluss aller Seiten :
    User-Agent: *
    Disallow: /
  • Ausschluß keiner Seite (äquivalent am Fehlen einer Datei robots.txtalle Homepages können besucht werden) :
    User-Agent: *
    Disallow: 
  • Genehmigung eines Roboters  :
    User-Agent: nomDuRobot
    Disallow :
    User-Agent: *
    Disallow: /
  • Ausschluss einer Roboters :
    User-Agent: Name des Roboters
    Disallow: /
    User-Agent: *
    Disallow:
  • Ausschluss einer Seite :
    User-Agent: *
    Disallow: /Verzeichnis/weg/seite.html
  • Ausschluss mehrerer Seiten :
    User-Agent: *
    Disallow: /Verzeichnis/weg/seit.html
    Disallow: /Verzeichnis/weg/seite2.html
    Disallow: /Verzeichnis/weg/seite3.html
  • Ausschluß aller Seiten eines Registers und seiner unter-Ordner :
    User-Agent: *
    Disallow: /repertoire/

Einige User-Agents

Voici quelques exemples de User-Agents für die populärsten Forschungsmotoren :

Name des Motors User Agent
Alta Vista Scooter
Excite ArchitextSpider
Google Googlebot
HotBot Slurp
InfoSeek InfoSeek Sidewinder
Lycos T-Rex
So Echo

für mehr Infos

die Web-Robots Seite

Letzte Änderung am Mittwoch 1 April 2009 à 14:16:19.Das Dokument mit dem titel « Robots.txt » aus Kioskea (de.kioskea.net) zur verfügung gestellt wird unter den bedingungen der Creative Commons lizenz. Können Sie ändern, Kopien dieser Seite, unter den Bedingungen der Lizenz, als diese Bewertung deutlich.

Beste Antworten für « Robots.txt » auf :
Formate und Erweiterungen von Dateien Sehen Anmerkung: Die folgende Liste hat keinen Vollständigkeitsanspruch und manche Erweiterung Namen können mehrere Funktionalitäten haben. Die vorgeschlagenen Programme um diese Dateien zu benutzen, sind nicht unbedingt die einzigen, noch die am besten...
MIME Standard (Multipurpose Internet Mail Extensions) Sehen Einführung zu MIME MIME (Multipurpose Internet Mail Extensions) ist ein Standard, der 1991 von den Laboratorien Bell Communications vorgeschlagen wurde, um die begrenzten Möglichkeiten von E-Mails auszuweiten, und vor allem zu ermöglichen,...
Linux - Die Shell Sehen Einführung in Shell Der Befehlsinterpreter ist die Schnittstelle zwischen Benutzer und Betriebssystem, daher sein englischer Name «shell», was bedeutet «Schale». Die Shell ist also damit beauftragt der Vermittler zwischen Betriebssystem und...
Download OraLoader SehenOraLoader ist eine Datenbank-Anwendung für die Oracle konzipiert. Die Anwendung ermöglicht, Daten aus Textdatei zu importieren und diese nachher nach anderen Formaten wie zB: TXT, CSV, HTML, XML zu exportieren. Sie können dieses Tool verwenden, um...