Robots.txt Tester

Laden Sie robots.txt von einer Domain:

Oder manuell eingeben / einfügen:

URL-Pfad zum Testen

User-Agent

Analysierte Regeln

User-Agent	Richtlinie	Pfad

Verstehen von Robots.txt

Die robots.txt Datei ist ein Standard, der von Websites verwendet wird, um mit Suchmaschinen-Crawlern und anderen Web-Robotern zu kommunizieren. Sie sagt Bots, welche Teile Ihrer Seite sie zugreifen können und welche nicht.

Was ist robots.txt?

Robots.txt ist eine einfache Textdatei, die sich im Wurzelverzeichnis Ihrer Website befindet (z.B. beispiel.com/robots.txt) und dem Robots Exclusion Protocol folgt. Sie enthält Regeln, die Crawlern sagen, auf welche URLs sie auf Ihrer Seite zugreifen können.

Wie man dieses Tool verwendet

Fügen Sie den Inhalt Ihrer robots.txt in das Textfeld ein (oder rufen Sie ihn von einer Domain ab), geben Sie einen URL-Pfad ein, den Sie testen möchten, wählen Sie einen User-Agent aus und klicken Sie auf 'Testen Sie die URL'. Das Tool sagt Ihnen sofort, ob der Pfad erlaubt oder blockiert ist.

Warum Ihre Robots.txt testen?

Verhindern Sie, dass wichtige Seiten versehentlich von Suchmaschinen blockiert werden
Stellen Sie sicher, dass private oder Admin-Seiten ordnungsgemäß vor Crawlern verborgen sind
Debuggen Sie Crawling-Probleme, bevor sie Ihre Suchrankings beeinträchtigen
Validieren Sie Änderungen, bevor Sie sie in der Produktion bereitstellen

Datenschutz garantiert

Dieses Tool läuft vollständig in Ihrem Browser. Ihr robots.txt Inhalt und die Test-URLs werden niemals an einen Server gesendet. Perfekt zum Testen von Regeln, die sensible Pfade enthalten.

Häufig gestellte Fragen

Wie funktioniert das Matching von robots.txt?

Robots.txt verwendet das Matching von Pfadpräfixen. Eine Regel wie 'Disallow: /admin/' blockiert alle URLs, die mit '/admin/' beginnen. Das Wildcard (*) kann für das Muster-Matching verwendet werden, und das Dollarzeichen ($) verankert ein Match am Ende einer URL.

Was hat Vorrang: Erlauben oder Verweigern?

Wenn sowohl Erlauben- als auch Verweigern-Regeln mit einer URL übereinstimmen, gewinnt die spezifischere (längste) Regel. Wenn sie die gleiche Länge haben, hat Erlauben Vorrang. Dies folgt der standardmäßigen Google-Interpretation.

Verhindert robots.txt, dass Seiten indexiert werden?

Nein, robots.txt steuert nur das Crawlen, nicht das Indizieren. Eine Seite, die durch robots.txt blockiert ist, kann weiterhin in den Suchergebnissen erscheinen, wenn andere Seiten auf sie verlinken. Verwenden Sie das 'noindex' Meta-Tag, um die Indizierung zu verhindern.

Was passiert, wenn es keine robots.txt gibt?

Wenn keine robots.txt Datei existiert, gehen Crawler davon aus, dass sie auf alle Teile Ihrer Seite zugreifen können. Dies ist das Standardverhalten für gut funktionierende Bots.

Kann ich Wildcard-Regeln testen?

Ja, dieses Tool unterstützt Wildcard (*) Matching und das Verankern am Ende der URL ($), wie es von Google und anderen großen Suchmaschinen verwendet wird.

Bild-Tools

Metadaten & KI

Video in Frames

PDF Werkzeuge

Tools

More

Tools

More

Tools

More

Sitemaps gefunden

Analysierte Regeln

Sofortiges Testen

Unterstützung für mehrere Bots

100% Client-Seite

Verstehen von Robots.txt

Was ist robots.txt?

Wie man dieses Tool verwendet

Warum Ihre Robots.txt testen?

Datenschutz garantiert

Häufig gestellte Fragen