1.9. HTTP Status Codes
keine Übungen · ca. 15 Minuten
Mögliche Ursachen für Crawling-Probleme
In den Ergebnissen der URL-Übersicht gibt es zwei hilfreiche Spalten: Status-Code und Status. Sie geben Dir in Echtzeit eine Information, welche Antwort der Webserver bei dem Versuch gab, die URL zu crawlen. Sollte mal etwas nicht so funktionieren, wie Du es Dir gedacht hast – beispielsweise weil Dein Crawl direkt bei der Startseite abbricht oder Teile der Website nicht erfasst wurden – beginnst Du am besten hier die Fehlersuche.
Ein HTTP Status Code ist eine kurze Benachrichtigung, die ein Server an den Webbrowser zurücksendet, um ihm mitzuteilen, ob seine Anfrage erfolgreich war oder nicht. Dabei handelt es sich um eine dreistellige Zahl, die einen bestimmten Zustand des Servers oder der angeforderten Ressource angibt. Die bekanntesten Codes sind 200 (alles ist in Ordnung), 404 (Seite nicht gefunden) und 500 (interner Serverfehler).
Verschiedene Kategorien der HTTP Status Codes
Bei HTTP Status Codes wird zwischen verschiedenen Kategorien unterschieden. Grundsätzlich gibt es fünf verschiedene Kategorien, die der Webserver zurücksendet. Im Screaming Frog SEO Spider findest Du noch eine weitere Kategorie mit detaillierteren Angaben, die so nicht direkt vom Webserver als Benachrichtigung ausgesendet werden.
Laufende Anfragen – 1xx
Status Code | Statusname | Beschreibung |
---|---|---|
100 | Continue | Der Server hat die Anfrage des Clients erhalten und bearbeitet sie weiter. |
101 | Switching Protocols | Der Server ändert das Protokoll, um die Anfrage des Clients zu erfüllen. |
102 | Processing | Der Server verarbeitet die Anfrage, aber hat noch keine Antwort bereit. |
HTTP-Statuscodes, die mit 1xx beginnen, werden als Informationscodes bezeichnet und geben Informationen darüber, dass die Anfrage des Clients empfangen wurde und dass weitere Schritte unternommen werden, um die Anfrage zu verarbeiten. Sie zeigen normalerweise keine Fehler an, sondern informieren lediglich über den Fortschritt der Anfrageverarbeitung.
Erfolgreiche Anfragen – 2xx
Status Code | Statusname | Beschreibung |
---|---|---|
200 | OK | Die Anfrage wurde erfolgreich bearbeitet und die Antwort wird im Body der Antwort zurückgesendet. |
201 | Created | Die Anfrage wurde erfolgreich bearbeitet und eine neue Ressource wurde erstellt. |
202 | Accepted | Die Anfrage wurde akzeptiert, aber die Bearbeitung ist noch nicht abgeschlossen. |
203 | Non-Authoritative Information | Die Antwort kommt nicht direkt vom Server, sondern aus einem Cache oder Proxy. |
204 | No Content | Die Anfrage wurde erfolgreich bearbeitet, aber es gibt keine Antwort im Body. |
205 | Reset Content | Die Anfrage wurde erfolgreich bearbeitet und der Client soll seine Oberfläche zurücksetzen. |
206 | Partial Content | Die Anfrage wurde teilweise erfüllt, da der Client nur einen Teil der Ressource angefordert hat. |
HTTP-Statuscodes, die mit 2xx beginnen, werden als Success Codes bezeichnet und geben an, dass die Anfrage des Clients erfolgreich verarbeitet wurde und dass der Server eine gültige Antwort zurücksendet.
Weiterleitungen – 3xx
Status Code | Statusname | Beschreibung |
---|---|---|
300 | Multiple Choices | Die angeforderte Ressource hat mehrere Optionen, aus denen der Client auswählen kann. |
301 | Moved Permanently | Die angeforderte Ressource wurde dauerhaft auf eine andere URL umgeleitet. |
302 | Found | Die angeforderte Ressource wurde vorübergehend auf eine andere URL umgeleitet. |
303 | See Other | Die angeforderte Ressource kann unter einer anderen URL gefunden werden. |
304 | Not Modified | Die angeforderte Ressource hat sich seit der letzten Anfrage nicht geändert und kann aus dem Cache geladen werden. |
307 | Temporary Redirect | Die angeforderte Ressource wurde vorübergehend auf eine andere URL umgeleitet, ohne dabei die Anfragemethode zu ändern. |
308 | Permanent Redirect | Die angeforderte Ressource wurde dauerhaft auf eine andere URL umgeleitet, ohne dabei die Anfragemethode zu ändern. |
HTTP-Statuscodes, die mit 3xx beginnen, werden als Redirect Codes bezeichnet und geben an, dass der Client weitere Aktionen ausführen muss, um die Anfrage abzuschließen. Dies bedeutet normalerweise, dass die vom Client angeforderte Ressource an einem anderen Ort zu finden ist.
Clientfehler – 4xx
Status Code | Statusname | Beschreibung |
---|---|---|
400 | Bad Request | Die Anfrage des Clients ist fehlerhaft und kann nicht verarbeitet werden. |
401 | Unauthorized | Der Client hat sich nicht korrekt authentifiziert und hat daher keine Berechtigung, um auf die angeforderte Ressource zuzugreifen. |
402 | Payment Required | Dieser Statuscode ist für die Verarbeitung von Zahlungen reserviert und wird selten verwendet. |
403 | Forbidden | Der Client hat keine Berechtigung, um auf die angeforderte Ressource zuzugreifen. |
404 | Not Found | Die angeforderte Ressource konnte nicht gefunden werden. |
405 | Method Not Allowed | Die Anfragemethode (z.B. GET, POST) ist für die angeforderte Ressource nicht erlaubt. |
406 | Not Acceptable | Die angeforderte Ressource kann nicht in einer für den Client akzeptablen Form zurückgegeben werden. |
407 | Proxy Authentication Required | Der Client muss sich zuerst gegenüber einem Proxy-Server authentifizieren. |
408 | Request Timeout | Der Server hat keine Antwort erhalten, bevor der Timeout abgelaufen ist. |
409 | Conflict | Die Anfrage des Clients konnte aufgrund eines Konflikts nicht verarbeitet werden. |
410 | Gone | Die angeforderte Ressource existiert nicht mehr und wurde dauerhaft entfernt. |
411 | Length Required | Der Server benötigt eine Content-Length-Angabe im Header der Anfrage. |
412 | Precondition Failed | Eine Bedingung im Header der Anfrage wurde nicht erfüllt. |
413 | Payload Too Large | Die Anfrage des Clients ist zu groß und kann nicht verarbeitet werden. |
414 | URI Too Long | Die URL der angeforderten Ressource ist zu lang und kann nicht verarbeitet werden. |
415 | Unsupported Media Type | Der Server kann den Medientyp, der in der Anfrage angegeben wurde, nicht verarbeiten. |
416 | Range Not Satisfiable | Der angeforderte Teilbereich der Ressource ist ungültig. |
417 | Expectation Failed | Eine Erwartung im Header der Anfrage konnte nicht erfüllt werden. |
418 | I’m a teapot | Ein Aprilscherz-Statuscode, der angibt, dass der Server eine Teekanne ist und keine Kaffeemaschine. |
421 | Misdirected Request | Die Anfrage wurde an einen falschen Server gesendet. |
422 | Unprocessable Entity | Die Anfrage des Clients konnte aufgrund einer fehlerhaften Syntax nicht verarbeitet werden. |
423 | Locked | Die angeforderte Ressource ist gesperrt und kann derzeit nicht geändert werden. |
424 | Failed Dependency | Eine Abhängigkeit der angeforderten Ressource konnte nicht erfüllt werden. |
425 | Too Early | Der Server ist nicht bereit, die Anfrage zu verarbeiten, da die Bedingungen für die Durchführung der Aktion noch nicht erfüllt sind. |
426 | Upgrade Required | Der Client sollte auf eine andere Protokollversion oder einen anderen Kommunikationsprotokoll wechseln. |
428 | Precondition Required | Der Server erfordert eine Bedingung im Header der Anfrage. |
429 | Too Many Requests | Der Client hat zu viele Anfragen innerhalb eines bestimmten Zeitraums gesendet. |
431 | Request Header Fields Too Large | Die Anfrage konnte nicht verarbeitet werden, weil die Größe des Header-Feldes überschritten wurde. |
451 | Unavailable For Legal Reasons | Die angeforderte Ressource ist aus rechtlichen Gründen nicht verfügbar. |
HTTP-Statuscodes, die mit 4xx beginnen, werden als Client Error Codes bezeichnet und geben an, dass die Anfrage des Clients fehlerhaft oder ungültig ist. Die häufigsten Ursachen für 4xx-Statuscodes sind eine falsche URL, fehlende oder falsche Parameter, ungültige Authentifizierung oder fehlende Berechtigungen.
Serverfehler – 5xx
Status Code | Statusname | Beschreibung |
---|---|---|
500 | Internal Server Error | Der Server hat einen unerwarteten Fehler bei der Verarbeitung der Anfrage gefunden. |
501 | Not Implemented | Der Server unterstützt die angeforderte Funktion nicht und kann sie daher nicht verarbeiten. |
502 | Bad Gateway | Der Server fungiert als Proxy oder Gateway und hat eine ungültige Antwort von einem vorgeschalteten Server erhalten. |
503 | Service Unavailable | Der Server ist vorübergehend nicht in der Lage, die Anfrage zu verarbeiten, da er überlastet oder gewartet wird. |
504 | Gateway Timeout | Der Server fungiert als Proxy oder Gateway und hat keine Antwort von einem vorgeschalteten Server innerhalb der festgelegten Frist erhalten. |
505 | HTTP Version Not Supported | Der Server unterstützt die angeforderte HTTP-Version nicht. |
506 | Variant Also Negotiates | Der Server hat eine interne Konfigurationsfehler und kann daher nicht alle Varianten des Ressourceninhalts zurückgeben, die vom Client angefordert wurden. |
507 | Insufficient Storage | Der Server hat nicht genügend Speicherplatz, um die Anfrage abzuschließen. |
508 | Loop Detected | Der Server hat eine Endlosschleife bei der Verarbeitung der Anfrage erkannt. |
510 | Not Extended | Der Client muss eine Erweiterung angeben, damit der Server die Anfrage verarbeiten kann. |
511 | Network Authentication Required | Der Client muss sich authentifizieren, um Netzwerkzugriff zu erhalten. |
HTTP-Statuscodes, die mit 5xx beginnen, werden als Server Error Codes bezeichnet und geben an, dass der Server eine gültige Anfrage des Clients nicht bearbeiten kann. Dies kann auf verschiedene Probleme wie Überlastung, fehlerhafte Konfiguration oder Ausfall der Server-Infrastruktur zurückzuführen sein.
Hinweise des Screaming Frog bei fehlender Serverantwort – 0xx
Status Code | Statusname | Beschreibung |
---|---|---|
0 | Blocked By Robots.txt | Die robots.txt der Website hat den User-Agent des SEO-Spiders am Zugriff auf die angeforderte URL gehindert. Daher wird die eigentliche HTTP-Antwort aufgrund der disallow-Direktive nicht angezeigt. |
0 | DNS Lookup Failed | Die Website konnte gar nicht gefunden werden. Ist die URL eventuell falsch geschrieben oder steht momentan keine funktionierende Internetverbindung zur Verfügung? |
0 | Connection Timeout | Ein Timeout tritt auf, wenn der SEO Spider keine HTTP-Antwort vom Server innerhalb einer bestimmten Zeitspanne (standardmäßig 20 Sekunden) erhält. |
0 | Connection Refused | Der Verbindungsversuch des SEO Spiders auf dem lokalen Rechner und der Website wurde abgelehnt. Gemeint ist damit nicht die Ablehnung durch den Webserver. Meist sind hier Restriktionen im eigenen Netzwerk bzw. Firewall-Einstellungen eine Ursache. |
0 | Connection Error / No Response | Der SEO Spider hat Probleme, Verbindungen herzustellen oder Antworten zu erhalten. Ursache sind hier ggf. Proxy-Einstellungen im Netzwerk und im Programm selbst. |
Jeder Status-Code für eine URL, der mit 0xx beginnt, zeigt an, dass es hierfür keine HTTP-Antwort des Servers gab. Der Status im SEO Spider gibt Aufschluss darüber, warum keine Antwort zurückgegeben wurde.