John Mueller von Google bietet detailliertere Informationen zu neuen Daten in der aktualisierten Suchkonsole Crawl Stats-Bericht – die Metriken “Entdeckung” und “Aktualisierung”.

Der Crawl Stats-Bericht in Google Search Console wurde vor einigen Wochen aktualisiert und bietet Daten, über die zuvor nicht berichtet wurde.

Ein bestimmter Datenabschnitt, Crawl Purpose, wurde am 27. November im Live-Stream von Google Search Central veröffentlicht.

Mueller wurde gebeten, mehr Kontext zu den beiden in Crawl Purpose enthaltenen Metriken bereitzustellen – Prozentsatz der “entdeckten” URLs und Prozentsatz der “aktualisierten” URLs.

Insbesondere wurde die folgende Frage gestellt:

„Was ist der Unterschied zwischen Erkennung und Aktualisierung? In unserem Fall wird eine Aktualisierung von 84% angezeigt.

Bedeutet das, dass 84% ​​der Zeit Google ist? kriechen bekannte URLs aus ihrer Datenbank und nur 16% der Zeit, in der sie unsere Website, Sitemaps und Links von anderen URLs aus der bekannten URL-Datenbank crawlen? “

Das offizielle Hilfedokument der Google-Suchkonsole bietet kurze Beschreibungen der Erkennung und Aktualisierung:

Ermittlung: Die angeforderte URL wurde noch nie von Google gecrawlt. Aktualisieren: Ein erneutes Zeichnen einer bekannten Seite.

Mueller erweitert diese Informationen in seiner Antwort auf die obige Frage.

Mueller über ‘Crawl Purpose’-Daten

Mueller geht seiner Antwort mit der Offenlegung voran, dass er nicht 100% sicher ist, welche URLs in Entdeckung und Aktualisierung gruppiert werden, aber er gibt sein eigenes Verständnis dafür.

Aktualisierte URLs beziehen sich auf zuvor gecrawlte Seiten, die erneut gecrawlt wurden, um die Informationen im Google-Suchindex zu aktualisieren.

Entdeckte URLs beziehen sich auf Seiten auf einer Website, die zum ersten Mal gecrawlt und von Google noch nie gesehen wurden.

So drückt es Müller aus:

„Ich bin mir nicht hundertprozentig sicher, was genau wir in jeden dieser Buckets stecken würden, aber im Allgemeinen teilen wir die Dinge in Aktualisierungs-Crawling auf, bei dem wir versuchen, die Informationen auf einer Website zu aktualisieren, und Discovery-Crawling, wo wir es versuchen Finden Sie neue URLs, von denen wir auf der Website gehört haben. Dies können beispielsweise neue interne Links oder externe Links sein, die auf Ihre Website verweisen. “

Mueller fügt hinzu, dass ein Aktualisierungscrawl das Aktualisieren von Inhalten beinhaltet, während aktiv nach neu platzierten Links gesucht wird.

“Das Crawlen von Crawls bedeutet nicht, dass wir nur den Inhalt der Seite aktualisieren. Wir suchen auch nach neuen Links, über die wir dann neue Inhalte entdecken können.”

Beim Lesen des Berichts “Crawl Stats” sollten Websitebesitzer einen höheren Prozentsatz aktualisierter URLs als erkannte URLs sehen.

Ausnahmen, die mir in den Sinn kommen, sind das Starten einer neuen Site, das Migrieren einer Site mit einer anderen, das Hochladen einer neuen Sitemap und andere solche Aktionen.

Wenn der Bericht zeigt, dass sich schnell ändernde Seiten nicht oft genug gecrawlt werden, stellen Sie sicher, dass sie in einer Sitemap enthalten sind.

Seiten, die weniger häufig aktualisiert werden, werden seltener gecrawlt, obwohl Websitebesitzer eine erneute Sperrung erzwingen können, indem sie Google manuell anpingen.

Die vollständige Frage und Antwort aus dem Search Central-Stream finden Sie im folgenden Video. Ausführliche Informationen zum aktualisierten Crawl Stats-Bericht von Google finden Sie hier: Crawl-Statistikbericht der Google Updates-Suchkonsole.

Quelle