googlewebmastercentral-de: Ein Vorschlag, AJAX crawlbar zu machen

Ein Vorschlag, AJAX crawlbar zu machen

Mittwoch, 14. Oktober 2009

Geringe Anpassungen bei einer wachsenden Website

User und Suchmaschinen sehen denselben Content (kein Cloaking)

Suchmaschinen können User direkt auf die AJAX-URL verweisen (keine statische Kopie)

Sitebesitzer können ueberpruefen, ob ihre AJAX-Website richtig erscheint und somit, ob der Crawler Zugriff auf den gesamten Content hat

Leichte Veränderung der URL-Teile für statusabhängige AJAX-Seiten
Statusabhängige AJAX-Seiten zeigen denselben Content, sofern direkt auf sie zugegriffen wird. Diese Seiten könnten in Suchergebnissen auftauchen. Anstelle einer URL wie http://example.com/page?query#state, schlagen wir vor, einen Token hinzufügen, der es ermöglicht, diese URLs zu erkennen: http://example.com/page?query#[FRAGMENTTOKEN]state. Basierend auf einer Untersuchung der URLs, die es zur Zeit im Web gibt, schlagen vor, "!" (ein Ausrufungszeichen) als den Token hierfür zu verwenden. Die URL, die in Suchergebnissen gezeigt werden könnte, wäre dann: http://example.com/page?query#!state.

Verwendung eines Browsers ohne GUI, der einen HTML-Snapshot an euren Webserver ausgibt
Der GUI-freie Browser wird dazu verwendet, auf AJAX-Seiten zuzugreifen und HTML-Code basierend auf dem Endzustand im Browser zu generieren. Nur speziell getaggte URLs werden an den GUI-freien Browser zur Verarbeitung weitergegeben. Da dies auf der Serverseite passiert, hat der Websitebesitzer Kontrolle über den generierten HTML-Code, und er kann leicht verifizieren, dass der gesamte JavaScript ordnungsgemäß ausgeführt wird. Ein Beispiel für einen solchen Browser ist HtmlUnit, ein Open-Source Browser ohne GUI für Java-Programme.

Escapen von Statusinformationen, damit Suchmaschinen-Crawler auf diese URLs zugreifen können
Da URL-Fragmente nie ohne Anfrage zu Servern geschickt werden, ist es notwendig, die URL, die zum Seitenaufruf verwendet wird, leicht zu modifizieren. Gleichzeitig wird dadurch dem Server mitgeteilt, mit dem GUI-freien Browser HTML-Code zu generieren, anstelle die Seite mit JavaScript widerzugeben. Andere existierende URLs - wie etwa die, die von Usern verwendet werden - würden außerhalb des GUI-freien Browsers normal verarbeitet werden. Wir schlagen vor, die Statusinformation mit einem Escape-Zeichen zu versehen und sie zu den Query-Parametern mittels eines Token hinzuzufügen. Um auf das vorherige Beispiel zurückzugreifen, eine derartige URL könnte http://example.com/page?query&[QUERYTOKEN]=state sein. Basierend auf unserer Analyse der URLs im Web schlagen wir vor, "_escaped_fragment_" als Token zu verwenden. Die vorgeschlagene URL wäre dann http://example.com/page?query&_escaped_fragment_=state.

Anzeige von Original-URLs in den Suchergebnissen
User sollten direkt auf die AJAX-basierten Seiten zu verwiesen werden, um eine bessere User-Erfahrung zu bieten. Dies kann erreicht werden, indem die Original-URL (wie etwa http://example.com/page?query#!state aus unserem vorherigen Beispiel) in den Suchergebnissen gezeigt wird. Suchmaschinen können überprüfen, dass der indexierbare Text, der an Googlebot zurückgegeben wird, derselbe oder zumindest ein Auszug des Textes ist, der an die User ausgegeben wird.

(Grafik von Katharina Probst)http://example.com/dictionary.html#AJAXhttp://example.com/dictionary.html#!AJAXhttp://example.com/dictionary.html?_escaped_fragment_=AJAXhttp://example.com/dictionary.html#!AJAXHier findet ihr die Original-Präsentationenglischsprachigen Diskussionsforum für WebmasterA proposal for making AJAX crawlable (English version)

Webmaster-Zentrale Blog

Ein Vorschlag, AJAX crawlbar zu machen

Keine Kommentare :

Kommentar veröffentlichen

Labels

Archiv

Feed

Google

Producte

Entwickler