robots.txt mit Typo3 erstellen

23 Kommentare | Rubrik: Empfohlene Module, SEO

 

Die robots.txt gestattet dem Websitebetreiber Einfluss auf die Suchmaschinencrawler zu nehmen. Mit ihr können bestimmte Bots für Seiten und Teilbereiche gesperrt werden, um so eine Indexierung zu verhindern.

robots.txt für Typo3

robots.txt für Typo3

Eine Typo3 Extension zur Generierung einer solchen robots.txt ist "Robotstxt" (weeaar_robotstxt). Zwar gehört die robots.txt nur im weiten Umfeld zur Suchmaschinenoptimierung, doch ein Steuerung der Suchmaschinencrawaler kann auch das Unterbinden von Zugriffen sein, um Teilbereiche erst nach und nach zugänglich zu machen. Auch eine XML-Sitemap für Suchmaschinen kann über die robots.txt bekannt gemacht werden.

Extensionbeschreibung auf Typo3.org

Installation

  1. Im Ext Manager die Extension weeaar_robotstxt suchen, herunterladen und installieren
  2. Im Setup der Rootseite mit folgendem TS einen neuen Seitentyp erstellen. Die pid_list auf die Seite setzen (am besten die Rootseite), in der später der robots.txt Inhalt eingetragen wird.
    robots = PAGE
    robots {
      typeNum = 201
      10 >
      10 < plugin.tx_weeaarrobotstxt_pi1
      10.pid_list = 1
      config {
        disableAllHeaderCode = 1
        additionalHeaders = Content-type:text/plain
        no_cache = 1
      }
    }
  3. Die Seiteneigenschaften der Seite bearbeiten, die bei pid_list eingetragen wurde.
  4. Im neuen Block "Inhalt der Robots.txt" die Konfiguration der robots.txt eintragen.
    Eine Erläuterung zur Konfiguration der robots.txt findet man z.B. bei Wikipedia. Im Netz findet man aber auch viele gute Generatoren, die einem bei der Erstellung der Konfiguration helfen.
    Folgendes Beispiel erlaubt allen Bots das crawlen aller Seiten.
    User-agent: *
    Disallow:

    Für SEO-Zwecke kann auch der Verweis auf eine XML-Sitemap der Website geschaltet werden. Hierzu erstellt man eine XML-Sitemap für Typo3 und fügt der robots.txt folgenden anzupassenden Eintrag hinzu.

    Sitemap: http://www.meineseite.tld/sitemap.xml 
  1. Den Aufruf der robots.txt testen (ID der Rootseite und Domain anpassen):
    www.meinedomain.de/index.php

 

Konfiguration für RealURL

Wer RealURL verwendet kommt mit folgender Konfiguration weiter. Der robots.txt-Teil muss zur Konfiguration hinzugefügt werden.

'index' => array(
                'rss.xml' => array(
                    'keyValues' => array(
                        'type' => '100',
                    ),
                ),
                'robots.txt' => array(
                    'keyValues' => array(
                        'type' => '201',
                    ),
                ),
),

3 Kommentare

Seite 1 von 1 1

#3 suit answer
schrieb am 13.07.2011 11:50

Es gibt alternativ auch noch "robots_exclusion" - tut dasselbe wie weeaar_robotstxt, macht aber vieles automatisch

 

http://typo3.org/extensions/repository/view/robots_exclusion/current/

#2 Bernd answer
schrieb am 06.05.2008 12:39

Hallo,

nachdem ich die Extension installiert und eingerichtet habe, kann die Robots.txt zwar über index.php?id=1&type=201 aufrufen, doch wenn ich es mit robots.txt versuche komme ich nur auf die normale Seite. Was muss ich in der realurl_autoconf.php noch anpassen?

 

Viele Grüße

Bernd

#1 samefa answer
schrieb am 27.02.2008 16:28

Hallo,

wie kann ich die Extension "weeaar_robotstxt" in Kombi mit RealURL und einer mehrsprachigen (multi language) Typo3-Installation (mit mehreren Länder-Domains) einsetzen?

Also so, dass jede Länder-Domain eine eigene "robots.txt" erhält?

Vielen lieben Dank für Dein/Euer Feedback!

samefa

Einen Kommentar schreiben

Email wird nicht veröffentlicht.


Aktuelles aus Typo3

Bookmark setzen

bookmark in your browserbookmark at mister wongpublish in twitterbookmark at del.icio.usbookmark at digg.combookmark at furl.netbookmark at linksilo.debookmark at reddit.combookmark at spurl.netbookmark at technorati.combookmark at google.combookmark at yahoo.combookmark at facebook.combookmark at stumbleupon.combookmark at propeller.combookmark at newsvine.combookmark at jumptags.com