Como excluir directorios de tu pagina en los motores de busquedas

El estándar de exclusión de robots, también conocido como el protocolo de la exclusión de robots o protocolo de robots.txt es un método para evitar que ciertos bots que analizan los sitios Web u otros robots que investigan todo o una parte del acceso de un sitio Web, público o privado, agreguen información innecesaria a los resultados de búsqueda. Los robots son de uso frecuente por los motores de búsqueda para categorizar archivos de los sitios Webs, o por los webmasters para corregir o filtrar el código fuente.

Debes crear una archivo llamado robots.txt, cargar en el el sgte codigo:
User-agent: *
Disallow: /directory/

(Ejemplo que dice a un robot específico no entrar en un directorio)
Guardarlo y subirlo en el directorio raíz de tu sitio.

Obs.: debes cambiar “directory por el nombre del directorio que deseas bloquear.

Personalmente lo utilicé para excluir el directorio donde hago mis experimentos.

Los resultados los verás en unos días.

Fuente: http://es.wikipedia.org/wiki/Est%C3%A1ndar_de_exclusi%C3%B3n_de_robots

Advertisement

, ,

  1. Dejar un comentario

Deja un comentario

Fill in your details below or click an icon to log in:

Logo de WordPress.com

You are commenting using your WordPress.com account. Log Out / Cambiar )

Twitter picture

You are commenting using your Twitter account. Log Out / Cambiar )

Facebook photo

You are commenting using your Facebook account. Log Out / Cambiar )

Connecting to %s

Seguir

Get every new post delivered to your Inbox.