Pruebas para evitar el rastreo de Google de partes del contenido

Habitualmente las opciones para bloquear que los robots de búsqueda de Google rastreen el contenido están pensada para página completas o carpetas completas de contenido.
Para desactivar el contenido íntegro de una página es habitual el uso de la etiqueta

al principio del documento html. O bien la directiva de no follow en el archivo htaccess para desativar páginas completas:

User-Agent: gsa-crawler
Disallow: /folder1/
Allow: /folder1/myfile.html

Pero si en lugar de bloquear una página completa se necesita únicamente bloquear ciertas partes del contenido, para ello existen un grupo de etiquetas llamadas .
Estas etiquetas nos pueden interesar si tenemos por ejemplo un texto de biografía que se va repitiendo en el footer o en cierta posición de la página.
Existen varias etiquetas según el uso que se le quiera dar y el procedimiento es incluir la etiqueta al principio del texto a bloquear y al final del texto que se desea indexar.
A continuación los siguientes ejemplos son:

<!–googleoff: snippet–>
este es un texto reiterativo que no queremos que se indexe y le pongo un enlace y este texto es wuachinaipun plaking taun

<!–googleon: anchor –>
esto es un texto para que indexe los enlaces pero no los anchors como a pagina wuachipunpun esclie

<!–googleoff: index–>
verding raming Esto es texto del experimento que no debería indexarse estreginapol clearil granglinau pagina partidings

<!–googleoff: all–>
Este es un párrafo de 30 palabras que contiene la palabra pagina concepto inventado para probar que NO se indexa en los buscadores klopu nita pagina

This entry was posted in Tests SEO. Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>