Cómo desindexar páginas para dummies

Cómo desindexar páginas para dummies

Hoy os traemos una guía para que sepáis cómo desindexar URLs con Search Console, así podréis mejorar la optimización de vuestra web para el SEO, ¡que la disfrutéis!

¿Para qué sirve desindexar páginas de nuestra web?

¿Por qué íbamos a querer desindexar páginas? Porque muchas veces se indexan algunas (o cientos de miles😩😩) que no nos interesan como: política de cookies, aviso legal, imágenes,  las páginas 2-3-4 del blog, , pasarelas de pago, páginas del tipo  project category etc.

¿Y qué pasa que se indexen? Por un lado que páginas como pasarela de pago no es muy seguro que lo estén, y por otro porque perdemos el Crawl Budget en analizar tonterías 🤡 y contenido de poca calidad (como es un aviso legal, ¿o es que acaso alguien se pone a buscarlo en Google? Si dices que sí y tú lo haces para de leer esto y míratelo 😬😬).

Ok, ¿cómo son estas URLs? Fácil de identificar, tienen esta pinta tan chunga🎃👽🤖🧙‍♂️💩:

www.paginadeejemplo.es/wp-content/uploads/2018/02/imageEJEMPLOF_i5.pdf

www.paginadeejemplo.es/wp-content/uploads/2012/01/Color-4.pdf

www.paginadeejemplo.es/blog/page-2

www.paginadeejemplo.es/Aviso-legal

En otras ocasiones sí queremos que se indexen pero igualmente no están muy optimizadas y son poco SEO-friendly páginas como: www.paginadejemplo.es/category/sofas/product/sofa-cama En este caso lo idóneo es hacer que queden sin el category ni el product pero depende del caso. Otro día veremos cómo hacer esto (recordádmelo por twitter o por donde queráis que sino se me olvida, thank youuuuuu😇😇)

 

Pasos para desindexar URLs

Identificación de páginas indexadas que no debían estarlo

Lo primero que tenemos que hacer es saber qué páginas están indexadas y qué fallos hay. Para esto recomiendo 2 pasos:

1 Search Console

Ir a Google Search Console – Aparición de búsquedas – Mejoras de HTML. Aquí encontraremos sugerencias acerca de los fallos encontrados, como páginas duplicadas.

Problema: que suele estar desactualizado y a veces falla en cuanto a lo que considera páginas duplicadas.

Ventaja: también da información útil, pobrecito, no seamos malos con él😈😈.

 

Desindexar con Search Console

2 Site:

Hacer un maravilloso👏, espectacular🙌, brillante☀️, emocionante🥳🤗, apasionante y flipante  site ‘2 puntos’ (también podemos usar para  hacerlo perfecto Screaming Frog, pero esto ya no es para dummies así que lo veremos otro día). ¿Y esto del site: qué es? Pues sencillamente ponemos en la barrita de Google site:paginadeejemplo.es (poniendo la URL de la web limpia).👍🔥⚡️💥

Con esto veremos TODAS las páginas indexadas del dominio principal y podemos comenzar a investigar las URLs. Veamos un ejemplo con las URLs de CMAcomunicacion:

 

Cómo hacer un site 2 puntos

 

Le damos a buscar en Google y comenzamos a investigar las URLs que no queremos que estén Indexadas entre los resultados.

Análisis de las páginas indexadas

¿Cómo investigarlas? Tal y como suena, debemos ir mirando, buscando patrones comunes como por ejemplo que se repita blog/page-2/3/4/5…., en este caso pondremos site:paginadeejemplo.es/blog/page y nos dirán todas las URLs de este tipo. También podemos poner paginadejemplo.es blog o la palabra clave que nos interese y en teoría debe darnos resultados (digo en teoría porque a veces lo hace como quiere😡😡).

Pues bien, ¿Cómo facilitar esto? Lo primero que podemos hacer es instalar la extensión de Chrome Infinite Scroll for Google para  hacer Scroll hacia abajo ilimitadamente sin tener que ir pasando de la página 1 a la 2 y a la 20 de los resultados (lamentablemente también funciona como quiere a veces, o eso o yo tengo gafe 🤧🤧)

Pues bien, vamos mirando errores y suponemos que efectivamente se han indexado páginas asi:

www.paginadeejemplo.es/blog/page-2

www.paginadeejemplo.es/blog/page-3

www.paginadeejemplo.es/blog/page-4

www.paginadeejemplo.es/sofa/sofa-cama/amarillo

Estas páginas deberíamos de cogerlas y meterlas en el Search Console para desindexarlas. Si son 5 muy fácil, las cogemos y las pegamos, pero ¿y si son 30? ¿Ya no tienes tantas ganas de ir sacándolas una a una verdad🤪🤪?

Para esto es útil coger alguna extensión de Chrome que permita extraer todas las URL como Link Klipper o alguna web que las extraiga como Intavant.

Lamentablemente no voy a recomendar ninguna porque aún no he encontrado la que me convenza del todo y no dé fallos. En cuanto a Link Klipper vale, pero a veces no sabes si ha sacado el listado de todas las páginas por el Scroll infinito o solo de una, igualmente saca una guarrada de enlaces que hay que limpiar en el Excel, ese programa de Windows que todo el mundo ama 💚.

Enfin… vamos a apañarnos con esto🤨.

 

Una vez que con el Link Klipper sacamos todos los enlaces en un documento de Excel LOS TIRAMOS A LA BASURA (que no hombre que no, los abrimos 😂😂 me río yo solo😂). Una vez abierto nos encontraremos con unas deliciosas LENTEJAS 🤢 y tendremos que comérnoslas 🥴… pero vamos a  hacer que sepan mejor (por ejemplo podemos echarles queso o mayonesa, SIII, habéis leído bien, queso o mayonesa, no están tan mal, I promise).

 

Limpieza de las URLs indexadas con un Excel

¿Cómo limpiamos y mejoramos entonces nuestro Excel? Pues bien:

1 Ordenamos alfabéticamente el contenido: Seleccionamos la primera columna donde están todas las URLs y vamos a: Datos – Ordenar alfabéticamente.

 

Ordenar alfabéticamente Excel

2 Borramos todas aquellas que no eran las que buscábamos (Será fácil porque previamente las hemos ordenado)

3 Limpiamos las URLs. Volvemos a seleccionar la primera columna donde están las URLs y de nuevo vamos a datos – texto en columnas – delimitados – seleccionamos comas y finalizar. De esta forma todo lo que sobra que viene después de la URL (que suele ir precedido de una coma) se pondrá en la columna 2 y simplemente tendremos que eliminarla.

 

 

4 Ya tenemos la URL acabada en un .pdf / .es o lo que queramos desindexar. Ahora toca limpiarla todavía más. Para ello con nuestra primera columna seleccionada vamos a Inicio – Buscar – Buscar y reemplazar. En el campo buscar ponemos: https://www.paginadeejemplo.es/ y en el de reemplazar lo dejamos vacío. De esta forma la URL quedará sencillamente blog/page-2.

 

Buscar y reemplazar en Excel

 

Ya está, chupado, hasta aquí hemos acabado con el Excel 🤬🤬🤯🔫

 

Subida masiva de páginas a Search Console para desindexarlas

Cogemos las URLs y las pegamos en un bloc de notas y lo guardamos.

Nos vamos al Search Console – Índice de Google – Eliminar URLs.

Dentro de Eliminar URLs nos saldrá  un cuadrito para ir metiendo las URLs que queremos que se desindexen. Como seguramente tengamos un montón y no queramos ir una por una tenemos que volver a las extensiones de Chrome y buscarnos una que nos permita subir masivamente URLs al Search Console. Podemos usar Bulk URL Removal, activar el modo desarrollador, instalarla y activarla.

Una vez instalado simplemente subimos el documento del bloc de notas y comenzará a desindexarse una a una.

 

Desindexar URLs con Search Console

 

Con esto conseguiremos limpiar los resultados de Google de páginas indexadas por error. Igualmente es recomendable volver a mirar una o dos semanas después para ver que se ha hecho correctamente y no se han vuelto a indexar (podemos configurar también para que ciertas páginas no se indexen en un futuro, pero eso también lo dejamos para otro día para no cansaros demasiado 😁.

Conclusión

Son muchas las razones por las que podemos estar interesados en desindexar páginas creadas en nuestra web. Bajo mi opinión y como digo siempre, lo más importante, más que los pasos técnicos, es entender los conceptos más abstractos, el funcionamiento de Google, para qué indexar y desindexar, cuándo hay que hacerlo, sobre qué páginas, cuál es la mejor forma y sobre todo, para qué.

Este entendimiento de conceptos y realizarte las adecuadas preguntas clave es lo que te diferenciará como buen profesional, sea cual sea tu especialidad y el mundillo en el que te muevas.

No dudéis en realizar cualquier pregunta, estaré encantado de resolverla.

Deja un Comentario