21 de febrero de 2017

:: Search Console. Eliminar masivamente url's indexadas

En las herramientas de webmaster, ahora llamadas Search Console, en ocasiones necesitamos sacar del índice de Google páginas indexadas. Esta es una tarea habitual cuando -por ejemplo- se modifica una web existente, por lo que las páginas del antiguo portal siguen estando indexadas.
Los pasos a seguir son normalmente los siguientes:
.- En la sección "Rastreo" > "Errores de rastreo" tendremos una relación de url indexadas, susceptibles de ser extraídas del índice de Google

.- Por cada una de las url's que figuran en esta relación, deberemos seleccionar la entrada de menú: "Índice de Google" > "Eliminación de Url"

.- Pulsaremos sobre el botón "Ocultar temporalmente" y especificaremos la url a eliminar del índice y aceptaremos para confirmar

.- Tras unas horas, estas url serán eliminadas del índice de Google

El problema de esta tarea es que debemos ir una a una eliminando las urls indexadas, consideradas incorrectas.
En cualquier caso, estas url's pueden ser indexadas de nuevo, ya que puede que se encuentren referenciadas desde otros portales.

Una forma más ágil de eliminar un número considerable de url's, sería haciendo uso de una extensión.

1.- Accederemos a la siguiente url:
https://github.com/noitcudni/google-webmaster-tools-bulk-url-removal

2.- Nos descargamos la extensión y la descomprimimos en una carpeta

3.- Abrimos el navegador Chrome en nuestro equipo, y accedemos a la url: "Chrome://extensions" y habilitamos el modo "Desarrollador" (check "Modo de desarrollador") o bien seleccionamos la entrada de menú": "Más herramientas" > "Extensiones"

4.- Nos aparecen unos botones y pulsaremos sobre el que dice: "Cargar extensión descomprimida" y seleccionaremos la extensión descargada

Tras este proceso, nos aparecerá esta extensión como habilitada y lista para ser utilizada.


Accederemos a Search Console y seleccionaremos el dominio sobre el que queremos eliminar las urls indexadas, seleccionando la entrada de menú: "Índice de Google" > "Eliminación de URL".
En este caso, nos aparecerán en un desplegable las opciones habituales, además de un botón para poder seleccionar un archivo, que previamente habremos creado con la lista de todas las url's a eliminar (una por línea).
Mediante el uso de esta extensión podemos sacar del índice de Google un conjunto de url especificadas sin necesidad de ir una a una.

2 de febrero de 2017

Liferay :: Friendly Url's y Stop Words

En cualquier CMS, bien sea Wordpress, Liferay, Joomla, etcétera, es importante tener en cuenta que las url's sean amigables, es decir, dotarlas de cierta semántica, como por ejemplo:
"www.dominio.com/liferay-friendly-url" en lugar de "www.dominio.es/post?id=21"

La mayoría de los CMS's ya tienen en cuenta estas pautas, pero quizás deberíamos considerar también las "Stop Words".

Este concepto -Stop Words- indica el uso de palabras que "no aportan significado semántico" a la url, como podría ser: artículos, preposiciones, conjunciones,... y quizás deberíamos suprimirlas de la url amigable que estamos definiendo.

Por ejemplo:
www.dominio.com/ruta-por-los-picos-de-europa-en-invierno

Esta entrada podría quedar de la siguiente manera y lograr un mejor posicionamiento:
www.domino.com/ruta-picos-europa-invierno

Aunque otros CMS disponen de la posibilidad de modificar la url amigable de un contenido, a día de hoy Liferay no permite la modificación de esta url amigable, por lo que es importante tener en cuenta estos detalles durante la definición de la misma.

:: Cookies de nuestra página web. ¿Para qué sirve cada una?

A menudo una pregunta que nos hacen es qué cookies se están utilizando en mi página y para qué sirven. Para ver las cookies, podemos selecci...