Saltar al contenido

Transformar urls en columnas de excel para sacar las categorías de una Web

excel

Hoy hemos hecho algo nuevo.. de una Excel con miles de rutas que componían un sitio Web, hemos sacado de modo separado cada una de las categorías y subcategorías que componían las rutas.

Esto era necesario para recategorizar el portal (replantear el sistema de categorías), pero tremendamente dificultoso debido al gran número de categorías y subcategorías que había y a que no seguían aparentemente ninguna regla a la hora de formarse.

No sé si me he explicado.. teníamos algo así:

  1. http://www.tudominio.com/categoria1/subcat1/subcat2/nombreproducto
  2. http://www.tudominio.com/categoria2/subcat3/subcat4/nombreproducto
  3. http://www.tudominio.com/categoria2/subcat5/subcat6/nombreproducto

Y hasta el infinito y un poquito más allá, y necesitábamos, a efectos de análisis, separar los subdirectorios en una Excel, allá donde apareciera un «/». Posteriormente sería muy sencillo filtrar por categorías, estudiar las relaciones entre las categorías y subcategorías, montar tablas dinámicas a efectos de contar las apariciones de cada una, plantear redirecciones para que Google no te penalice, etc.

Todo esto es tremendamente útil si planteas un cambio de tecnología en un portal, un rediseño, etc.

¿Cómo separar los directorios y subdirectorios de miles de urls en una Excel?

Pues después de mucho probar con fórmulas tipo Encontrar, Izquierda, Derecha, Largo, Concatenar… ha sido tan sencillo como:

  1. Sacar el listado de rutas a un txt.
  2. Buscar y reemplazar los «/» por «;».
  3. Guardar el txt como .csv.
  4. Abrirlo desde Excel y asegurar que separa por «;» (lo hace por defecto).

Y ya está, todo separadito y ordenadito. Llevábamos un rato pegándonos con las fórmulas, y así ha sido mucho mucho más sencillo… Espero que te sirva!