Advanced SEO Tool 2021: l'automazione per il redirect 301

Sul palco dell'Advanced SEO Tool ho parlato di migrazione dei siti web, un'operazione critica per i brand che operano nel mondo digital. In particolare ho approfondito il tema dell'automazione della fase di redirect 301, condividendo un metodo messo a punto nel team.

Advanced SEO Tool 2021: come automatizzare il redirect 301 in fase di migrazione
Advanced SEO Tool 2021: come automatizzare il redirect 301 in fase di migrazione

All'Advanced SEO Tool, quest'anno, ho parlato di migrazione dei siti web, un'operazione critica per i brand che operano nel mondo digital, e ho approfondito, in particolare, il tema dell'automazione nella fase di generazione del noto "redirect 301".

Come automatizzare il redirect 301 in fase di migrazione

Vediamo una sintesi dei concetti che ho condiviso.

I temi dell'intervento

  • Come si azzera o si riduce in maniera importante l’effort del redirect 301?
  • Perché non è sempre possibile  mettere in atto questo tipo di soluzioni?
  • Un metodo "salvavita" per automatizzare le operazioni senza dannosi compromessi.
  • Casi di utilizzo recenti del metodo su alcuni progetti.

Come si azzera l'effort del redirect 301?

Dopo il rifacimento di un sito web, possiamo assistere a due azioni per la migrazione dei contenuti: l’importazione o il data entry.

Come si azzera l'effort del redirect 301? Uno schema operativo
Come si azzera l'effort del redirect 301? Uno schema operativo

In entrambi gli scenari, possiamo fare in modo che nella base di dati del nuovo sito web, per ogni entità (pagina, prodotto, categoria, ecc.), esista un’associazione alla stessa entità del vecchio sito web, attraverso, ad esempio, l'URL e/o l'ID.

Questo permette, in seconda battuta, di estrarre tutte le entità di interesse attraverso alcune query SQL, e per ognuna di avere a disposizione l'associazione tra il vecchio ed il nuovo URL. Attraverso un semplice algoritmo, tutto ciò si trasforma nella generazione di tutte le regole di rewrite necessarie.

Perché sfruttare il DB del nuovo sito web e non, ad esempio, una struttura dati esterna? Perché mentre il vecchio sito è un sistema statico dal punto di vista dello sviluppo del progetto, il nuovo in costruzione può cambiare dalla fase di data entry al "golive". Usando il database del nuovo sito web, si può essere certi di avere una sincronizzazione perfetta.

Un frammento dell'intervento in cui spiego l'automazione del redirect 301

Perché non è sempre possibile?

In realtà, soluzioni come quella descritta, sono sempre attuabili, ma sono necessarie della competenze di sviluppo e una grande consapevolezza dell'architettura che si sta implementando.

Come dico spesso, l'era dell'improvvisazione nel mondo dello sviluppo sta per terminare (fortunatamente)!

Inoltre, spesso, si tratta di attività non previste in fase di pianificazione del progetto, ed il team SEO viene coinvolto soltanto in seconda battuta e "a giochi fatti".

Di conseguenza si tende ad agire per compromessi che possono essere dannosi. Nel post che segue, racconto un esempio dei rischi che si possono correre per un errore in fase di redirect.

SEO: l’importanza della migrazione
Una migrazione SEO ben architettata è davvero importante, perché l’effort per tornare ad avere delle performance soddisfacenti è notevole.
Una migrazione ben architettata è davvero importante, perché l'effort per tornare a performare (e a crescere) è notevole.

Un metodo "salvavita" per automatizzare le operazioni

Come possiamo agire prima di arrivare a scelte che possono penalizzare il progetto? Durante l'intervento ho spiegato un metodo che abbiamo messo a punto nel team SEO di site By site.

I protagonisti del metodo per automatizzare il redirect 301
I protagonisti del metodo per automatizzare il redirect 301

Come funziona il metodo? L'algoritmo in breve

Ne riassumo le fasi principali.

  • La base di partenza è la lista degli URL del vecchio sito web da migrare, inseriti, ad esempio, in una colonna di un foglio di Google Data Sheet.
  • Individuiamo un dato in queste pagine che, cercato nel nuovo sito, dia un risultato utile, ovvero permetta di trovare la nuova entità corrispondente. Chiaramente dev'essere un dato il più possibile univoco per rendere la ricerca più precisa.
  • Estraiamo il dato attraverso un’azione di scraping all’interno delle pagine da migrare. In questo caso usiamo XPath per identificare gli elementi.
  • Eseguiamo una ricerca nel nuovo sito web usando il dato estratto, attraverso una nuova azione di scraping della pagina di ricerca per ottenere il nuovo URL.
  • Attraverso un semplice algoritmo, utilizzando il vecchio URL e il nuovo URL, generiamo automaticamente le regole di rewrite.
Attraverso un semplice algoritmo, generiamo automaticamente le regole di rewrite
Attraverso un semplice algoritmo, generiamo automaticamente le regole di rewrite

Durante l'intervento ho mostrato un esempio del sistema in azione partendo dalla lista dei prodotti di un e-commerce B2C, ed utilizzando l'implementazione dell'algoritmo attraverso un foglio di Google Data Sheet, Apps Script e un'API esterna sviluppata in PHP (per la fase di scraping). Tuttavia, può essere implementato utilizzando qualunque linguaggio di programmazione.


Casi di utilizzo recenti

Quelli che seguono sono due esempi di progetti in cui, nel team, abbiamo utilizzato il metodo appena descritto.

Due esempi di progetti in cui è stata usata l'automazione nella creazione del redirect 301
Due esempi di progetti in cui è stata usata l'automazione nella creazione del redirect 301

Entrambi sono e-commerce B2C, in cui sono stati migrati circa 15k URL nel primo caso e 3k URL nel secondo, con un effort davvero bassissimo.


Un metodo sperimentale per automatizzar eil redirect 301

Ma se il nuovo sito web non avesse la ricerca? Premettendo che l’idea dell'uso di automazione nasce per siti web strutturati, e quindi difficilmente non dotati di ricerca interna. Tuttavia, abbiamo creato un prototipo con il seguente flusso di funzionamento.

Un metodo sperimentale per creare il redirect 301 automaticamente
Un metodo sperimentale per creare il redirect 301 automaticamente

L'algoritmo è molto simile. Stavolta, però, si parte dalle pagine del nuovo sito web, si passa sempre per un'azione di scraping per estrarre un dato utile per unire la vecchia e la nuova entità, ma non effettuiamo più una ricerca interna per ottenere il nuovo URL; effettuiamo uno scraping della SERP di Google o di Bing per ottenere il vecchio URL. La ricerca avviene utilizzando l'operatore "site" e attraverso le API di un browser headless come Puppeteer (vedi gli approfondimenti alla fine del post) o Selenium.


Conclusioni

Come conclusioni, vorrei lasciare due semplicissimi, ma importanti, take away.

  1. In caso di migrazione, coinvolgendo il team SEO da subito, si possono implementare soluzioni a basso effort che permettono di risparmiare giorni di lavoro, senza compromessi.
  2. Grazie al metodo che ho condiviso, possiamo automatizzare le operazioni e ridurre di molto l’effort con buoni risultati.

Per approfondire

Puppeteer: come usare Chrome attraverso le API per fare browser automation
In questo post scopriamo e impariamo ad usare Puppeteer, uno strumento che permette di creare delle automazioni per Chrome utili per analisi SEO e UX.
Generare in automatico gli script per Puppeteer? Con un’estensione di Chrome!
Attraverso un’estensione di Google Chrome, è possibile registrare gli eventi del browser e convertirli in uno script per Puppeteer. Scopri come!