Come Google classifica i contenuti: trapelati documenti top secret

0
146
google-foto

Come Google classifica i contenuti: trapelati documenti top secret su come il motore di ricerca classifica le pagine in serp. Ne parliamo su Pop Up

Dopo il caso Yandex del 2023, è successo questa volta a Google. Una serie di documenti top secret sono stati rilasciati e analizzati. Nello specifico, l’evento è accaduto il 13 marzo e la documentazione è stata rilasciata su Github da un bot automatico chiamato yoshi-code-bot. Questo ha rilevato molte informazioni su come Google indicizza e posiziona i contenuti sul suo motore di ricerca.

Questi documenti sono stati poi condivisi con Rand Fishkin, co-fondatore di SparkToro, all’inizio di questo mese e i risultati riportati da numerosi siti di informazione a tema web marketing e SEO, come Search Engine Land, da cui abbiamo estrapolato le informazioni che adesso vi riportiamo.

Andando ad analizzare i documenti, si tratta di 2.596 moduli rappresentati nella documentazione API con 14.014 attributi. I documenti non specificano come vengono ponderate le caratteristiche di classificazione delle pagine ma ci dicono solo che esistono in quanto tali.

Ad esempio, sappiamo che i contenuti possono essere declassati per una serie di motivi, come:

  • Un link non corrisponde al sito di destinazione.
  • I segnali SERP indicano insoddisfazione degli utenti.
  • Recensioni di prodotti.
  • Location.
  • Domini a corrispondenza esatta.
  • Pornografia.

Quello che sappiamo è, inoltre, che Google ha una copia di ogni versione di una pagina che ha indicizzato sul suo motore di ricerca ma utilizza solo le ultime 20 modifiche di un url quando analizza i link.

Altro dato interessante riguarda i backlink, che continuano ad essere un fattore di ranking importante per il posizionamento sul motore di ricerca americano. La diversità e la rilevanza dei link rimangono fondamentali e il PageRank è considerato ancora importante per Google. Non sappiamo, però, se questo è un fattore principale o solo uno dei tanti fattori presi in considerazione da Big G quando deve decidere chi è in alto e chi è in basso nelle sue gerarchie.

Ciò che rimane importante per Google sono i click, che contano ancora, quindi se vuoi ben posizionarti devi puntare sulla qualità del content e privilegiare la user experience. Google utilizza una varietà di misurazioni, tra cui badClicks, goodClicks, lastLongestClicks e unsquashedClicks.

I contenuti più brevi ottengono poi un punteggio che varia da 0 a 512, basato sull’originalità. Vengono assegnati punteggi anche ai contenuti come salute e notizie.

Google memorizza anche le informazioni sugli autori associati ai contenuti e cerca di determinare se un ente è l’autore dello stesso documento.

Infine, Google utilizza qualcosa chiamato “siteAuthority”, molto simile ad un punteggio che determina l’autorità di un sito e influisce sul posizionamento dei contenuti che pubblica. Nello specifico abbiamo che i contenuti di bassa qualità su una parte del sito possono incidere sulla classificazione e sul punteggio del sito nel suo insieme.

Altro dato interessante è che Google guarda se un post è aggiornato oppure no, attraverso le date nella firma (bylineDate), URL (syntacticDate) e nel contenuto della pagina (semanticDate).

Per determinare se un documento è o non è un argomento centrale del sito, Google vettorizza pagine e siti, quindi confronta gli embedding della pagina (siteRadius) con gli embedding del sito (siteFocusScore). Google memorizza anche le informazioni sulla registrazione del dominio (RegistrationInfo).

Google ha anche una funzione chiamata titlematchScore, che si crede misuri quanto bene un titolo di pagina corrisponda ad una query di ricerca.

Google misura la dimensione media ponderata del carattere dei termini nei documenti (avgTermWeight) e nel testo di ancoraggio.

Conclusioni

Sono tantissime, quindi, le informazioni rilasciate in questi documenti, che ci aiutano a capire meglio come Google lavora e come il motore di ricerca decida chi far salire e chi scendere nelle sue serp.

Si tratta a mio parere di una piccola parte dei tanti fattori di posizionamento. Ma queste informazioni sono comunque utili per comprendere i motivi per i quali un dato contenuto è premiato rispetto ad un altro.

Un tassello in più per comprendere il mondo affascinante e in continua evoluzione della SEO. Alla prossima con le ultime notizie a cura di Pop Up!