Scandalo Google: trapelati documenti con le "bugie" che ci ha detto

Domenica 5 maggio, è emersa un’informazione senza precedenti riguardante una massiccia fuga di documentazione API proveniente dall’interno della divisione Ricerca di Google. Una comunicazione via e-mail da parte di un individuo anonimo ha rivelato che questi documenti trapelati sono stati autenticati da ex dipendenti di Google e che ulteriori informazioni riservate sulle operazioni di ricerca dell’azienda sono state diffuse. Le affermazioni contenute in questi documenti mettono in discussione direttamente le dichiarazioni pubbliche fatte dai rappresentanti di Google nel corso degli anni.

La conferma di Google

Google ha finalmente emesso un verdetto sulla controversa questione dei 2.500 documenti riservati che hanno scosso le fondamenta dell’algoritmo del motore di ricerca. “Mettiamo in guardia dal fare supposizioni inaccurate su come funziona Search basate su informazioni decontestualizzate, obsolete o incomplete“, avverte un portavoce di Mountain View. “Abbiamo condiviso informazioni su come funziona Search e sui tipi di fattori che i nostri sistemi valutano, lavorando anche per proteggere l’integrità dei nostri risultati dalle manipolazioni“.

NavBoost e le “pratiche segrete” di Google

Naturalmente, sorgeva un legittimo scetticismo di fronte alle affermazioni fatte dalla fonte, la quale ha richiesto di mantenere l’anonimato. Queste affermazioni, come riportato da Rand Fishkin, esperto del settore includevano dettagli notevoli, come:

Negli anni iniziali, il team di ricerca di Google riconobbe l’importanza dei dati clickstream completi, ossia l’insieme di tutte le URL visitate da un browser, per migliorare la qualità dei risultati del suo motore di ricerca. Per soddisfare questa necessità, fu sviluppato un sistema denominato “NavBoost“, inizialmente basato sui dati del PageRank della barra degli strumenti di Google. Il desiderio di dati clickstream più completi, infatti, servì da motivazione primaria per la creazione del browser Chrome, lanciato nel 2008.
NavBoost si avvale del numero di ricerche per una specifica parola chiave per identificare le tendenze di ricerca, nonché del numero e del tipo di clic sui risultati di ricerca. Inoltre, si sono condotti esperimenti per valutare l’efficacia dei clic lunghi rispetto a quelli brevi. Google utilizza la cronologia dei cookie e i dati di navigazione di Chrome, insieme al rilevamento di modelli di clic, per contrastare lo spam causato sia da clic manuali che automatizzati.
Il sistema attribuisce un punteggio alle query in base all’intento dell’utente, attivando funzionalità specifiche, come video o immagini, in risposta a determinati comportamenti di ricerca. NavBoost analizza i clic e il coinvolgimento sia durante che dopo una ricerca principale, noto come “query NavBoost“, influenzando così i risultati di ricerca in base alle interazioni dell’utente.
I dati raccolti da NavBoost vengono utilizzati per valutare la qualità complessiva di un sito web, influenzando la sua posizione nei risultati di ricerca. Fattori minori, come le penalizzazioni per i nomi di dominio corrispondenti esattamente alle query di ricerca, vengono anche presi in considerazione durante questo processo di valutazione.
NavBoost raccoglie dati geografici, tenendo conto del luogo e del tipo di dispositivo utilizzato per la ricerca. Durante eventi rilevanti come la pandemia di Covid-19 e le elezioni democratiche, Google ha utilizzato whitelist per influenzare i risultati di ricerca, evidenziando la complessità delle politiche e delle pratiche di gestione dei dati del motore di ricerca più utilizzato al mondo. Queste rivelazioni rappresentano solo la punta dell’iceberg, sollevando importanti interrogativi sull’impatto e sulla trasparenza delle azioni di Google nel campo della ricerca online.

Google ha mentito?

Le “bugie” di Google, come svelato dalla fuga di documenti API, sono molteplici e riguardano principalmente le dichiarazioni pubbliche contraddittorie rispetto alle pratiche effettive utilizzate nei suoi algoritmi di ricerca.

Tra quelle più significative troviamo le negazioni riguardanti l’utilizzo di segnali utente basati sui clic nelle classifiche dei risultati di ricerca. I dettagli contenuti nei documenti soggetti al leak suggeriscono, innanzitutto, che Google abbia mantenuto un velo di menzogna sulla classificazione delle pagine web nella ricerca: sembrerebbe che abbia raccolto (e potrebbe utilizzare) dati che fino ad ora aveva negato contribuissero all’indicizzazione nei risultati di ricerca, come i click o l’autorevolezza di un brand. Tuttavia, rimane incerto quali di questi dati vengano effettivamente impiegati e quale sia il peso attribuito ai diversi fattori.

Questo cambierà la SEO?

La SEO, acronimo di Search Engine Optimization, è il processo di ottimizzazione di un sito web e dei suoi contenuti per migliorare la visibilità organica su motori di ricerca.

L’obiettivo principale della SEO è quello di aumentare il traffico qualificato al sito web attraverso risultati di ricerca non a pagamento, noti anche come risultati organici. Questo viene ottenuto mediante l’ottimizzazione di fattori che influenzano il posizionamento del sito web nei risultati di ricerca, tra cui la scelta delle parole chiave, l’ottimizzazione del contenuto, la struttura del sito, la qualità dei collegamenti esterni (backlink) e altri aspetti tecnici. Una strategia efficace di SEO può contribuire a migliorare la visibilità del sito web, aumentare il traffico organico e generare maggiori conversioni e vendite.

La rivelazione di queste informazioni avrà un impatto significativo sulle strategie e le tattiche utilizzate dagli specialisti di marketing online per ottimizzare i siti web per i motori di ricerca. Gli operatori SEO dovranno rivalutare le loro pratiche per adeguarsi ai potenziali cambiamenti nei criteri di classificazione di Google.

Potrebbero emergere nuove best practice basate su queste informazioni, consentendo agli operatori SEO di adattare le loro strategie per massimizzare l’ottimizzazione dei siti web e migliorare il posizionamento nei risultati di ricerca. Tuttavia, potrebbe anche essere necessario un maggiore impegno nell’etica e nella conformità alle linee guida di Google per evitare sanzioni e mantenere una posizione competitiva nei risultati di ricerca. Inoltre, la divulgazione di queste informazioni potrebbe portare a una maggiore richiesta di trasparenza da parte di Google riguardo ai suoi algoritmi di ricerca e alla gestione dei dati, influenzando così anche le pratiche future degli operatori SEO.

Documenti API Google: quanto del contenuto è Ancora attivo nei sistemi di ranking?

La questione principale è quanto di ciò che è descritto nei documenti API sia attualmente utilizzato da Google. Mentre alcuni dettagli potrebbero essere stati ritirati o utilizzati solo internamente, altri sembrano ancora in uso attivo.

Il testo fornito contiene alcune informazioni cruciali:

Viene menzionato che il campo “nome visualizzato a livello di dominio del sito web” è stato deprecato a partire da agosto 2023, indicando che la documentazione potrebbe essere stata aggiornata fino a quella data.
Si sottolinea che la ricerca su Google subisce cambiamenti significativi di anno in anno, e molte delle innovazioni recenti, come le AI Overviews, non sono incluse nella fuga di notizie.
Si solleva la domanda su quali parti della documentazione siano ancora attivamente utilizzate nei sistemi di ranking di Google.
Viene indicato che il testo fornisce uno dei collegamenti più significativi fino ad ora, in particolare considerando le testimonianze dei dirigenti di Google nel processo del Dipartimento di Giustizia.

La documentazione sembra confermare e ampliare molte delle dichiarazioni fatte durante quel processo. Quindi, quale parte di questa documentazione è ancora attivamente utilizzata nei sistemi di ranking di Google? Questo è un argomento su cui si può solo speculare.

Continua la lettura su MeteoWeb