Home
» Wiki
»
Google ha pubblicato accidentalmente la documentazione sul funzionamento della ricerca
Google ha pubblicato accidentalmente la documentazione sul funzionamento della ricerca
Lunedì sono trapelati documenti interni che descrivono i fattori che Google Search prende in considerazione per classificare e visualizzare i risultati web.
Google rivela accidentalmente come funziona la Ricerca
Questi documenti sono stati resi pubblici da Rand Fishkin di SparkToro, un'azienda di software. Fiskin ha lavorato in precedenza nel settore dell'ottimizzazione dei motori di ricerca (SEO).
Questo "Google API Content Repository" contiene la documentazione API interna che spiega ai dipendenti come funzionano i diversi componenti che generano i risultati di ricerca. Ci sono più di 2.500 pagine in totale. Alcuni descrivono sistemi più vecchi, ma altri documenti sembrano essere aggiornati.
In base a quanto pubblicato, Google sembra averlo reso disponibile al pubblico – forse per sbaglio – tramite GitHub a partire dal 27 marzo. I documenti esplicativi sono stati poi pubblicati il 7 maggio. Tuttavia, poiché era stato indicizzato da un servizio di terze parti in quel periodo, una copia è rimasta disponibile anche dopo la rimozione da parte di Google.
Sebbene questi dati mostrino quali fattori la Ricerca Google potrebbe prendere in considerazione per classificare i risultati di ricerca, non rivelano quanto sia importante ciascun fattore per la classifica finale.
Coloro che nella comunità SEO cercano di adattarsi ai cambiamenti nelle classifiche di ricerca di Google e di apparire più in alto nella pagina potrebbero trovare utili questi dati. Dopo aver esaminato il documento, hanno scoperto che contraddiceva quanto Google aveva dichiarato pubblicamente sul funzionamento della Ricerca.
Google non ha ancora rilasciato dichiarazioni pubbliche in merito alla fuga di notizie. A marzo l'azienda ha annunciato l'ultimo importante aggiornamento della Ricerca, con l'obiettivo di mostrare contenuti più autentici e "utili". Il suo sistema di classificazione di base è stato aggiornato per determinare se una pagina è "creata per i motori di ricerca piuttosto che per le persone " .
Le scoperte più importanti nella fuga di notizie
Una cosa è chiara: l'algoritmo di ricerca di Google non è trapelato e gli esperti SEO non hanno improvvisamente tutte le risposte. Ma le informazioni trapelate in una serie di migliaia di documenti interni di Google sono comunque ingenti. Uno sguardo senza precedenti ai meccanismi interni di Google, solitamente tenuti gelosamente custoditi.
I siti web dipendono dal traffico di ricerca per sopravvivere e molti di loro sono disposti a tutto, anche a spendere molto, per battere i concorrenti e arrivare in cima ai risultati. Un posizionamento migliore si traduce in più traffico sul sito web, che a sua volta si traduce in più soldi. Di conseguenza, i gestori di siti web monitorano attentamente ogni parola pubblicata da Google, nonché ogni post sui social media, per quanto riguarda la classifica dei risultati di ricerca.
Nel corso degli anni, i portavoce di Google hanno ripetutamente negato che i clic degli utenti influenzino il posizionamento dei siti web, ma documenti trapelati hanno evidenziato che alcuni tipi di clic degli utenti incidono sul posizionamento nei risultati di ricerca. Una testimonianza relativa a un precedente caso antitrust del Dipartimento di Giustizia degli Stati Uniti ha rivelato un fattore di ranking chiamato Navboost, che utilizza i clic degli utenti per migliorare i contenuti nei risultati di ricerca.
"Per me, la cosa più importante da imparare è che molte delle dichiarazioni pubbliche di Google su ciò che raccolgono e su come funziona il loro motore di ricerca sono in contrasto con la realtà", ha detto via e-mail a The Verge Rand Fishkin, esperto nel settore dell'ottimizzazione per i motori di ricerca (SEO) .
La fuga di notizie è diventata virale per la prima volta dopo che gli esperti SEO Fishkin e Mike King hanno pubblicato all'inizio di questa settimana parte del contenuto del documento riservato, insieme all'analisi di accompagnamento. I documenti API trapelati includono repository pieni di informazioni e definizioni sui dati raccolti da Google, alcuni dei quali possono influenzare il posizionamento dei siti web nei risultati di ricerca. Inizialmente Google ha eluso le domande sull'autenticità dei documenti trapelati prima di confermarli ufficialmente mercoledì scorso.
"Mettiamo in guardia dal fare supposizioni inaccurate sulla Ricerca basate su informazioni fuori contesto, obsolete o incomplete", ha dichiarato mercoledì il portavoce di Google Davis Thompson a The Verge in una e-mail. Abbiamo condiviso informazioni approfondite su come funziona la Ricerca e sui tipi di fattori presi in considerazione dai nostri sistemi e lavoriamo per proteggere l'integrità dei nostri risultati da eventuali manipolazioni .
Nella documentazione non c'è alcun punto in cui si spieghi come ponderare i diversi attributi. È anche possibile che alcune delle proprietà menzionate nella documentazione, come un identificatore per un "piccolo sito personale" o un downgrade per le recensioni dei prodotti, siano state implementate in un secondo momento, ma poi rimosse. Potrebbero anche non essere mai stati utilizzati per classificare i siti web.
"Non sappiamo necessariamente come [gli elementi] vengano utilizzati, a parte le varie descrizioni che ne vengono fornite. Sebbene non sia un materiale molto ricco, è comunque una fonte di informazioni molto ricca", ha detto King. "Quali aspetti dovremmo considerare più specificamente quando creiamo o ottimizziamo un sito web?".
L'idea che la piattaforma di ricerca più grande al mondo non classifichi i risultati di ricerca in base al modo in cui gli utenti interagiscono con i contenuti sembra assurda. Ma le ripetute smentite, le risposte attentamente formulate e le pubblicazioni del settore ne fanno un argomento controverso.
Un altro punto importante evidenziato da Fishkin e King riguarda il modo in cui Google potrebbe utilizzare i dati di Chrome nelle sue classifiche di ricerca. I rappresentanti di Google Search hanno affermato di non utilizzare nulla di Chrome per le classifiche, ma alcuni documenti trapelati suggeriscono che potrebbe non essere vero. Ad esempio, una sezione elenca "chrome_trans_clicks" per indicare quali link da un dominio compaiono sotto il sito principale nei risultati di ricerca. Fishkin spiega che questo significa che Google "prende il numero di clic sulle pagine nel browser Chrome e usa quel numero per determinare gli URL più popolari/importanti su un sito, che vengono poi calcolati per l'inclusione nella funzionalità dei sitelink " .
Nel documento sono menzionate oltre 14.000 proprietà e i ricercatori dovrebbero scavare per settimane per trovare gli indizi contenuti nelle pagine. I "Twiddlers" o aggiustamenti della classificazione vengono implementati al di fuori dei principali aggiornamenti di sistema per classificare i contenuti in base a determinati criteri. Vengono trattati elementi del sito, come ad esempio l'identità dell'autore, nonché parametri relativi all'"autorevolezza" del sito. Fishkin sottolinea che ci sono molte cose che non vengono rappresentate nei documenti, come ad esempio le informazioni sui risultati di ricerca generati dall'intelligenza artificiale.
Cosa significa tutto questo? Innanzitutto, forse chiunque gestisca un sito web leggerà di questa fuga di notizie e cercherà di capirne il motivo. Editori, aziende di e-commerce e aziende progetteranno probabilmente vari esperimenti per provare a testare alcuni degli aspetti suggeriti nel documento. Quando ciò accade, i siti web possono iniziare ad apparire un po' diversi, nel tentativo di dare un senso a questa nuova, seppur ambigua, ondata di informazioni.
"I giornalisti e gli editori che si occupano di SEO e di Google Search devono smettere di ripetere a pappagallo le dichiarazioni pubbliche di Google e osservare con più attenzione e in modo più conflittuale la retorica del gigante della ricerca", ha affermato Fishkin . “Le pubblicazioni che ripetono le affermazioni di Google come se fossero fatti aiutano solo Google a creare una narrazione utile all’azienda, non ai professionisti, agli utenti o al pubblico.”