delete

Google Penguin 2.0, lo zoo non dorme mai

 

Se lo dice Matt Cutts, che è a capo del webspam team di Google, possiamo tranquillamente crederci:

Si parla dell’aggiornamento di Penguin, riguardante uno degli update di Google fra i più importanti degli ultimi due anni e perfettamente inserito nel “filone” che, con risultati forse non così evidenti, dovrebbe portare a un repulisti  dei risultati di Google, penalizzando (per semplificare) tutti i siti che non fanno un uso corretto di tecniche e contenuti. In una parola, tutti i siti che abbiano utilizzato, nel corso del tempo, strategie di posizionamento e visibilità poco pulite.

Rilasciato poco più di un anno fa, il core dell’azione di Pengiun prevedeva il penalizzare la sovra ottimizzazione on-page per quanto riguarda tecniche e contenuti percepiti come “non naturali” (proseguendo quanto già introdotto con Panda), utilizzo di anchor text “exact match” (su tutto), keyword stuffing (in generale) e molti altre tecniche “border line” – e spesso nemmeno percepite come di area grigia, o comunque da considerarsi involontarie.

Proprio il colpire molti siti innocenti, o presunti tali, ha destato, lo scorso anno, qualche preoccupazione. E la necessità di difendersi dall’attacco di Penguin. Quindi, se il precedente Panda aveva un effetto qualitativo, generalmente osservato da webmaster e SEO specialist “con la coscienza a posto” senza grandi preoccupazioni, nel caso di Penguin l’impatto è stato meno prevedibile (anche se, numericamente, meno pesante: l’ultimo update di Penguin è stato stimato come influente per lo 0,3% dei risultati italiani).

La versione 2.0 di Penguin, che come apprendiamo entrerà in servizio nelle prossime settimane, è già al centro di molte speculazioni nell’ambiente SEO. Si tratterà, appunto, di un major update e non di un altro ritocco (ce ne sono già stati due, l’ultimo a ottobre).
Le tante previsioni e speculazioni, perché di questo si tratta, che si iniziano a leggere, convergono sulla “prospettiva” che Google ha assunto sui link da un paio d’anni a questa parte, e in questo caso in particolare sulla loro implementazione nel corso dei contenuti. La domanda da farsi è più o meno sempre la solita: se non esistessero i motori di ricerca, creeremo questo link? Se non ci fossero i motori di ricerca, questo link fornirebbe contenuti e informazioni interessanti ai nostri utenti? E utilizzeremo questo anchor text?

In attesa di saperne di più, manteniamo le buone abitudini acquisite nella creazione dei contenuti, e diamo un’occhiata a questa interessante disamina su Panda e Penguin, recentissima, di Search Engine Land.

 

delete

Lo zoo di Google e la marcia del Pinguino

L’arrivo di Penguin è stato annunciato il 25 aprile, un anno dopo l’uscita del precedente Panda. Anche questo algoritmo va a colpire le diverse tecniche di sovraottimizzazione. Si tratta di un algoritmo iterativo, ciò significa che dopo aver ricevuto una penalizzazione, l’utente può ottimizzare il proprio sito con le migliori strategie, ma dovrà aspettare un nuovo iterazioneper vedere se effettivamente il suo lavoro è stato sufficiente e se si è posto rimedio a ciò che non piaceva a Penguin. Si tratta comunque di un aspetto positivo: il fatto che le scansioni di Penguin siano a ciclo continuo e nell’arco di un breve periodo permetterà a chi è stato penalizzato di poter essere eventualmente riabilitato.

SEO Hacker Blog

L’obiettivo di Penguin è quello di operare una selezione dei siti web, penalizzando le strategie poco pulite e vari trucchetti di esperti SEO, oltre i semplici contenuti del sito. Eppure, fin dalla sua uscita, il lancio di Penguin ha suscitato subito numerose critiche: indipendentemente dalla qualità dei contenuti, l’algoritmo infatti ha colpito molti siti pertinenti e “puliti”, e SEO che hanno sempre tenuto un comportamento white hat.

Google, dopo l’uscita, ha messo a disposizione degli utenti un form per la richiesta di revisione del sito e per la segnalazione e quindi la rimozione di penalizzazioni “ingiuste”: questo comportamento da parte di Google fa intuire che Penguin sia ancora parecchio migliorabile e sottoposto a continua verifica. Ricordatevi comunque che Penguin rimane un algoritmo, non una “penalizzazione” personale. E’ quindi inutile continuare a lagnarsi per la presunta ingiustizia: l’unica cosa da fare è rimboccarsi le maniche, scoprire i motivi per cui si è stati penalizzati e tentare di porre rimedio. Riuscirete così a non sprecare il lavoro di anni e a probabilmente a tamponare le eventuali perdite economiche.

Ad un anno dall’uscita di Panda, Penguin non ne rappresenta una semplice evoluzione. Panda verifica la qualità del sito sotto il profilo del contenuto, con particolare attenzione ai testi, controllando le duplicazioni, dando valore a commenti dei visitatori e prendendo di mira la sovra ottimizzazione di contenuti di scarsa qualità. Penguin invece è più indirizzato verso il controllo specifico delle keyword, penalizzando i siti che hanno scalato le SERP tramite tecniche black hat, con keyword stuffing, backlinks e anchor text di scarsa qualità: sostanzialmente prende di mira tutte quelle azioni strategiche di SEO spam. In Italia, tra i siti maggiormente colpiti, ci sono quelli del settore turistico, dove l’uso di keyword precise nell’anchor text è tra le strategie maggiormente utilizzate.

Come difendersi dall’attacco Penguin

In base alle informazioni che abbiamo su Penguin possiamo intuire quali espedienti potrebbero essere penalizzate in un sito web, tenendo presente che non esistono soluzioni univoche:

  •  Penguin potrebbe penalizzare il tag Title delle pagine, se ritenuto eccessivamente “imbottito” di keyword,
    così come potrebbero essere penalizzate le ripetizioni di parole chiave nei tag.
  •  Il Keyword stuffing è tra le tecniche presa decisamente più di mira: la ripetizione forzata e innaturale di keyword nei testi comporta sicura penalizzazione. La keyword density di una pagina non deve mai essere eccessiva: la ricetta è sempre la stessa, scrivere i testi in modo fluido e naturale. Scrivete sempre per l’utente, non per lo spider!
  •  Evitare i contenuti duplicati, volontari o involontari.
  •  I vecchi abusati trucchi “black hat” come fare uso di cloaking (la tecnica per cui è possibile mostrare ai motori di ricerca un contenuto differente da quello che vedrà l’utente sul sito) o inserire parti di testo mimetizzati sullo sfondo sono decisamente da abbandonare per sempre. Non utilizzare css o codice per nascondere testo e link!
  • Attenzione ai link in entrata e in uscita. Gli outbound links vengono giudicati in base alla qualità del sito al quale puntano. Siti penalizzati da Google penalizzeranno anche voi. Evitate dunque scambi di link con siti con autorevoli o di scarsa qualità. I backlinks con keyword specifiche all’interno dell’anchor text sono da evitare, soprattutto se presenti in grande quantità. Controlla inoltre se sul tuo sito sono presenti anchor text non più esistenti, duplicati o che provengono da un dominio non indicizzato. Alcune tipologie di link, da directory o da article marketing sono fortemente svalutate, così come i link presenti in sidebar, footer, header e blogroll (per cui si rischiano duplicazioni infinite).
  • Molto importante è anche l’argomento trattato dal sito con cui abbiamo uno scambio di link: deve essere pertinente a quello del nostro sito, occuparsi della nostra stessa area tematica. Se il nostro sito si occupa di libri e lettura saranno per noi decisamente penalizzanti link che trattano di motori!

Per quanto riguarda i link può essere poi un buon consiglio suddividerli in maniera certosina tra link nofollow (per esempio per link a pagamento) e link dofollow, con intervento nel codice HTML. Un altro aiuto può essere l’inserimento dell’attributo rel=“bookmark” per i link da considerare Permalink (il Permalink si riferisce a un contenuto statico, preferibile proprio se i contenuti vengono linkati ad altri siti)

Questa revisione dei link potrebbe costare un po’ di fatica, ma tutto questo lavoro darà valore al link conquistato e verrà premiato da Google.

penguins photo credit: Anne Froehlich via photo pin cc

delete

Panda e la psicoanalisi

Google Panda nasce dall’esigenza di Google di distinguere a livello algoritmico il contenuto di qualità da quello di bassa qualità. Ovviamente i segnali di qualità che Google utilizza per il posizionamento devono essere letti dall’ algoritmo; non si tratta quindi di formule magiche ma di elementi specifici e dati di un sito. Google non ne parla in modo dettagliato, facendo della complessità dell’algoritmo una difesa dalle forzature che se ne potrebbero fare, inficiando l’intero lavoro dei suoi ingegneri. Le variabili e i modi, con cui Google potrebbe mixare i dati (on-site e off-site) per ricavare le sue scale di qualità, sono pressoché infinite. Ecco perché probabilmente non vale la pena cercare di eludere il sistema, ma semmai migliorare la qualità del sito dal punto di vista dell’utente, proprio come Google ci suggerisce di fare.

Ma cosa significa qualità?

Come in psicologia, comprendere il comportamento è un’analisi che deve tener conto di tanti elementi, interni ed esterni.

Ecco qui in sintesi le principali domande che bisogna porsi nel valutare il proprio contenuto o il proprio operato, magari per capire perché Google ci ha penalizzati o evitare che succeda.

Allora stendetevi sulla chaise longue e cominciamo!

Chi sono io?

Certamente, come utenti o come lettori, si è portati a considerare l’autore un elemento di qualità di un determinato contenuto. Ecco perché Google vuole sempre più simulare questo approccio “personale” e “umano” che col tempo determinerà il risultato finale, non solo dal punto di vista della popularity e del traffico che ne consegue, ma anche agendo in modo diretto sul Rank.

Come autori è quindi consigliabile fornire i propri dati, possibilmente mettendo in evidenza quei titoli professionali e non che possono avere a che fare con l’argomento trattato. Ecco che entra in gioco, come vetrina privilegiata del proprio profilo personale, Google+. Abbiamo già parlato dell’importanza di Google+ in un precedente articolo , ma questo è un esempio pratico di come il Social della grande G vada ad interferire con il posizionamento.

E’ consigliabile collegare le informazioni sull’autore (una pagina bio di un blog ad esempio) al suo profilo Google+ utilizzando il parametro rel=author.

 

Sono credibile?

Così come per qualsiasi altro tipo di scambio, commerciale e non, la credibilità è parte essenziale del successo di un prodotto o di una conversazione.

Si può essere credibili per diverse ragioni: perché si gode di un brand o nome conosciuto, perché si sono ottenute precedentemente valutazioni positive da parte di terzi, perché si è stati più volte citati e linkati da altri siti autorevoli, perché il proprio sito tiene conto di specifici elementi e caratteristiche lato utente (dalla struttura, alla velocità di caricamento, all’usabilità in generale).

 

Qual è il mio scopo?

Per essere di qualità, un contenuto deve avere uno scopo e Google su questo è molto chiaro. Lo scopo non può essere quello di farsi leggere dai motori di ricerca ma non dagli utenti, salvo non si voglia sperimentare la penalizzazione e la rimozione dall’indice… Ecco allora che costruire pagine con contenuto nascosto, oppure con contenuto ridondante di parole chiave ma con poco spessore, pagine col solo scopo di ritorno economico tramite pubblicità pay per click o affiliazione, è estremamente pericoloso.

 

Sono coerente con me stesso?

Un sito web deve essere considerato nel suo complesso. Per questo motivo bisogna tener conto di tutte le pagine e di tutti i contenuti di un sito per capire se stiamo facendo un buon lavoro in senso qualitativo. E’ importante sapere che in un sito con contenuti di buona qualità, anche un solo contenuto di bassa qualità può compromettere il tutto. Inoltre le pagine di un sito dovrebbero essere coerenti oltre che per qualità anche per argomento, allineandosi allo scopo generale del sito con contenuto coerente.

E ricordiamoci naturalmente che il contenuto duplicato rappresenta di per sé un segnale di bassa qualità.

Si può contare su di me?

Il nostro sito deve essere affidabile dal punto di vista tecnico e delle prestazioni. Presenza di errori 404 (page not found), ingiustificata lentezza di caricamento, down del sito, saranno interpretati dai motori di ricerca come elementi di bassa qualità, soprattutto se ripetuti nel tempo.

 

Deludo spesso il mio prossimo?

Il contenuto deve corrispondere alle aspettative. Se facciamo in modo di associare una pagina o un sito ad una parola chiave o ad un campo semantico, il contenuto dovrà corrispondere a quelle parole chiave e/o a quel campo semantico. Google infatti prima o poi se ne accorgerà, insospettito per esempio dalla frequenza di rimbalzo alta che indica la poca soddisfazione dell’utente che ha posto la query e si è ritrovato su un sito che non rispondeva affatto alle sue domande. Anche link irrilevanti o fuori argomento sono penalizzanti dal punto di vista della qualità, così come anchor text non pertinenti o poco significativi. Senza trucchi e senza inganni quindi, mi raccomando!

 

Rimugino sul passato o so guardare al futuro?

Altro dato rilevante è la freschezza di contenuto. Abbiamo già visto come sia necessario che il contenuto sia originale (non duplicato o copiato da altri). Un altro elemento di cui Google tiene conto è l’aggiornamento del contenuto (posto sempre che ia di alta qualità) perché parte del presupposto, sempre molto “umano”, che ciò spingerà gli utenti a tornare su quel sito perché rappresenta una risorsa utile anche nel tempo. Va da sé che anche tutti gli elementi che segnalano l’attualità del sito debbano essere aggiornati (sitemaps, software e supporti, date nei post dei blog…)

 

Mi sento perso?

Il contenuto deve essere sempre presentato nella maniera più ordinata, fruibile e semplice possibile. Gli utenti devono avere dei chiari punti di riferimento per capire dove si trovano e trovare agilmente le sezioni di loro interesse. Ecco perché alcuni elementi “orientatori” (breadcrumbs, mappe del sito…) sono considerati indicatori di qualità del sito e alcune caratteristiche non sono invece ben viste da Google (troppi link sulla stessa pagina, gerarchia confusa, pagine isolate).

 

Quando mi guardo allo specchio cosa vedo?

Anche la forma vuole la sua parte! E’ infatti il biglietto da visita per l’utente, ma non è sottovalutata neppure dai motori di ricerca. Quando si sceglie l’impostazione grafica, quindi, si devono seguire delle regole abbastanza intuitive ma non trascurabili. La forma dev’essere coerente col contenuto e con lo scopo del sito, le immagini utilizzate devono essere di alta qualità , originali e pertinenti, se ci sono annunci pubblicitari (Adsense, ecc.), questi devono interferire il meno possibile coi contenuti del sito, il sito deve essere accessibile (tag ALT per le immagini, contrasto tra sfondo e contenuto scritto, ecc.).

 Insomma, dottore, sono grave?