Gentili utenti vi informiamo che il team di MyTech si è spostato sul canale Hitech & Scienza di Panorama.it

      non hai uno username? regìstrati   /   recupera la password

apple / google / microsoft

Blog spam, adesso basta!

Scritto da Antonio Volpon

[img]
Come difendersi dai finti *commenti nei weblog*Il blog al cinema_Internet: tutte le notizie_Blog: mai più senza
Da qualche mese una fastidiosa piaga provoca non pochi mal di testa a chi possiede e gestisce un blog. Si tratta del “blog spamming”, cioè l’inserimento di (molti) commenti che nulla hanno a che fare con l’argomento discusso, ma recano nel corpo del messaggio link ad attività di dubbio gusto, le stesse che compaiono nelle email di spam “tradizionali”, quelle che arrivano nelle caselle di posta elettronica.

Digital rights
Spamming per PageRank. Le cause del “blog spamming” sono però diverse da quelle che inducono gli stessi attori a inondare le caselle di posta di spazzatura. Mentre in quest’ultimo caso la speranza è che l’utente visiti i collegamenti presenti nell’email, ai “blog spammer” questa eventualità non interessa. L’unica loro preoccupazione è inondare la rete di link verso i loro siti.

Google è indirettamente colpevole del fenomeno: e in particolare GoogleRank_, l’algoritmo utilizzato dal motore di ricerca e che contribuisce a premiare (cioè a far comparire per primo nella lista dei risultati), a parità di parola cercata, un sito rispetto a un altro.

Il funzionamento di PageRank è, nel suo nucleo, alquanto semplice ed efficace. Premia infatti i siti che ricevono un buon numero di link in ingresso da altri siti. Detto in altre parole, se molti siti contengono dei collegamenti verso un dato sito, Google lo considera più importante di altri che trattano il medesimo argomento, ed è probabile che compaia tra i primi posti nella pagina dei risultati. Se poi i collegamenti al sito provengono da siti che Google reputa già “importanti”, il sito stesos ne trae ancora più vantaggio, e così via.

I “blog spammer” utilizzano proprio questa caratteristica dell’algoritmo di Google: inseriscono commenti nei weblog con dei link al sito che vogliono favorire, al solo scopo di aumentare il numero di collegamenti. Google, nell’analizzare le pagine dei vari weblog, scoprirà molti link verso questi siti e l’algoritmo di PageRank li premierà, spostandoli verso l’alto nella lista dei risultati.

Software automatico. Il “blog spammer”, come è facile intuire, non è una persona dalla pazienza certosina, che spende le sue giornate a compilare form di commento per tutti i weblog. Utilizza invece dei software automatici che simulano l’operato di un normale utente sul sito, tra cui anche la possibilità di lasciare un commento. Questi software sono configurati per chiamare direttamente e più volte lo script che nel weblog consente di inserire un commento e sono così in grado di infestate le pagine in poco tempo e con una quantità incredibile di interventi spazzatura. Data la natura del web è praticamente impossibile capire se l’autore che carica un commento sia una persona o un software, e solo nei casi più semplici di “comment spam” possono essere filtrati in questo modo.

Le contromisure. Come fare per evitare la diffusione indiscriminata di questo tipo di messaggi?
Innanzitutto, sensibili al problema, i tecnici di Google (presto seguiti da Yahoo!, Microsoft, e altri), hanno cercato in fretta di trovare una soluzione. Hanno chiesto ai creatori dei software per il blogging (Movable Type, WordPress, ecc) di intervenire sulle pagine di commento così che ogni link inserito da un utente venga fatto seguire da un ben identificato attributo Html (rel=”nofollow”). Il motore di ricerca visiterà in ogni caso il link, ma senza alterare (migliorandolo) il suo posizionamento nella lista dei risultati.

Un metodo semplice ed efficace, che prevede però interventi alle diverse piattaforme di weblogging. Nessun problema, in particolare, per gli utenti di servizi del tipo chiavi in mano (come Blogger ad esempio) che si sono trovati la modifica senza neppure accorgersene.
Diverso è il discorso per chi ha installato sul proprio server il software di blogging, e si trova costretto a scaricare e installare l’aggiornamento.
È comunque probabile che un utente che ha installato da solo una piattaforma di questo tipo sia anche sensibile alle problematiche di sicurezza e completi queste operazioni con relativa tranquillità.
Al di là di questo, comunque, la proposta di Google non ha dissuaso i “blog spammer” dal perseverare con le intrusioni nei commenti, e poco importa al weblogger che tutti questi link spazzatura non vengano presi in considerazione dal motore di ricerca.

È in ogni caso importante, nel caso si utilizzi una piattaforma installata nel proprio sito, aggiornarla all’ultima versione disponibile. Gli strumenti di difesa che questi software (o alcune estensioni di questi software, i plugin) mettono a disposizione si basano su alcune informazioni che ricavano dal commento stesso. Quasi tutti danno ai propri utenti la possibilità di definire una lista di parole “proibite”. Un commento che contiene uno di questi termini viene cestinato nel peggiore dei casi o inserito in una coda di moderazione, dove dev’essere esplicitamente approvato prima di andare on line. Anche la ripetizione ossessiva di una parola potrebbe portare allo stesso risultato.

In realtà i “blog spammer” hanno presto aggirato l’ostacolo, inserendo nel corpo del messaggio frasi assolutamente fittizie, pescate da libri di qualche autore classico, farcite però di link presso i loro siti. Inoltre la lista deve essere costantemente aggiornata: ogni volta che un commento indesiderato finisce on line, va analizzato e le parole sospette aggiunte all’elenco.

Un’altra tecnica di difesa che molti strumenti di blogging mettono a disposizione è allora un filtro per i messaggi che contengono più di un certo numero di link (dove il numero è configurabile dall’utente), il che indica con tutta probabilità qualche malintenzionato che sta cercando di acquisire posizioni su Google.

Altre tecniche sviluppate dai produttori di software per il blogging controllano ad esempio il tempo intercorso tra due commenti della stessa persona (o, nel nostro caso, software) e, se questo è relativamente breve, non ne autorizzano l’inserimento di altri. In alcuni casi è anche possibile limitare il numero di interventi che provengono da uno stesso indirizzo Ip, indice con tutta probabilità di un software che ha preso di mira il nostro sito.

A parte queste soluzioni “automatiche” esiste comunque un’altra “buona norma”, insieme all’aggiornamento periodico del software, che può ridurre considerevolmente il numero di commenti indesiderati. Molti dei software di blogging consentono ad esempio di moderare i commenti relativi a interventi non recenti_. Questo evita al blogger di moderare sempre e comunque tutti i commenti, anche quelli relativi agli interventi più recenti, che sono quelli solitamente meno attaccabili dagli spammer, ma più commentati invece dai reali utenti del sito.

Impiegando queste soluzioni si riduce di molto la probabilità che uno “spam commento” finisca on line nel blog ma, come succede con i filtri della posta, rimane non solo la possibilità che questo sfugga alle nostre difese, ma anche che un commento del tutto legittimo venga filtrato o, peggio, cancellato. La battaglia è appena all’inizio.

Commenti   (Inserisci un commento)

Grazie per la critica sensata sul mytech.it. Io e il mio vicino di casa erano solo preparando a fare qualche ricerca su questo. Abbiamo ottenuto una Prendi un libro della nostra biblioteca locale, ma credo di aver imparato di più da questo post. Sono molto contento di vedere questi grandi informazioni da condividere liberamente là fuori.

Ciao a tutti, appena scoperto mytech.it su Yahoo, e ha scoperto che è davvero impressionante. Sto andando guardare fuori per bruxelles. Io apprezzo se continuare a scrivere su questo argomento anche in futuro. Un sacco di persone beneficeranno la tua scrittura. Cheers!

Ich pl?diere für eine Existenz, habe ich ein gutes Leben zu erhalten, aber ruhig!

Effettua il login