Gentili utenti vi informiamo che il team di MyTech si è spostato sul canale Hitech & Scienza di Panorama.it

      non hai uno username? regìstrati   /   recupera la password

apple / google / microsoft

Google a tutta velocità

Scritto da Juri Bordani

[img]
Da Stanford algoritmi e statistiche per migliorare l’efficienza di PageRank e restituire ricerche più precise e pertinenti
Quante volte avviando una richiesta su un motore di ricerca ci si trova inondati di numerosi link di scarsa utilità? Cercando ad esempio “gattopardo” verranno proposti collegamenti ai siti più disparati (alberghi, biblioteche, recensioni cinematografiche, curiosità sul simpatico felino ecc) indipendentemente dagli interessi. E se invece i motori di ricerca potessero tenere conto di questi interessi in fase di presentazione dei risultati?

Alcuni ricercatori dell’università di Stanford hanno sviluppato tecniche per rendere decisamente più veloce e efficiente il motore di ricerca di Google; tecniche che potrebbero aprire la strada alla personalizzazione delle risposte.

Lo studio si basa su sofisticati algoritmi di algebra lineare numerica, uno dei campi di maggiore interesse della matematica applicata, che permettono di ottimizzare i metodi di catalogazione delle pagine web; e su alcune osservazioni statistiche per migliorare l’engine di Google.

L’algoritmo utilizzato attualmente impiega infatti parecchi giorni per classificare in ordine di importanza circa 3 miliardi di Url. Anche questo sistema, noto come PageRank, è stato sviluppato all’Università di Stanford da Larry Page e Sergey Brin (fondatori di Google) e ha contribuito all’attuale successo del motore di ricerca.

La prima tecnica innovativa - estrapolazione - si basa su alcune astrazioni sulla struttura dei siti web (piuttosto vicine alla realtà) che permettono di semplificare e quindi di accelerare il lavoro di PageRank.
Il secondo metodo, chiamato BlockRank, è quello in assoluto più efficiente e sfrutta il fatto che l‘80% dei link all’interno di una pagina web punti ad altre pagine interne al sito. Il conteggio delle pagine in “blocchi”, anziché singolarmente, rende l’algoritmo estremamente più efficiente.
Infine, l’eliminazione delle ridondanze nel calcolo delle pagine - soprattutto per i siti con punteggio minore - è il principio che ispira l’ultima procedura (Adaptative PageRank).

L’uso combinato di queste nuove tecniche renderà PageRank fino a 5 volte più veloce”- sottolineano i ricercatori della prestigiosa università.

È importante precisare che la maggior velocità non andrà a vantaggio dei tempi di attesa (peraltro già brevissimi) dei risultati delle ricerche, perché l’indicizzazione delle pagine è fatta prima della richiesta dell’utente e non in tempo reale.
L’obiettivo è appunto quello di migliorare la qualità e la pertinenza dei risultati. Gli stessi ricercatori ammettono però che questi risultati non bastano per sperare di avere un search engine su misura per ogni utente, cosa che richiederebbe - oltre alla velocità di calcolo - enormi quantità di spazio per contenere i dati delle indicizzazioni di ciascuno.
Più realisticamente, è possibile auspicare che i risultati possano servire per implementare una classificazione per macro categorie. Tornando all’esempio del gattopardo: potremmo scegliere se avere ai primi posti i collegamenti a siti di turismo, cultura o scienza.

Commenti   (Inserisci un commento)

Ancora nessun commento.

Effettua il login