Muore PageRank che lascia il passo a TrustRank.

Dal 28 maggio il PageRank, amico di viaggio di tanti indicizzatori di
tutto il mondo è stato disattivato da Google creando forti sobbalzi
d'umore a chi non vedeva più il proprio valore di pagerank sulla Google
toolbar. Ricordiamo che il pagerank di Google era un valore numerico
che rappresenta l'importanza di una data pagina nel web.

Google ipotizzava con questo strumento che se una pagina è elencata da
un'altra, quest'ultima stia ricevendo una sorta di voto, o attestato di
stima da parte della prima: "ti linko perché ti reputo importante". Quindi
più links riceve una pagina e maggiore è la sua importanza. Questo faceva
aumentare il suo pagerank. Ciò però non aveva impedito già da tempo agli
spammers di tutto il mondo di riuscire con varie alchimie di aggirare
questo meccanismo di valutazione.

Già da mesi Google aveva dichiarato guerra ai tanti spammers sites
costruiti per il solo scopo di incrementare guadagni mediante i più
diffusi sistemi di ad affiliation pay per click facendo perdere
performance e credibilità allo stesso Adword .

Ed ecco l'ultima nata in casa Google che dovrebbe risolvere il problema:
TrustRank, sviluppato in collaborazione con un giovane allievo
dell'Università di Stanford, (la stessa dopve praticamente nacque Google)
Zoltan Gyongyi insieme a Hector Garcia-Molina oltre che Jan Pedersen di
Yahoo.

il TrustRank, brevettato da Google a marzo scorso presso la US Patent and
Trademark office infatti dovrebbe meglio valutare la veridicità (o
qualità) dei contenuti del sito e la loro credibile vicinanza al contenuto
che viene poi linkato dalla pagina d'origine. L'unico documento che si
riesce a reperire sul web è quello contenuto nel sito della Università di
Stanford intitolato "Combating Web Spam with Trust Rank". Sebbene la
pubblicazione è ricca di riferimenti tecnici si può comunque evincerne la
filosofia del nuovo TrustRank.

Ecco alcuni passaggi significativo del documento tradotto in italiano:
"Le pagine dei siti che fanno spam usano le varie tecniche per realizzare
un ranking alto nei risultati del motore di ricerca. Mentre gli esperti
umani possono identificare lo Spam, diventa troppo costoso da valutare
manualmente tantissime pagine.

Invece, proponiamo le tecniche per separare
in maniera semiautomatica le pagine stimabili e buone dallo Spam. In primo
luogo selezioniamo un piccolo insieme di pagine campione per essere
valutate da un esperto. Una volta che identifichiamo manualmente le pagine
stimabili, usiamo la struttura di link del web per scoprire altre pagine
che possono probabilmente essere buone. In questo documento discutiamo i
modi possibili per implementare la selezione di base e scoprire le buone
pagine.

Presentiamo i risultati di esperimenti fatti sul World Wide Web
indicizzati da AltaVista e valutiamo le prestazioni delle nostre tecniche.
I nostri risultati indicano che possiamo filtrare efficacemente lo Spam da
una quantità significativa di siti web, partendo da un buona selezione-
campione di circa 200 siti."

Potete leggere l'articolo redatto dai ricercatori clicca qui: Combating
Web Spam with Trust Rank ( http://dbpubs.stanford.edu:809 0/pub/2004-17)
Il testo in pdf: Combating Web Spam with Trust Rank (
http://dbpubs.stanford.edu:809 0/pub/showDoc.Fulltext?lang=en &doc=200...
mat=pdf&compression=&name=2004-52.pdf )

Una domanda: Sarà l'ulteriore caso di fatta la legge... poco dopo so
troverà l'inganno?

al proposito propongo un interessante artocolo sul Pittsburg Post Gazette
di Lee Gomes, The Wall Street Journal
(http://www.post-gazette.com/pg /05122/497852.stm) dal titolo "Web sites
that exist only to sell advertising"