Internet: studio, scoperti modelli matematici dietro il tagging
Scritto da Infm-Cnr   
Venerdì 03 Luglio 2009 11:27

Il tagging, ovvero l'associazione tra contenuti e parole chiave sul web, sembra non essere casuale. Modelli matematici al confine tra fisica e statistica ne replicano infatti i risultati, a partire da idee intuitive sul funzionamento della mente umana. E in futuro permetteranno di perfezionare la gestione di pubblicita' e marketing online, di combattere con efficacia lo spam, e rivoluzionare il social networking.
E' questo che hanno scoperto un gruppo di ricercatori dell'Istituto nazionale per la fisica della materia del Consiglio nazionale delle ricerche (infm-Cnr)- in collaborazione con l'Universita' la Sapienza di Roma, la Fondazione ISI di Torino e il Cnr francese - analizzando i dati di Del.icio.us e Bibsonomy. La ricerca e' stata pubblicata sul numero corrente di Pnas.
In pratica, i ricercatori hanno creato un modello di tagging capace di produrre risultati confrontabili con i dati reali estratti da siti di social networking,  nello specifico del.icio.us e Bibsonomy.
Un modello semplice. L'associazione e' un problema di testa, e i processi che la regolano sono ancora piuttosto oscuri. Quello che intuitivamente sappiamo pero', e' che non e' casuale, ma tende a muoversi lungo catene di 'affinita' semantica' (come 'cielo' e 'nuvola', 'nuvola' e 'bianco', e cosi' via). Questo semplice meccanismo e' stato usato dai ricercatori come base per dare vita al loro modello, che e' un sistema in grado di generare post virtuali che mimano per struttura quelli reali. Centinaia di migliaia di post virtuali sono stati quindi creati e confrontati con altrettanti provenienti da siti reali, con risultati sorprendenti: i due gruppi condividono una stessa struttura complessiva, e rispondono alle stesse leggi statistiche.
Questa grande coincidenza ha sorpreso gli scienziati. Il loro modello, volutamente generico, ha infatti ricostruito in maniera quasi perfetta la struttura dei dati reali, rispecchiandone molte importanti caratteristiche, come la co-occorrenza di tag (cioe' quante volte un tag e' usato assieme a un altro, si pensi a 'mare' e 'acqua'), o la legge che regola l'aumento del numero complessivo di tag usati dagli utenti. Un risultato brillante che i ricercatori stanno pero' gia' cercando di migliorare, perfezionando ulteriormente il modello con vari correttivi che meglio rispecchiano il comportamento degli utenti reali.

 












Template design by Braz Design - Template coding by Digitest