martedì 20 luglio 2010

Google si rafforza nel web semantico

[Il Sole 24ore 20/07/2010]
MILANO - Google ha acquistato Metaweb, società specializzata nella catalogazione e archiviazione delle ricerche sulle pagine web e il loro significato. Con l'acquisizione, segnalata sul blog di Google con un post del suo direttore prodotti Jack Menzel, la società californiana intende aumentare il suo vantaggio competitivo nel core business dell'azienda, vale a dire le ricerche web, delle quali detiene quasi il 75% del mercato.


Metaweb è stata acquisita per una somma non specificata. L'azienda, con sede a San Francisco, è stata fondata nel 2005 da Danny Hillis e Robert Cook, coppia di fuoriusciti da Applied Minds. Metaweb ha avuto due round di finanziamenti da parte di venture capitalist: nel 2006 per 15 milioni di dollari e ancora nel 2008 per 42,5 milioni. Il suo unico prodotto è "Freebase", un archivio costruito in maniera aperta e collaborativa da volontari sulla rete (ma strutturato secondo rigorosi criteri sviluppati dai ricercatori di Metaweb) e che contiene oltre 12 milioni di singole informazioni. Tim O'Reilly, uno dei principali osservatori degli sviluppi economici e sociali della tecnologia, ha definito Freebase «il ponte ideale fra l'approccio dal basso dell'intelligenza collettiva caratteristico del web 2.0 e quello più strutturato che è invece proprio del web semantico».

Proprio questo è il campo di azione di Metaweb che interessava a Google: il web semantico. I motori di ricerca solitamente rispondono alle domande dei loro utenti cercando di far collimare le parole contenute nella ricerca con le parole chiave raccolte indicizzando in maniera automatica il web e ordinando i risultati in base alla loro popolarità. In questo modo, però, non è possibile rivolgere ai motori di ricerca delle domande che richiedano la comprensione del significato della domanda stessa da parte del motore di ricerca. Si cercano ad esempio informazioni su Boston intesa come città (e negli Usa ce ne sono ben 26) o come gruppo rock?

Il web semantico ha invece l'obiettivo di organizzare le parole-chiave per gruppi, definendone il senso e permettendo così di riorganizzare le pagine web sulla base del loro significato e quindi di trovare risultati più aderenti alla realtà. La principale difficoltà nel costruire gli enormi archivi di parole, legate fra loro con complessi rapporti basati sulle sfumature del senso a seconda del contesto, è il tempo e il dispendio di energie necessario.
Metaweb ha risolto brillantemente il problema creando una struttura tecnologica di base, sistematizzando i principi sui quali organizzare le parole e lasciando poi al lavoro dei volontari della rete di trovare e schedare milioni di termini. Il lavoro fatto da Metaweb e dai suoi volontari si contrappone a quello di analoghe iniziative commerciali o non profit che da tempo stanno cercando di schedare tutte le parole utilizzate in rete.

Google ha annunciato che non intende "privatizzare" l'archivio Freebase di Metaweb, anche se sicuramente verrà messo in contatto con l'analogo esperimento Google Squared creato nel 2009 dall'azienda di Mountain View, ma che anzi intende tenerlo aperto e lasciare così che possa continuare ad essere arricchito da volontari in tutto il mondo e che possa essere utilizzato anche da altri oltre che contribuire direttamente l'azienda stessa. Attualmente fra i 12 milioni di parole schedate su Freebase compaiono centinaia di migliaia di nomi di film, di libri, di show televisivi, di personaggi famosi, di località geografiche, di aziende e di decine di altre categorie che contribuiscono a creare ambiguità nelle ricerche effettuate sulle pagine web. «Siamo convinti – scrive sul blog dell'azienda Jack Menzel – che migliorando Freebase diventerà una risorsa ancor più potente per rendere l'esperienza del web migliore per tutti. E, nella misura in cui il web diventa un posto migliore, questo è meglio per tutti, utenti e creatori di pagine web».

Nessun commento:

Posta un commento