INTERNET PER MEDIATORI LINGUISTICI

© Hellmut Riediger

2.2 - I motori di ricerca

I motori di ricerca (dall'inglese search engine) sono quei siti web che offrono gratuitamente un servizio di ricerca. Esistono ormai svariate centinaia di motori di ricerca sul web. Quali sono i migliori? Come scegliere quello più adatto alle proprie esigenze? Vediamo quali possono essere le modalità con le quali selezionare un motore di ricerca e non un altro, quali caratteristiche contraddistinguono i search engine attuali e come funzionano e quali possono essere le tipologie nelle quali suddividere questi servizi sul web.

I motori di ricerca automatici si avvalgono di agenti software, di programmi robot (detti crawler, spider o indicizzatori) che navigano in internet e archiviano i testi di tutte le pagine che trovano. Esempi di motore di ricerca automatici sono Google, All the web, Altavista , Ask, Alexa , A9.

Una web directory (indice, catalogo) è un motore di ricerca in cui una redazione composta da esseri umani cataloga e suddivide i siti web in categorie, raggruppandoli per argomento. A differenza dei motori di ricerca automatici, nel caso delle web directory un sito deve essere segnalato da chi l'ha creato oppure individuato dalla redazione. Attualmente le web directory più famose e più grandi del mondo sono Yahoo! e Dmoz-Open directory project.

Le directory, dunque, offrono liste di siti web, suddivisi in categorie a seconda del loro argomento e accompagnati da brevi descrizioni dei contenuti. Dalla categoria generale si passa alla sottocategoria, poi alla sotto-sottocategoria ecc., finché non si arriva al livello dove si trovano i siti che ci interessano. È possibile anche fare ricerche sulla descrizione dei siti contenuti nella categoria. Categorie e descrizioni sono suggerite dai realizzatori dei siti web e poi esaminate dalla redazione della directory.

Tuttavia, per combinare le potenzialità del software alle caratteristiche delle web directory la maggior parte dei grandi motori di ricerca è dotata ormai sia di uno strumento di ricerca con indice generato in modo automatico, sia di una directory gestita e recensita da una redazione umana.

I metamotori di ricerca (metacrawler) permettono di consultare contemporaneamente diversi motori eseguendo l'interrogazione da una stessa pagina e riportando in modo chiaro i risultati.

I metacrawler riescono infatti a recuperare tutte le informazioni provenienti dagli archivi dei diversi motori presentandoli in un'unica lista e raggruppando i duplicati. L'efficacia dei metamotori è strettamente collegata al numero di motori che sono in grado di interrogare e alla possibilità o meno di recuperare tutte le informazioni in un'unica lista.
Un buon esempio di questa tipologia di strumenti sono Ixquick e Clusty . In modo analogo funzionano anche alcuni software di ricerca, scaricabili da internet e da installare sul proprio computer, come l'ottimo Copernic; questi software offrono la possibilità di gestire i risultati delle proprie ricerche anche offline.

Motore di ricerca o Web directory?

La maggior parte degli internauti usa indifferentemente i motori di ricerca automatici e le web directory, spesso però senza sapere bene quando sia meglio utilizzare gli uni e quando le altre.

Mentre le directory raccolgono poche informazioni sui siti (la semplice descrizione), un motore di ricerca raccoglie tutte le informazioni su tutte le pagine web che trova. Le più grandi directory coprono, oggi, tra uno e due milioni di siti, mentre il motore di ricerca Google, per esempio, dichiarava nel marzo del 2005 di avere in archivio oltre 8 miliardi di pagine web.

Le directory sono create e gestite da persone secondo gusti e criteri personali che non necessariamente corrispondono alle nostre esigenze. Gli indici dei motori di ricerca sono generati in modo automatico in base alle parole o alle sequenze di parole trovate sulle pagine web senza che le informazioni vengano filtrate o riorganizzate, e applicando i metodi di ricerca si può ottenere direttamente ciò che si vuole.

Con l'andare del tempo le directory rischiano di invecchiare, perché per esempio i siti scompaiono oppure cambiano indirizzo e le redazioni, per un motivo o per l'altro, non le aggiornano con sufficiente frequenza, mentre i motori di ricerca non corrono questo pericolo e si arricchiscono nel tempo con l'indicizzazione di nuove pagine web.

Poiché i siti spesso comprendono pagine di argomento diverso, a volte è difficile classificare con categorie univoche. Problema che non si pone, invece, con il motore di ricerca automatico, poiché quest'ultimo considera ogni pagina come singola.

Complessivamente si può dire che la directory è più adatta per una ricerca sistematica mirata alla raccolta possibilmente esaustiva di documenti validi su un certo argomento, mentre il motore di ricerca è particolarmente adatto per ricerche mirate al reperimento di un'informazione specifica.

Alcuni esempi:

Altre tipologie

Negli ultimi anni si sono moltiplicati motori di ricerca specializzati e portali verticali, siti che offrono servizi di ricerca oppure directory limitate ad ambiti specifici.
Poiché è meno problematico gestire l'indice di siti relativi a un argomento circoscritto, e poiché in genere sono gestiti da una redazione, questi servizi offrono maggiori garanzie di reperire siti o pagine contenenti informazioni utili nei vari ambiti di ricerca.
Ricordiamo anche i servizi di ricerca "umani", in cui una redazione è a disposizione - di solito a pagamento - per ricerche sugli argomenti indicati, in genere via e-mail, dall'utente.

.

I browser più diffusi (Microsoft Internet Explorer, Netscape Navigator, Opera e il più recente Mozilla Firefox) hanno molte funzioni in comune:

  • salvataggio e gestione dei propri siti preferiti (bookmark, segnalibri)
  • visualizzazione le pagine web fuori linea
  • consultazione la cronologia della pagine visitate
  • barra di ricerca con motori e altri strumenti di ricerca

Da segnalare i plug-in in Mozilla Firefox dalla finestra di ricerca in alto a destra, oltre ai motori di ricerca standard si possono aggiungere, facendo clic su Altri motori di ricerca, motori di ricerca, banche dati, dizionari e molte altre risorse. In questo modo si può lanciare la ricerca direttamente in queste risorse digitando le proprie parole chiave nella barra di ricerca senza aprire i vari siti.

I motori di ricerca con funzioni speciali rientrano nella categoria dei motori di ricerca "specializzati", e più che rivolgersi ad ambiti specifici svolgono funzioni per così dire speciali.
Di particolare utilità per redattori, traduttori e linguisti è per esempio il WebCorp che offre modalità di ricerca per utilizzare al meglio il web come corpus testuale.
Interessante anche WaybackMachine, un vero archivio o museo del web che permette di guardare nel passato di internet e vedere pagine web di 2, 3 o 5 anni fa spesso non più raggiungibili oppure rivedere versioni precedenti di un determinato sito.

Tutti conosciamo o quanto meno abbiamo sentito parlare di programmi Peer to Peer (P2P) con cui scaricare musica, film o software gratuitamente. Questi programmi si basano su una modalità di distribuzione dei file, basata non su un rapporto client-server, come nella maggior parte delle altre transazioni internet ma sulla condivisione dei file (file sharing) in un rapporto da "pari a pari", peer to peer appunto.

Mentre l'architettura client-server prevede che un computer abbia la funzione prevalente di fornire informazioni e un altro la funzione prevalente di riceverle, l'architettura peer to peer vuole che entrambi i computer spediscano e ricevano file, in un rapporto paritetico: chi partecipa al gioco mette a disposizone una serie di propri file da condividere con gli altri.

Oltre a file musicali, video o programmi si possono dunque trovare e-book o testi in vari formati. Tra i più noti programmi peer to peer segnaliamo, oltre allo storico Napster, KaZaA e Limewire.

indietro | avanti