INTERNET PER MEDIATORI LINGUISTICI

© Hellmut Riediger

2.4.3 - Strumenti di ricerca strutturati: archivi di testi

La messa in rete dei cataloghi bibliotecari ha radicalmente trasformato le modalità di ricerca dei documenti su supporto cartaceo ma non il modo di fruizione dei documenti stessi, né la natura principale della biblioteca come luogo fisico di conservazione organizzata dei testi.
Profondi mutamenti sono invece scaturiti dalla sempre maggiore autonomia del documento digitale dopo la nascita del web. Lo sviluppo tecnologico dei nuovi media ha fatto sì che oggi i supporti digitali rappresentino ormai fondamentali integrazioni se non addirittura reali alternative, sia nell'ambito della comunicazione linguistica (libri, riviste, giornali, certificati, rapporti, relazioni, atti ecc.), sia in quello della comunicazione visiva e sonora (fotografia, pellicola, video, cassetta, vinile ecc.).

La diffusione di internet ha inoltre provocato la progressiva digitalizzazione e telematizzazione della comunicazione scientifica, che in alcuni ambiti si svolge ormai quasi esclusivamente attraverso pubblicazioni on-line.
Un ruolo fondamentale è assunto quindi dai luoghi virtuali in cui sono raccolti tali documenti, ovvero i corpora, le biblioteche digitali - a volte chiamate anche biblioteche virtuali - gli archivi e le banche dati testuali. In generale si può dire che tutte queste risorse sono raccolte di testi digitalizzati organizzate per lingue, per ambiti settoriali (letteratura, filosofia, scienze, stampa ecc.) o periodi storici.

Di solito sono dotate di un motore di ricerca con il quale l'utente può cercare parole o sequenze di parole all'interno della raccolta di testi. La maggior parte di queste raccolte contiene testi letterari o saggistici in lingua inglese, ma non mancano archivi di testi in molte altre lingue occidentali, repertori di testi latini e greci, nonché repertori testuali dedicati a determinati autori o temi. Ciò che distingue una biblioteca digitale dalle altre raccolte - semplici contenitori testuali non organizzati ed eterogenei, come può essere lo stesso world wide web - sono le modalità di accesso e di consultazione attraverso un catalogo strutturato.

Le prime sperimentazioni nel campo delle biblioteche digitali risalgono ai primordi di internet, ma dall'inizio degli anni Novanta si è assistito a una notevole espansione di questi progetti, in parte anche grazie a significativi finanziamenti pubblici da parte dei vari paesi.
Essenzialmente si possono distinguere tre modalità con cui un utente può accedere ai documenti archiviati in una biblioteca digitale:

Ovviamente una modalità non esclude le altre, anche se va detto che tra le attuali biblioteche digitali solo poche offrono tutti e tre i servizi. In particolare i servizi di ricerca e analisi dei documenti sono disponibili solo in alcuni sistemi sviluppati in ambito bibliotecario o accademico.

Molte biblioteche digitali su internet nascono come grandi progetti radicati nel mondo bibliotecario tradizionale, progetti di ricerca accademici oppure progetti a carattere volontario.
I primi sono realizzati dalle grandi biblioteche nazionali o da consorzi bibliotecari, con forti finanziamenti pubblici nazionali o sovranazionali (ad es. dell'UE).
Del secondo gruppo fanno parte progetti di ricerca specializzati, spesso realizzati con strumenti tecnologici avanzati e competenze specifiche altamente qualificate. Tuttavia non di rado i testi sono coperti da diritti d'autore e quindi non liberamente utilizzabili da parte degli utenti.

Vi sono infine i progetti sviluppati e curati da organizzazioni e associazioni private. Queste banche dati contengono testi che l'utente può utilizzare poiché in genere liberi da diritti d'autore, per esempio classici della letteratura. Non sempre le edizioni elettroniche contenute in questi archivi hanno un grado di affidabilità filologica elevato. Si tratta comunque di risorse che mettono a disposizione degli utenti una grande mole di materiale. In questo contesto si colloca anche l'ambizioso Print Program di Google (Google Books) che intende digitalizzare tutto il patrimonio librario del mondo, anche se per ora stenta a decollare.

Per un lista completa di risorse consigliamo di consultare le seguenti sezioni della Sitoteca di Edigeo: Biblioteche digitali , Motori di ricerca, portali e corpora specializzati.

Per ricerche mirate consultate Term-minator.it, in particolare le sezioni Testi e libri e Testi scientifici

indietro | avanti