Referenze scientifiche per tutti by

11 Mar
2009

A volte le idee (quelle buone ma anche quelle poco buone) arrivano da dove meno te lo aspetti. A me ne è venuta una (anche se ancora non saprei dire se è buona o se farei meglio a sotterrarla) leggendo uno sfogo di un anziano prof (un boss nel mio settore) su quanto facciano pena i vari sistemi per la gestione delle referenze scientifiche.

Una prefazione per chi non è del ramo: per chi scrive di scienza (ma anche per chi scrive di filologia normanna) referenze e citazioni sono una parte fondamentale del proprio lavoro. Quando si scrive un articolo non si può ripartire sempre da Adamo ed Eva e quindi, sia per inquadrare l’argomento, sia per dare un’indicazione al lettore di dove si trovino dimostrati/spiegati alcuni risultati che utilizziamo ci si riferisce a lavori precedenti. Il numero di volte che un certo articolo/libro/monografia è stato citato da altri viene generalmente considerato un indicatore di quanto impatto abbia avuto sulla comunità scientifica e quindi è un’indicazione della sua importanza (del funzionamento e delle perversioni dell’impact factor avevamo già parlato a suo tempo). Avere un database completo e facile da utilizzare delle referenze risulta quindi estremamente utile. Anche un sistema per mettere le referenze nei propri scritti in maniera il più possibile semi-automatica non sarebbe male.

Mentre la seconda dipende direttamente dall’editor di testi che usate (io amo molto LaTeX e la gestione della bibliografia tramite BibTeX) la prima è una questione di fonti. Il metodo più brutale è di andare, volta per volta, sul sito/catalogo dell’editore della rivista/libro che vi interessa, cercare le informazioni e poi trascriverele. Un metodo più furbo è andare su un database on-line, fare una rapida ricerca, esportare la bibliografia nel formato che vi interessa e importarla nel vostro text editor di fiducia. Questo però presuppone l’esistenza di un database completo, ben fatto, facile da usare e, soprattutto, accessibile.

In ambito scientifico (almeno per la fisica e la chimica) “il database” per eccellenza è l’ISI Web of Knowledge. Si tratta di un database piuttosto completo (i dati per alcune riviste vanno indietro fino agli inizi del XX secolo) ma è a pagamento. Questo può non essere un problema così importante dato che gran parte delle università ha accesso e che qualcuno dovrà pur pagare quei poveretti che tengono aggiornato il database. Un problema un po’ più grosso è che dà di matto tutte le volte che c’è un carattere che esula dall’alfabeto inglese e, ancora peggio, è che non ha un sistema pulito ed univoco per gestire le identità degli autori. Appena il nome di qualcuno esula anche di poco dagli standard americani diventa necessaria una certa fantasia per riuscire a trovare la persona che si sta cercando.Un “Bart van Tiggelen” diventa (a seconda di come gli gira alsito) “Bart vanTiggelen”, “BART VANTIGGELEN”, “Bart Tiggelen Van” ed infinite altre combinazioni (case sensitive) con cui l’utente ha modo di divertirsi nel disperato tentativo di trovare le informazioni di cui ha bisogno. Se poi ci sono delle omonimie (anche solo di cognome) il database non è assolutamente in grado di distinguere chi è chi e, nel caso di nomi comuni come un “García López” (che già viene impietosamente trasformato in “Garcia Lopez”) si rischia di trovarsi davanti le pubblicazioni di decine e decine di autori diversi che operano in settori diversissimi tra loro.

Mi dicono che Scopus (altro database a pagamento) sia un po’ meglio, anche se meno completo. Io però non sono in grado di verificare dato che la mia università non ha l’accesso.

Quale sarebbe allora l’idea? Semplice, dato che ciascuno di noi (dove per “noi” intendo quelli che scrivono articoli più o meno accademici ) ha da qualche parte sul suo computer una piccola raccolta di queste referenze, perché non le mettiamo tutte insieme e creiamo un database aperto, gratuito e sotto licenza libera così che tutti possano utilizzarlo? Gente che di informatica ne mastica più di me mi dice che per farlo serva una cosa chiamato “database semantico” (o qualcosa di simile, perdonatemi ma non sono un esperto del settore) ma non credo che questo sarebbe un problema. Anche la tecnica in stile wikipedia di lasciare libertà di editare il database a tutti quelli che passano potrebbe creare qualche problemino; tuttavia questo si risolve facilmente permettendo la scrittura solo a chi siano riconoscibili come “scienziati”. Se io do il permesso in scrittura a tutti gli scienziati che conosco e loro danno il permesso a tutti quelli che conoscono loro in pochi passaggi abbiamo già incluso (con nome e cognome in chiaro e riconoscibili) tutti i possibili utenti di una cosa del genere.

Insomma, io sono convinto che con uno sforzo limitato sia possibile mettere in piedi un database ragionevolmente completo, di libero accesso e “costruito dal basso”. Certo, rimane aperto il problema di come risolvere i doppioni, le omonimie ecc ma sono convinto che con un po’ di buona volontà sia possibile superare questi dettagli tecnici senza troppi problemi.

(forse) ne abbiamo parlato qui:

3 Responses to Referenze scientifiche per tutti

Avatar

Massimiliano

Marzo 11th, 2009 at 16:47

Non so cosa si intenda di preciso per “database semantico” ma non mi sembra sia un concetto affermato in informatica (il testo che ho io non mi pare ne parli, e non mi pare ve ne siano definizioni formali).
Per come la vedo io un classico database relazionale ha caratteristiche semantiche nella misura in cui ciascun dato ha, per costruzione, una serie di informazioni che lo descrivono.
Il problema della semantica si pone a livello superiore, ovvero: come verranno presentati i dati?
Le pagine Web in HTML sono un’opzione, ma non necessariamente l’unica, e hanno la caratteristica di perdere le informazioni semantiche. Serve quindi un formato che permetta di rappresentare dati e metadati dopo che essi sono stati estratti dal DB. Spero di non aver detto qualche stupidaggine 🙂

Avatar

Davide

Marzo 11th, 2009 at 22:14

Concordo con quanto dice Massimiliano.
Il problema del’internazionalizzazione dei caratteri è risolvibile adottando un po’ di accorgimenti.
Esportare formati diversi di dati non dovrebbe essere molto difficoltoso.
Certo mi servirebbero più informazioni per capire come modellizzare la base di dati e anche l’interfaccia migliore con l’utente.
Purtroppo non avrei tempo di seguire un progetto del genere, ma posso aiutare con un po’ di brainstorming e qualche consulenza di web development.

Avatar

s.l'i

Marzo 12th, 2009 at 10:11

Non credo che “DB semantico” significhi “DB relazionale”.
Piuttosto autorelazionale.
La struttura delle info è sempre un problema delle costruzioni frammentarie e/o collaborative, vedasi Wikipedia: montagne di informazioni in genere destrutturate. Antologia più che enciclopedia.

top