5 hashtag (spiegati bene) e 1 infografica per capire finalmente cos’è l’Open Science

chef · 24/04/2020 · 9 min

Sentiamo spesso parlare di Open Science ma non credo che tutti abbiano chiare le diverse interpretazioni di queste parole. Cosa significa davvero Open Science?Che cosa deve essere aperto e accessibile a tutti? Schematizzando al massimo il lavoro mio e di colleghi attivi in tutte le discipline, un progetto di ricerca sperimentale procede per fasi grossomodo standard.

Gli scienziati si pongono delle domande e pensano ad un esperimento che permetta di trovare le risposte.

Cercano i finanziamenti necessari e fanno l’esperimento, oppure i calcoli, che hanno progettato. Raccolgono dei dati, li analizzano e poi pubblicano i risultati.Cominciamo dall’ultimo atto, la pubblicazione dei risultati. E’ un passo molto importante dal quale dipende la carriera dei ricercatori. E’ imperativo pubblicare su riviste internazionali ad alto impatto che però sono imprese commerciali i cui bilanci quadrano attraverso abbonamenti che possono essere anche parecchio costosi. E’ una fetta importante nel bilancio delle biblioteche e non tutti i centri di ricerca, specialmente i più piccoli, oppure quelli delle nazioni meno opulente, se li possono permettere. Senza abbonamento, non si possono leggere i lavori pubblicati sulle riviste, quindi non ci si può tenere aggiornati e si viene penalizzati.

Per ovviare al problema occorre rendere “open”, cioè liberamente accessibili, le pubblicazioni scientifiche il cui numero cresce con una impressionante accelerazione.

Credits: sciencemag.com

#ARXIV E LE PRIME BANCHE DATI SCIENTIFICHE

I pionieri del libero accesso alle pubblicazioni sono stati i fisici e gli astronomi che, un quarto di secolo fa, hanno inventato il server arXiv dove depositare le proprie pubblicazioni che poi sono liberamente consultabili da chiunque. Il server è nato a Los Alamos da un’idea di Paul Ginsparg e l’ha seguito nelle sue varie sedi di lavoro fino ad approdare all’università Cornell.

Se siete appassionati di Amarcord informatico, pensate che una singola workstation ha fatto partire la rivoluzione nella distribuzione degli articoli dei fisici e degli astronomi.

Non dimentichiamo che, all’epoca, se volevamo fare conoscere il nostro ultimo lavoro a colleghi in giro per il mondo, occorreva stampare un certo numero di copie, imbustarle, attaccare etichette con indirizzi e portare il tutto all’ufficio postale. Un sistema che non garantiva la disseminazione dell’informazione a tutti i potenziali interessati, che magari noi non conoscevamo e non avevano nel nostro indirizzaio. Per contro, una delle possibilità previste da subito nel sistema arXiv è il possibilità di essere avvisati quando viene aggiunto un lavoro che abbia attinenza con i campi di interesse che abbiamo scelto, grazie all’uso di parole chiave.

Chiunque può depositare i propri articoli sia che siano stati appena sottoposti ad una rivista, che li farà giudicare da esperti esterni, sia che abbiamo già superato questo stadio e siano stati accettati per la pubblicazione. E’ importante sapere lo stadio di accettazione di un articolo perché un lavoro depositato appena scritto potrebbe non superare il giudizio degli esperti della rivista e non essere mai pubblicato. Rimarrà come preprint nel server a futura memoria, se mai ce ne sarà bisogno.

Sull’onda del successo di arXiv sono nati altri sistemi per la disseminazione degli articoli in altri ambiti come PubMed Central, che ospita solo articoli già accettati da riviste in campo medico, oppure bioRxiv per le scienze biologiche.

I server rimandano alle riviste, che in questo modo amplificano la loro visibilità, e permettono anche a chi non ha accesso all’abbonamento di leggere l’articolo.

Il sistema arXiv ha avuto un successo straordinario e la sua crescita continua ad un ritmo sempre più sostenuto: Partito nell’agosto 1991, quando nessuna rivista aveva una edizione online, ci ha messo 17 anni per arrivare a quota mezzo milione di lavori, ma solo 6 per arrivare a quota 1 milione, traguardo che ha toccato il 26 dicembre 2014.

E’ un sistema semplice che per vent’anni è stato gestito nei ritagli di tempo dal fondatore con l’aiuto di qualche bibliotecaria/o di buona volontà e di volontari col compito di assicurare un minimo di controllo della qualità dei lavori sottoposti, specialmente nel caso di lavori non ancora accettati. Un servizio dal costo molto limitato che ha cambiato la vita di fisici, astronomi, matematici, esperti di computer science, statistici e analisti finanziari che spesso iniziano la giornata andando a vedere gli ultimi articoli depositati. Adesso il fondatore ha ceduto il passo e il server, ospitato dall’Università di Cornell, ha trovato modo di autosostenersi facendo pagare una tassa ai centri di ricerca che sono gli usatori più accaniti.

ANCHE LA SCIENZA HA LE SUE RIVISTE #OPEN

Per completare il panorama dell’editoria scientifica non si possono dimenticare le ultime nate: le riviste “open access”. Generalmente sono solo in edizione online e rendono subito liberamente (e gratuitamente) disponibili i lavori pubblicati. Tuttavia, per fare quadrare i conti in mancanza di abbonamenti, richiedono un contributo (dall’entità variabile tra qualche centinaia a qualche migliaia di dollari o euro) agli autori. Ne esistono un numero sempre crescente, alcune di livello ottimo come PLoS (per Public Library of Science), altre di livello medio oppure decisamente basso disposte d accettare di tutto pur di incassare il contributo di pubblicazione.

Per apprezzare il diverso grado di serietà delle riviste “open access” sono stati fatti dei test illuminanti.

Un autore inventato, con affiliazione in un istituto inesistente, ha inviato, da un indirizzo e-mail taroccato, un articolo infarcito di errori in un qualche settore biologico ad un centinaio di riviste open access. Gli errori erano così plateali che qualunque esperto del campo se ne sarebbe accorto. Mentre diverse riviste hanno detto no grazie, sono state molte quelle pronte ad accettarlo senza fare una piega, purchè venisse pagato il contributo alle spese. Oltre a non verificare il contenuto, questi signori non avevano neanche verificato l’esistenza dell’indirizzo di questo sedicente scienziato. Per arginare il fenomeno e per proteggere le testate che svolgono seriamente il loro lavoro, sono nate liste nere di riviste “open access”. Rimane vero che, data la scelta, la maggior parte dei colleghi preferisce le riviste tradizionali cercando di garantire con servizi come arXiv l’accesso all’informazione.

#CONDIVIDERE. PERCHE’ LIBERARE LE SCOPERTE DELLA SCIENZA

L’apertura dei fisici e degli astronomi non è però condivisa da tutte le branche della scienza, specialmente da quelle che producono risultati con potenziale impatto commerciale. In questi casi è dovuto intervenire il finanziatore pubblico, tanto negli Stati Uniti che in Europa, per imporre che tutte le ricerche che ricevono finanziamenti pubblici vengano pubblicate in riviste che permettano il libero accesso agli articoli, almeno dopo un certo periodo di tempo, tipicamente un anno.

La dicotomia è ancora più evidente quando si passa a considerare il secondo aspetto della Open Science: la condivisione dei dati.

Una volta letto un articolo, può succedere che vengano dei dubbi circa il metodo di analisi utilizzato. Se i dati li avessimo avuti noi, avremmo proceduto in maniera diversa. A questo punto sorge spontanea la domanda: i dati utilizzati sono stati archiviati da qualche parte? Possono essere richiesti? In altre parole, sono disponibili?

Sono orgogliosa di dire che, in questo campo, nessuno batte gli astronomi. Dopo un anno di proprietà dell’astronomo/a che ha effettuato o ha richiesto l’osservazione di un determinato oggetto celeste, tanto con i telescopi a terra, quanto con i telescopi spaziali, i dati passano automaticamente a fare parte di un archivio e possono essere utilizzati da chiunque. Se qualcuno ha dei dubbi sul risultato che io ho ottenuto, può rifare l’analisi dei dati e, se arriverà a risultati diversi, li pubblicherà mettendo nero su bianco somiglianze e differenze. La condivisione dei dati a volte si spinge fino a rendere disponibili i dati appena ottenuti.

L’ESPERIMENTO DELLA MISSIONE #DSCVOR DELLA NASA

E’ un approccio che piace molto alla NASA che lo richiede a molte delle sue missioni. È il caso delle missioni di astrofisica delle alte energie Fermi e SWIFT, ma anche dell’osservatorio solare Solar Dynamics Observatory, che fa un monitoraggio continuo della nostra stella e mette in rete le immagini, delle missioni che fanno la mappatura di Marte e della nuova missione DSCOVR, che è arrivata da poco al punto lagrangiano da dove osserverà sia la Terra sia il Sole.

La terra vista da DSCVR

La prima immagine ad alta risoluzione del nostro pianeta è stata acquisita il 6 luglio ed è decisamente bellissima. In questi giorni DSCOVR ha iniziato a produrre e mettere a disposizione di tutti diverse immagini del nostro pianeta ogni giorno rendendo possibile studiare la meteorologia a larga scala ma anche i cambiamenti climatici, l’inquinamento, l’aerosol, le polveri.

Ovviamente, questo prezioso servizio non è a costo zero. Oltre allo spazio disco necessario per l’immagazzinamento, per garantire l’accessibilità dei dati bisogna aggiornare di continuo il software di lettura e di analisi. Mantenere un archivio ha un costo dell’ordine dell’1% di quello dell’esperimento o della missione che ha generato i dati. Può sembrare una cifra trascurabile ma non lo è. Quando si deve risparmiare su tutto anche l’1% diventa prezioso. Chi paga per il mantenimento (e la distribuzione) dei dati?Anche in questo caso le agenzie finanziatrici richiedono che i dati ottenuti da ricerche finanziate con fondi pubblici vengano depositati in banche dati che li rendano disponibili a tutti perché tutti possano ripetere l’analisi e riprodurre i risultati.

#AVIARIA. IL CASO ILARIA CAPUA

Qui il mondo accademico si divide: perché dovrei rendere pubblici i dati che mi sono costati tanta fatica e dai quali potrei ricavare altri risultati, magari dei brevetti con anche un valore commerciale? Anni fa, quando il mondo viveva nel terrore dell’influenza aviaria, Ilaria Capua causò scompiglio nel momento in cui decise di rendere pubblici i suoi risultati sul virus dell’aviaria.

I grandi centri di ricerca epidemiologica avrebbero preferito che l’informazione circolasse solo nei circoli che contano.

LA LEZIONE DEGLI ASTRONOMI

Posso dire che nel caso degli astronomi si è rapidamente arrivati ad una situazione di equilibrio: tu usi i dati che ho ottenuto io ma la prossima volta sarò io a usare i dati che hai ottenuto tu. Alla fine ci abbiamo guadagnato entrambi.Per questo le agenzie spaziali e i grandi osservatori a terra dedicano una piccola fetta dei loro budget all’archiviazione dei dati perché è chiaro a tutti che i dati non mantenuti vengono persi nel giro di pochi anni. Basta che un determinato sistema operativo venga ritirato dal mercato per rendere illeggibili ed inutilizzabili batterie di dati.

E gli altri, cosa fanno? I fisici stanno pensando di rendere disponibili i dati di LHC ma si chiedono come fare e stanno cercando soluzioni innovative. Sono i fisici del Cern che hanno inventato il World Wide Web per scambiarsi i dati, diamogli fiducia, sanno quello che fanno.

Autore

5 hashtag (spiegati bene) e 1 infografica per capire finalmente cos’è l’Open Science

chef

Continua a leggere

Donne nella scienza: come ridurre i bias lungo la pipeline STEM

Citizen science: guida pratica a biodiversità, clima e salute

Guida open science: licenze CC, MIT, preprint, dataset FAIR e DOI