, , ,

Data Management Plan e principi FAIR per la tesi 2026: come gestire e condividere i dati di ricerca

5 min di lettura

Data Management Plan e principi FAIR per la tesi 2026: come gestire e condividere i dati di ricerca

Raccogliere dati per la tesi richiede settimane o mesi di lavoro sul campo, in laboratorio o in archivio. Documentarli in modo che un’altra persona — o tu stesso fra sei mesi — possa capire esattamente come sono stati prodotti, dove si trovano e con quale licenza possono essere riutilizzati richiede qualcosa di diverso: un Data Management Plan (DMP) costruito attorno ai principi FAIR. Senza questa struttura, i dati rischiano di restare un archivio opaco su un disco personale, inutilizzabile per la verifica scientifica e incompatibile con i requisiti dei finanziatori europei e italiani.

Il tema è diventato urgente per molti laureandi e dottorandi italiani da quando il Piano Nazionale per la Scienza Aperta (PNSA 2021–2027), adottato con Decreto Ministeriale n. 268 del 28 febbraio 2022, ha esteso l’obbligo di gestione FAIR dei dati a tutta la ricerca finanziata con fondi pubblici — inclusi i dottorati PNRR. Eppure la formazione su DMP e FAIR rimane frammentata e spesso assente nei corsi triennali e magistrali. Questa guida copre tutto il necessario: dal significato pratico di ciascun principio FAIR alle sezioni obbligatorie di un DMP, fino ai repository dove depositare i dati e agli strumenti per redigere il piano.

In sintesi

Un Data Management Plan è un documento strutturato che descrive come i dati della ricerca vengono raccolti, documentati, conservati e condivisi lungo tutto il ciclo di vita del progetto. I principi FAIR (Findable, Accessible, Interoperable, Reusable) definiscono gli standard internazionali che ogni DMP deve soddisfare per garantire la riproducibilità e il riuso dei dati. Horizon Europe e i dottorati PNRR richiedono un DMP esplicito; molti atenei italiani lo richiedono anche per le tesi magistrali con componente empirica.

Che cos’è un Data Management Plan

Un Data Management Plan è un documento formale — spesso definito “documento vivo” perché viene aggiornato durante tutto il progetto — che descrive sistematicamente come i dati di ricerca vengono:

  • generati o raccolti (metodi, formati, volumi attesi);
  • documentati e descritti con metadati standardizzati;
  • archiviati e protetti durante la fase attiva della ricerca;
  • condivisi, resi accessibili o — dove necessario — mantenuti riservati;
  • conservati a lungo termine dopo la conclusione del progetto.

Il DMP non è un semplice modulo burocratico: è uno strumento di pianificazione che obbliga il ricercatore a prendere decisioni esplicite su ogni dato prodotto prima di raccoglierlo. Questo approccio preventivo riduce il rischio di perdere dati critici, di non poter rispondere a domande di revisione post-pubblicazione e di violare requisiti etici o legali senza averlo previsto.

A livello internazionale, il quadro di riferimento per i DMP è stato stabilito da Science Europe con il suo Practical Guide to the International Alignment of Research Data Management, che definisce le sezioni obbligatorie e i criteri di valutazione riconosciuti dalla maggior parte dei finanziatori europei. In Italia, il Piano Nazionale per la Scienza Aperta adotta questo framework e richiede che i DMP siano allineati agli standard europei e ai principi FAIR.

La differenza rispetto a un semplice piano di archiviazione è che il DMP considera l’intero ciclo di vita del dato: dalla generazione alla conservazione decennale post-progetto, passando per la condivisione intermedia con collaboratori, il deposito in repository certificati e la citabilità persistente tramite DOI. Questo approccio trasforma i dati grezzi della tesi in risorse scientifiche riutilizzabili, aumentando l’impatto a lungo termine del lavoro di ricerca.

I quattro principi FAIR spiegati per la tesi

I principi FAIR sono stati formalizzati nel 2016 da Wilkinson et al. su Scientific Data (Nature Publishing Group) come linee guida per rendere i dati scientifici trovabili, accessibili, interoperabili e riutilizzabili — tanto dalle persone quanto dalle macchine. Applicarli a una tesi magistrale o di dottorato non richiede infrastrutture complesse: richiede decisioni consapevoli prese fin dall’inizio della ricerca.

Diagramma dei quattro principi FAIR per i dati di ricerca: Findable (Trovabile), Accessible (Accessibile), Interoperable (Interoperabile), Reusable (Riutilizzabile)
I principi FAIR per i dati di ricerca. Fonte: Wikimedia Commons (CC BY-SA 4.0)

F — Findable (Trovabile)

I dati devono poter essere trovati da chi cerca. In pratica questo significa assegnare ai dataset un identificatore persistente (DOI o Handle) tramite un repository riconosciuto; descrivere i dati con metadati ricchi e strutturati secondo uno standard (Dublin Core, DataCite, DDI); indicizzare i metadati in sistemi di ricerca consultabili, come il catalogo di Zenodo o OpenAIRE Research Graph. Un file Excel chiamato dati_finali_v3_DEFINITIVO.xlsx salvato su Google Drive personale non è Findable: non ha identificatore persistente, non ha metadati strutturati, non è indicizzato in alcun sistema di scoperta.

A — Accessible (Accessibile)

Una volta trovati, i dati devono essere recuperabili tramite un protocollo standardizzato e aperto. I repository come Zenodo garantiscono l’accesso tramite API REST e OAI-PMH. Un aspetto fondamentale che spesso viene trascurato: la “A” si applica separatamente ai dati e ai metadati. I metadati devono restare accessibili anche quando i dati non possono essere resi pubblici — ad esempio per vincoli GDPR o accordi di riservatezza — garantendo che la scheda descrittiva del dataset sopravviva anche alla rimozione dei file.

I — Interoperable (Interoperabile)

I dati devono usare formati e vocabolari che permettono lo scambio e l’integrazione con altri dataset. Nella pratica questo significa preferire formati aperti e longevi: CSV al posto di Excel proprietario, TIFF o PNG al posto di formati fotografici con compressione lossy, XML o JSON con schema documentato al posto di strutture ad hoc. Significa anche usare vocabolari controllati e ontologie disciplinari riconosciute (SNOMED per medicina, Getty AAT per storia dell’arte, MeSH per scienze biomediche) al posto di etichette inventate caso per caso.

R — Reusable (Riutilizzabile)

Il principio R è il più esigente: i dati devono essere documentati in modo talmente preciso che un ricercatore indipendente possa comprenderli, valutarli e riutilizzarli senza dover contattare l’autore originale. Questo richiede una licenza d’uso esplicita (Creative Commons CC BY o CC0 per dati non sensibili), documentazione dettagliata della provenienza — come e dove sono stati raccolti, con quale strumentazione o protocollo, in quale contesto geografico e temporale — e un file README strutturato che spieghi ogni variabile, unità di misura e convenzione di denominazione dei file.

Per una trattazione comparativa dei principi FAIR applicati alla ricerca accademica in contesti disciplinari diversi, la guida completa ai principi FAIR per i ricercatori su tesify.app offre esempi pratici e casi d’uso internazionali.

Quando il DMP è obbligatorio: Horizon, PNRR e atenei italiani

Il DMP non è un requisito universale per ogni tesi di laurea triennale, ma la sua obbligatorietà si estende progressivamente a categorie sempre più ampie di ricercatori italiani.

Contesto Requisito DMP Tempistica
Horizon Europe Obbligatorio come deliverable ufficiale Prima versione entro 6 mesi dall’avvio; aggiornamenti ad ogni revisione
Dottorati PNRR Conformità alle linee guida MUR sulla gestione FAIR dei dati Durante il percorso di dottorato
ERC (Consiglio Europeo della Ricerca) Obbligatorio per tutti i grant ERC Prima versione entro 6 mesi dall’avvio
Tesi magistrali con dati primari Raccomandato o richiesto in base alla policy d’ateneo e alla disciplina Prima della raccolta dati
Tesi triennale (ricerca secondaria) Generalmente non richiesto

Il panorama dell’Open Science in Italia nel 2026 — con Plan S, EOSC e le politiche MUR — è in rapida evoluzione: verificare le policy del proprio ateneo è sempre il punto di partenza corretto, poiché alcune università hanno già adottato politiche proprie più stringenti rispetto al minimo nazionale.

Come strutturare il DMP della tua tesi: le sei sezioni principali

Il template Science Europe, adottato da Horizon Europe e da molti atenei italiani tramite DMPonline, prevede sei aree tematiche. Ecco come tradurle concretamente per una tesi di laurea magistrale o di dottorato.

1. Raccolta e descrizione dei dati

Indica quali dati produce la ricerca — dati primari raccolti direttamente (interviste, esperimenti, osservazioni, misurazioni strumentali) oppure dati secondari riutilizzati da fonti esistenti (dataset pubblici, archivi storici, banche dati bibliografiche). Specifica i metodi di raccolta, i formati scelti, i volumi attesi e la motivazione della scelta del formato. Questa sezione risponde alla domanda: se qualcuno leggesse solo questo paragrafo, saprebbe esattamente che tipo di dati hai prodotto?

2. Metadati e documentazione

Specifica lo standard di metadati adottato: Dublin Core per uso generale, DataCite per dataset depositati in repository, DDI (Data Documentation Initiative) per dati delle scienze sociali, EML (Ecological Metadata Language) per dati ecologici. Descrivi le convenzioni di denominazione dei file, la struttura delle cartelle e le procedure di controllo qualità. Un file README strutturato — allegato a ogni dataset e redatto secondo le linee guida disciplinari — è il minimo indispensabile per garantire la “R” di FAIR.

3. Archiviazione e sicurezza durante la ricerca

Dove risiedono i dati durante la raccolta attiva? Su quale infrastruttura vengono eseguiti i backup? Con quale frequenza? Chi ha accesso ai dati grezzi? Questa sezione è particolarmente rilevante per ricerche con dati personali o sensibili, dove l’accesso deve essere ristretto, documentato e tracciabile per ottemperare al GDPR.

4. Aspetti legali ed etici

Documenta se i dati contengono informazioni personali, come è stato ottenuto il consenso informato, quali obblighi impone il GDPR (Reg. UE 2016/679) e come li hai adempiuti. Indica eventuali vincoli di proprietà intellettuale — accordi con aziende partner, dati sotto NDA, dati clinici coperti da normativa speciale. La nostra guida sul GDPR per tesi con dati sensibili approfondisce le decisioni del Garante Privacy italiano rilevanti per i ricercatori.

5. Condivisione e conservazione a lungo termine

Indica dove depositerai i dati dopo la tesi, con quale licenza (CC BY, CC0, accesso ristretto motivato), in quale formato e per quanto tempo. Scegli un repository che garantisca la conservazione a lungo termine: Zenodo, ad esempio, si impegna alla conservazione per un minimo di 20 anni e riceve finanziamento istituzionale stabile da CERN e OpenAIRE. Specifica eventuali embargo — periodi durante i quali i dati non sono accessibili pubblicamente — utili se la tesi potrebbe dare origine a pubblicazioni su rivista.

6. Responsabilità e risorse

Chi è responsabile della gestione dei dati durante la ricerca? Chi si occupa del deposito finale nel repository? Se la tesi è un lavoro di gruppo — frequente nei dottorati industriali o nelle ricerche multidisciplinari — la CRediT Taxonomy 2026 offre un vocabolario standardizzato per assegnare i contributi, incluso il ruolo esplicito di “Data Curation” per chi gestisce l’archiviazione e la manutenzione dei dati.

Dove archiviare i dati: Zenodo, OpenAIRE, re3data e IRIS

La scelta del repository è una delle decisioni più strategiche del DMP. Un repository adeguato garantisce la persistenza del DOI, la visibilità del dataset nella comunità scientifica internazionale e la conformità ai requisiti dei finanziatori.

Zenodo

Zenodo (zenodo.org) è il repository generalista più diffuso in Europa, co-finanziato da CERN, OpenAIRE e Horizon 2020. Assegna un DOI DataCite a ogni deposito, supporta sia l’accesso aperto sia quello ristretto, consente il versioning dei dataset con DOI per ogni versione, e collega automaticamente il deposito alle sovvenzioni Horizon tramite l’integrazione con OpenAIRE Research Graph. I metadati vengono rilasciati in CC0 e rimangono accessibili anche se i file vengono rimossi — garantendo il principio “A” di FAIR nella sua accezione più rigorosa. È la scelta consigliata per la maggior parte delle tesi magistrali e di dottorato quando non esiste un repository disciplinare specifico.

OpenAIRE Research Graph

OpenAIRE (openaire.eu) non è un repository di deposito primario, ma un aggregatore semantico che raccoglie metadati da oltre 80.000 fonti — repository istituzionali, editori, Zenodo, archivi disciplinari — e li rende consultabili in un grafo collegato alle sovvenzioni europee. Se la tesi è associata a un progetto Horizon, assicurarsi che il DMP menzioni OpenAIRE come punto di aggregazione e che il deposito Zenodo sia collegato alla sovvenzione è un requisito standard della rendicontazione finale al progetto.

re3data

re3data.org (Registry of Research Data Repositories) non ospita dati ma è un catalogo globale di oltre 3.000 repository disciplinari e generalisti, con filtri per disciplina, tipo di accesso, tipo di identificatore persistente e paese. Usarlo per identificare il repository disciplinare più adeguato alla propria area di ricerca — GEO per scienze della terra, PANGAEA per oceanografia, ArrayExpress per genomica, ICPSR per scienze sociali — è il percorso corretto per soddisfare il principio “R” di FAIR in modo disciplinarmente appropriato.

IRIS (CINECA)

In Italia, molti atenei utilizzano il sistema IRIS di CINECA sia come repository istituzionale per le pubblicazioni sia come archivio dati di ricerca. Se l’ateneo di appartenenza ha un’istanza IRIS con modulo Research Data Management attivo, depositare lì garantisce visibilità interna, conformità alle policy d’ateneo e integrazione con il curriculum del ricercatore. È sempre opportuno verificare con la biblioteca universitaria o con il data steward istituzionale se questa opzione è disponibile prima di scegliere un repository esterno.

Come scegliere il repository giusto in tre passi

  1. Esiste un repository disciplinare riconosciuto dalla comunità nella tua area? (Cerca su re3data.org)
  2. Il tuo ateneo ha un repository istituzionale con modulo Research Data attivo? (Chiedi alla biblioteca)
  3. In assenza di opzioni più specifiche: Zenodo è accettato da Horizon Europe, ERC e MUR senza riserve.

Strumenti per redigere il DMP

Scrivere un DMP da zero su un documento di testo è possibile ma inefficiente e soggetto a dimenticanze strutturali. Esistono strumenti web che guidano il ricercatore sezione per sezione, garantiscono la conformità ai template dei finanziatori e permettono la collaborazione con il relatore e il data steward istituzionale.

  • DMPonline (dmponline.dcc.ac.uk): strumento open-source del Digital Curation Centre (DCC), offre template per Horizon Europe, Science Europe ed ERC. Supporta la collaborazione multi-utente, la revisione da parte del supervisore e genera output machine-readable in JSON. Numerosi atenei italiani hanno un’istanza personalizzata con template specifici.
  • ARGOS (argos.openaire.eu): sviluppato nell’ecosistema OpenAIRE, è particolarmente adatto per progetti finanziati dalla Commissione Europea; integra la ricerca delle sovvenzioni direttamente dal database OpenAIRE e produce DMP in formato linked data conforme agli standard europei.
  • Data Stewardship Wizard (ds-wizard.org): fornisce questionari adattivi con domande diverse in base alla disciplina e al tipo di dato, e genera DMP con una valutazione FAIR integrata che segnala le lacune. È la scelta più indicata per ricerche con requisiti complessi: biomedicale, scienze sociali con dati sensibili, ricerche multidisciplinari.

La scelta dello strumento dipende principalmente dal template richiesto dal finanziatore o dall’ateneo: per dottorati PNRR e Horizon Europe, DMPonline con template Horizon oppure ARGOS sono le opzioni più sicure e più frequentemente verificate in sede di revisione progettuale.

GDPR e dati sensibili: aperto quanto possibile, chiuso quanto necessario

Il principio guida europeo per la gestione dei dati di ricerca non è “tutto aperto”: è “aperto quanto possibile, chiuso quanto necessario”. Questa distinzione è fondamentale per le tesi che trattano dati personali, dati sanitari, dati su minori o dati di categoria speciale ai sensi del GDPR (Reg. UE 2016/679, art. 9).

Un DMP conforme al GDPR deve documentare con precisione:

  • la base giuridica del trattamento dei dati (consenso informato dell’interessato, legittimo interesse della ricerca scientifica ai sensi dell’art. 89 GDPR, obbligo legale);
  • le misure di anonimizzazione o pseudonimizzazione applicate ai dati prima del deposito in repository;
  • l’eventuale Valutazione d’Impatto sulla Protezione dei Dati (DPIA) richiesta per trattamenti ad alto rischio;
  • le modalità di accesso ristretto nel repository prescelto (Zenodo supporta nativamente file ad accesso ristretto con approvazione del depositante).

Per i dati che non possono in nessun caso essere resi pubblici — ad esempio registrazioni audio di testimonianze di minori o cartelle cliniche identificative — il DMP deve comunque prevedere il deposito dei soli metadati nel repository (rendendo il dataset Findable e Accessible a livello descrittivo) mantenendo i file in accesso chiuso o disponibili solo su richiesta motivata e documentata. La nostra guida completa sul GDPR per tesi con dati sensibili analizza le decisioni del Garante Privacy italiano e le procedure di consenso informato per la ricerca accademica nel contesto normativo italiano aggiornato al 2026.

CRediT Taxonomy e responsabilità nella gestione dei dati

Nelle tesi con componente empirica significativa — in particolare dottorati industriali, tesi sperimentali multidisciplinari o ricerche con grandi dataset longitudinali — la questione di chi è responsabile di cosa nella gestione dei dati diventa rilevante sia eticamente sia ai fini della rendicontazione ai finanziatori.

La CRediT Taxonomy 2026 include esplicitamente il ruolo “Data Curation” — attività di gestione, annotazione, manutenzione e archiviazione dei dati di ricerca — e il ruolo “Data Formal Analysis” per chi elabora statisticamente i dati raccolti. Dichiarare nel DMP chi svolge questi ruoli — dottorando, supervisore, tecnico di laboratorio, data steward istituzionale — migliora la trasparenza nella gestione dei dati e facilita la verifica della catena di custodia dei dati in caso di audit post-pubblicazione.

Per le ricerche basate su revisione sistematica della letteratura che includono la gestione di dataset estratti da studi primari, la checklist PRISMA 2020 prevede sezioni specifiche sulla disponibilità dei dati estratti e sulla registrazione del protocollo su PROSPERO, che si integrano direttamente con la sezione “condivisione dati” del DMP.

FAQ: Data Management Plan e principi FAIR per la tesi

Il DMP è obbligatorio per una tesi magistrale italiana?

Non esiste un obbligo nazionale uniforme per le tesi magistrali: dipende dalla policy del singolo ateneo e dalla natura della ricerca. Se la tesi raccoglie dati primari (interviste, esperimenti, osservazioni), sempre più atenei italiani — in linea con il Piano Nazionale per la Scienza Aperta (D.M. 268/2022) — richiedono o raccomandano fortemente la redazione di un DMP. È sempre consigliabile verificare con il relatore e la biblioteca di ateneo prima di iniziare la raccolta dati.

Posso depositare i dati su Zenodo anche prima che la tesi sia discussa?

Sì. Zenodo supporta la funzione di embargo: è possibile depositare i dati prima della discussione della tesi, ottenere subito un DOI (citabile nella tesi stessa), e impostare una data futura a partire dalla quale il dataset sarà pubblicamente accessibile. Questo è lo scenario consigliato per tesi che potrebbero dar luogo a pubblicazioni su rivista, dove la disponibilità pubblica immediata dei dati potrebbe anticipare la pubblicazione scientifica.

Quali formati di file sono considerati FAIR-compliant?

I formati preferibili sono aperti, non proprietari e longevi: CSV o TSV per dati tabulari, PDF/A per documenti, TIFF o PNG per immagini senza compressione lossy, XML o JSON con schema documentato per dati strutturati. I formati proprietari come .xlsx, .docx o RAW fotografico possono essere depositati come materiale supplementare, ma non dovrebbero essere l’unico formato di archiviazione primaria in un deposito FAIR-compliant.

Come gestisco i dati sensibili rispettando sia FAIR sia il GDPR?

Applica il principio “aperto quanto possibile, chiuso quanto necessario”: anonimizza o pseudonimizza i dati dove tecnicamente praticabile e deposita la versione anonimizzata in open access. Se l’anonimizzazione non è possibile senza perdere il valore scientifico dei dati, deposita solo i metadati nel repository (rendendo il dataset Findable e Accessible a livello descrittivo) e mantieni i file in accesso ristretto o disponibili solo su richiesta documentata. Documenta nel DMP tutte le misure GDPR adottate, incluse la base giuridica e le procedure di consenso informato.

Quanto tempo richiede la preparazione di un DMP per una tesi magistrale?

Un DMP base per una tesi magistrale con dataset di medie dimensioni richiede generalmente tra le quattro e le otto ore di lavoro iniziale, distribuite in due o tre sessioni con DMPonline o uno strumento equivalente. Il tempo aumenta significativamente se la ricerca coinvolge dati sensibili (GDPR), partnership industriali con NDA, o dataset di grandi dimensioni che richiedono infrastrutture di archiviazione specifiche. Iniziare prima della raccolta dati è sempre la scelta più efficiente e riduce i rischi di dover correggere il piano a posteriori.

Che cosa succede se il DMP di un progetto Horizon Europe non viene aggiornato?

L’assenza di un DMP aggiornato può comportare problemi nelle revisioni periodiche del progetto (project reviews) da parte della Commissione Europea e, nei casi più gravi, richieste di giustificazione o di restituzione parziale del finanziamento. Horizon Europe richiede la prima versione del DMP entro sei mesi dall’avvio del progetto e aggiornamenti ogni volta che si verificano cambiamenti significativi nella gestione dei dati. Il DMP è valutato come deliverable ufficiale del progetto, non come documento facoltativo.

Stai strutturando i dati della tua tesi?

Tesify ti aiuta a organizzare la struttura della tesi, verificare la coerenza metodologica e controllare l’originalità dei tuoi contenuti prima della consegna — sempre nel rispetto dell’integrità accademica e senza scrivere al posto tuo.

Prova Tesify gratuitamente →