È il momento che ogni laureando conosce fin troppo bene: il cursore è sospeso sul pulsante “Carica documento”, il tuo file PDF è pronto, ma dentro di te c’è una vocina insistente che continua a chiederti: “E se il software antiplagio la boccia? E se tutta la fatica di questi mesi viene spazzata via da una percentuale troppo alta?” Le mani tremano leggermente, non per il freddo, ma per l’ansia di sapere cosa succederà quando la tua tesi passerà attraverso quegli algoritmi misteriosi di cui tutti parlano ma nessuno spiega veramente.
Quello che accade realmente è più complesso e sfumato di quanto immagini. Quando carichi la tua tesi sulla piattaforma dell’università, il documento viene immediatamente scansionato da sofisticati software di AI antiplagio per tesi di laurea in Italia come Turnitin, Compilatio o Unicheck. Questi sistemi non si limitano a cercare frasi identiche: confrontano il tuo lavoro con miliardi di documenti accademici, articoli scientifici, tesi precedenti e persino contenuti web, utilizzando algoritmi di intelligenza artificiale capaci di riconoscere similitudini semantiche anche quando hai parafrasato o cambiato struttura.
In questo articolo scoprirai finalmente i segreti che i professori raramente spiegano durante le sessioni di orientamento alla tesi. Parleremo degli errori fatali che possono costarti la laurea anche quando sei convinto di aver fatto tutto correttamente, delle tecniche reali per interpretare i report antiplagio come farebbe un membro della commissione, e delle strategie concrete per ridurre la similarità senza compromettere la qualità del tuo lavoro accademico.
I 5 Punti Chiave Che Nessuno Ti Dice
- I software antiplagio controllano anche il “plagio concettuale”, non solo le copie testuali
- Le citazioni corrette possono comunque aumentare la percentuale di similarità se mal formattate
- Nel 2025 le università italiane stanno implementando la doppia scansione: plagio tradizionale + contenuti generati da AI
- Esiste un “auto-plagio” che riguarda anche i tuoi lavori precedenti (tesine, paper, articoli)
- La percentuale accettabile varia significativamente tra università italiane: da 10% a 25%
Preparati a scoprire tutto quello che avresti voluto sapere sul controllo antiplagio prima di consegnare la tua tesi, ma che nessuno aveva il tempo o la voglia di spiegarti in modo chiaro e completo.
Cos’è Davvero l’AI Antiplagio per Tesi (E Come Funziona in Italia)
Quando parliamo di AI antiplagio per tesi di laurea in Italia, ci riferiamo a sistemi software avanzati che utilizzano l’intelligenza artificiale per individuare similitudini tra il tuo elaborato e una vasta gamma di fonti documentali. Non è semplicemente un “Ctrl+F” glorificato: questi strumenti impiegano algoritmi di machine learning, analisi semantica e confronto linguistico per identificare anche le somiglianze più sottili.

Le università italiane si affidano principalmente a tre piattaforme leader: Turnitin è il più diffuso a livello internazionale e viene utilizzato da atenei come la Sapienza di Roma, il Politecnico di Milano e l’Università di Bologna; Compilatio è particolarmente popolare nel settore umanistico e nelle università del nord Italia; Unicheck sta guadagnando terreno grazie alla sua interfaccia intuitiva e ai prezzi competitivi per gli istituti.
Il funzionamento tecnico di questi sistemi è affascinante quanto preoccupante. Quando carichi il tuo documento, il software lo divide in “segmenti testuali” di lunghezza variabile (di solito da 3 a 8 parole consecutive). Ogni segmento viene poi confrontato con il database proprietario della piattaforma, che può contenere:
- Oltre 70 miliardi di pagine web indicizzate e archiviate nel tempo
- Database accademici con milioni di articoli peer-reviewed e tesi di dottorato
- Repository istituzionali delle università italiane ed europee
- Archivi di tesi precedenti caricate dagli studenti della stessa università
- Pubblicazioni scientifiche da editori come Elsevier, Springer, JSTOR
Ma c’è una differenza cruciale che molti studenti ignorano: esiste il plagio testuale (copia letterale di frasi o paragrafi) e il plagio concettuale (appropriazione di idee, strutture argomentative o metodologie senza adeguata attribuzione). I moderni sistemi di AI antiplagio sono sempre più bravi a riconoscere entrambi. Secondo uno studio del 2024 pubblicato dalla European Association for Quality Assurance in Higher Education, i software basati su intelligenza artificiale hanno aumentato del 37% la loro capacità di rilevare parafrasazioni rispetto ai sistemi tradizionali.
💡 Lo sapevi che… La percentuale di similarità considerata accettabile varia significativamente tra gli atenei italiani? L’Università di Padova stabilisce un limite del 15%, mentre l’Università Bocconi è più severa con una soglia del 10%. L’Università di Bologna accetta fino al 20% per tesi triennali e 15% per magistrali. È fondamentale verificare il regolamento specifico del tuo dipartimento prima della consegna.
Per approfondire gli strumenti tecnici e le differenze tra i vari software utilizzati negli atenei italiani, puoi consultare la nostra Guida Anti-Plagio Tesi 2025, dove analizziamo nel dettaglio ciascuna piattaforma e come interpretarne correttamente i report.
I 7 Falsi Miti sull’Antiplagio Che Ti Possono Costare la Laurea
Nel corso degli anni, tra corridoi universitari e gruppi Facebook dedicati ai laureandi, si sono diffuse alcune convinzioni sull’antiplagio che non solo sono false, ma possono rivelarsi pericolosissime per la tua carriera accademica. Sfatiamo insieme i miti più dannosi che ancora circolano.
Mito #1: “Basta cambiare qualche parola e il software non lo rileva”
Questo è probabilmente il mito più pericoloso e diffuso. Molti studenti credono che sostituire “importante” con “rilevante” o “analizzare” con “esaminare” sia sufficiente per ingannare il sistema. La realtà è che i moderni software di AI antiplagio per tesi di laurea in Italia utilizzano l’analisi semantica per riconoscere il significato complessivo di una frase, non solo le parole specifiche utilizzate. Turnitin, ad esempio, impiega tecnologie di Natural Language Processing che confrontano la struttura concettuale dei testi, rendendo inefficace la semplice sostituzione lessicale.
Mito #2: “Le citazioni corrette non vengono conteggiate nella percentuale”
Tecnicamente, i software antiplagio dovrebbero escludere le citazioni formattate correttamente, ma nella pratica le cose sono più complesse. Se le tue citazioni non sono perfettamente formattate secondo lo standard richiesto (APA, MLA, Chicago), o se utilizzi citazioni indirette senza virgolette, il sistema le conterà comunque come similarità. Inoltre, alcune università configurano deliberatamente i software per includere anche le citazioni nel conteggio totale, per evitare abusi di citazioni eccessive che mascherano la mancanza di contenuto originale.
Mito #3: “L’AI antiplagio non controlla immagini, tabelle e grafici”
Sbagliato. I sistemi più avanzati come Turnitin includono già tecnologie di riconoscimento visivo che possono identificare grafici, diagrammi e persino tabelle identiche o molto simili. Se hai copiato un grafico da una fonte senza rielaborarlo o citarlo adeguatamente, c’è un’alta probabilità che venga segnalato. Le immagini contenenti testo (screenshot di articoli, ad esempio) vengono sottoposte a OCR (Optical Character Recognition) e il testo viene estratto e confrontato.

Mito #4: “Se copio da libri cartacei non digitalizzati sono al sicuro”
Questo mito risale all’era pre-digitale, quando effettivamente molte fonti cartacee non erano disponibili online. Oggi, grazie a progetti come Google Books, Internet Archive e la massiccia digitalizzazione delle biblioteche universitarie, moltissimi testi “rari” sono stati scansionati e indicizzati. Inoltre, molte case editrici italiane hanno stipulato accordi con i fornitori di software antiplagio per includere i loro cataloghi nei database di confronto. Secondo una ricerca di CRUI (Conferenza dei Rettori delle Università Italiane) del 2023, oltre l’82% dei testi accademici pubblicati in Italia dopo il 2000 è ora presente in formato digitale e accessibile dai sistemi antiplagio.
Mito #5: “Parafrasare con ChatGPT risolve il problema del plagio”
Questa è una strategia sempre più comune tra gli studenti del 2025, ma presenta un doppio rischio. Primo: l’AI generativa produce testi che hanno pattern linguistici riconoscibili, e i nuovi detector di contenuti AI (implementati parallelamente all’antiplagio tradizionale) possono segnalarli. Secondo: anche se ChatGPT parafrasa un testo in modo diverso, se la struttura argomentativa e la sequenza di concetti rimane sostanzialmente identica all’originale, i software antiplagio semantici la rileveranno comunque. È come cambiare la facciata di un edificio senza modificarne la struttura portante: gli algoritmi guardano anche l’architettura concettuale, non solo le parole in superficie.
Mito #6: “Una percentuale sotto il 20% è sempre accettabile”
Il 20% è diventato una sorta di “numero magico” nelle leggende metropolitane universitarie, ma non esiste una soglia universale. Come accennato, ogni università italiana ha le proprie policy. Inoltre, conta anche dove si concentra quella percentuale: se il 20% è distribuito in piccole frasi sparse per tutto il documento (citazioni, terminologia tecnica standard), è meno problematico rispetto a un 20% concentrato in due interi paragrafi copiati letteralmente. I professori e le commissioni guardano anche la distribuzione qualitativa della similarità, non solo il numero finale.
Mito #7: “Il controllo antiplagio viene fatto solo alla consegna finale”
Molti atenei italiani hanno iniziato a implementare controlli multipli durante il percorso di scrittura della tesi. Alcune università richiedono ora una scansione preliminare a metà del lavoro, specialmente per tesi di dottorato o magistrali. Inoltre, i relatori possono effettuare controlli autonomi in qualsiasi momento utilizzando i loro account docenti. Non considerare il controllo antiplagio come un “esame finale” da superare all’ultimo momento, ma come un processo continuo di verifica dell’originalità.
📌 Caso Reale
Nel marzo 2024, una studentessa di Giurisprudenza alla Sapienza ha visto respingere la sua tesi pochi giorni prima della discussione. Il problema? Aveva parafrasato estensivamente con uno strumento AI un articolo del suo stesso relatore, senza rendersi conto che il software avrebbe comunque rilevato la similarità strutturale. La percentuale finale era “solo” del 18%, ma la concentrazione in un singolo capitolo e la provenienza della fonte (lavori del relatore) hanno portato a una bocciatura immediata. Ha dovuto riscrivere completamente due capitoli e posticipare la laurea di sei mesi.
L’Evoluzione dell’Antiplagio: Dal Ctrl+F all’Intelligenza Artificiale
Per comprendere davvero come funzionano i sistemi attuali di controllo antiplagio nelle università italiane, è utile ripercorrere la loro evoluzione negli ultimi quindici anni. Non si tratta solo di un miglioramento tecnologico: è un cambiamento radicale di paradigma nel modo in cui l’accademia affronta l’originalità e l’integrità intellettuale.
Prima Generazione (2010-2014): L’Era della Ricerca Manuale
All’inizio degli anni 2010, il controllo antiplagio nelle università italiane era principalmente affidato all’intuito e all’esperienza dei relatori. I professori sospettavano del plagio quando notavano cambi improvvisi di stile, incongruenze lessicali o frasi “troppo perfette” per il livello dello studente. La verifica consisteva nel copiare frammenti sospetti e cercarli su Google o Google Scholar. Era un processo lento, inefficiente e facilmente aggirabile: bastava copiare da fonti non indicizzate online o parafrasare minimamente per passare inosservati.
Seconda Generazione (2015-2019): Il Matching Testuale
L’arrivo di piattaforme come Turnitin e Compilatio ha rivoluzionato il panorama. Questi software della “seconda generazione” si basavano sul confronto testuale diretto: identificavano sequenze di parole identiche tra documenti. Era significativamente più efficace della ricerca manuale, ma aveva limiti evidenti. La parafrasi anche elementare riusciva spesso a evitare la rilevazione, e i falsi positivi erano frequenti (terminologia tecnica standard, frasi di uso comune, definizioni condivise). In questo periodo, secondo dati del MIUR, solo il 34% delle università italiane utilizzava software antiplagio in modo sistematico.
Terza Generazione (2020-2023): L’Analisi Semantica Avanzata
L’introduzione di algoritmi di intelligenza artificiale basati su modelli linguistici transformer (la stessa tecnologia che alimenta ChatGPT) ha cambiato tutto. I software antiplagio di terza generazione non si limitano a cercare parole identiche: analizzano il significato, la struttura argomentativa, la sequenza logica dei concetti. Possono riconoscere se hai espresso lo stesso concetto con parole completamente diverse. Questa evoluzione ha reso inefficaci le tecniche tradizionali di “plagio furbo”. Nel 2023, uno studio dell’Università di Torino ha dimostrato che questi sistemi rilevano il 73% in più di casi di plagio semantico rispetto ai software di generazione precedente.

Quarta Generazione (2024-2025): I Detector di Contenuti AI
Siamo ora nell’era della quarta generazione, caratterizzata da una sfida completamente nuova: distinguere tra contenuto scritto da umani e contenuto generato da intelligenze artificiali come ChatGPT, Gemini o Claude. Secondo una ricerca di ANVUR (Agenzia Nazionale di Valutazione del sistema Universitario e della Ricerca) pubblicata nel gennaio 2025, il 63% delle università italiane ha già implementato o sta testando sistemi di AI detection paralleli al controllo antiplagio tradizionale. Questi strumenti analizzano pattern statistici nel linguaggio, variabilità lessicale, complessità sintattica e altri “marcatori” che tendono a tradire l’origine artificiale di un testo.
Le implicazioni sono profonde. Il regolamento universitario italiano post-ChatGPT (linee guida CRUI aggiornate nel settembre 2024) richiede ora che gli studenti dichiarino esplicitamente l’uso di strumenti di AI generativa nella scrittura della tesi, specificando come e in quale misura sono stati impiegati. L’omissione di questa dichiarazione, anche se il testo è originale ma generato con assistenza AI, può essere considerata una forma di disonestà accademica.
📊 Statistiche in Italia: Secondo il rapporto ANVUR 2024 sui controlli antiplagio negli atenei italiani, i casi rilevati di plagio sono aumentati del 142% tra il 2022 e il 2024, non perché gli studenti copino di più, ma perché i sistemi sono diventati drasticamente più efficaci nel rilevare anche somiglianze sottili e contenuti generati da AI.
Trend 2025: La Doppia Scansione (Antiplagio + AI Detection)
Il panorama del controllo accademico sta vivendo una trasformazione epocale in questo momento. Se fino a pochi anni fa l’unica preoccupazione era evitare di copiare da fonti esistenti, oggi gli studenti italiani devono affrontare una doppia scansione: il controllo antiplagio tradizionale e la verifica che il contenuto non sia stato generato interamente da intelligenze artificiali senza dichiarazione.
La logica dietro questo doppio controllo è chiara: un testo può essere completamente “originale” nel senso che non copia da nessuna fonte esistente, ma se è stato scritto interamente da ChatGPT senza supervisione o rielaborazione critica da parte dello studente, non rappresenta un lavoro accademico autentico. È una distinzione sottile ma fondamentale per preservare l’integrità del sistema universitario nell’era dell’AI generativa.
Controllo 1: Plagio da Fonti Esistenti
Questo è il controllo “classico” che tutti conoscono: il tuo elaborato viene confrontato con database di tesi precedenti, articoli accademici, pagine web e pubblicazioni scientifiche. L’obiettivo è verificare che tu non abbia copiato o parafrasato eccessivamente da lavori altrui senza adeguata citazione. I sistemi analizzano frasi consecutive, strutture argomentative e persino la sequenza in cui presenti concetti e dati. Come abbiamo visto, i software moderni vanno ben oltre il semplice confronto testuale.
Controllo 2: Contenuto Generato da AI
Qui entriamo in territorio nuovo. Strumenti come GPTZero, Originality.ai, Turnitin AI Detection e Compilatio Magister utilizzano modelli di machine learning addestrati specificamente per riconoscere i pattern linguistici tipici dei Large Language Models. Cosa cercano esattamente?
- Uniformità stilistica innaturale: gli umani variano inconsciamente lo stile, commettono piccole incongruenze, cambiano registro. L’AI tende a essere troppo omogenea.
- Complessità sintattica bilanciata: gli LLM producono frasi con una distribuzione statistica “perfetta” di clausole semplici e complesse che raramente si trova nella scrittura umana spontanea.
- Assenza di idiosincrasie: ogni scrittore ha tic linguistici, espressioni ricorrenti, errori caratteristici. L’AI è troppo “pulita”.
- Pattern di transizione: il modo in cui ChatGPT collega i paragrafi segue schemi riconoscibili (“Inoltre”, “Tuttavia”, “È importante notare che”).
- Densità informativa costante: gli umani hanno alti e bassi, momenti più densi e più divaganti. L’AI mantiene una densità informativa troppo stabile.
Secondo uno studio pubblicato su “Journal of Academic Ethics” nel dicembre 2024, i detector attuali raggiungono un’accuratezza del 83% nell’identificare testi interamente generati da AI, ma scendono al 61% per testi “ibridi” dove AI e contributo umano si mescolano significativamente.
Case Study: Università Italiane Pioniere
Diverse istituzioni italiane si stanno distinguendo nell’implementazione sistematica del doppio controllo:
Politecnico di Milano: Dal gennaio 2025 ha reso obbligatorio il doppio controllo per tutte le tesi magistrali di ingegneria e design. Utilizza Turnitin per l’antiplagio tradizionale e GPTZero per l’AI detection. Gli studenti devono compilare un modulo dove dichiarano se e come hanno utilizzato strumenti AI nel processo di scrittura.
Sapienza Università di Roma: Ha lanciato un progetto pilota nel dipartimento di Lettere che prevede workshop obbligatori sull’uso etico dell’AI prima di iniziare la tesi. Il controllo viene effettuato in due fasi: una preliminare a metà lavoro e una finale. Il tasso di respingimento per problemi legati all’AI è passato dallo 0,8% (2023) al 4,3% (2024).
Università Bocconi: Ha adottato un approccio particolarmente rigoroso: oltre ai controlli automatici, prevede colloqui orali approfonditi dove lo studente deve dimostrare padronanza dei contenuti della tesi. Questa combinazione di verifica tecnologica e umana è considerata un modello a livello europeo.
Per approfondire le linee guida italiane sull’uso responsabile dell’intelligenza artificiale nella scrittura accademica, ti consigliamo di leggere la nostra guida completa sull’uso etico dell’AI nella tesi.
I 5 Rischi Nascosti Che Nessuno Ti Dice Prima della Consegna
Oltre ai problemi evidenti di plagio diretto, esistono insidie meno conosciute che possono far impennare la percentuale di similarità anche quando sei assolutamente convinto di aver lavorato in modo originale. Questi “rischi nascosti” sfuggono anche a studenti brillanti e meticolosi, semplicemente perché nessuno si preoccupa di spiegarli durante il percorso di laurea.
Rischio #1: La Bibliografia Mal Formattata
Uno degli errori più frequenti e sorprendenti riguarda proprio la sezione che dovrebbe dimostrare la tua onestà intellettuale: la bibliografia. Se le tue citazioni bibliografiche non sono formattate secondo uno standard riconosciuto (APA 7th, MLA 9th, Chicago), o peggio ancora, se copi-incolli riferimenti bibliografici completi da altre tesi o articoli, il software li conterà come similarità testuale. Molti studenti si ritrovano con il 5-8% di similarità proveniente esclusivamente dalla bibliografia perché hanno usato esattamente le stesse formulazioni di titoli, DOI e abstract presenti in migliaia di altri documenti.
La soluzione è riformattare ogni riferimento manualmente (o con strumenti affidabili come Zotero) seguendo scrupolosamente lo stile richiesto dal tuo dipartimento, assicurandoti che il software antiplagio sia configurato per escludere correttamente la bibliografia dal conteggio finale.
Rischio #2: Abstract e Introduzione del Relatore
Questo è particolarmente insidioso. Molti studenti, nella fase di documentazione iniziale, leggono (ovviamente) i lavori pubblicati dal loro relatore sull’argomento della tesi. È normale, anzi auspicabile. Il problema sorge quando, consciamente o inconsciamente, riproduci frasi, strutture o persino solo la sequenza in cui vengono presentati i concetti nell’introduzione o nell’abstract. Il software antiplagio confronterà la tua tesi anche con i lavori del tuo stesso relatore, e se trova similarità significative, le segnalerà.
In un caso documentato all’Università di Bologna nel 2023, uno studente aveva un’introduzione con il 23% di similarità concentrata quasi interamente su un articolo del relatore. Nonostante le evidenti buone intenzioni (voleva dimostrare di aver studiato a fondo i lavori del professore), questo è stato interpretato come mancanza di rielaborazione critica personale.
Rischio #3: Metodologie Standard Segnalate Come Copiate
In discipline scientifiche come medicina, biologia, psicologia o ingegneria, esistono metodologie consolidate che vengono descritte in modo molto simile in migliaia di paper. Se devi spiegare come hai condotto un’analisi statistica ANOVA, una reazione PCR o un test psicometrico standardizzato, è inevitabile che la tua descrizione somigli a quella di altri ricercatori. I termini tecnici, le sequenze procedurali, persino i valori di parametri standard sono identici perché descrivono protocolli replicabili.
Il problema è che alcuni software antiplagio non distinguono automaticamente tra “similarità legittima” dovuta a terminologia tecnica standard e vera copia. Potresti ritrovarti con il 15% di similarità proveniente dalla sezione metodologica semplicemente perché hai descritto correttamente una procedura riconosciuta. La chiave è aggiungere contestualizzazione, spiegare perché hai scelto quella metodologia specifica per il tuo caso, quali adattamenti hai apportato, quali limiti hai considerato.
Rischio #4: Auto-Plagio da Lavori Precedenti
Sorpresa: puoi plagiare te stesso. Se durante il tuo percorso universitario hai scritto tesine, saggi brevi, paper per corsi o abstract per conferenze, e poi riutilizzi quegli stessi passaggi nella tesi di laurea senza rielaborazione, tecnicamente stai commettendo “auto-plagio”. Questo concetto, poco conosciuto in Italia, è preso molto seriamente in ambito accademico internazionale e sta guadagnando terreno anche nelle università italiane.
Il ragionamento è che la tesi deve rappresentare un lavoro nuovo, originale, creato specificamente per quel titolo accademico. Riciclare materiale precedente, anche se tuo, mina questo principio. Secondo le linee guida CRUI 2024, il riutilizzo di propri lavori precedenti è permesso solo se dichiarato esplicitamente e se rappresenta una percentuale minoritaria (generalmente sotto il 10%) del totale.
Rischio #5: Citazioni Lunghe Oltre il Limite
Esiste una regola non scritta ma ampiamente riconosciuta nell’accademia: le citazioni dirette (con virgolette) non dovrebbero mai superare le 40-50 parole consecutive, e il totale di citazioni dirette nella tesi non dovrebbe superare il 10-15% del testo. Anche se formattate perfettamente, citazioni troppo lunghe o troppo frequenti segnalano che stai facendo “collage di fonti” piuttosto che sviluppare una tua argomentazione originale.
Gli algoritmi più sofisticati di AI antiplagio per tesi di laurea in Italia ora tengono conto non solo della presenza di citazioni, ma anche della loro lunghezza, frequenza e distribuzione. Una tesi con 35 citazioni da 80 parole ciascuna verrà segnalata come problematica anche se ogni singola citazione è formattata correttamente.
💬 Testimonianza Anonima
“Tre giorni prima della discussione ho ricevuto una mail del mio relatore. Report antiplagio: 34%. Sono entrato in panico totale. Dopo un’analisi approfondita è emerso che il 18% proveniva dalla bibliografia mal formattata, il 9% da una metodologia statistica standard descritta in modo troppo simile al manuale, e il 7% da una tesina che avevo scritto io stesso due anni prima per un corso. Ho dovuto riformattare tutto in 72 ore di lavoro no-stop. L’ho passata, ma è stata l’esperienza più stressante della mia vita universitaria. Nessuno mi aveva mai spiegato queste insidie.”
— Studente di Economia, Università di Torino
Come Leggere il Report Antiplagio Come un Professore
Ricevere il report dal software antiplagio può essere un’esperienza disorientante. Quel numero grande, la percentuale di similarità, cattura immediatamente la tua attenzione, spesso provocando panico o sollievo eccessivo. Ma i professori esperti sanno che quel numero da solo racconta solo una piccola parte della storia. Capire come interpretare un report antiplagio con l’occhio critico di un membro della commissione può fare la differenza tra una revisione mirata efficace e una riscrittura inutile e dispendiosa.
La Percentuale Complessiva: Quando Preoccuparsi Davvero
Il “Similarity Index” o “Indice di Similarità” è il numero che appare in grande all’inizio del report. Rappresenta la percentuale totale del tuo documento che presenta somiglianze con fonti nel database. Ma questo numero va contestualizzato. Una tesi di filosofia con il 25% di similarità può essere problematica, mentre una tesi di chimica organica con il 20% può essere perfettamente normale se quella percentuale proviene principalmente da descrizioni di composti, reazioni standard e nomenclatura IUPAC.
Ecco una guida pratica basata sull’esperienza delle commissioni italiane:
- 0-10%: Eccellente. Indica un lavoro altamente originale con citazioni appropriate e ben integrate.
- 11-20%: Accettabile nella maggior parte dei contesti, ma richiede analisi delle fonti specifiche.
- 21-30%: Zona grigia. Può essere OK se la similarità è distribuita e giustificabile, o problematica se concentrata.
- 31-50%: Allarmante. Richiede revisione sostanziale indipendentemente da dove si concentra la similarità.
- 50%+: Critico. Indica quasi certamente problemi gravi di plagio che richiederanno riscrittura estesa.
Similarity Index vs. Match Overview: Le Differenze Cruciali
Molti studenti confondono questi due concetti. Il Similarity Index è il totale complessivo, mentre il Match Overview è la lista dettagliata di ogni singola fonte con cui il tuo documento condivide similitudini. Questa distinzione è fondamentale perché il Match Overview ti dice dove guardare.
Immagina due scenari con entrambi 22% di similarità totale:
Scenario A: Match Overview mostra 58 fonti diverse, ciascuna con 0,2-0,8% di match. Questo pattern suggerisce terminologia tecnica comune, frasi di transizione standard, formulazioni condivise nel tuo campo di studio. Probabile falso positivo o similarità legittima.
Scenario B: Match Overview mostra 3 fonti: una con 15%, una con 5%, una con 2%. Questo pattern suggerisce che hai copiato o parafrasato pesantemente da una singola fonte principale. Questo è molto più problematico dello Scenario A, anche se la percentuale totale è identica.

Come Distinguere i Falsi Positivi dai Problemi Reali
I software antiplagio, per quanto sofisticati, non sono infallibili. Producono regolarmente “falsi positivi” – segnalazioni di similarità che non costituiscono plagio reale. Ecco come riconoscerli:
✅ Probabili Falsi Positivi (OK):
- Titoli di sezioni standard (“Introduzione”, “Metodologia”, “Conclusioni”)
- Definizioni da dizionari o glossari tecnici universalmente accettati
- Dati numerici o tabelle con valori standard (es. costanti fisiche)
- Riferimenti bibliografici completi
- Domande di ricerca o ipotesi formulate in modo convenzionale nel tuo campo
- Frasi di 3-5 parole molto comuni (“come dimostrato da”, “è importante notare”)
🚨 Problemi Reali (Richiedono Azione):
- Paragrafi interi (50+ parole) che matchano con una singola fonte
- Sequenze argomentative identiche anche se con parole diverse
- Riformulazioni evidenti dove hai solo cambiato l’ordine delle parole
- Descrizioni di risultati o analisi identiche a quelle di altri studi
- Frasi chiave senza citazione dove la fonte è chiaramente identificabile
- Match superiori al 5% con una singola tesi precedente dello stesso ateneo
Il Trucco dei Colori: Decodificare il Sistema Visivo
Turnitin e Compilatio utilizzano codici colore per rappresentare visivamente i livelli di similarità. Non sono standardizzati al 100%, ma generalmente seguono questa logica:
- Verde (0-24%): Similarità bassa, generalmente accettabile
- Giallo (25-49%): Similarità moderata, richiede attenzione
- Arancione (50-74%): Similarità alta, probabile problema
- Rosso (75-100%): Similarità molto alta, plagio quasi certo
Tuttavia, questi colori si riferiscono alle singole corrispondenze nel documento, non al totale complessivo. Potresti avere una percentuale totale del 18% (verde) ma con alcuni paragrafi evidenziati in rosso perché matchano al 80% con una specifica fonte. Sono quelle sezioni rosse che richiedono la tua attenzione immediata, indipendentemente dalla percentuale globale bassa.