Come calcolare la dimensione del campione per la tesi 2026: formule, potenza statistica ed esempi
Il calcolo della dimensione del campione è uno dei passaggi metodologici più critici nella stesura di una tesi empirica, eppure è spesso liquidato in poche righe o, peggio, giustificato a posteriori in base alla convenienza pratica. Una numerosità campionaria inadeguata non è un dettaglio trascurabile: uno studio sottopotenziato non riesce a rilevare effetti reali anche quando esistono, mentre un campione sovradimensionato spreca risorse e, in certi contesti, espone un numero di partecipanti superiore al necessario a rischi o disagi. La dimensione del campione per la tesi deve essere calcolata prima della raccolta dati, documentata nel capitolo metodologico e giustificata con i parametri statistici espliciti. Questa guida illustra le formule essenziali, i criteri per scegliere i parametri e gli strumenti computazionali disponibili nel 2026.
Nella comunità accademica italiana il requisito di una power analysis esplicita si è consolidato in linea con i principi della Open Science e con le raccomandazioni ANVUR per la valutazione della qualità della ricerca. I comitati etici degli atenei — i cui contatti e procedure sono raccolti nella nostra guida ai comitati etici universitari — chiedono oggi quasi sistematicamente che il protocollo includa una stima motivata della numerosità prima di rilasciare il parere favorevole. Ignorare questo requisito espone il lavoro a critiche in fase di discussione.
Popolazione vs. campione: concetti di base
La popolazione (N) è l’insieme di tutte le unità a cui si vuole generalizzare i risultati: gli studenti universitari italiani, i pazienti diabetici in un determinato ospedale, le PMI manifatturiere di una regione. Il campione (n) è il sottoinsieme effettivamente osservato. Il problema del campionamento consiste nel determinare quante unità occorre includere nel campione affinché le stime campionarie riflettano con sufficiente precisione i parametri della popolazione.
La dimensione del campione non dipende in modo lineare dalla dimensione della popolazione — questa è la contro-intuizione statistica più rilevante per chi inizia la tesi. Un campione di 400 unità fornisce stime con margine di errore del 5 % indipendentemente dal fatto che la popolazione sia di 5.000 o di 5 milioni di persone, purché la popolazione sia ampia rispetto al campione (regola: n/N < 5 %). Solo quando la popolazione è piccola occorre applicare la correzione per popolazione finita, che riduce la numerosità necessaria.
Va distinto il campionamento per stima (si vuole conoscere una proporzione o una media con certa precisione) dal campionamento per test di ipotesi (si vuole verificare se esiste una differenza tra gruppi). Le formule e i parametri rilevanti differiscono nei due casi.
I parametri che determinano la numerosità
Prima di applicare qualunque formula è necessario definire quattro quantità. Ogni valore è una scelta metodologica che va giustificata esplicitamente nel testo della tesi.
| Parametro | Simbolo | Valore convenzionale | Effetto su n |
|---|---|---|---|
| Livello di confidenza | 1 − α | 95 % (z = 1,96) | ↑ confidenza → ↑ n |
| Margine di errore | e | ±5 % (e = 0,05) | ↓ margine → ↑ n |
| Proporzione attesa | p | 0,5 (massimizza n) | p = 0,5 → n massimo |
| Deviazione standard | σ | Da letteratura o pilot study | ↑ σ → ↑ n |
Livello di confidenza e valore z
Il livello di confidenza 1 − α indica la probabilità che l’intervallo di confidenza costruito sul campione contenga il vero parametro della popolazione. I valori standard sono 90 % (z = 1,645), 95 % (z = 1,960) e 99 % (z = 2,576). Nelle scienze sociali il 95 % è la convenzione dominante; nelle scienze biomediche il 99 % è frequente per studi di elevata rilevanza clinica. Scegliere il 90 % solo per ridurre la numerosità richiede una motivazione esplicita.
Margine di errore
Il margine di errore e (o tolleranza) è la massima deviazione accettabile tra la stima campionaria e il vero valore della popolazione. Il valore e = 0,05 (5 %) è la scelta standard per studi descrittivi. Per ricerche cliniche o politiche dove piccole differenze hanno rilevanza pratica, si adottano valori più stringenti (e = 0,02 o meno), con conseguente aumento marcato del campione.
Proporzione attesa
Se si stima una proporzione senza informazioni preliminari, si usa p = 0,5, che massimizza il prodotto p(1−p) e quindi la numerosità — garantendo la stima più conservativa. Se la letteratura o un pilot study suggeriscono una proporzione più precisa (es. p = 0,30), utilizzarla riduce n senza perdere validità.
Formula per proporzioni: passo dopo passo
La formula di Cochran è lo standard per la stima di una proporzione in una popolazione ampia:
n₀ = (z²α/2 × p × (1 − p)) / e²
Esempio numerico completo — ricerca sulla frequenza di utilizzo di strumenti IA da parte degli studenti universitari italiani:
- Livello di confidenza: 95 % → z = 1,96
- Proporzione attesa: p = 0,5 (nessuna stima preliminare)
- Margine di errore: e = 0,05 (5 %)
n₀ = (1,96² × 0,5 × 0,5) / 0,05²
n₀ = (3,8416 × 0,25) / 0,0025
n₀ = 0,9604 / 0,0025
n₀ = 384,16 → arrotondato a 385
Arrotondare sempre verso l’alto per non scendere sotto la soglia di precisione richiesta. Se la proporzione attesa fosse p = 0,30 invece di 0,50, il campione si ridurrebbe a circa 323 unità — ma questa scelta deve essere motivata da evidenza preesistente.

Formula per il confronto tra medie
Quando l’obiettivo è confrontare la media di una variabile continua tra due gruppi indipendenti (t-test per campioni indipendenti), la numerosità per ciascun gruppo si calcola come:
n (per gruppo) = 2 × ((zα/2 + zβ)² × σ²) / δ²
dove σ è la deviazione standard (ipotizzata uguale nei due gruppi), δ = μ₁ − μ₂ è la differenza minima rilevante tra le medie, zβ è il valore z corrispondente alla potenza desiderata (per potenza 80 %: zβ = 0,842; per 90 %: zβ = 1,282).
Esempio numerico — confronto tra il punteggio medio di soddisfazione (scala 1–10) di due corsi universitari, con σ = 2 e differenza minima rilevante δ = 1 punto:
n = 2 × ((1,96 + 0,842)² × 4) / 1²
n = 2 × (7,8456 × 4) / 1
n = 2 × 31,38 = 62,76 → 63 per gruppo (126 totali)
Questa formula è equivalente al calcolo tramite Cohen’s d (effect size standardizzato): d = δ/σ = 1/2 = 0,5 (effect size medio). Le tabelle pubblicate da Cohen (1988) indicano n ≈ 64 per gruppo per d = 0,5, potenza 80 %, α = 0,05 — confermando il calcolo. La formula presuppone un test a due code; per test a una coda zα = 1,645.
Correzione per popolazione finita
Quando il campione calcolato supera il 5 % della popolazione (n₀/N > 0,05), la numerosità può essere ridotta applicando la correzione di Cochran per popolazione finita:
n_corr = n₀ / (1 + (n₀ − 1) / N)
Esempio: n₀ = 385, N = 800 (popolazione di 800 studenti in un singolo corso di laurea):
n_corr = 385 / (1 + 384/800) = 385 / 1,48 = 260 (arrotondato in su)
La correzione può ridurre significativamente il carico di raccolta dati in studi con popolazione circoscritta (un singolo ateneo, un reparto ospedaliero, una classe professionale specifica). Per N → ∞, la correzione tende a 1 e la formula si riduce alla versione standard. Questo aspetto è particolarmente rilevante nelle tesi di Scienze della Comunicazione o altri corsi con ricerca empirica su popolazioni delimitate, dove la popolazione di riferimento può essere molto ridotta.
Potenza statistica e effect size
La potenza statistica (1 − β) è la probabilità che il test rifiuti correttamente l’ipotesi nulla quando questa è effettivamente falsa, ovvero la probabilità di rilevare un effetto che esiste davvero. Uno studio con potenza 0,80 ha il 20 % di probabilità di non rilevare un effetto reale (errore di tipo II). Il valore soglia convenzionale è 0,80 (80 %), ma molte riviste di alta qualità e le linee guida per la ricerca clinica richiedono 0,90.
La potenza dipende da tre elementi: il livello di significatività α, la dimensione del campione n e la grandezza dell’effetto (effect size). L’effect size è la misura standardizzata della rilevanza pratica di un fenomeno, indipendente dall’ampiezza campionaria.
Misure di effect size e soglie convenzionali
| Misura | Contesto | Piccolo | Medio | Grande |
|---|---|---|---|---|
| Cohen’s d | Confronto tra due medie | 0,20 | 0,50 | 0,80 |
| Cohen’s f | ANOVA (più di 2 gruppi) | 0,10 | 0,25 | 0,40 |
| Cohen’s w | Test chi-quadro | 0,10 | 0,30 | 0,50 |
| r di Pearson | Correlazione | 0,10 | 0,30 | 0,50 |
| η² parziale | ANOVA con covariate | 0,01 | 0,06 | 0,14 |
Le soglie di Cohen (1988) sono convenzionali e contestuali: un effect size “piccolo” in psicologia sperimentale può avere impatto enorme in epidemiologia. È preferibile giustificare l’effect size atteso sulla base della letteratura specifica del dominio di ricerca, piuttosto che limitarsi a citare le soglie convenzionali. La capacità di individuare e motivare un effect size plausibile è uno degli elementi valutativi più apprezzati dalla commissione di tesi.
Una trattazione accurata di questi parametri nel capitolo metodologico si collega direttamente alla sezione limitazioni delle conclusioni: un campione sottopotenziato deve essere dichiarato come limite esplicito. Per una guida strutturata su come inserire le limitazioni nel capitolo finale, si veda come scrivere le conclusioni della tesi 2026.
Come usare G*Power
G*Power (versione 3.1, sviluppato dall’Università Heinrich Heine di Düsseldorf) è il software di riferimento per la power analysis nelle scienze sociali, psicologiche e biomediche. È gratuito, disponibile per Windows e macOS, e produce output citabili direttamente nel testo della tesi.
Procedura per un t-test su campioni indipendenti:
- Aprire G*Power. In Test family selezionare t tests; in Statistical test selezionare Means: Difference between two independent means (two groups).
- In Type of power analysis scegliere A priori: Compute required sample size.
- Impostare Effect size d (es. 0,50 per medium), α err prob = 0,05, Power (1−β err prob) = 0,80, Allocation ratio N2/N1 = 1 (gruppi uguali).
- Cliccare Calculate. Il programma restituisce n per ciascun gruppo e il campione totale.
- Esportare il grafico della funzione potenza cliccando X-Y plot for a range of values.
Il risultato va riportato nella tesi in modo completo: «La power analysis condotta con G*Power 3.1 ha indicato una numerosità minima di n = 128 (64 per gruppo) per rilevare un effect size d = 0,50 con potenza 1−β = 0,80 e α = 0,05 (test a due code).» Questa citazione è sufficiente per la maggior parte dei comitati editoriali e di tesi; in alternativa si cita Faul et al. (2009) — l’articolo di riferimento del software.
Oltre al t-test, G*Power gestisce ANOVA a una e due vie, regressione multipla (test su R²), analisi di correlazione, test chi-quadro, test esatti di Fisher e modelli di regressione logistica. Per ciascun test la logica operativa è identica: specificare il tipo di test, l’effect size appropriato, α, potenza desiderata e recuperare n.

Altri strumenti e calcolatori
Oltre a G*Power, esistono strumenti web utili per verifiche rapide o per contestualizzare il calcolo nel capitolo metodologico:
- OpenEpi (openepi.com) — calcolatori epidemiologici online per studi caso-controllo, coorti e proporzioni, con output in HTML stampabile.
- Raosoft Sample Size Calculator — strumento web per la formula di Cochran con interfaccia semplificata, adatto per sondaggi descrittivi.
- pwr package in R — equivalente funzionale di G*Power per chi lavora già nell’ecosistema R; la funzione
pwr.t.test()restituisce n per t-test con i parametri specificati. - Python scipy.stats — la funzione
statsmodels.stats.power.TTestIndPower().solve_power()fornisce calcoli analoghi per workflow in Python.
I calcolatori web vanno usati come strumento di verifica, non come fonte primaria da citare in tesi. La citation corretta è sempre quella del metodo statistico (Cochran, 1977; Cohen, 1988; Faul et al., 2009 per G*Power), non del sito web utilizzato.
Per le tesi che raccolgono dati primari, la gestione e documentazione di questi dati è un’operazione distinta dal semplice calcolo della numerosità: il data management plan secondo i principi FAIR deve descrivere come i dati del campione saranno archiviati, protetti e — dove applicabile — condivisi con la comunità scientifica.
Errori metodologici frequenti
L’esame delle tesi italiane respinte o bocciate in fase di discussione rivela alcuni pattern ricorrenti legati alla numerosità campionaria:
- Giustificazione post-hoc: il campione viene scelto per praticità (quanti questionari si sono riusciti a raccogliere) e la formula applicata in seguito per dimostrare la sufficienza. La commissione riconosce questa inversione logica. La determinazione della numerosità deve precedere la raccolta.
- Omissione del tasso di risposta atteso: se si prevede un tasso di risposta del 60 %, occorre distribuire n_corr / 0,60 questionari per ottenere il campione calcolato. La numerosità target e la numerosità da contattare sono due valori distinti.
- Effect size troppo ottimistico: dichiarare un effect size “grande” (d = 0,80) senza fonti dalla letteratura è una scelta che riduce il campione ma sottostima i requisiti reali dello studio.
- Ignorare il tipo di test: la formula per proporzioni non si applica a confronti tra medie; la formula per t-test non si applica ad analisi di regressione multipla. Ogni design richiede la propria formula o procedura in G*Power.
- Non aggiornare la sezione metodologia dopo perdite di dati: se al termine della raccolta mancano osservazioni per missing data o rifiuti, occorre discutere l’impatto sulla potenza effettiva dello studio.
FAQ
Quanti questionari servono per una tesi di laurea magistrale?
Non esiste un numero universale: dipende dal tipo di analisi. Per un’analisi descrittiva con sondaggio (proporzione, margine di errore 5 %, confidenza 95 %) sono sufficienti circa 385 questionari validi se la popolazione è ampia. Per un confronto tra due gruppi con t-test (effect size medio d = 0,5, potenza 80 %, α = 0,05) servono 64 soggetti per gruppo, ovvero 128 totali. La soglia non è mai arbitraria: va calcolata e dichiarata.
Cosa succede se il campione raccolto è inferiore a quello calcolato?
Uno studio con numerosità inferiore a quella calcolata è sottopotenziato: la probabilità di rilevare l’effetto atteso scende sotto la soglia prefissata. In questo caso è obbligatorio calcolare la potenza effettiva raggiunta con il campione disponibile (analisi post-hoc in G*Power) e dichiararla come limitazione nel capitolo conclusivo. Presentare risultati non significativi di uno studio sottopotenziato come “conferma dell’assenza di effetto” è un errore metodologico grave.
Come si calcola la dimensione del campione per una regressione multipla?
Per la regressione multipla si usa la power analysis basata sull’R² atteso (effect size f² = R²/(1−R²)). In G*Power: Test family → F tests → Linear Multiple Regression: Fixed model, R² increase. La numerosità dipende dal numero di predittori, dall’R² atteso e dalla potenza desiderata. Come regola empirica orientativa (non sostitutiva del calcolo formale), alcuni metodologi citano 10-20 osservazioni per predittore, ma questo criterio non considera la potenza statistica ed è inadeguato come unica giustificazione.
Serve l’approvazione del comitato etico prima di calcolare la numerosità?
No: l’ordine è inverso. Il calcolo della numerosità è parte del protocollo di ricerca che si presenta al comitato etico per ottenere il parere. Il comitato valuta se il campione è adeguato (né troppo piccolo, che esporrebbe i partecipanti a rischi inutili, né eccessivamente grande, che esporrebbe un numero superiore al necessario). Questo è uno dei motivi per cui la power analysis è richiesta esplicitamente già nella fase di pre-registrazione.
G*Power è gratuito e citabile in tesi?
Sì, G*Power è gratuito e scaricabile dal sito dell’Università Heinrich Heine di Düsseldorf. Per la citazione accademica, il riferimento standard è: Faul, F., Erdfelder, E., Buchner, A., & Lang, A.-G. (2009). Statistical power analyses using G*Power 3.1: Tests for correlation and regression analyses. Behavior Research Methods, 41(4), 1149–1160. https://doi.org/10.3758/BRM.41.4.1149. Alcuni atenei accettano anche la citazione del manuale online.



