Strumenti utili: incertezza ed errore
L'importanza di sapere di quanto si può sbagliare!
Definire con precisione il concetto di incertezza può apparire paradossale: se una cosa è incerta, come si può definirla accuratamente e tanto meno cercare di misurarla? Tuttavia questo concetto è di fondamentale importanza non solo nelle applicazioni pratiche di tutte le scienze, ma anche nelle basi concettuali delle scienze stesse. Qualcuno avrà certamente sentito parlare del principio di indeterminazione di Heisenberg!
Ma torniamo all'oggetto del nostro corso ed alle esperienza che abbiamo già fatto con esso. In molti casi ci è stato chiesto di desumere, da una serie di dati, qualche proprietà significativa della grandezza che stavamo considerando. Spesso, guardando semplicemente un grafico, siamo stati in grado di dire che una grandezza stava crescendo o diminuendo. Come abbiamo potuto farlo non è semplice da spiegare. Il nostro occhio (o meglio, il sistema occhio-cervello) ha colto una "regolarità" al di là dell'apparenza oscillante e confusa dei dati.
Così procede anche la scienza: si cerca di mettere a punto un "modello" dell'evoluzione di una grandezza o di un fenomeno e su questo modello si fanno elaborazioni e previsioni. Quello che il modello non riesce a descrivere, ovvero la differenza tra i dati effettivamente rilevati e quanto calcolato con il modello, è un errore (detto talvolta "residuo") che rappresenta l'incertezza delle nostre conoscenze (vedi figura 1).
FIGURA 1: Le pecore, introdotte
in Tasmania all'inizio del 1800 dai coloni, si moltiplicarono molto
velocemente. Nel grafico i punti rappresentano il numero di pecore
(espresso in milioni) presenti realmente in Tasmania nei diversi anni.
La linea continua rappresenta l'evoluzione del numero di pecore come
viene descritta da un modello matematico. Per l'anno 1887 le pecore
realmente presenti erano 1,5 milioni (Nreale = 1,5), mentre
quelle calcolate dal modello 1,75 milioni (Ncalcolato =
1,75); la differenza tra questi valori rappresenta l'errore (o residuo)
che nel caso specifico è pari a 1,75 - 1,5 = 0,25 milioni.
Tale errore può essere calcolato per ciascun anno ottenendo
così una nuova serie temporale di dati (la serie dei residui).
- Le cause dell'incertezza
- Questa incertezza può essere dovuta a tante cause diverse, le più significative sono:
- la mancanza di conoscenze sui reali processi chimico-fisici,
- l'impossibilità di conoscere le vere condizioni di partenza,
- la dipendenza da fattori che non conosciamo o non possiamo misurare,
- l'inesattezza delle stesse misure di cui disponiamo.
Tutti questi fatti contribuiscono all'errore compiuto dal nostro modello e, se anche non siamo in grado di spiegarli esattamente, possiamo però provare a misurarli.
- L'incertezza si può misurare come differenza fra dati reali e valori calcolati dal modello
- In effetti, se disponiamo di una serie di misure fisiche (per esempio le concentrazioni di CO2 a Mauna Loa nel tempo) e di un modello che dovrebbe riprodurle, possiamo sottrarre uno per uno i valori misurati e quelli calcolati dal modello e ottenere così la serie degli errori. E questa serie, come quelle che abbiamo già esaminato in precedenza, può essere analizzata con i tradizionali strumenti della statistica. Ne possiamo calcolare:
- la media (che speriamo sia prossima a 0 perché altrimenti significa che il nostro modello manca di qualche temine costante),
- la varianza (che dovrebbe essere bassa rispetto a quella dei dati originali per segnalare che il modello rappresenta bene la maggior parte della variabilità dei dati),
- la correlazione con le altre variabili e anche con la stessa serie dei residui (autocorrelazione), che dovrebbe essere vicina a zero per dimostrare che gli errori compiuti dal modello sono effettivamente indipendenti da tutte le variabili utilizzate e quindi non si poteva in alcun modo inserirli nel modello stesso.
- L'utilità di sapere l'incertezza
- La valutazione dell'incertezza è estremamente utile perché se il modello ci dice che, ad esempio, l'incremento di temperatura previsto per il 2040 è 1,4°C, la conoscenza dell'incertezza ci consente di aggiungere che al 90% (cioè con probabilità 0,9) sarà compresa tra 0,95 e 2,0°C e che c'è una probabilità di 0,03 che si superino i 2,4°C. Sono informazioni importanti che servono a dare un'idea più completa della situazione e dei rischi ad essa connessi (vedi figura 2).
FIGURA 2: La curva rappresenta l'andamento dal 1950 al 2040 della temperatura media globale rispetto al valore pre-industriale come prevista da un modello sviluppato da alcuni climatologi (modello HadCM2 ricalibrato, figura riadattata da Allen et al. 2000). I rombi indicano le temperature medie decennali effettivamente osservate e le barre sopra e sotto tali valori raffigurano gli scarti quadratici medi (moltiplicati per 2). L'area grigia indica la regione di confidenza al 90% per le previsioni del modello. Nota: quello raffigurato è uno dei tanti modelli climatologici esistenti, andando avanti nel percorso scoprirai le previsioni più aggiornate sull'evoluzione della temperatura del nostro pianeta!
- L'incertezza va misurata su dati reali diversi da quelli che sono stati usati per creare il modello
- E' evidente che tutte le valutazioni sul modello e sull'incertezza devono essere compiute su una serie di dati che non sono stati usati in precedenza per lo sviluppo e la messa a punto del modello stesso: sarebbe come se il compito di matematica fosse su un esercizio già imparato a memoria! Il modello va dunque provato (o, come si dice in gergo "validato") su un nuovo insieme di dati, proprio per provarne il buon funzionamento anche in condizioni diverse da quelle già sperimentate. Solo quando gli errori compiuti dal modello (che misurano la sua incertezza) sono piccoli rispetto a quanto invece il modello riesce a capire e descrivere (cioè a modellizzare) allora potremo fare affidamento, anche per il futuro, su quanto il modello dice. Questo ragionamento è particolarmente importante su fenomeni, come i cambiamenti climatici, dei quali non abbiamo esperienze passate e, quindi, possiamo studiare solo attraverso l'utilizzo di modelli, come vedremo nell'ultimo modulo del nostro percorso.