Istituto Nazionale di Statistica

Inizio Contenuto

Nota metodologica

 

 

1. La costruzione di un indice sintetico

 

Un indice sintetico è una combinazione matematica (o aggregazione) di un insieme di indicatori elementari [1] (variabili) che rappresentano le diverse componenti di un concetto multidimensionale da misurare (per es., sviluppo, qualità della vita, benessere, ecc.). Quindi, gli indici sintetici sono usati per misurare concetti che non possono essere catturati da un unico indicatore.

Generalmente, un indice sintetico dovrebbe essere basato su un quadro teorico che consenta di selezionare, combinare e pesare gli indicatori elementari in modo da riflettere le dimensioni o la struttura del fenomeno che si sta misurando. Tuttavia, la sua costruzione non è semplice e, spesso, richiede una serie di decisioni/scelte (metodologiche o no) da prendere.

La procedura per costruire un indice sintetico prevede i seguenti passi.

 

1)   Definizione del fenomeno da misurare. La definizione del concetto dovrebbe fornire un senso chiaro di ciò che si intende misurare con l’indice sintetico. Essa dovrebbe riferirsi a un quadro teorico, comprendente diversi sottogruppi e indicatori sottostanti. Un aspetto fondamentale riguarda l’identificazione del modello di misurazione, per il quale si distinguono due diversi approcci:

-     modello riflessivo, se gli indicatori sono visti come “effetto” del fenomeno da misurare, per cui un cambiamento nella variabile latente si riflette in un cambiamento degli indicatori osservati (gli indicatori sono intercambiabili e le correlazioni tra di essi sono spiegate dal modello);

-     modello formativo, se gli indicatori sono visti come “causa” del fenomeno da misurare, per cui un cambiamento nella variabile latente non implica necessariamente un cambiamento di tutti gli indicatori osservati (gli indicatori non sono intercambiabili e le correlazioni tra di essi non sono spiegate dal modello).

 

2)   Selezione di un gruppo di indicatori elementari. La forza e la debolezza di un indice sintetico riflettono la qualità degli indicatori elementari sottostanti. Gli indicatori dovrebbero essere selezionati in base alla loro rilevanza, validità, tempestività, disponibilità, ecc. La fase di selezione è il risultato di un compromesso tra possibili ridondanze e perdita di informazione. Un approccio statistico alla scelta degli indicatori consiste nel calcolare le correlazioni tra potenziali indicatori e includere quelli meno correlati tra loro. Tuttavia, il processo di selezione dipende dal modello di misurazione adottato: in un modello riflessivo, tutti gli indicatori devono essere correlati tra loro, mentre in un modello formativo possono essere incorrelati.

 

3)   Normalizzazione degli indicatori elementari. La normalizzazione ha lo scopo di rendere gli indicatori comparabili in quanto essi, spesso, sono espressi in unità di misura diverse e possono avere polarità [2] differenti. Pertanto, è necessario portare gli indicatori a uno stesso standard, invertendo la polarità, laddove necessario, e trasformandoli in numeri puri, adimensionali. Esistono vari metodi di normalizzazione, come la trasformazione in ranghi, il “re-scaling” in indici relativi (o metodo Min-Max) e la standardizzazione (calcolo dei z-scores).

4)   Aggregazione degli indicatori normalizzati. È la combinazione di tutte le componenti per formare l’indice sintetico (funzione matematica). Tale passo richiede la definizione dell’importanza di ciascun indicatore elementare (sistema di ponderazione) e l’identificazione della tecnica di sintesi (compensativa o non-compensativa). Il sistema più semplice e usato per la definizione del sistema di ponderazione – ma non per questo esente da critiche – consiste nell’assegnare lo stesso peso a tutti gli indicatori. Per quanto riguarda la tecnica di sintesi, si distinguono due approcci:

-     approccio compensativo, se gli indicatori elementari sono considerati sostituibili[3]; in tal caso, si adottano delle funzioni lineari, come la media aritmetica;

-     approccio non compensativo, se gli indicatori elementari sono considerati non-sostituibili [4] ; in tal caso, si adottano delle funzioni non lineari in cui si tiene conto – implicitamente o esplicitamente – dello sbilanciamento tra i diversi valori, in termini di penalizzazione.

5)   Validazione dell’indice sintetico. Consiste nel verificare che l’indice sintetico è coerente con il quadro teorico generale. In particolare, occorre valutare la capacità dell’indice di produrre risultati stabili e corretti (robustezza) e la sua capacità discriminante.


2. I metodi di sintesi

 

I metodi di sintesi disponibili su i.ranker si basano sull’assunzione di un modello di misurazione formativo e sono i seguenti:

  • - Metodo delle graduatorie (MG);
  • - Media dei valori standardizzati (MZ);
  • - Media degli indici relativi (MR);
  • - Mazziotta-Pareto index (MPI+/MPI-);
  • - Metodo tassonomico di Wroclaw (MTW).

 

Metodo delle graduatorie (MG)

 

Data la matrice X={xij} di n righe (unità statistiche) e m colonne (indicatori), si calcola la matrice trasformata G={gij}, dove gij è il rango dell’unità i nella graduatoria secondo l’indicatore j. Se l’indicatore j ha polarità positiva, le unità sono ordinate per valori decrescenti; se l’indicatore j ha polarità negativa, le unità sono ordinate per valori crescenti. Se due o più unità assumono lo stesso valore, ad esse si attribuisce il rango medio delle posizioni che avrebbero avuto in caso di valori differenti.

L’indice sintetico, per l’unità i, è dato dalla formula:

.

 

Media dei valori standardizzati (MZ)

 

Data la matrice X={xij} di n righe (unità statistiche) e m colonne (indicatori), si calcola la matrice trasformata Z={zij}, con:

 

 

 

dove e sono, rispettivamente, la media e lo scostamento quadratico medio dell’indicatore j.

L’indice sintetico, per l’unità i, è dato dalla formula:

.

 

Media degli indici relativi (MR)

 

Data la matrice X={xij} di n righe (unità statistiche) e m colonne (indicatori), si calcola la matrice trasformata R={rij}, con:

 

 

 

 


dove e sono, rispettivamente, il minimo e il massimo dell’indicatore j.

L’indice sintetico, per l’unità i, è dato dalla formula:

.

 

Mazziotta-Pareto index (MPI +/MPI -)

 

Data la matrice X={xij} di n righe (unità statistiche) e m colonne (indicatori), si calcola la matrice trasformata Z={zij}, con:

 

 

 

doveesono, rispettivamente, la media e lo scostamento quadratico medio dell’indicatore j.

L’indice sintetico, per l’unità i, è dato dalla formula [5] :

dove ; ; .

 

Metodo tassonomico di Wroclaw (MTW)

 

Data la matrice X={xij} di n righe (unità statistiche) e m colonne (indicatori), si calcola la matrice trasformata Z={zij}, con:

;

dove e sono, rispettivamente, la media e lo scostamento quadratico medio dell’indicatore j.

Per ogni unità, si calcola la “distanza” , dove zoj è uguale a se l’indicatore j ha polarità positiva e a se l’indicatore j ha polarità negativa.

L’indice sintetico, per l’unità i, è dato dalla formula:

dove e sono, rispettivamente, la media e lo scostamento quadratico medio delle distanze .

 

 

3. La scelta del metodo di sintesi

 

Com”è noto, non esiste un metodo generale per la costruzione di indici sintetici. La loro costruzione è legata alla particolare applicazione, sia dal punto di vista teorico (assunzioni di base) che empirico (tipo di indicatori), e dipende dall’obiettivo prefissato, oltre che da una conoscenza approfondita del fenomeno da misurare.

Gli indici sintetici possono inviare messaggi fuorvianti se costruiti male o male interpretati e possono portare a conclusioni semplicistiche, se non sono usati insieme agli indicatori elementari. Tuttavia, i vantaggi degli indici sintetici sono chiari e possono essere riassunti in: (a) misurazione unidimensionale di fenomeni complessi, (b) facilità di interpretazione rispetto a una batteria di indicatori elementari (“dashboard” o “cruscotto”), (c) semplificazione dell’analisi dei dati (in particolare, ordinamento delle unità geografiche).

Nella tabella 1 sono riportate le principali caratteristiche dei metodi a disposizione, per la scelta di quello più adatto.

 

Tabella 1. Caratteristiche dei metodi di sintesi

Metodo di sintesi

Caratteristiche principali

Metodo delle graduatorie
(MG)

Metodo compensativo
Si basa sulla somma dei ranghi
Varia tra 0 e 1
È insensibile ai dati anomali (outliers)
Assume che le modalità consecutive di ciascun indicatore siano equispaziate

 

Media dei valori standardizzati
(MZ)

Metodo compensativo
Si basa sulla media aritmetica dei z-scores
Ha media 0 e varia, all'incirca, tra -3 e +3
Assume che gli indicatori abbiano la stessa variabilità

 

Media degli indici relativi
(MR)

Metodo compensativo
Si basa sulla media aritmetica di valori relativi
Varia tra 0 e 1
Non ha una media prefissata (si perde il riferimento del valor medio)

 

Mazziotta-Pareto index
(MPI+/MPI-)

Metodo non compensativo
Si basa su una media aritmetica penalizzata in base allo sbilanciamento dei valori
Ha media 100 e varia, all'incirca, tra 70 e 130
Assume che gli indicatori abbiano la stessa variabilità
È applicabile sia a fenomeni positivi (MPI-) che a fenomeni negativi (MPI+)
Può essere scomposto in due parti: effetto “ medio” (compensativo) ed effetto“penalità” (sbilanciamento)

 

Metodo tassonomico di Wroclaw
(MTW)

Metodo non compensativo
Si basa sulla distanza da un'unità ideale nello spazio euclideo
Varia tra 0 e 1 (talvolta, può assumere valore superiori a 1)
L’unità ideale può essere costituita da un insieme di valori che nei fatti è irrealizzabile o incongruente

 

 


Bibliografia

Aureli Cutillo E. (1996), Lezioni di statistica sociale. Parte seconda, sintesi e graduatorie, CISU, Roma.

Delvecchio F. (1995), Scale di misura e indicatori sociali, Cacucci editore, Bari.

Harbison F. H., Maruhnic J., Resnick J. R. (1970). Quantitative Analyses of. Modernization and Development, Princeton University Press, New Jersey.

Maggino F. (2008), La misurazione dei fenomeni sociali attraverso indicatori statistici. Aspetti metodologici, Università degli Studi di Firenze – Working paper, Firenze.

Mazziotta M., Pareto A. (2011), Un indice sintetico non compensativo per la misura della dotazione infrastrutturale: un'applicazione in ambito sanitario, Rivista di Statistica Ufficiale, n. 1/2011, pp. 63-79.

Mazziotta M., Pareto A. (2015). On a Generalized Non-compensatory Composite Index for Measuring Socio-economic Phenomena, Social Indicators Research, DOI 10.1007/s11205-015-0998-2.

OECD (2008), Handbook on Constructing Composite Indicators. Methodology and user guide, OECD Publications, Paris.

Silvio-Pomenta J. F. (1973), Typological study using the Wroclaw Taxonomic Method (A study of regional disparities in Venezuela), SHC/WS/316, UNESCO.



[1] Un indicatore elementare è un dato “elaborato” costruito, generalmente, rapportando un dato “grezzo” ad un altro che ne costituisce una base di riferimento (per es., “reddito pro-capite”).

[2] La “polarità” (o “verso”) di un indicatore elementare è il segno della relazione tra l’indicatore e il fenomeno da misurare (per es., nella costruzione di un indice sintetico di sviluppo, la “speranza di vita” ha polarità positiva, mentre la “mortalità infantile” ha polarità negativa).

[3] Gli indicatori elementari sono detti “sostituibili” se un deficit in un indicatore può essere compensato da un surplus in un altro (per es., un valore basso in “Percentuale di persone che hanno partecipato ad attività spirituali o religiose” può essere compensato da un valore alto in “Percentuale di persone che hanno partecipato a incontri di associazioni ricreative o culturali” e viceversa).

[4] Gli indicatori elementari sono detti “non-sostituibili” se un deficit in un indicatore non può essere compensato da un surplus in un altro (per es., un valore basso in “Letti di ospedale per 1.000 abitanti” non può essere compensato da un valore alto in “Medici per 1.000 abitanti” e viceversa).

[5] È una forma generalizzata, poiché include due indici in uno. Se l’indicatore è di tipo crescente o positivo, ossia se a variazioni crescenti dell’indicatore corrispondono variazioni positive del fenomeno (per esempio, il benessere), si utilizza MPI-.Viceversa, se l’indicatore è di tipo decrescente o negativo, ossia se a variazioni crescenti dell’indicatore corrispondono variazioni negative del fenomeno (per esempio, il malessere), si utilizza MPI+.