I SONDAGGI ELETTORALI SONO AFFIDABILI?
di Romano Scozzafava
ordinario di Calcolo delle probabilità e Statistica matematica all'Università La Sapienza di Roma
Come è noto, il termine “sondaggio” indica il processo consistente nel considerare un campione estratto da una data popolazione per valutarne alcune sue caratteristiche, per esempio le percentuali di elettori che dichiarano di votare per determinati partiti o liste. Evidentemente, la principale fonte di errori in questo tipo di indagine risiede nel fatto che i dati rilevati non si riferiscono all’intera popolazione degli aventi dirittoal voto, ma provengono solo da una parte di essi, e quindi la corretta scelta di questi ultimi svolge un ruolo determinante sui risultati. E possono avere un ruolo importante anche altri aspetti meno … “statistici”, come il modo di formulare le domande, che non sempre sono poste in modo chiaro, preciso e non ambiguo.
I vari sondaggi che oggi vengono forniti a ripetizione sui mass-media posseggono i requisiti per essere ritenuti attendibili?
Intanto, una condizione preliminare è il rispetto della rappresentatività statistica del campione, cioè la corrispondenza fra le proporzioni secondo le quali sono presenti, nel campione e nell’intera popolazione, i vari parametri individuati per caratterizzare i componenti di quest’ultima (per esempio: sesso, età, grado di istruzione, professione, regione diresidenza, … e qualunque altro carattere che sia possibile e/o ragionevole immaginare). E quindi anche la soggettività di queste scelte può evidentemente avere influenza sui risultati. Queste sono comunque difficoltà presenti necessariamente in qualunque sondaggio, anche il più … “scientifico” possibile, ma il problema è che non sempre la esatta composizione del campione viene indicata dagli organi di informazione che pubblicano il sondaggio e, peggio ancora, una volta formato un campione (ed ammettiamo pure che soddisfi requisiti di rappresentatività convincenti e ragionevoli, opinione comunque – come già osservato - soggettiva) succede che vi è sempre un’altissima percentuale (anche superiore all’80 %) di intervistati che si rifiuta dirispondere. Ma questo ulteriore parametro caratterizzante il campione non può essere valutato nel momento che si programmano le scelte di rappresentatività, e quindi alla fine il campione delle persone che rispondono è sicuramente “distorto” (come si dice nel linguaggio statistico, corrispondente al termine inglese “biased”). Anche questo aspetto viene di solito taciuto quando si comunicano i risultati, ed è facile rendersi conto che quegli intervistati che accettano di rispondere ( pochi,rispetto al totale degli intervistati ) sono quelli che sono (o si ritengono) più informati perché seguono le vicende politiche.
E dove le seguono?
Soprattutto sui mass-media, e cosi il cerchio si chiude, perché difficilmente potranno dare risposte o indicazioni di voto che coinvolgano quei partiti dei quali nei mass-media non si parla o si parla molto poco. Un altro punto importante è la scelta della cosiddetta “dimensione” n del campione. Il valore di n influenza ovviamente la bontà dei risultati, perchè è legato al cosiddetto errore standard (inversamente proporzionale alla radice quadrata di n),cioè al margine – in più o in meno rispetto alla percentuale rilevata nel sondaggio – entro il quale tale percentuale possa essere considerata (con alta probabilità, evengono considerati diversi livelli di tale probabilità, per esempio al 95 % o al 99 %) una stima attendibile del valore effettivo relativo alla intera popolazione. Non è possibile (né opportuno) entrare qui nei dettagli tecnici, ma basterà ricordare che, rispetto ad una popolazione costituita da poco meno di 50 milioni di elettori, tutti isondaggi elettorali che ci vengono propinati dai vari mass-media si basano su valori di n (numero di persone intervistate e che hanno accettato di rispondere) dell’ordine di 800-1000 persone! L’errore standard oscilla fra il 3 % e il 5 %, e tuttavia si continuano a sfornare sondaggi di voti attribuiti ai vari partiti anche quando questi sono inferiori al 4-5 %. A maggior ragione nessun senso possono quindi avere percentuali, per esempio, come 0.8 %, 1.2 %, 2 %, che possono variare di molto anche con meno di una decina di intervistati in più o in meno. Inoltre, anche considerando campioni effettivamente “casuali” (rappresentativi della popolazione e non “distorti”), sono risibili le argomentazioni svolte basandosi su variazioni (per esempio) di 0,2-0,4 punti percentuali, corrispondenti ad un numero di intervistati variabile (in più o in meno) da 1 a 3!Questa incertezza oscillante fra il 3 % e il 5 % vale già per i sondaggi con risposta SI o NO, ma il fenomeno rilevato evidentemente si amplifica quando le risposte possibili sono (molto) più di due, come nel caso in cui le risposte di quelle 800-1000 persone devono ripartirsi su una platea di una decina (circa) di partiti.
Andiamo avanti, con un accenno al problema delle domande chiuse o aperte.
Le domande chiuse sono quelle che ammettono esplicitamente solo una lista fissa di risposte possibili, di cui l'intervistatore rende edotto l'intervistato nel rivolgergli la domanda. Con le domande aperte, invece, non viene proposta all'intervistato alcuna lista di risposte possibili (nel questionario, inoltre, il testo della domanda viene annotato della seguente avvertenza per l'intervistatore: non suggerire alcuna risposta!). L'intervistato viene invitato a dare la sua risposta del tutto liberamente, trovando anche, lui stesso, le parole per esprimerla. L'intervistatore deve scrivere per esteso la risposta, fedelmente, cioè senza modificare né tralasciare alcuna delle parole usate dall'intervistato. Saranno, poi, gli addetti ai lavori di spoglio a classificare tutte le risposte in gruppi omogenei (ossia gruppi di risposte equivalenti o molto simili nelsignificato), per poterne fare una statistica di sintesi significativa. E’ quindi chiaro come sia più semplice (ma evidentemente meno corretto) lavorare con liste chiuse …A tale proposito, forse è opportuno ricordare quando l’anno scorso, in un sondaggio di Ballarò, inserirono ... “per errore” (sic!) anche Emma Bonino fra i possibili premier, e siccome la Bonino (malgrado la disinformazione di cui è oggetto) superò tutti gli altri leader politici (con il 47%, contro il 45% a Bersani e Bindi, il44% a Vendola e Fini, il 43% a Casini), nei successivi sondaggi non fu più inserita fra i possibili candidati (domande chiuse …). Il guaio è che, quando vengono elencate le percentuali di gradimento, di solito non viene detto che gli intervistati possono indicare solo i nomi proposti e non quello di un qualunque possibile leader (cioè non viene detto se si tratta di domande chiuse o aperte).
Altre distorsioni sono legate al fatto che le interviste sono quasi sempre telefoniche. Ma le liste degli abbonati al telefono sono, almeno per ora, quelle riguardanti la telefonia fissa, e quindi sono in pratica liste di famiglie e non liste di individui. Se le usassimo per selezionare ed intervistare proprio e soltanto le persone elencate, che sono i titolari degli abbonamenti, finiremmo per ottenere un campione dei capifamiglia (e neanche è proprio così, perché non tutti i titolari di abbonamento sono capifamiglia), ma non, come vorremmo, un campione casuale secondo i parametri stabiliti. Sarebbe necessario allora, una volta stabilito il contatto con laf amiglia selezionata, scegliere a caso, e intervistare, un elettore tra quelli che compongono la famiglia. Per assicurare la massima casualità di quest’ultima scelta, e nel contempo tenere sotto controllo la rappresentatività del campione, sempre esposta ad insidie di ogni tipo (compresa quella dovuta alla non perfetta identità tra le unità-abbonato e le unità-famiglia), vengono usati metodi diversi (sui quali non possiamo dilungarci). Ma è credibile una tale scrupolosa professionalità dell’intervistatore? Forse per rispondere a questa domanda può essere interessante considerare un caso reale e concreto, descritto in un bell’articolo di Laura Arconti che risale a due anni fa (su Notizie Radicali del 22 dicembre 2010), ma che è ancora attualissimo. Sono stati elencati solo alcuni aspetti connessi al problema della affidabilità dei sondaggi elettorali, ma si potrebbe continuare …
Conclusioni?
Forse basta ricordare qualche previsione di passati sondaggi, per esempio il caso delle Regionali del 2000 che assegnavano 10 regioni a 5 a favore della sinistra, e poi il risultato fu esattamente l’opposto a favore della destra. O anche le elezioni politiche del 2001 e del 2006, con i sondaggi che accreditavano i DS del 25 %, a fronte di un risultato conseguito del 16 %.
Articolo di riferimento : http://angelocristofanelli.blogspot.it/2013/02/i-sondaggi-ovvero-l-arma-totale-della.html
Il Prof. Scozzafava in viva voce
9 febbraio 2013 SONDAGGI 1 - Il Prof. Romano Scozzafava ce ne spiega i segreti
9 febbraio 2013 - SONDAGGI 2 - LE COMMITTENZE spiegate da SCOZZAFAVA
http://www.youtube.com/watch?v=rsJ30yoJgJM&list=UUmH9ZIeOtGPHp40iwTLEtaA&index=3
Nessun commento:
Posta un commento