Monthly Archives: noviembre 2011

Ranking de Encuestas 2.0

Uno de los objetivos de tresquintos es analizar encuestas de opinión pública. Una forma de analizar encuestas es tender inferencias cada vez que una encuestadora publica una encuesta nueva. Otra forma de analizar encuestas es tender inferencias en base a múltiples encuestas, de múltiples encuestadoras distintas. Los que conocen el terreno de la opinión pública en Chile sabrán que la segunda forma no es nada de fácil. Las encuestas difieren en varios aspectos. Tienen diferencias significativas en sus ‘diseños metodológicos’, ‘tamaños de muestra’ y ‘fechas de trabajo de campo’.

Durante la campaña presidencial de 2009 hubo un par de sitios que intentaron tender inferencias en base a múltiples encuestas, al ponderar varias de ellas en un indicador único que intentaba representar el valor real de la intención de voto para cada candidato. El sitio TodoPolítica solo consideró las 4 encuestas más recientes. Promedió el valor de la última encuesta con las 3 anteriores en una regresión local para generar su indicador único. El sitio Vota 2009 de La Tercera tuvo una aproximación similar. Ponderó todas las encuestas con una media aritmética para dar con su propio indicador único.

En ambos casos, encuestadoras y encuestas fueron comparadas par a par. En el caso de TodoPolítica, las encuestas presenciales que entrevistaron a más de 1,000 personas con un margen de error de 3,0% fueron consideradas igual de relevantes que las encuestas telefónicas que entrevistaron a 600 personas con un margen de error de 4,5%. En el caso de Vota2009, las encuestas que se realizaron durante fines de 2008 (más de un año antes de la elección!) fueron consideradas igual de relevantes que las encuestas que fueron realizadas a fines de 2009 (menos de un mes antes de la elección!).

Comparar encuestadoras y sus encuestas involucra un proceso metodológico complejo. Justamente porque todas las encuestas difieren, las respectivas proporciones de intención de voto que reportan tienden a ser distintos. Por ejemplo, podemos anticipar proporciones diferentes dependiendo si las encuestas son presenciales o telefónicas, o si los entrevistados son seleccionados por cuota o de forma aleatoria. Incluso si todas las encuestadoras tuvieran las mismas características particulares, es probable que observáramos diferencias en sus resultados.

Para crear un indicador único sin sesgo, es importante partir de la base que todas las encuestadoras tienen características particulares distintas y todas sus encuestas introducen error en sus predicciones. El primer paso es asignarles mayor peso en el indicador único a las encuestadoras que tienen encuestas que introducen menos error en sus predicciones. Para determinar que encuestadora tiene menos error, mire las encuestas que sondearon intención de voto para la primera vuelta de la elección presidencial de 2009. En total, consideré 12 encuestadoras:

  • CEP
  • CERC
  • Direct Media
  • El Mercurio-Opina
  • Giro País (Subjetiva)
  • Imaginacción
  • IPSOS
  • La Segunda (UDD)
  • La Tercera
  • MORI
  • TNS-Time
  • UDP

Para crear el ranking, se necesita un mínimo nivel de homogeneidad entre las encuestadoras. Es decir, se debe usar datos que midan lo mismo. No todas las encuestas reportan el porcentaje de encuestados que se declara registrado para votar. Por ejemplo, la encuestadora CERC excluye nulos, blancos y abstenciones. Es decir, la intención de voto por candidato suma 100%. Las otras encuestas, en cambio, sí reportan nulos, blancos, abstenciones, por lo cual los votos válidos suman menos de 100%. Para homogeneizar las encuestadoras, normalicé los datos de todas las encuestas a 100%.

Si suponemos que todas las encuestadoras diseñan sus encuestas metodológicamente bien, deberíamos esperar que aquellas con un menor margen de error (o un mayor número de encuestados) tengan una mejor capacidad predictiva. Sin embargo, el siguiente cuadro muestra que no hay una asociación entre margen de error y capacidad predictiva. Algunas encuestas con un bajo margen de error fallaron más que otras encuestas con un alto margen de error. Por ejemplo, la encuestadora con el menor margen de error (Ipsos, con 2,5%) tuvo la octava mejor predicción (de doce!) de intención de voto para Piñera.

Eso es suficiente evidencia para sostener que el margen de error no es la única fuente de error en las encuestas. Si el margen de error fuera el único error de las encuestas, todas las encuestas tendrían una predicción correcta, dentro de su margen de error. En esencia, esto significa que las encuestadoras introducen un error natural a partir de su particular proceso metodológico. Para medir el error de cualquier encuesta, propongo aislar sus fuentes de error en una parte provista por la encuestadora y una parte no provista por la encuestadora:

ERROR REAL = Error Reportado + Error-No-Forzado

Ahora bien, en vez de mirar el error de cada encuesta en las predicciones de cada candidato, decidí fijar un parámetro de estimación. Principalmente porque es común que una encuesta reporte una predicción correcta para un candidato, pero falle significativamente en su predicción para el resto. Por ejemplo, MORI hizo la segunda mejor predicción de votación para Piñera, pero tuvo mayor error que el resto de las encuestas en la predicción de votación para los otros candidatos.

En este caso el parámetro de estimación más importante es el que mide la diferencia en votación entre los dos candidatos con más preferencias. Esto tiene sentido porque a menudo sabemos quién es el favorito, pero no sabemos por cuánto. En elecciones competitivas esta distancia es crucial. Si ambos candidatos giran en torno al 50% de las preferencias,  lo importante es conocer la distancia entre ambos. Por ejemplo, en 2009, todas las encuestas reportaron a Piñera como favorito, pero todas con distancias de Frei diferentes.

Error Reportado

El primer paso es estimar el Error Reportado. Esta es la diferencia entre la predicción del parámetro de cada encuesta y el parámetro real. Es la forma más básica de medir el error de una encuesta. El siguiente cuadro muestra el error reportado para el parámetro de estimación. La columna ‘Parámetro Estimado’ es la predicción del parámetro (la diferencia entre Piñera y Frei). La columna ‘Error Parámetro’ es la diferencia entre parámetro estimado y el parámetro real. La columna ‘Error Reportado’ es el valor absoluto de ‘Error Parámetro’.

El índice de mayor interés es ‘Error Reportado’, que muestra la distancia absoluta del parámetro estimado de cada encuesta y el parámetro real (14,5%). El promedio de error reportado de todas las encuestas fue de 3,7%. Esto significa que en general las encuestas hicieron buenas predicciones, haciendo una estimación relativamente cercana al resultado de la elección. De todas las encuestas La Segunda/UDD tuvo el error reportado más bajo (0,05%) con una predicción de 14%, mientras que ICSO-UDP tuvo el error reportado más alto (7,9%) con una predicción de 6,6%.

Error-No-Forzado

El segundo paso es estimar el Error-No-Forzado. Esta es la diferencia entre el error reportado y el margen de error. Es lo que el margen de error no explica en el error reportado de la encuesta. El siguiente cuadro muestra el error-no-forzado para el parámetro de estimación. La columna ‘Error Reportado’ es el valor absoluto de ‘Error Parámetro’. La columna ‘Margen de Error’ muestra el margen de error que reporta la encuesta. La columna ‘Error No Forzado’ es la diferencia entre el error reportado y el margen de error.

El índice de mayor interés es ‘Error No Forzado’, que muestra el error que tiene una encuesta, que no puede ser explicado por su margen de error. Un índice negativo significa que la encuesta tuvo una predicción dentro de su margen de error. Un índice positivo significa que la encuesta tuvo una predicción fuera de su margen de error. De las 12 encuestas, 5 estuvieron dentro de sus margenes de error. De las 7 encuestas restantes, Imaginacción tuvo un error-no-forzado más bajo (0,7%), y UDP tuvo el error-no-forzado más alto (5,2%).

Error-No-Forzado Relativo

El tercer paso es estimar el Error-No-Forzado Relativo. Esta es la diferencia entre el error-no-forzado de cada encuesta y el promedio de error-no-forzado de todas las encuestas. Esto permite estimar la capacidad predictiva de cada encuesta en base a la capacidad predictiva promedio de todas las encuestas. El siguiente cuadro muestra el error-no-forzado relativo. Las columnas ‘Margen de Error’ y ‘Error No Forzado’ son lo mismo que arriba. La columna ‘Error No Forzado Relativo’ es la diferencia entre ‘Error No Forzado’ y el promedio de ‘Error No Forzado’.

El índice de mayor interés es ‘Error No Forzado Relativo’, que muestra el error que tiene una encuesta, en comparación con todas las encuestas. Un índice negativo significa que la encuesta tuvo un error-no-forzado menor que el promedio de todas las encuestas. Un índice positivo significa que la encuesta tuvo error-no-forzado mayor que el promedio de todas las encuestas. Por ejemplo, La Tercera tuvo un error-no-forzado de 1,4% menos que el resto de las encuestas. Asimismo, Giro País/Subjetiva tuvo un error-no-forzado de 0,03% más que el resto de las encuestas.

Personalmente, tengo algunas aprensiones metodológicas con las características particulares de algunas de las encuestadoras que figuran en la parte superior del ranking. Principalmente con los tamaños de las muestras y los métodos de recopilación de datos. Sin embargo, el ranking esta construido en base a la capacidad predictiva de las encuestas, y no a sus características metodológicas. Para efectos de un ranking, las encuestas que tienen a introducir un error-no-forzado relativo menor deben tender a figurar en la parte alta de la tabla.

Un argumento en contra de este punto es que no todas las encuestas son predictivas. Dado que algunas encuestas se hacen con meses de anticipación a la elección (e.g., UDP), las encuestadoras pueden argumentar que su encuesta es solo una foto del momento. La respuesta es simple. Cuando una encuestadora decide preguntar sobre “la elección del próximo Domingo”, esta haciendo una predicción. Además, si cada año electoral la encuestadora hace la misma pregunta con la misma distancia de tiempo a la elección, podremos fácilmente anticipar su error real.

Las Tres Etapas de Piñera

Una simple mirada a la popularidad de Sebastián Piñera muestra un constante declive en su aprobación presidencial y un constante aumento en su desaprobación presidencial. Si miramos los datos a nivel agregado, y ploteamos una línea de tendencia continua de todas las encuestas que han sondeado su popularidad desde que asumió en Marzo de 2010, vemos un patrón de deterioro paulatino.

Sin embargo, si miramos con más detención el patrón de las encuestas a nivel desagregado podemos identificar varios puntos de inflexión. Por ejemplo, en algunos artículos anteriores (ver aquí y aquí) argumenté que a diferencia de los presidentes de la Concertación, la popularidad de Piñera es más dependiente de factores coyunturales (mineros, protesta de estudiantes) que de factores estructurales (economía, inflación).

Por eso, decidí dividir el gobierno de Piñera en tres periodos, separándolos por los dos factores coyunturales que creo que han sido más decisivos. El primer factor coyuntural es el rescate de los mineros, en septiembre de 2010. El segundo factor coyuntural es el nacimiento de los conflictos estudiantiles, en marzo de 2011. Es decir, los tres periodos son (marzo 2010 – septiembre 2010), (septiembre 2010 – marzo 2011) y (marzo 2011 – octubre 2011).

Esta técnica estadística está basada en el diseño de regresión descontinuada (regression discontinuity design). Es un método comúnmente usado para determinar el efecto causal de ciertos factores, al asignarlos como un tratamiento exógeno en un escenario donde no se les puede considerar al azar.  Al comparar las observaciones a cada lado del tratamiento, se puede estimar su efecto.

El cambio de dirección en las líneas de tendencia es notorio. En el primer periodo hay un incremento paulatino en la aprobación presidencial del Piñera. Esto puede ser explicado por la etapa de luna de miel que tiene una presidente al inaugurar su periodo. Pero también hay un incremento en la desaprobación. Esto puede ser explicado por los conflictos de interés, el efecto post-terremoto y la instalación de un nuevo gobierno que naturalmente contribuye a retrasar el trabajo.

Tras el peak de popularidad en septiembre de 2010, hay una importante caída en la aprobación presidencial y un aumento en la desaprobación. Los seis meses hasta Marzo de 2011 muestran la peor etapa del gobierno de Piñera. Esta etapa comienza tras el crepúsculo de la luna de miel, cuando la gente comienza a exigir resultados concretos. La inhabilidad del gobierno de producir estos resultados y sus constantes conflictos de interés terminaron por hundir la esperanza de tener un gobierno nuevo.

El tercer periodo comienza con el conflicto estudiantil en marzo de 2011. Es cuando los problemas de la segunda etapa se solidifican. En vez de comenzar una reversión en la tendencia de popularidad, las protestas y manifestaciones de los estudiantes ayudan a marcar la inclinación negativa que había comenzado tras el rescate de los mineros. Es decir, contrario a lo que muchos exponen, los estudiantes no causaron la baja en la aprobación, simplemente la intensificaron.

Esta evidencia contribuye a la teoría que la popularidad de Piñera es peligrosamente susceptible a cambios coyunturales. Esto, lejos de ser algo positivo, es una amenaza a la gobernabilidad. Es difícil prever el éxito de un gobierno cuando pequeños o medianos cambios en el comportamiento de los ciudadanos interfieren de forma drásticamente en sus proyectos. De seguir igual, anticipo un patrón estancado en la popularidad.

El Factor Bachelet

La compleja situación política por la cual pasa la Concertación es representativa de su dificultad para respaldar un candidato presidencial único para 2013. Hasta el momento se barajan alrededor de 11 nombres: Ignacio Walker, Claudio Orrego, Ximena Rincón, Soledad Alvear, Michelle Bachelet, Fulvio Rossi, Osvaldo Andrade, Ricardo Lagos Weber, Carolina Tohá, Guido Girardi y José Antonio Gómez. La principal dificultad ha sido decidir el método de selección del candidato único. Mientras algunos piden nominar de forma directa a Bachelet, otros piden fijar primarias.

La nominación directa tiene la ventaja de unificar a todos los partidos tras la popular figura de Bachelet. Sus partidarios esperan que esta estrategia se consolide como una especie de blindaje a las críticas de la Alianza. Además permite construir una ofensiva poderosa en los últimos años del gobierno de Piñera. Pero tiene la desventaja de abrir un flanco para que candidatos dentro–o fuera–de la coalición compitan por fuera. En el peor de los casos podría repetirse lo de 2009, cuando las élites decidieron nominar a Frei como candidato, indirectamente potenciando la candidatura de Marco Enríquez-Ominami.

Por estas razones ciertos sectores dentro de la Concertación han pedido fijar primarias. Algunos han pedido primarias abiertas, aceptando incluir a candidatos que no militan en los partidos de la coalición. Esto permitiría la entrada de Enríquez-Ominami y Andrés Velasco en la boleta. Otros han pedido primarias cerradas, justamente para prevenir la entrada de independientes y descolgados. En ambos casos los resultados difieren substancialmente. Por ejemplo, el número de candidatos aumenta considerablemente en primarias abiertas respecto a primarias cerradas.

Pero para determinar el mejor método de selección del candidato presidencial, es importante saber cuáles son las intenciones de Bachelet. En un artículo anterior argumenté que su silencio es un factor divisor. Mientras no manifieste su intención de aceptar o rechazar una candidatura, persistirán los problemas intra-coalicionales. Dado que el escenario cambia dramáticamente dependiendo de su disposición, es difícil ver que se pueda tomar una decisión antes de que ella hable. El siguiente cuadro muestra la alta probabilidad de que Bachelet sea la candidata única en 2013.

Si bien es altamente probable que Bachelet sea la candidata única de 2013, si decide no competir también logra influir en la selección del candidato presidencial. Principalmente porque fuerza primarias. Es difícil concebir un escenario donde los partidos de la Concertación concuerden en nominar un candidato único que no sea Bachelet. Ninguno de los 10 nombres restantes recoge el apoyo transversal que obtiene Bachelet. Además, si las primarias son vinculantes, logran evitar potenciales candidaturas paralelas por fuera.

Si Bachelet decide no competir, y las primarias son abiertas mi intuición es que Enríquez-Ominami y Velasco tienen una alta probabilidad de ganar. En un artículo anterior anticipé que el clivaje de 2013 sería uno de sistema/anti-sistema, lo cual es mejor representado por candidatos descolgados e independientes. Entre ambos, me parece que los votantes pueden favorecer a Enríquez-Ominami, dado que Velasco compite contra los militantes de la Concertación. Mientras Enríquez-Ominami cuenta con un voto duro dentro de algunos sectores, el apoyo de Velasco está en un estado incipiente.

Por otro lado, si Bachelet decide no competir, y las primarias son cerradas mi intuición es que disminuirá el número de candidatos. En vez de que cada partido nomine a cada uno de los potenciales candidatos como un pre-candidato, cada partido nominará a su militante más competitivo. En este caso, especulo que Walker tiene una ventaja sobre Tohá y Gómez. Principalmente porque tiene mayor apoyo en los sectores moderados, los cuales son más y por ende tienen una mayor probabilidad de votar en primarias voluntarias.

En definitiva, todo depende de Bachelet. Mientras Bachelet no hable, las elites de la Concertación no podrán decidir qué tipo de selección de candidato presidencial utilizarán para 2013. En el escenario que Bachelet decide competir, la evidencia apunta a que será la preferida tanto por las elites como por los ciudadanos que decidan votar en primarias. En el escenario que Bachelet decide no competir, la evidencia apunta a que Enríquez-Ominami o Walker serán los favoritos.

Bachelet 2013 y la Sobrevivencia de la Concertación

Desde que Michelle Bachelet dejó La Moneda en 2010, ha sido la figura pública con mayor adhesión en las encuestas de opinión pública. También ha liderado los sondeos entre los potenciales candidatos para la próxima elección presidencial. El bajo nivel de rechazo y el alto nivel de apoyo ha llevado a un sector dentro de la Concertación a pedir su pronta nominación como la abanderada de la coalición para las elecciones de 2013.

El sector que plantea nominar a Bachelet cuanto antes descarta negociar con candidatos independientes y descolgados–Andrés Velasco y Marco Enríquez-Ominami. Buscan nominar a un candidato militante del cual exigen un gobierno sustentado en lealtades partidarias. Al nominar a Bachelet desde las elites, la Concertación evita la amenaza de fraccionar a los votantes de cara a una potencial segunda vuelta y potenciar a los partidos de su coalición.

Otro sector plantea nominar un candidato militante de la Concertación, pero por medio de primarias. Estos apuntan a renovar las cúpulas de líderes al permitir a todos los militantes que quieran levantar una candidatura. Dentro de este grupo también hay quienes apoyan incluir a independientes y descolgados en la nómina. Al establecer primarias, abiertas o cerradas, la coalición vincula a los aspirantes a apoyar al candidato único.

Si bien los dos sectores incluyen estrategias diferentes para lidiar con la candidatura de Bachelet, ambas representan una amenaza a la sobrevivencia de la Concertación. El primer sector propone reiterar el error de la Concertación en 2009, cuando al nominar a Frei implícitamente impulsaron la candidatura de Enríquez-Ominami. El segundo sector propone homologar el peso de Bachelet al de candidatos que no tienen apoyo en las encuestas (e.g. Claudio Orrego, Carolina Tohá).

El factor común de ambas estrategias es usar a Bachelet como punto de referencia. Si bien es algo inevitable, dado sus altos índices de apoyo en las encuestas, se está consolidando como un factor divisor por sobre uno unificador. Es probable que Bachelet sea parte del problema más que parte de la solución. Mientras Bachelet no manifieste su intención de levantar o declinar una candidatura en 2013, seguirán los conflictos intra-coalicionales.