Artículos

Explorando datos de la cámara de diputados de Chile – Manzana Mecánica

por Alvaro Graves

Desde hace tiempo he venido pensando en cómo podemos entender mejor las votaciones de los diputados y senadores. La verdad es que muchas veces sólo nos enteramos parcialmente por las noticias, o incluso peor, sólo porque algún diputado comparte en redes sociales una foto de los resultados de las votaciones. Creo que es importante poder comprender mejor cómo se comportan quienes aprueban o rechazan leyes que nos afectan a todos.

Lamentablemente las APIs del congreso de Chile dejan mucho que desear, por lo que es necesario hacer esfuerzos extra para poder estudiar estos datos. Este es un intento para poder entender cuán similares son unos diputados con otros. Es importante notar que esta es una exploración inicial, y que hay muchísimas preguntas interesantes que no alcancé a contestar -o que simplemente no se me ocurrieron.

Distancia entre diputados

Lo primero que necesitamos es poder definir una métrica de qué tan similares o diferentes son dos diputados. Para esto, realizamos Web Scraping del sitio de la cámara de diputados y obtenemos, por cada votación del actual periodo legislativo, quien votó a favor, en contra, se abstuvo o se pareó con otro diputado. Con esto, podemos definir las siguientes reglas para cada votación:

  • Si dos diputados votan igual (ambos a favor, ambos en contra, abstención o pareo), a ese par de diputados se le asigna un 1.
  • Si dos diputados votan de forma opuesta (uno a favor y el otro en contra, o uno en contra y el otro a favor), se les asigna un 0.
  • Para el resto de los casos (por ejemplo en que uno vota a favor y el otro se abstiene, y todas las otras combinaciones), se les asigna un 0.5.

La idea es que, para cada votación, si los diputados se alinean en su voto, entonces “son más parecidos”. Si en la votación en cuestión difieren diametralmente, entonces dicha votación no suma similitud. Para el resto de los casos, consideramos un valor intermedio para cuantificar su cercanía dado que no es una similitud ni diferencia categórica.

Luego por cada par de diputados, calculamos el promedio de estos valores a lo largo de las votaciones consideradas, y normalizamos de 0 a 100 para obtener una noción de “porcentaje de similitud”. Si dos diputados votan exactamente igual en todas las votaciones evaluadas, entonces van a tener un puntaje de 100. Si votan exactamente opuesto en cada votación, van a tener un puntaje igual a 0. Finalmente, calculamos este puntaje para todos los pares de diputados.

Primeras preguntas

Lo primero que podemos preguntarnos es quienes son el par de diputados que están más cerca y quienes son los más lejanos. Los más cercanos son Marcos Espinosa y Marcela Hernando, ambos del PRSD, con una similitud de 98.6 (de 100). En términos de los más lejanos están Joaquín Godoy (Independiente) y José Perez (PRSD) con una distancia de 51.6.

Para tener una noción de qué tan distintos son estos valores de similitud, es útil ver cómo se distribuyen las distancias, lo cual podemos visualizar en un histograma de todas las relaciones, como se ilustra a continuación:

Es claro que en general hay dos tipos de similitudes: Quienes son muy cercanos entre sí (en los 90s) o quienes son contrarios entre sí (en los 60s). Resulta interesante que en realidad no hay tanto antagonismo como uno podría suponer, es decir, aproximadamente la mitad de las votaciones consisten en un acuerdo transversal de la cámara. Mi hipótesis personal era que los casos más extremos estarían en los 20s o 30s, no en los 60s.

Otra visualización de interés es ver cómo se ubicarían los diputados en una red, agrupando a los diputados según la relación de similitud definida. Para ello, cada diputado es un nodo (coloreado según el partido al que pertenece), el cual tiene una arista a todos los demás nodos. El largo de cada arista va a ser proporcional a la diferencia en similitud entre ambos diputados. Así, si dos diputados son muy similares, van a estar muy cerca, pero si son muy diferentes van a estar más lejos. Graficando lo anterior, podemos visualizar la red en la siguiente imagen:

Aquí es más clara la división en dos grandes clusters bien marcados, con algunosoutliers alrededor. Es interesante notar que los partidos de la Nueva Mayoría (a la izquierda) están más agrupados que los diputados de oposición (a la derecha). Esto muestra que los votos de la izquierda son más similares entre sí.

Disciplina de los partidos

Otra pregunta interesante es ¿Qué tan similares son los diputados de un mismo partido?. Esto podría entenderse como una forma de medir qué tan disciplinados son los partidos: Si hay grandes diferencias en los votos de sus integrantes, un partido es poco disciplinado. Si todos votan igual (o muy parecido), el partido es muy disciplinado. Mi hipótesis es que los partidos más “extremos” son más disciplinados. Para esto realizamos el mismo ejercicio anterior, pero agrupando sólo los nodos que son del mismo partido. El resultado se puede ver en la siguiente imagen (click para agrandar):

Como es de esperar, en general los partidos más extremos son más disciplinados (su distancia media es menor), mientras que los del centro son menos disciplinados (las distancias medias son mayores). Un caso particular es el de los independientes, ya que en realidad ese no es un partido político, sino que una categoría para agrupar a diputados de distintas tendencias. El caso del partido comunista es quizás confuso, ya que al ser una red mucho más pequeña que la de otros partidos, es esperable que sean más similares. Por eso es que la distancia media entre ellos es tan grande. Un diagrama de las distancias medias por partido se puede ver en la siguiente figura:

Distancia de cada diputado a los demás

Finalmente, podemos preguntarnos cómo se ve cada diputado con respecto a los demás. Para esto, los colocamos a todos (menos uno) en un círculo, ordenados por partido. El diputado restante al centro y todos los demás se ordenan por distancia: Si otro diputado ha votado muy parecido al del centro, estará muy cerca de él. Si ha votado muy diferente al diputado central, estará más alejado. Es posible explorar esta visualización con todos los diputados, pero aquí revisamos unos ejemplos:

Consideremos dos métricas: Mayor/menor distancia media y mayor/menor desviación estándar. Mayor distancia y desviación estándar pueden ser métricas para identificar a los “extremistas”, mientras que una menor distancia o menor desviación estándar puede servir para identificar a los diputados más “moderados”. Tomando estas métricas (¡que pueden ser muy discutibles!), encontramos lo siguiente:

  • Mayor distancia media: José Manuel Edwards (RN)
  • Menor distancia media: Christian Urízar (PS)
  • Mayor desviación estándar: Rodrigo González (PPD)
  • Menor desviación estándar: Karla Rubilar (Independiente)

Conclusiones

Todas estas visualizaciones están disponibles enhttp://graves.cl/chile/congreso/camara/. Estoy seguro de que hay decenas de preguntas que pueden ser mucho más interesantes que las que he planteado acá, incluyendo aspectos temporales, de cada ley en particular, etc. Personalmente, esta exploración me ha servido para entender mucho mejor cómo se estructuran los distintos grupos de diputados y como se relacionan unos con otros.

Agradecimientos

Quiero agradecer públicamente a Alberto Cairo, Chato y a Javier Sajuria por los comentarios y sugerencias dados para este proyecto.