Brincando com políticos e inteligência artificial

A idéia desta análise veio do André Lima (@andlima) e será executada por mim como um projeto de pesquisa orientado pelo Prof. Siome K. Goldenstein.

Resumo

A quantidade de informação disponível eletronicamente sobre a atuação dos nossos representantes eleitos tem aumentado drasticamente em tempos recentes e, apesar de ainda longe do ideal, já permite análises interessantes.

“Informação”, aqui, refere-se não a notícias ou opiniões, mas a dados crus e objetivos como: contribuições de campanha, fluxos orçamentários, movimentações partidárias, processos na justiça, históricos de votação em plenário, etc. Para os fins deste artigo, vamos nos focar no último.

A idéia básica é, olhando apenas os históricos de votação dos deputados:

  • fazer um agrupamento automático por similaridade;
  • comparar este agrupamento automático com o real (por partidos);
  • estabelecer as votações ou projetos de lei mais relevantes.

Modelagem

No site da Câmara dos Deputados há muita informação sobre o processo legislativo. Em particular, o site lista:

  • Deputados;
  • Votações (projetos de lei, entre outros);
  • Votos (sim/não/abstenção/ausência).

Com estas informações, podemos modelar um deputado como sendo um vetor de votos, onde cada dimensão corresponde a uma votação, e o valor da dimensão, ao voto. Ex.:

Deputado1: <sim,não,não,sim,aus,abs>
Deputado2: <não,não,não,sim,sim,aus>

Sabemos a que votação cada voto corresponde pela posição no vetor.

Tendo isso em mãos, podemos criar uma medida de distância entre dois deputados, dada pelo número de votações em que os dois votaram diferente. Intuitivamente, quanto mais eles discordarem, mais “distantes” estarão ideologicamente. No exemplo acima, Deputado 1 e Deputado2 discordam na primeira, na penúltima e na última votação. Portanto, tem distância 3.

Agrupamento

Vetores e uma medida de distância são a entrada de vários algoritmos de agrupamento (clustering, em inglês), subárea da Inteligência Artificial conhecida como Aprendizado de Máquina (Machine Learning, em inglês). As saídas em que estamos interessados são o número de grupos encontrado e a distribuição dos deputados em grupos.

Uma maneira intuitiva de imaginar, grosso modo, como o número de grupos é obtido é a seguinte: se todos os políticos tiverem votado exatamente a mesma coisa em todas as votações, precisamos apenas de 1 grupo (eles concordam em tudo). Se eles tiverem votado exatamente a mesma coisa em todas as votações exceto em uma, onde metade votou “sim” e a outra “não”, precisamos de 2 grupos, e assim por diante.

O número de grupos é um resultado interessante em si porque, de certa forma, pode ser interpretado como a quantidade de “variação ideológica” entre os deputados. Uma crítica frequente ao sistema político brasileiro é o fato de haver dezenas de partidos sem muita definição da diferença entre eles (ao contrário do sistema estadunidense, polarizado em dois partidos principais). O número de grupos encontrado pelo algoritmo refletiria o número de pólos ideológicos reais, definidos puramente pelas opiniões dos deputados expressas em seus votos.

A composição dos grupos é também interessante, pois podemos ver não só que políticos foram parar em que grupos mas, melhor ainda, que partidos foram parar em que grupos. Talvez haja pouca surpresa aqui, mas seria curioso se pessoas de partidos supostamente opostos ideologicamente acabassem no mesmo grupo, ou se um pedaço de um partido estivesse em um grupo e outro pedaço em outro, revelando uma divisão partidária.

Relevância dos projetos de lei

Fazendo algo semelhante a uma Análise de Componentes Principais (PCA – Principal Component Analysis, em inglês), podemos obter um conjunto pequeno das votações que foram mais relevantes em distinguir um político do outro. Retomando o exemplo acima, se todos tivessem votado exatamente a mesma coisa exceto em uma votação, onde metade votou “sim” e metade “não”, concluiríamos que esta uma votação é muito mais relevante do que as outras porque, para qualquer político, bastaria saber o que ele votou nesta uma votação para determinarmos a que grupo ele pertence. O resultado real claramente não será tão óbvio, mas através deste procedimento poderíamos obter, por exemplo, as 10 votações ou projetos de lei mais relevantes.

Aplicações

A aplicação mais imediata seria, a partir da análise de relevância, criar um questionário online com as leis mais importantes, determinando a que grupo o usuário pertence e que deputados de seu estado se encontram nele (e quais não se encontram). Outras aplicações, diretas ou indiretas, das idéias básicas apresentadas aqui são muitas e muito importantes, e as apresentarei melhor em outro post.

  • Share/Bookmark
  • rafaelproenca
    Ótimo projeto. Tô ansioso pra ver os resultados.
  • kkk gênio, gênio
blog comments powered by Disqus