Sobre a morte das pesquisas de intenção de votos (ao menos, como as conhecemos)

Créditos da imagem: Scientific American / NASA / Ian Allen

O serviço de funeral terá início às 15h. O sepultamento ocorre às 17h.

A mecânica dos fluídos, ramo da física que estuda o comportamento das forças aplicadas em fluídos [e.g.: água, ar], tenta, há muito tempo, explicar como o perfil aerodinâmico da asa de um avião gera sustentação. Em palavras bem simples: a ciência humana ainda não sabe – exatamente – porquê a asa do avião permite ele voar. Veja: a ciência sabe COMO fazer a asa do avião para que ele voe. O que a ciência não sabe é PORQUÊ isso dá certo.

Se você pesquisar por uma equação clássica de sustentação aerodinâmica, ela é um monstrinho. Cheia de letras (incógnitas ou variáveis) e valores pré-definidos (constantes):

L = (1/2) d v² s CL

Se cairmos na bobagem de verificar equações de arrasto, ou de velocidade mínima de sustentação do perfil aerodinâmico, a coisa só piora…

Agora, comparemos essa equação com a equação de Einstein, feita para descrever sua famosa teoria especial da relatividade:

E = mc²

Como algo pode ser mais (matematicamente) elegante do que isso? A equação de Einstein descreve como massa e energia são a mesma entidade física e como é possível arguir que uma pode se transformar na outra (afinal, é isso que toda equação faz: propõe a equivalência de dois lados [expressões] separados por um sinal de igual).

Há uma citação que frequentemente se atribui a Einstein (se não é dele, só pode ser da Clarice): “Se sua equação tem muitas variáveis, é provável que você não tenha entendido o fenômeno que quer explicar”. Se a frase é mesmo dele, só posso dizer: mala dos caral$#@%… Mas, como rebater o cara que segue tendo suas teorias (praticamente) demonstradas, décadas após sua morte?
¯\_(ツ)_/¯

Se não é dele a citação, ela não deixa de ser menos interessante e, até certo ponto, verdadeira. Quanto mais entendemos um fenômeno, menos ele nos é suscetível a interferências e imprevisibilidades. Em outras palavras, quando entendemos o que realmente influencia um fenômeno, não precisamos trabalhar com n variáveis de controle adicionais só para endereçar o risco de não termos considerado tudo.

É claro – mas é melhor dizer: para chegar em E = mc², Einstein escreveu mais linhas de equações do que existem dogs caramelos no mundo (ok, talvez nem tanto). Foi o domínio e a compreensão do fenômeno que ele queria descrever que permitiu o refino de tantas equações e extrapolações matemáticas em uma elegante equação de apenas 3 variáveis. Não quer dizer que uma equação com mais “entradas” é malfeita. Apenas quer dizer que ela precisa de mais informação para reproduzir matematicamente um fenômeno e permitir predições daquele fenômeno no futuro, através dela.

George Box, com sua prancha importada, assombrou a meninada da ciência. O estatístico calhorda advertia, em algum lugar distante da última década de 70, que “todos os modelos estão errados, mas alguns são úteis”. Coitado de Georjão. Não tenho razões para dizer que ele era calhorda. Talvez fosse. Mas eu só quis brincar com “surfista calhorda” dos Replicantes, que eu ouvia enquanto escrevia o começo deste post.

Eu já falei do Georginho por aqui, no passado. A minha insistência (quase-obsessão) com Lord Box (eu também não sei se ele era um Lord) é que a mensagem dele é, ao mesmo tempo, óbvia e perspicaz para quem tem amor à ciência. Ironicamente, a mensagem parece estar perdida nos tempos atuais, especialmente aos olhos dos que promovem as ciências sociais aplicadas.

George Box, químico na origem, estava com uma bucha gigante em suas mãos quando teve que dominar sozinho a área de estatística teórica para demonstrar aos seus chefes que eles estavam indo pelo caminho errado. O pior é que o caminho errado era pavimentado de boas intenções e “boa ciência” (contas e mais contas e mais contas). George teve que evangelizar que a compreensão do mundo pelas lentes de modelos (matemáticos, sociológicos, químicos […]) é sempre incompleta, sempre imprecisa, sempre falha. E, então, o que fazemos? Jogamos todos os modelos/equações/teoremas fora? Claro que não. Só não podemos perder de vista, em nenhum momento, de que todos eles – mesmo os que nos são úteis – estão errados.

Qual é o crime que o(a) cientista (matemático, físico, biológico, político […]) comete quando se esquece que todos os modelos estão errados? Ele(a) passa a culpar a realidade pelo desvio em comparação com suas previsões/modelo. É o triste caso do rabo que abana o cachorro, versão ciência.

Ontem, na capital paulista, amanheceu com sol, 2 de outubro, tudo funcionando, limpeza, jumbo… De madrugada, eu senti um calafrio. Não era do vento, não era do frio (se não notou, note: Racionais™)… O calafrio era o medo de estar sendo enganado da mesmíssima forma que boa parte dos estado-unidenses foram enganados em 2016.

Em 2016, as pesquisas de intenção de votos (vamos chamar só de “pesquisas eleitorais”), nos EUA, apontavam que Hillary Clinton venceria o pleito presidencial daquele ano. O que ocorreu, todos sabemos: Trump ganhou e, com ele, ganharam os republicanos, boa parte das cadeiras do Congresso daquele país. O mundo ficou estupefato. As pesquisas eleitorais até ali, eram um sólido instrumento de interpretação dos pleitos democráticos estado-unidenses e de predição dos resultados. Mas, se elas conseguiam estar tão equivocadas em suas predições (superando grandemente as margens de erro consideradas operacionais), qual era a chance de toda a percepção sociopolítica dos EUA estar equivocada?

Veio 2020, Trump perdeu a eleição para Biden, mas por margem bem menos avantajada do que se supunha, novamente, por meio de pesquisas eleitorais. Dessa vez, é humanamente possível argumentar que as pesquisas não estavam tão descoladas da realidade. Eu discordo dessa defesa. Em 8 estados dos EUA, a distância entre os candidatos foi de apenas 3.5% e metade desses eram estados em que as pesquisas tinham outra expectativa, uma bem mais favorável a Biden. Uma pequena mudança nessa realidade e Trump estaria em seu segundo (e, quem sabe, permanente?) mandato.

Com duas eleições equivocadas na – por muitos considerada – maior democracia do mundo, e tendo a experiência brasileira em 2018 se equivocado igualmente, a minha expectativa – e a de muita gente – era de que os institutos de pesquisa eleitoral haveriam feito a lição de casa, reaprendido a fazer pesquisa de intenção de votos, criado técnicas e métodos de “detecção de descolamento da realidade” (deve haver nome mais científico como “desvio da mediana” ou coisa que o valha) e… E… Nada disso aconteceu.

Verdade seja dita, a maior parte dos institutos de pesquisa de grande porte, no Brasil, não vinha prometendo a vitória em primeiro turno para Lula, em 2022 (embora as projeções permitissem essa conclusão, com só um pouco de otimismo na leitura). Não, o problema não eram os números de Lula. Na verdade, quase todas as pesquisas chegaram bem perto da realidade para o Ptista. Onde elas falharam miseravelmente foi na predição do teto de Bolsonaro. O teto, como se confirmou ontem, é assustadoramente mais alto. Muito mais alto. Mesmo a Paraná Pesquisas, envolvida com algumas polêmicas e acusações de enviesamento, ainda errou o teto de Bolsonaro por 4 pontos percentuais. Não é pouco.

O Bolsonarismo não está desgastado, a pandemia não machucou essa marcha da extrema direita brasileira, a fome não assusta o eleitor das classes C e D o suficiente para fazê-lo voltar na opção. Pelo contrário: Essa marcha da extrema direita está muito perto de emplacar a façanha de colocar um carioca que – como dita o meme – não sabe a diferença entre São José dos Campos, no Sudeste paulista, e São José do Rio Preto, no extremo Noroeste, para governar o estado de São Paulo – o estado mais orgulhoso e afeito ao “nós vs. o resto” da nação… O estado que mais encrenca com o Rio, vai ter um governador carioca que não sabe onde vota em São Paulo, o estado mais rico do país. Esse é o tamanho do poder Bolsonarista, em 2022.

Diferente das pesquisas e sua natureza amostral (onde você extrapola os números do todo a partir de uma parte), o 1º turno é um censo. Mais que um censo, ele é a verdade; ali não existe “voto envergonhado”. O cidadão põe na urna aquilo que ele absolutamente quer que aconteça. Culpar os resultados do 1º turno é como culpar a realidade pois ela não respeitou suas equações que tentaram explicá-la. E esse é um pecado imperdoável para qualquer um que se diz “do lado da ciência”.

O modelo de pesquisa eleitoral que praticamos nas Américas está errado. E, do jeito que ele é, sequer é útil, pois erra e erra em margens inaceitáveis de tão abertas que são. Pode ser A ou pode ser B, e a chance de A e B é de 50%… Não dá para decidir com base nesse tipo de predição. Ou melhor, tanto faz se você considerou as pesquisas para se informar ou não.

Veja: não há qualquer dúvida por aqui de que estatística é uma ciência. A estatística não se resume, de forma alguma, à piada da cabeça no forno, o pé no freezer e a temperatura agradável do paciente. Estatística tem um alto poder de predição de eventos futuros e isso é um resumo – porco – do que é a ciência: a capacidade de compreender fenômenos passados e seus mecanismos e, dessa profunda compreensão, extrair modelos (equações, teorias, leis, lógicas […]) que permitem predizer, com grande margem de certeza, como se dará aquele fenômeno no futuro. Estatística é, sim, ciência.

Mas a forma como usamos a estatística para prever o comportamento do eleitorado em democracias – especialmente as americanas [EUA, Brasil, Chile …] – do século XXI, está morta. Se não está morta, falta só desligar os aparelhos. Eu cheguei ao absurdo de ler um cientista político sério dizendo que a pesquisa para Senador “sempre foi um chute”. Esse é o grau de avacalhação de algumas pessoas da área. Oras! Se é um chute, por que me dar ao trabalho de consultar as pesquisas, então? Por que os institutos se dão o direito de vender isso? Vender como estatística o que é mero chute não seria estelionato ou charlatanismo? Mais que pseudociência (no caso da pesquisa para o Senado), estaríamos diante de crime contra o consumidor?

Para o desagravo do autor do tiro no pé, eu sei que ele é BEM mais sério do que isso. Mas essa resposta para tentar defender a validade das pesquisas foi um senhor desserviço. Ele claramente se esqueceu de que todos os modelos estão errados e que só devemos salvar os que são úteis.

Para mim, é fato consumado de que não dá mais para sair às ruas com um bloquinho embaixo do braço, um sorriso no rosto e perguntar “em quem o senhor (ou a senhora) vai votar para presidente?”. Isso simplesmente não é mais capaz de explicar a realidade política do nosso tempo. E é um grave problema para a democracia porque a lógica dos partidos que ainda querem jogar o jogo democrático é utilizar as pesquisas para saber se a campanha está focando nos pontos certos, falando dos problemas que importam à maior parte do povo, e endereçando medos e receios em relação ao próprio programa político. Sem nenhum tipo de pesquisa política, as campanhas serão basicamente construídas às cegas. Como isso é ruim para todo o sistema democrático? Simples: O candidato que mais falar em superstições e crendices que o povo crê, leva o pleito. E o sistema se retroalimenta a cada 4 anos. Mais superstição, mais voto. Mais ressonância de medos, mais membros na seita. E esse é só um aspecto dentre tantos outros.

Não é possível governar (bem) um país, sem censo. O censo é o GPS de um avião no meio de um céu nublado. Do mesmo modo, não é possível fazer uma campanha política, de qualidade, e refleti-la em seu projeto de governo, sem as pesquisas. MAS… Mas… Nesse exato momento, as pesquisas são um GPS que aponta São José dos Campos e do Rio Preto como cidades quase vizinhas. Um pequeno desvio é uma coisa. Um grande desvio não é aceitável. Nem no GPS, nem na pesquisa.

O problemasso é que seres humanos se apaixonam pelas ferramentas que têm. Quando você ama martelos, tudo vira prego. Quando você ama pesquisas e elas estão erradas, não são elas que estão erradas, é o(a) eleitor(a). “Ah, os evangélicos”, “ah, o Bolsonarista mente”, “ah, a periferia não entende sua classe social”… A estupidez da Esquerda pode ser bem parecida (senão idêntica) à da Direita.

Todas as respostas acima estão sendo dadas, aqui e ali, para explicar como o “desgastado Bolsonarismo” deu um cruzado de direita na boca da “Frente Ampla”. O combate não acabou. O segundo assalto vem aí e tudo indica que Lula deve, sim, vencer, se ao menos trouxer para casa o grosso (~70%) dos votos de Tebet e metade dos votos de Ciro, sem perder o que já conseguiu. Mas o susto foi grande.

Enquanto política não é futebol, o clima é mesmo o daquele time de estrelas que vai pra final contra um time azarão, toma um empate aos 90 minutos + acréscimos e acaba tendo que jogar o golden goal com os cavalinhos paraguaios. O time grande entra na prorrogação se sentido pequeno. O time pequeno entra gigante.

Se Lula, o PT, e todos nós – que não votaríamos em Bolsonaro nem que a disputa fosse entre ele e o próprio Satã – não organizarmos as ideias e ESQUECERMOS as pesquisas como ferramenta de aferição da realidade, o risco que todos nós corremos é o de achar que os ~5% a mais de Lula são suficientes e que não há risco de votos virando ao longo dessas 4 semanas até o dia 30. E aí, novamente, vamos culpar a realidade, o eleitorado, as fake news […] por seu “imenso desrespeito” às nossas previsões e modelos.

Esquecer que o eleitor – ao menos o brasileiro – gosta de votar em quem vai ganhar é um erro crasso. O sentimento moral – mesmo que não se comprove tanto nos números – é de que Bolsonaro e quem ele apoiou venceram o primeiro turno. A realidade é menos festiva. Mas a realidade pode não importar para eleitores buscando ficar do lado do time que venceu o primeiro jogo da final.

Voltado a cutucar uma ferida já comentada, a ideia de que as pesquisas não estão acertando porque o Bolsonarista não responde pesquisa, ou responde e mente (por vergonha ou sacanagem) é de todo idiota. Idiota, canalha, imbecíl… Escolha o termo que quiser. É obrigação do pesquisador da área social preparar seu modelo para lidar com a diferença entre o que o ser humano diz e faz – porque isso é basicamente o objeto de estudo das ciências sociais aplicadas. E, para isso, o modelo precisa, por vezes, ser deselegante – como as equações de aerodinâmica – e coletar muitas variáveis, medir o mesmo objeto pelos mais variados ângulos, questionar a mesma coisa de diversas formas diferentes, acarear uma amostra com outra e, no pior cenário, ter a coragem de abraçar o ceticismo e descartar a amostra por inteiro (porque ela não é confiável/está contaminada). A única razão para que isso não ocorra é o ego de quem (CPF ou CNPJ) pesquisa. Se você se apaixona pelo modelo e o modelo está errado e, ainda por cima é inútil, vai ser difícil reconhecer isso; especialmente a segunda parte.

Vai ser preciso reinventar os sistemas de pesquisa eleitoral para o futuro. Não é possível confiar no Zap do Bozo. Não é – mais – possível confiar nas pesquisas tradicionais, igualmente. Mas não dá para fazer política de qualidade só com fé em Deus e sorriso no rosto. Notem o que eu disse: política de qualidade. Política populista, retrógrada, necrófila, claro: esta se faz pelas formas mais abjetas possíveis.

Enquanto os grandes institutos não reformularem seus métodos, não aumentarem as variáveis na equação e não forem absolutamente céticos no descarte de amostras contaminadas, as pesquisas eleitorais serão equiparáveis a astrologia. Pode dar certo, pode dar errado, mas efeito e causa não tem qualquer correlação. Vão acertar aqui e ali, quando o eleitorado quiser que acertem. Vão errar sempre que o eleitorado quiser que errem. E com 44% de Bolsonaristas no grupo dos 79% de eleitores (do universo de 156 milhões de eleitores habilitados) que compareceram às urnas, eu fico muito à vontade para dizer que as pesquisas tradicionais ainda vão errar muito e para sempre.

Por este motivo, daqui por diante – e enquanto não houver publicidade de reformulação do modelo – eu trato pesquisas eleitorais como trato a previsão do meu signo: pode ser divertido de ler e acompanhar, mas é essencialmente falso e ninguém – que preza a ciência – deveria se guiar por aquilo para saber o que fazer da própria vida (ou com o próprio voto).

Material consultado:

All models are wrong – Wikipedia

George E. P. Box – Wikipedia

Why Polls Were Mostly Wrong – Scientific American

Did Biden win by a little or a lot? The answer is … yes. (nbcnews.com)

Fluid mechanics – Wikipedia

No One Can Explain Why Planes Stay in the Air – Scientific American

E = mc² | Equation, Explanation, & Proof | Britannica

Lift Formula (nasa.gov)

aerodynamics-and-aircraft-limits.pdf (aerostudents.com)

Institutos de pesquisa precisarão rever metodologias, diz professor da USP – BBC News Brasil