Viés de não-resposta e amostras não-aleatórias: quais seus problemas?

Introdução

A aleatorização da amostra é essencial para qualquer pesquisa estatística de qualidade. Mas um aluno mais astuto talvez possa vir a questionar a necessidade desse processo lento e custoso invocando coisas como as Leis dos Grandes Números e o Teorema Central do Limite.

Esse aluno estaria correto? Poderíamos dispensar a randomização uma vez que N tendesse ao infinito? Vamos no presente texto mostrar o porque isso não se segue usando o exemplo mais clássico de previsão errada na história de pesquisas eleitorais, a da eleição da presidência americana em 1936 feita pela Digest.

Antes de propriamente adentrarmos no texto precisamos contextualizar o cenário de nossa análise. Tal constitui-se na eleição presidencial de 1936 entre o até então presidente em exercício, Franklin D. Roosevelt, contra Alfred Landon, o desafiante republicano que na época era governador do Kansas. Roosevelt já havia ganhado a eleição prévia com uma porcentagem considerável tanto no colégio eleitoral quanto no voto popular, com uma porcentagem de 57,4% de Roosevelt contra 39,6% de Hoover, muito como consequência da percebida inação de Herbert Hoover à Grande Depressão.

Entretanto, o avanço de políticas contracíclicas fiscais, denominadas de New Deal, acarretaram uma reação negativa do público republicano. Essa reação possivelmente indicava uma certa turbulência com relação à percepção de Roosevelt na presidência, algo que seria corroborado aos leitores da revista The Literary Digest.

A revista Digest foi uma influente revista semanal de interesse geral americana fundada por Isaac Kaufmann Funk em 1890. A partir de 1916, ela realizou uma pesquisa sobre o provável resultado da eleição presidencial quadrienal, tendo um histórico de acerto em relação às suas estimativas até o fatídico ano de 1936.

A pesquisa realizada nesse ano foi atípica, devido a um conjunto de fatores. Dentre eles, temos que a revista entrevistou dez milhões de pessoas, sendo que desse total 2,27 milhões responderam, um total astronômico para qualquer pesquisa de opinião, uma vez que o padrão hoje em dia nas pesquisas americanas é uma amostra de 1500 a 2000 pessoas. A revista pesquisou primeiro seus próprios leitores (um grupo com renda disponível bem acima da média nacional da época) e as pessoas presentes em duas outras listas prontamente disponíveis, as de proprietários de automóveis registrados e as de usuários de telefones (ambas contendo pessoas também mais ricas do que o americano médio na época).

Outro fator anômalo do ano é o desastroso resultado da pesquisa, a despeito da sua amostra gigantesca. A conclusão da Digest, depois de todas as análises estatísticas e descritivas, foi de que o candidato republicano provavelmente seria o vencedor esmagador contra o então presidente Roosevelt. Porém, em novembro, Roosevelt venceu a eleição com uma vitória esmagadora sem precedentes, vencendo todos os estados (exceto Maine e Vermont) e tendo vencido o voto popular agregado com uma diferença de mais de 24 pontos percentuais em relação a Landon. A magnitude do erro da revista destruiu sua credibilidade e ela fechou 18 meses após a eleição.

Mas por que isso aconteceu?

Viés de não-resposta e amostragens não-aleatórias

Como o título da seção já adianta, há dois erros presentes na amostragem da pesquisa: o viés de não-resposta e amostragens não-aleatórias. Ambos estão relacionadas na forma como os dados foram coletados, ilustrando o fato de que independentemente da amostra ser dez, cem ou mil vezes maior que o número de participantes de uma amostra padrão, isso não é suficiente para resolver o problema se a amostra foi coletada de forma não-aleatória e se houver um grande viés de não-resposta.

Para prosseguir, é preciso entender o que é uma amostra aleatória.

Amostra aleatória

Primeiramente, algumas definições:

  • População é o conjunto de todos os elementos ou resultados sob investigação;
  • Amostra é qualquer subconjunto da população.

Exemplo retirado de Morettin & Bussab (2017, p. 262-263): consideremos uma pesquisa para estudar os salários dos 500 funcionários da Companhia MB. Seleciona-se uma amostra de 36 indivíduos, e anotam-se os seus salários. A variável aleatória a ser observada é “salário”. A população é formada pelos 500 funcionários da companhia. A amostra é constituída pelos 36 indivíduos selecionados. Na realidade, estamos interessados nos salários, portanto, para sermos mais precisos, devemos considerar como a população os 500 salários correspondentes aos 500 funcionários. Consequentemente, a amostra será formada pelos 36 salários dos indivíduos selecionados. Podemos estudar a distribuição dos salários na amostra, e esperamos que esta reflita a distribuição de todos os salários, desde que a amostra tenha sido escolhida com cuidado.

Seguindo de perto novamente Morettin & Bussab (2017, p. 267-268), a estatística nos mostra que a maneira de se obter a amostra é extremamente importante, e há muitos modos de fazê-lo, mas poderíamos simplesmente dividir os procedimentos científicos de obtenção de dados amostrais em três grandes grupos:

  1. Levantamentos amostrais, nos quais a amostra é obtida de uma população bem definida, por meio de processos bem protocolados e controlados pelo pesquisador.
  2. Planejamento de experimentos, cujo principal objetivo é o de analisar o efeito de uma variável sobre outra. Requer, portanto, interferências do pesquisador sobre o ambiente em estudo (população), bem como o controle de fatores externos, com o intuito de medir o efeito desejado.
  3. Levantamentos observacionais, nos quais os dados são coletados sem que o pesquisador tenha controle sobre as informações obtidas, exceto eventualmente sobre possíveis erros grosseiros.

Tendo isso em vista, uma amostragem aleatória (simples) é uma maneira para selecionarmos uma amostra probabilística de uma população na qual, utilizando-se um procedimento aleatório, sorteia-se um elemento da população, sendo que todos os elementos têm a mesma probabilidade de serem selecionados. Repete-se o procedimento até que sejam sorteadas as N unidades da amostra (Morettin & Bussab, 2017, p. 269). É digno de nota que a amostragem aleatória é diferente de uma variável aleatória. Sendo que uma variável aleatória é aquela que assume valores numéricos e tem um resultado que é determinado por um experimento, sendo este por sua vez qualquer procedimento que pode, pelo menos em teoria, ser repetido infinitamente e tem um conjunto bem definido de resultados.

Dizem Morettin & Bussab (2017, p. 264): “o objetivo da Inferência Estatística é produzir afirmações sobre dada característica da população, na qual estamos interessados, a partir de informações colhidas de uma parte dessa população. Essa característica na população pode ser representada por uma variável aleatória. Se tivéssemos informação completa sobre a função de probabilidade, no caso discreto, ou sobre a função densidade de probabilidade, no caso contínuo, da variável em questão, não teríamos necessidade de escolher uma amostra. Toda a informação desejada seria obtida por meio da distribuição da variável.

Ou seja, uma amostragem não aleatória simplesmente indica que há maior probabilidade de selecionar um determinado grupo de indivíduos que outros. O problema dessa seleção é justamente o fato dela enviesar a inferência. Para ser mais preciso, com amostragem não aleatória, não há garantia teórica de convergência ao resultado correto. Para entender isso é preciso saber que, pela Lei Forte dos Grandes Números, a proporção amostral converge quase certamente para a proporção populacional (em particular, a probabilidade empírica converge para a probabilidade teórica) à medida que N aumenta. Então existe uma justificativa teórica para o uso de amostras aleatórias.

Dito isso, vamos às duas situações em que não houve uso de amostra aleatória:

  1. Usa-se uma amostra não probabilística: se a amostra é não probabilística, então sequer faz sentido falar que, quando tende ao infinito, ela converge em probabilidade (ou quase certamente, etc.) para algum valor ou distribuição;
  2. Usa-se uma amostra probabilística diferente da distribuição-alvo: como a distribuição da amostra é diferente da distribuição-alvo, não há garantia de que a proporção amostral está convergindo aos valores da população-alvo.

A partir desses erros, embora não há como argumentar que o resultado necessariamente vai ser errado, tudo que conseguimos apontar é que, ao contrário da amostra aleatória, a amostra não aleatória não possui nenhuma garantia teórica de que ela leva ao resultado certo, gerando apenas um estimador não consistente e enviesado.

Esse problema aparece na pesquisa da revista pelo fato de que as fontes de amostras não são aleatórias. Os leitores da revista Digest, como pontuado acima, tinham uma renda média maior do que a da população americana. O mesmo valia para as pessoas com carros e telefones na década de 30. Portanto, dado que a revista estava analisando um estrato mais rico da população, naturalmente certas características estavam sendo privilegiadas, de modo a enviesar a amostra.

Por exemplo, de acordo com o estudo de Powdthavee & Oswald (2014), pessoas mais ricas tendem a ter crenças políticas mais à direita. No estudo, os pesquisadores analisaram as posições políticas de indivíduos ao longo do tempo, dos quais alguns tiveram a sorte de ganhar na loteria. Descobriu-se que quanto maior é o ganho na loteria, maior é a tendência subsequente da pessoa, depois de se controlar por outras influências, mudar suas opiniões políticas da esquerda para a direita. (Para um resumo do estudo leia aqui).

Consequentemente, é de se esperar que, na amostra selecionada pela revista Digest (uma amostra composta por indivíduos mais ricos que a média da população), posições mais republicanas (à direita) foram privilegiadas.

A visão acima ficou consagrada na literatura para explicar o motivo do erro grotesco da revista. Entretanto, segundo Lusinchi (2012), evidências mostram que essa “explicação convencional” está errada (ou incompleta), porque os eleitores com telefones ou carros apoiaram mais, em média, Franklin D. Roosevelt.

Portanto, deve haver alguma outra explicação para o erro da revista. Vamos entender qual seria esse erro.

O viés de não-resposta

Como o nome sugere, o viés de não-resposta acontece quando os indivíduos que não querem ou não podem participar de um estudo de pesquisa possuem características diferentes daqueles que o fazem. Mais especificamente, ele ocorre quando respondentes e não-respondentes diferem categoricamente de maneiras que impactam a pesquisa. Portanto, a ausência de respostas gera uma amostra não-aleatória e consequentemente não-representativa. Como consequência, o estimador difere do parâmetro verdadeiro que se buscava estimar.

Note que o problema não é a não-resposta em si, mas o fato dos indivíduos que responderam e não responderam diferirem entre si em características relevantes para o que se busca estudar. Foi justamente esse problema que primordialmente afetou a pesquisa eleitoral feita em 1936, de acordo com Lusinchi (2012). A partir da análise das preferências de voto dos indivíduos que responderam e não responderam a pesquisa da Digest, o autor chegou às seguinte conclusões:

  1. Se todos na lista original da Digest tivessem respondido a pesquisa, a revista estaria em posição de prever o vencedor correto da eleição: Roosevelt.
  2. Os que responderam e os que não responderam a pesquisa da Digest favoreceram candidatos opostos: enquanto 3/5 dos que não responderam votaram em Roosevelt, apenas 2/5 dos que responderam o fizeram;
  3. Os apoiadores de Landon eram muito mais propensos a responder a pesquisa da Digest do que os de Roosevelt: quase 1/3 contra apenas 1/5.
  4. Portanto, a maior parte do erro de previsão feito pela revista pode ser atribuída ao viés de não-resposta.

Conclusão

Em suma, uma amostra grande não é um remédio para a ausência de aleatorização. Entretanto, vale notar que uma amostra aleatória pequena também é sujeita a problemas. Para uma estimação consistente e não-viesada é necessário possuir uma amostra de tamanho adequado, para que, pela Lei Forte dos Grandes Números, possa-se obter as propriedades desejáveis de um estimador (consistência e ausência de viés).

Para saber mais sobre como encontrar o tamanho mínimo adequado para uma amostra leia aqui. Também recomendo o já citado Morettin & Bussab (2017).

Referências

Lusinchi, Dominic. “’President’ Landon and the 1936 Literary Digest Poll: Were Automobile and Telephone Owners to Blame?”. Social Science History 36.1 (2012): 23–54.

Morettin, Pedro A.; Bussab, Wilton O. Estatística Básica. Saraiva Educação SA, 2017.

Powdthavee, Nattavudh; Oswald, Andrew J. “Does Money Make People Right-Wing and Inegalitarian? A Longitudinal Study of Lottery Winners”. 2014.

.

Publicado originalmente aqui.

Leia também:
O Paradoxo de Simpson
A Curva de Kuznets
Como raciocinar corretamente sobre a incerteza do futuro
Como o direito afeta o desenvolvimento econômico?

Deixe um comentário

Seu endereço de e-mail não ficará público