Jogo pesado: Datafolha frauda pesquisa

(recebido por e-mail)

O Datafolha, ao registrar sua pesquisa no TSE, declarou:

Plano Amostral:

“… Os dados utilizados para definição e seleção da amostra são baseados no IBGE (censo 2000 e estimativas 2009)…”

Ao observamos o primeiro gráfico abaixo vemos que não houve fraude na pesquisa de fevereiro, pois a seleção da amostra corresponde aos dados do IBGE.

Para quem não gosta de matemática e gráficos, basta observar no desenho, que o tamanho das barras amarelas são praticamente iguais ao tamanho das barras marrons em todas as regiões, no primeiro gráfico.

Já no segundo gráfico (pesquisa de março), houve fraude no plano amostral do Datafolha, como se pode notar no tamanho das barras marrons e amarelas bem diferentes.

O Instituto continuou declarando à justiça eleitoral que o plano amostral era baseado no IBGE, porém só as barras amarelas permanecem na mesma proporção que tinham em fevereiro (pois os dados do eleitorado do IBGE não mudam de proporção em um mês), mas as barras marrons do Datafolha não acompanharam:

Foram “esticadas” no Sudeste, onde está São Paulo, e José Serra tem índices mais altos.

Foram “encurtadas” nas demais regiões, onde Dilma tem índices mais altos.

O efeito disso nos números finais da pesquisa só abrindo a caixa-preta do Datafolha para saber. Por hora, os fato é que o Instituto abandonou a amostragem no padrão do IBGE logo após Dilma encostar em Serra, quando a diferença entre ambos apontava apenas 4%, e apresentou uma declaração falsa ao TSE ao registrar a pesquisa. Além disso manipulou a composição da amostragem desviando importância para cidades do Estado de São Paulo e para  bairros da capital paulista.

Leia também:

Comprovada fraude no Datafolha: plano amostral apresentado ao TSE foi fraudado

Exclusivo: FRAUDE no DATAFOLHA

Situação do Datafolha piora: “anabolizou” também amostras com cidades do interior de São Paulo

Situação do Datafolha piora mais ainda: reduziu entrevistas no Nordeste e aumentou em São Paulo, turbinando José Serra

Como o Datafolha manipulou as amostras para aumentar o número de Cidades pesquisadas no Estado de São Paulo

Como o Datafolha manipulou as amostras para aumentar o número de bairros pesquisados em São Paulo

8 comments / Add your comment below

  1. Importante lembrar que a pesquisa Sensus que dava empate técnico de 32% para Serra e Dilma, divulgada semana passada não aparecia o nome da empresa responsável pelo registro no TSE. Depois é que apareceu um sindicato de trabalhadores — ligado a CUT — o SINTRAPAV, como responsável.

    O PT no RS sempre questionou as pesquisas, até o momento em que elas erraram a favor do PT. Lembro que nas eleições para prefeito em 2004, a pesquisa UFRGS-RBS indicava vitória dos candidatos do PT em Pelotas, Caxias e Canoas e empate técnico em Porto Alegre. Na hora de aberta as urnas, todos os candidatos do PT perderam.

  2. O que vale, no fim, não é a correspondência absoluta entre amostra e população, e sim a ponderação final dos dados. Pelo gráfico, dá para inferir que a cada indivíduo pesquisado no SE foi dado um peso menor do que aos entrevistados no NE. Se tomarmos como verdade que no NE a população é majoritariamente favorável à Dilma, essa ponderação pode até tê-la ajudado, pois, com um número menor de entrevistados representando o mesmo universo (em relação à pesquisa anterior), a chance de aparecerem correntes minoritárias (serristas, no caso) diminui.

    O mais impressionante nessa corrente de e-mails nem é a falta de conhecimento básico de pesquisas, já que a área é cheia de tecnicidades e complicações estatísticas. É, sim, a ingenuidade de achar que, entre todas as formas possíveis de se fraudar uma pesquisa de opinião, o Datafolha, um instituto experiente e com técnicos competentes, teria escolhido aquela mais óbvia e rudimentar. Acreditem: se o objetivo é utilizar-se de trapaças para eleger o homem mais poderoso do país, as forças políticas (de esquerda ou de direita) não vão se utilizar de truques elementares que podem ser desmacarados em cinco minitos com um gráfico do Excel. O buraco é mais embaixo.

    1. Está na lei, os métodos das pesquisas devem ser muito bem detalhados, de acordo com os dados do IBGE. Sinceramente, acho que o Datafolha não faria algo tão óbvio, como afirmado no post. Pode estar havendo uma fraude na interpretação dos dados do Datafolha.

  3. E a pesquisa “quantos leitores deste blog vão aguentar, até as eleições, este assunto de Dilma e Serra?”, não vai fazer?

    cadê as crônicas humorísticas? as besteiras criativas? as levezas da alma que às vezes vimos até aqui para distraírmos um pouco? os debates literários? as discussões sobre assuntos sérios REALMENTE sérios aobre o país e o mundo?

    se essa perspectiva continuar, esse ano vai ser só Dilma e Copa do mundo. Daí, meus amigos, me desculpem, mas vou cancelar a assinatura da net.

Deixe uma resposta