Sobre a Mega Sena: nós, estatísticos, costumamos dizer que não vale a pena apostar, pois o valor esperado é negativo. Ou então falamos que a probabilidade de ganhar na Mega Sena com uma aposta simples de 6 número é de 1 em 50.063.860, ou seja, aprox 0,000002%, *quase* 0%. +
E uma curiosidade pessoal:
Quando entrei na graduação em Estatística, meu pai, um assíduo apostador na loteria, vibrou: "Agora sim a gente ganha na Mega Sena!"
Tive que jogar um balde de água fria nele: "Então pai, não é bem assim..." 😅
Como escrevi num artigo sobre uma proibição das pesquisas: "O vácuo de informação seria rapidamente preenchido com alternativas de qualidade inferior, como enquetes em redes sociais, estatísticas de ferramentas de busca ou até mesmo cotações em sites de apostas."
Taí um exemplo!
Nas bolsas de apostas, a diferença entre Lula e Bolsonaro diminuiu de forma acentuada. Eles estão quase empatados. A probabilidade de vitória de Lula despencou 18 pontos percentuais em uma semana e a de Bolsonaro subiu no mesmo patamar. Veja gráfico abaixo
Por outro lado, uma coisa que nós não costumamos dizer é que a probabilidade de ganhar na Mega Sena se vc NÃO apostar é de *exatamente* 0%. A não ser, é claro, que vc encontre de alguma forma um bilhete premiado por aí
#CromwellsRule
😉
Números enviados pelos Estados ao Ministério da Justiça, no âmbito do SINESP, mostram que tivemos o menor número de crimes violentos letais intencionais (CVLI) dos últimos 14 anos. Meus cumprimentos aos profissionais da Segurança Pública do Brasil. E que venham novas conquistas…
Pessoal, a falta de um Censo atual NÃO é um problema para as pesquisas eleitorais. Temos dados de alta qualidade (até mesmo de maior qualidade que o Censo num nível nacional e estadual) por meio da PNAD Contínua, que é mais que o suficiente para o controle e ajustes da amostra.
@rosana
Me desculpe, longe de mim de ficar problematizando tweet alheio, mas só sou eu ou isso aqui está mais parecendo uma lista de exemplos de privilégio branco? 😳
@ancapchequei
Não sei se falta interpretação de texto ou boa vontade das pessoas, mas, independente do que vc ache dela ou dessa previsão, o que ela disse é que a menos que não se faça nada nos próximos 5 anos, será tarde demais para reverter as consequências (futuras) das mudanças climáticas.
Para quem não conseguiu ler, segue abaixo meu artigo no O Globo desse final de semana.
A ideia do artigo é discutir a noção de erros (estatísticos) em pesquisas eleitorais utilizando conceitos do paradigma de Erro Total de Pesquisa (Total Survey Error, em inglês).
(1/4)
Para quem está esperando/cobrando respostas ou justificativas dos institutos de pesquisas, vou colocar aqui dois casos de pesquisas pré-eleitorais nos EUA para ajudar a colocar em perspectiva sobre quando e o que esperar disso, e o que pode ser feito no Brasil nesse sentido. 🧶+
Finalmente eu tenho a resposta para a pergunta que vem me assombrando há anos morando nos EUA! Pela definição do governo federal, brasileiros não são considerados latinos. +
NEW: In Census Bureau surveys, Brazilians in the U.S. are not considered Latino due to the federal government’s definition of the term. But a coding error in a recent bureau survey provided insight into how many Brazilians identify that way. 1/4
@tesoureiros
Valeu galera! Isso já faz um tempo, da época em que ele ficava disseminando a narrativa do antifa ponto com. Ele mesmo percebeu isso há dois meses, mas demorou um tempinho pra ele notar... 😅
Peguei todas pesquisas estaduais realizadas pelo IPEC entre 19 de agosto a 1 de setembro e combinei em uma estimativa nacional. Os resultados ficaram praticamente iguais ao da pesquisa nacional do mesmo instituto, mas com um nível de precisão bem maior. 👇
📊Câmara aprova urgência para projeto que pune institutos de pesquisas, mas relator descarta prisão:
Bolsonaristas querem votar mérito do texto antes do segundo turno das eleições, mas parte da base diverge.
@FlavioCadegiani
Como cientista da área de amostragem, metodologia de pesquisa e estatística posso afirmar que não só o que o senhor afirma não é verdade, como vários dos seus pontos estão equívocados. Vou colocar alguns contra-pontos em cada um deles.
Finalmente teremos no Brasil uma pesquisa pré-eleitoral sendo publicada aplicando um likely voter model mais robusto no estilo do que é feito nos EUA. Vale a pena conferir! 👇
1/ Nesta quinta (13/10) sai pesquisa Genial/Quaest para o 2º turno! O relatório completo será divulgado às 14h. Atenção para (1) os resultados brutos de intenção de voto e (2) os resultados de intenção de voto ponderados pelo modelo de likely voter desenvolvido pela Quaest.
Acabei de ver nesse site alguém dizendo que o matemático Paulo Boulos é tio do Guilherme Boulos e que ele fez fortuna com o livro de Geometria Analítica 🤣🤣🤣
Não sei quanto ao parentesco, mas ninguém, em nenhum lugar no mundo, faz fortuna com livro de matemática...
@ArthurLira_
Caro presidente Lira,
Antes de votar medidas legais em uma área tão técnica como essa, sugiro que busque se informar com especialistas da área, como estatísticos e metodologistas, sobre os métodos empregados em pesquisas e suas limitações. Fico à disposição caso tenha interesse.
Sabe aquela história que as pesquisas sempre "erram"* para o lado da esquerda? Já há algum tempo eu venho perguntando se alguém fez uma meta-análise para confirmar ou não isso. Eis que o Victor Araújo realizou tal análise com dados de 2002 a 2018:
Pedro ou Denise Britz, dois dos mais respeitados pesquisadores pela comunidade estatística no mundo e com vasta experiência e conhecimento do IBGE e de estatísticas oficiais, deveriam ser no mínimo considerados para nomeação a presidência do IBGE. +
Seria melhor ter um Censo atual, principalmente para dados a níveis geográficos menores? Claro! Mas isso não torna as estimativas de pesquisas amostrais substancialmente melhores do que já são com os dados da PNADc.
Ao contrário do que muita gente pensa, desenho de questionário em surveys é tão complexo quanto amostragem; não dá pra ficar fazendo elaboração de questionário free-style ou crowdsourcing. +
O conceito de "amostra representativa" ou "representatividade" não é bem definido na literatura técnica de amostragem. Existem certos problemas com esse tipo de conceito, bem ilustrado por Alan Stuart com o "paradoxo central da amostragem" em seu livro "The ideas of sampling":+
Mesmo nas etapas que envolvem o uso dos dados do Censo, como o uso de medidas de tamanho estimado na seleção de municipios e setores censitários por meio da técnica de seleção com probabilidade proporcional ao tamanho, essa não é uma questão tão relevante.
@gen_heleno
Caro general Heleno, como estatístico, especialista em amostragem, recomendo o senhor atualizar seus conhecimentos na área. Recomendo esse excelente livro escrito por pesquisadores da ENCE/IBGE e disponível gratuitamente em português:
Esse gráfico da matéria do FT circulou bastante por aqui (eu mesmo compartilhei).
Algumas pessoas resolveram verificar se esses resultados se replicavam em dados de outros estudos americanos.
Por enquanto a resposta é não (pelo menos não na mesma magnitude). Alguns deles seguem👇
Minha humilde sugestão é que empresas de pesquisas, associações de empresas e profissionais da área, e acadêmicos conduzam uma avaliação semelhante a essas e tragam a público os resultados desse trabalho.
\TheEnd
Se a margem de erro amostral é maior que 1%, não faz muito sentido publicar a estimativa com casas decimais (a não ser que seja necessário para se distinguir uma diferença para além da margem de erro). Isso dá a impressão que a precisão da estimativa é maior do que realmente é.
O Marcelo está fazendo um excelente trabalho em apresentar de forma simples e visual o quão sem fundamento é esse argumento que está sendo levantado por aí sobre as diferenças de votos em diferentes modelos de urna 👇
Distribuição das UE2020 em cada um dos mais de 90 mil locais de votação, claramente não é aleatório nem homogêneo.
Mapa interativo aqui, da pra dar zoom e colocar o mouse em cima mostra a distribuição de modelos.
Durante as três últimas semanas de setembro, embarquei numa campanha de procurar esclarecer que:
Pesquisas pré-eleitorais não são e nem devem ser usadas como prognóstico para resultados eleitorais.
Segue um sumário desse esforço até agora: +
#Eleicoes2022
Não sei se o pessoal se lembra ainda, mas tinha gente ano passado comparando pesquisa eleitoral com enquete de site. E alguns ainda achavam que essas enquetes eram melhores por causa do número de respostas...
@revistaoeste
@Rconstantino
Poderia, por favor, passar o contato? Estamos precisamos realizar uma faxina aqui em casa e fiquei sabendo que esse time é o melhor em passar pano para governo populista de extrema direita. Grato!
@Jose2junior
@folha
"A pesquisa ouviu 2.074 pessoas nos dias 7 e 8 de julho em 146 cidades brasileiras. Foram entrevistadas pessoas acima de 16 anos. A margem de erro é de dois pontos para mais ou para menos."
Uma forma de fake news é utilizar dados antigos quando existem outros dados mais recentes, inclusive da mesma fonte, que atualizam as conclusões dos anteriores. Eis aqui um exemplo:
Olha a não-resposta não-ignorável aparecendo mais uma vez na imprensa mainstream! 🤩
E quem está levantando essa hipótese agora é o
@CliffAYoung
, um dos maiores especialistas em pesquisas de opinião pública e eleitoral do mundo.
Obrigado a todos que atenderam ou assistiram ao seminário que dei ontem no IME-USP sobre erros em pesquisas eleitorais.
Para quem não pode assistir, o vídeo está disponível em
@FCoreili
@CentralEleicoes
Pelo contrário, ao incluir um modelo de likely voter, consegue se obter uma leitura mais fidedigna do eleitorado considerando-se sua potencial abstenção. É esse tipo de avanço metodológico que precisamos nas pesquisas pré-eleitorais no Brasil.
Passei a última hora falando sobre erro amostral no meu curso de Sampling I com um pessoal muito bom lá da Austrália, só para entrar nesse site e ver gente discutindo como uma flutuação amostral é indicador de alguma coisa...
Amigos amostristas: estamos perdendo essa batalha 😭
🇧🇷 ELEIÇÕES 2024: PREFEITURA DE SÃO PAULO
*Não estava na pesquisa de dezembro
🟣 Guilherme Boulos (PSOL): 33,0% (+1,9)
🟢 Ricardo Nunes (MDB): 32,0% (+6,6)
🟡 Tabata Amaral (PSB): 9,7% (+0,8)
🔵 Kim Kataguiri (UB): 5,2% (-0,2)
🟠 Marina Helena (NOVO): 3,3% (+0,2)
🟢 Padre Kelmon…
@RenanSantosMBL
O que vocês estão fazendo é disseminando pânico moral baseado na teoria de conspiração sobre aliciamento de menores por pessoas LGBTs promovida pela extrema-direita americana.
Ótima ilustração do potencial impacto de outras fontes de erros não-amostrais na margem de erro de uma pesquisa.
No entanto, em geral, essas outras fontes de erro tendem a contribuir mais ao viés do que a variabilidade das estimativas, que é o que a margem de erro mensura.
@kareem_carr
From survey statistics/methods and not a mathematical visualization, but this chart perfectly depicts the Total Survey Error framework we use in the field illustrating the various sources or error that inflict survey estimates (from Groves et al 2009, Survey Methodology textbook)
Dentre as coisas que vi sobre pesquisa eleitoral ano passado, essa certamente foi uma das mais estranhas: A Jovem Pan fazendo uma enquete pra perguntar para sua audiência se eles acreditam em pesquisa eleitoral... 🤦
Para quem tiver interesse em entender um pouco mais sobre pesquisas de opinião pública, aqui está um mini-curso, inteiramente gratuito, elaborado por um dos maiores especialistas (e mais simpáticos) da área, Scott Keeter do Pew Research Center 👇
Why do we have opinion polls? How do they work? And how can you tell a good one from a bad one? Our short course authored by
@pollcat
covers these questions and more.
Sobre a Mega Sena: nós, estatísticos, costumamos dizer que não vale a pena apostar, pois o valor esperado é negativo. Ou então falamos que a probabilidade de ganhar na Mega Sena com uma aposta simples de 6 número é de 1 em 50.063.860, ou seja, aprox 0,000002%, *quase* 0%. +
Vou traduzir livremente aqui essa frase da Ariel que eu gosto muito, porque eu acho que tem muita gente que precisa ouvir isso nesse momento:
"Pesquisas são só 100% inúteis se você espera que elas sejam 100% precisas"
O conceito de coeficiente de confiança em estatística é bastante contra-intuitivo, até mesmo para estatísticos algumas vezes. Ele se refere a probabilidade de um intervalo de confiança, sob repetidas realizações do processo de amostragem, conter o parâmetro populacional. +
O
@jcaetanoleite
levanta um ótimo ponto aqui que não é muito bem explicado pelos institutos. Então vamos falar um pouco sobre essa tal "margem de erro amostral máxima" reportada nas pesquisas: 🧵
Tebet. Isto não é exatamente verdade, as margens de erros dos candidatos não são iguais, por mais que os jornalistas vendam como 2 a mais e 2 a menos. É uma questão estatística, a construção da pesquisa de intenção de votos exige que se considere os erros amostrais.
Coitado do Likert, já é a segunda vez em menos de um mês que ele se revira no túmulo com uma escala desse tipo.
Mês passado foi o Datafolha, dessa vez foi o Ipec...
O Ipec divulgou um levantamento sobre a orientação política dos brasileiros. Em uma escala de 0 a 10, 11% disseram ser totalmente de esquerda, e 24%, totalmente de direita. Veja.
➡ Assista ao
#Est
údioi:
#GloboNews
Mais um dia no Brasil e essa frase de Samuel Wilks, parafraseado HG Wells, mostra-se ser mais verdadeira como nunca:
"Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write!"
Sobre a diferença nos resultados do IPEC e da Quaest 👇
Eu repliquei essa mesma análise, tanto com dados do IPEC como o
@LavaredaAntonio
fez, quanto com dados da Quaest, e cheguei na mesma conclusão dele. Segue mais detalhes e observações sobre isso:
1) Muita gente me perguntando o que explicaria diferença entre a Quaest, de hoje (14/9), e o Ipec dessa 2ª feira (12/9). O relatório completo do Ipec infelizmente ainda não foi divulgado,... siga o 🧶
Pesquisas pré-eleitorais não são e nem devem ser usadas como prognóstico para resultados eleitorais.
Por isso mesmo, a justificativa de projetos de lei como esse abaixo não faz o menor sentido. Segue o 🧶
#Elei
ções2022
@CentralEleicoes
Obrigado por compartilhar,
@CentralEleicoes
!
Só um esclarecimento com base nos comentários aqui: essa análise não permite concluir que, no período de coleta dessas pesquisas, Lula venceria no 1° turno.
@Capyvara
Nem sei o que é mais triste:
"Estávamos confiantes pelo volume de cartelas"
Ou
"Vamos fazer de novo, não vamos desistir não, persistir sempre”
@Rodrigo_Romani_
Boa questão! Sim, é possível fazer apostas com todas as combinações de forma a ter certeza que irá acertar a sena. Dito isso, é preciso se considerar alguns pontos:
1) Vc precisa ter essa quantidade inicial de dinheiro para fazer todas essas apostas.
+
Daqui a uma semana, muitos estarão começando a comparar as pesquisas realizadas nas vésperas das
#Eleicoes2022
com os resultados eleitorais. Por isso é importante lembrar:
Pesquisas pré-eleitorais não são e nem devem ser usadas como prognóstico para resultados eleitorais.
🧶
@viniciussexto
É possível desmentir todos esses casos com uma simples constantação: Pesquisas pré-eleitorais são um retrato do momento do período de sua coleta e não prognósticos dos resultados das eleições.
@MarceloCRedeTV
@LRobertoBarroso
Poxa
@MarceloCRedeTV
, pelo menos tenha mais honestidade intelectual e coloque os resultados das pesquisas sobre 2° turno realizadas depois do 1° turno. Ou o senhor acha que nada muda no cenário eleitoral depois do 1° turno?
A partir de uma mesma base de dados de pesquisa eleitoral, você esperaria que diferentes estatísticos ou analistas de dados chegariam a exatamente as mesmas estimativas, certo? Pense de novo! Em 2016, o The Upshot, do NYT fez um dos experimentos mais interessantes nesse sentido🧶
Se você fosse preencher um formulário nos EUA, você se classificaria como "latino/a"?
Para o governo americano, se você for brasileiro, não deveria dizer isso... Entenda esta definição neste
#EstudioBBC
com
@tcarran
@ptlcskltn
Verdade! E uma outra pessoa aqui tb apontou que no caso da Mega Sena da virada não acumula, então se não houver um acertador da sena, o prêmio vai para quem acertar a quina e assim por diante.
The Costco hot dog combo is a legendary meme.
But how does it still only cost $1.50? Introduced in 1985, the price of that combo should be ~$4.20 if adjusted for inflation.
Thankfully, the $216B warehouse retailer has done everything in its power to keep the price down.
And…
Isso é um absurdo sem tamanho. Quem propõe medidas como essas não deve entender muito bem questões técnicas envolvendo pesquisas de opinião pública.
Como já sugeri ao presidente da Câmara por aqui, eles deveriam primeiramente buscar se informar com especialistas da área.
Voltando a nossa programação diária, bem simples e direto hoje:
Pesquisas pré-eleitorais não são e nem devem ser usadas como prognóstico para resultados eleitorais.
@admcrlsn
I totally agree, it shouldn't be difficult to understand that.
I just wanted to point out, in case you don't know, that this Visegràd 24 account is quite shady, with some pretty far-right positions. I would avoid amplifying them.
Achei bastante interessante a inclusão dessa tabela nos relatórios das pesquisas eleitorais do IPEC para denotar o impacto do tamanho amostral, principalmente de subgrupos, na margem de erro amostral máxima. Vamos a algumas observações sobre isso: 🧵
Dado as taxas de abstenção nas eleições brasileiras, já venho levantando há algum tempo uma possível necessidade dos institutos de pesquisa em adotar um "likely voter model", nos moldes como é feito nos EUA, conforme comentei nessa entrevista para O Globo em julho desse ano: +
Com esse nível de conhecimento estatístico, ainda bem que o general Heleno não era responsável pelas análises estatística da Marinha americana durante a 2a Guerra Mundial!
Pesquisas com 2000 entrevistados (qdo temos mais de 156 milhões de eleitores); com 200 municípios visitados (em um total de mais de 5.600), não podiam ser publicadas. São um deboche à inteligência e quase certo que estão a serviço de algo ou de alguém. Só causam desconfiança!
Isso daqui é de um absurdo sem tamanho! E o pior é que até mesmo recenseadores do
#Censo2022
têm sido hostilizados. O trabalho dos entrevistadores e recenseadores é muito difícil e eu tenho o maior apreço por eles. Graças a eles temos os importantes dados sobre a população.
⚠️GRAVE: Equipes do Datafolha são alvo de hostilidade crescente ao fazer pesquisa eleitoral
Apenas nesta terça-feira (13), houve DEZ intercorrências com pesquisadores em diferentes regiões do país.