Em muitas notícias científicas aparece a palavra “sigma”, especialmente na física de partículas, cosmologia e astronomia. Um resultado de “5 sigma” parece poderoso, e frequentemente é. Mas significância estatística não é feitiço. Sigma representa desvios-padrão em relação a uma hipótese, geralmente a hipótese nula. Quanto maior o número de sigma, menor a probabilidade de observar um desvio daquele tamanho apenas por flutuação aleatória, assumindo que o modelo estatístico esteja correto.
Um desvio de 1 sigma é comum. Dois sigma já chama atenção, mas ainda pode surgir por acaso com frequência razoável. Três sigma é interessante, frequentemente tratado como evidência sugestiva. Cinco sigma, padrão famoso na física de partículas para reivindicar descoberta, corresponde a uma probabilidade extremamente pequena de flutuação aleatória sob certas condições. O bóson de Higgs, por exemplo, foi anunciado com significância alta porque dois experimentos independentes observaram sinais compatíveis.
O problema é que sigma só mede uma parte da história. Ele não corrige automaticamente viés instrumental, erro de calibração, escolha inadequada de modelo, múltiplas comparações, seleção retrospectiva de dados ou entusiasmo humano, essa substância experimentalmente abundante e metodologicamente tóxica. Um resultado pode ter alta significância dentro de uma análise mal formulada. Estatística sofisticada em hipótese ruim continua sendo hipótese ruim com decoração.
O efeito de múltiplas comparações é particularmente traiçoeiro. Se você testa milhares de possibilidades, algumas parecerão significativas por acaso. É como jogar dados muitas vezes e se espantar porque uma sequência improvável apareceu. Em grandes levantamentos astronômicos ou genômicos, pesquisadores precisam corrigir esse problema. Sem correção, a literatura vira uma fábrica de “descobertas” que evaporam quando alguém tenta repetir.
Outro ponto é a diferença entre significância estatística e relevância física. Um efeito minúsculo pode ser estatisticamente detectável em uma amostra enorme e ainda assim ser pouco importante. O contrário também ocorre: um efeito grande pode não alcançar significância se a amostra for pequena ou a medição for ruidosa. A pergunta científica não é apenas “o p-valor é pequeno?” ou “quantos sigma?”, mas “o efeito é real, relevante, robusto e interpretável?”.
Na física, sigma costuma estar ligado a modelos bem definidos e grandes controles experimentais. Mesmo assim, anomalias aparecem e desaparecem. A história da ciência está cheia de sinais de 2 ou 3 sigma que seduziram pesquisadores e depois foram embora discretamente, sem sequer pedir desculpas. Isso não é fracasso; é o sistema funcionando. Resultados preliminares geram hipóteses. Descobertas exigem sobrevivência.
Para o leitor, a regra prática é simples: menos de 3 sigma deve ser visto como sugestivo; 3 sigma merece atenção, mas não celebração; 5 sigma é forte, desde que o desenho experimental, os modelos e as verificações sistemáticas sejam sólidos. E mesmo 5 sigma pode precisar de confirmação independente dependendo do contexto. A estatística responde a uma pergunta formal. A ciência precisa responder a uma pergunta sobre o mundo.
Quando uma manchete usa sigma como martelo retórico, pergunte o que foi medido, qual hipótese foi testada, quantos testes foram feitos, se o resultado foi previsto antes da análise e se há replicação independente. Essa pequena sequência de perguntas evita muita confusão. É menos divertido que compartilhar a manchete em pânico, mas infinitamente mais civilizado.
Como usar este guia
Use este texto como ponto de partida para interpretar notícias científicas com mais cautela. A recomendação prática é sempre procurar a fonte primária, verificar o tipo de evidência e separar resultado medido de interpretação editorial.