Como a Bomba Atômica Nos Ajuda a Achar Aviões Perdidos

 

Da roleta de Los Alamos às profundezas do Oceano Índico, a história improvável de como simular o caos virou uma das melhores ferramentas de busca do mundo.

Introdução

É 1945 e no deserto do Novo México, os físicos que acabaram de construir a arma mais destrutiva da história estão com uma quantidade absurda de tempo livre entre um teste e outro. Em especial, Stanislaw Ulam está se recuperando de sua cirurgia jogando paciência sozinho e percebe algo que vai mudar para sempre a forma como resolvemos problemas, desde física nuclear até procurar destroços no fundo do mar.

A Febre, a Paciência e a Roleta de Las Vegas

Ulam, com febre alta e medo de danos permanentes, dada a sua cirurgia na cabeça,  estava tentando calcular as chances de ganhar no Canfield Solitaire, uma versão de paciência com probabilidade de vitória muito baixa. O problema parecia simples: dado um baralho embaralhado aleatoriamente, qual a probabilidade de completar o jogo? Matematicamente, calcular isso com precisão exigiria enumerar um número astronómico de combinações possíveis. Era inviável na prática.

A solução que Ulam teve foi: em vez de calcular, simule. Jogue a paciência cem vezes, mil vezes,dez mil vezes com baralhos diferentes. Conte quantas você venceu. Dívida pelo total. Pronto, você tem uma estimativa excelente da probabilidade real, sem precisar de nenhuma fórmula fechada. Estatisticamente, sabemos que quanto mais simulações, melhor a estimativa: essa é a Lei dos Grandes Números.

Ulam contou a John von Neumann, que ficou entusiasmado. Os dois logo perceberam que a mesma ideia poderia ser usada para resolver problemas muito mais sérios, como calcular o comportamento dos nêutrons em uma bomba de fissão nuclear. O comportamento de um único nêutron é aleatório e caótico, mas o comportamento médio de bilhões deles determina se a reação em cadeia acontece ou se implode. Simule nêutrons suficientes e você entende a bomba.

Para nomear o método, Nicholas Metropolis sugeriu a homenagem ao famoso cassino de Monte Carlo, em Mônaco, onde roletas, dados e cartas criam distribuições estatísticas a partir do acaso puro.

 

O Método de Monte Carlo: Simular o Mundo para Entendê-lo

A ideia formal do Método de Monte Carlo é usar amostragem aleatória para aproximar quantidades que seriam difíceis ou impossíveis de calcular diretamente. Imagine que você quer calcular a área de uma forma estranha desenhada dentro de um quadrado. Em vez de integrar, você joga dardos aleatoriamente no quadrado, a proporção dos dardos que caem dentro da forma é aproximadamente igual à proporção da área da forma em relação ao quadrado. Um exemplo clássico é estimar o valor de pi:

Essa ideia funciona para problemas de dimensionalidade absurdamente alta, o que métodos de integração numérica clássicos tornam impraticáveis. O grande problema do Monte Carlo clássico é que ele assume amostragem uniforme do espaço de possibilidades. Mas e quando você quer amostrar uma distribuição complicada, que você não consegue descrever completamente, mas sabe avaliar pontualmente? É aqui que as coisas ficam interessantes.

MCMC: Passear pelo Espaço de Probabilidades

Em 1953, Nicholas Metropolis e outros pesquisadores de Los Alamos publicaram um algoritmo que se tornaria um dos mais influentes. O Algoritmo de Metropolis, que décadas depois seria generalizado por W.K. Hastings, nasceu para resolver um impasse aparentemente sem saída: como extrair amostras de uma distribuição de probabilidade que é complexa demais para ser calculada da forma tradicional? 

A solução é fazer uma Cadeia de Markov. Em vez de sortear pontos independentes, você constroi uma sequência onde cada ponto depende apenas do anterior, como um caminhante aleatório. Mas não é um passeio qualquer: o caminhante tem regras de aceitação inteligentes que garantem que, no longo prazo, ele passaria mais tempo nas regiões de alta probabilidade.

O MCMC (Markov Chain Monte Carlo) é a família de algoritmos que usa esse princípio. Há variantes mais modernas e eficientes, como o Hamiltonian Monte Carlo (que usa física para dar passos mais inteligentes) e o No-U-Turn Sampler (NUTS), implementado em ferramentas como Stan e PyMC. Mas todos compartilham a mesma ideia: construir uma caminhada aleatória que, ao longo do tempo, descreve fielmente uma distribuição de probabilidade complicada. 

Mas afinal, de onde vêm essas distribuições tão complicadas que nos obrigam a criar um “caminhante aleatório” para resolvê-las? A resposta nos leva de volta ao século XVIII, diretamente para o coração da inferência bayesiana: o Teorema de Bayes.

Bayes, a Atualização de Crenças e a Arte de Não Saber

Para entender por que o MCMC é tão poderoso em buscas, precisamos fazer um desvio pelo reverendo Thomas Bayes, que no século XVIII formulou uma ideia simples e, para muitos, perturbadora: probabilidade pode ser uma medida de crença, não apenas de frequência. E crenças devem ser atualizadas à medida que você vê evidências novas.

O Teorema de Bayes diz que sua crença posterior sobre algo, depois de ver evidências, é proporcional à sua crença prior multiplicada pela verossimilhança das evidências*:

O problema é que calcular o posterior diretamente exige determinar a sua constante de normalização, ou seja, é necessário integrar a probabilidade de todos os cenários possíveis, o que se torna matematicamente intratável em problemas reais. É exatamente aqui que o MCMC entra como a solução ideal: não é preciso calcular o posterior diretamente, basta extrair amostras dele. O algoritmo explora o espaço de parâmetros proporcionalmente ao valor do posterior em cada ponto e, no final, você tem milhares de amostras que descrevem perfeitamente a distribuição completa.

*A separação formal entre prior, verossimilhança e posterior como conceitos distintos é uma leitura retroativa: Bayes e Laplace raciocinavam sobre causas a partir de efeitos observados, mas o conceito de verossimilhança como função de θ para dados fixos é expressa pela seguinte equação: L(θ) = P(dados | θ)  e só foi formalizado por Fisher em 1921. A notação usada aqui é moderna.

De Los Alamos ao Fundo do Mar

Quando um avião desaparece, você tem um conjunto de informações heterogêneo e incerto: o último sinal de radar, dados de vento, estimativas de combustível, testemunhos, destroços achados (ou não), pings satelitais fragmentados. Cada peça de informação é uma evidência que atualiza sua crença sobre onde o avião está. O objeto que você quer estimar é uma distribuição de probabilidade sobre posições geográficas,  não um ponto, mas uma superfície de probabilidade sobre o oceano.

O framework bayesiano é natural para isso: você começa com um prior baseado nos dados de voo, atualiza com cada evidência usando a verossimilhança, e obtém um posterior que é literalmente um mapa de calor de probabilidades. Para calcular esse posterior em um espaço de alta dimensionalidade (posição, altitude, velocidade, falhas de sistema…), você usa MCMC.

Os Casos Reais

A Linha Que Conecta Tudo

 Há algo quase poético nessa história. Um grupo de físicos construindo a bomba mais letal da história, entediados nas horas vagas, inventou um método matemático que acabaria salvando vidas no fundo do oceano décadas depois. Ulam jogando paciência com febre. Metropolis batizando o método com o nome de um cassino. E, sem saber, ambos pavimentaram o caminho para o dia em que um algoritmo apontaria, com milhas de precisão, onde 228 pessoas descansam no fundo do Atlântico.

Em vez de uma linha reta, a estatística avançou por saltos de complexidade. Monte Carlo abriu caminho ao simular a aleatoriedade, enquanto o MCMC expandiu essa fronteira ao mapear cenários de alta dimensionalidade. Ao integrá-los ao motor bayesiano de aprendizado contínuo, chegamos à busca probabilística moderna. Nesse novo cenário, a incerteza não é mais o inimigo a ser combatido, mas a matéria-prima sobre a qual construímos nossas conclusões.

ANO EVENTO DESCRIÇÃO
1763 Thomas Bayes & Price Publicação póstuma do Essay towards solving a problem in the doctrine of chances. O teorema de Bayes entra para a história.
1945–46 Ulam, von Neumann & Los Alamos Stanislaw Ulam tem a ideia do Monte Carlo se recuperando de uma cirurgia. Von Neumann formaliza e aplica à simulação de nêutrons no Projeto Manhattan.
1953 Algoritmo de Metropolis Metropolis e equipe publicam o primeiro algoritmo MCMC. Nasce o Markov Chain Monte Carlo.
1968 USS Scorpion John Craven usa probabilidade bayesiana para localizar o submarino nuclear desaparecido. Encontrado a 200 m do ponto de maior probabilidade.
Anos 80–90 Revolução do MCMC Com computadores mais potentes, MCMC se torna a base da estatística bayesiana aplicada. Gelfand & Smith (1990) popularizam o método.
2011 Air France 447 A Metron Inc. aplica inferência bayesiana com MCMC. Destroços e caixas-pretas encontrados em 7 dias após redirecionamento da busca.
2014–hoje MH370 Os mais sofisticados modelos bayesianos já desenvolvidos para aviação, incorporando incerteza em múltiplas dimensões simultâneas.

Observações finais

The Theory That Would Not Die de Sharon Bertsch McGrayne é a história mais acessível do teorema de Bayes. Bayesian Data Analysis de Gelman et al. é a referência técnica padrão. O paper da Metron sobre a busca do AF447 está disponível em acesso aberto no Statistical Science. Para MCMC na prática: Stan (https://mc-stan.org) e PyMC (https: //www.pymc.io). O filme Adventures of a Mathematician (2021, dir. Thor Klein) é o biopic baseado na autobiografia de Ulam. O laboratório onde o método nasceu: https://www.lanl.gov/

Autor: Thales de Souza Crivillari

Deixe um comentário!

Deixe um comentário

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.