Probabilidade empírica

imagem
(imagem do programa de TV de Monty Hall: o hóspede não conseguiu calcular corretamente as probabilidades, por isso ganhou a lhama surpresa em vez do carro)

Vamos discutir o que queremos dizer quando dizemos a palavra " probabilidade ". Peço que você tente responder a essa pergunta não da perspectiva de um estudante ou de um matemático "puro", mas da maneira que um engenheiro, pesquisador aplicado ou qualquer outra pessoa que tenha que tomar uma decisão com base em dados empíricos deve entendê-la.

Abordagem ingênua


Quanto a mim, por exemplo, o ditado: “uma moeda simétrica com 50% de probabilidade cai sobre a águia”, entendo o seguinte:

“Se você atirar uma moeda muitas vezes, em cerca de metade do caso ela cairá para que a águia fique no topo "

Mais precisamente, costumo usar a regra simplificada do seis-sigma, segundo a qual, em uma série, por exemplo, de 100 lançamentos, o número de águias caídas será determinado pela fórmula:

1001 12±1001 12(1 1-1 12)


isto é, situar-se entre 35 e 65.

Sem dúvida, minha afirmação contém um erro lógico e, teoricamente, de acordo com os resultados do experimento, o número de águias pode ser menor que 35 ou maior que 65. No entanto, se na prática, nas primeiras centenas, jogar o número águias realmente vão além dos limites especificados, ficarei muito surpreso com essa circunstância.

Perspectiva da Ciência Acadêmica


Contradições e erros não são muito bons, mesmo que raramente apareçam. Talvez exista alguma maneira melhor de dar sentido ao conceito de probabilidade, um método desprovido de erros lógicos e que não contradiga a experiência? Vamos recorrer à ciência exata para obter conselhos - tente se lembrar de um curso universitário!

Se nos restringirmos aos casos em que o experimento tem apenas um número finito de resultados possíveis , então, de acordo com os cursos universitários tradicionais, o conceito de probabilidade será reduzido para atribuir a cada resultado um certo peso não negativo e o requisito adicional de que a soma de todos os pesos seja igual a um.

Apresentada dessa forma, a teoria da probabilidade é de fato livre de contradições (possui um modelo) e permite provar formalmente muitos resultados interessantes, como a Lei dos Grandes Números ou o Teorema do Limite Central. No entanto, para o pesquisador, todos esses resultados permanecem puramente formais e não têm significado até que ele responda às seguintes perguntas:

  1. Como escolher o peso certo para o resultado de um experimento específico?
  2. Se os pesos são atribuídos incorretamente, isso pode ser entendido a partir de observações?
  3. Se os pesos forem atribuídos corretamente, que previsões podem ser feitas com relação a experimentos futuros?

Teorias abstratas


Neste ponto, eu gostaria de parar e fazer uma pequena observação sobre as teorias abstratas em seu sentido moderno. De acordo com os matemáticos "puros", para criar uma teoria abstrata (primeira ordem), basta fazer três coisas:

  • Reserve palavras (cadeias de caracteres) que indicarão variáveis ​​formais

  • Reserve as palavras que denotam relações formais (um, dois, três ... locais) entre variáveis ​​formais
  • Usando relações formais entre variáveis ​​formais como declarações atômicas, escreva qualquer número de fórmulas lógicas que servirão como axiomas formais da sua teoria abstrata


Deixe-me dar um exemplo simples.

Reservamos todas as letras pequenas do alfabeto latino como nomes de variáveis ​​formais.

Reservamos duas palavras: "is_direct" e "is_point" - para relações formais únicas e mais duas palavras: "pertence" e "coincide_s" - para relações duplas de nossa teoria.

Como axiomas, adotamos as seguintes declarações lógicas:

i) Para todos os a , b : se [ a is_direct] e [ b is_direct] e não- [ a coincide_ com b ], existem d tais que: [ d is_point] e [ d pertence a ] e [d pertence a b ] e (para qualquer c : se [ c pertence a um ponto ] e [ c pertence a a ] e [ c pertence a b ], então [ c corresponde a d ])

ii) Para todos a , b : se [ a é um ponto] e [ b is_point] e não- [ a_ corresponde a b ], então existe d tal que: [ d is_direct] e [ a pertence a d ] e [ b pertenced ] e (para todos c : se [ c yavlyaetsya_pryamoy] e [ um membro c ] e [ b pertencer a c ], então [ c sovpadaet_s d ])

imagem
(Linhas paralelas se cruzam. Ilustração tirada em robinurton.com)

Para facilitar a leitura, coloquei declarações atômicas entre colchetes. Se você estudou geometria projetiva, provavelmente aprendeu neste exemplo a axiomatica de um plano projetivo abstrato. Traduzido para o russo, o axioma i) diz que quaisquer duas linhas retas diferentes se cruzam exatamente em um ponto e o axioma ii) - que exatamente qualquer linha reta passa por dois pontos diferentes.

Vale lembrar aqui que variáveis ​​formais e relacionamentos formais são apenas sequências de caracteres impressos ou manuscritos. Quando você cria uma teoria abstrata, nem é necessário assumir que variáveis ​​formais na realidade podem significar algumas coisas, e relações formais são relações reais entre essas coisas. Assim, qualquer significado nas declarações formais está inicialmente ausente.

Usando relações formais entre declarações formais como fórmulas atômicas, além de axiomas, você pode construir outras declarações lógicas formais. Se qualquer uma dessas afirmações puder ser deduzida dos axiomas da teoria de acordo com as regras da lógica simbólica, será um teorema (formal) dessa teoria. Assim como os axiomas formais, os teoremas formais inicialmente não têm significado e não expressam nenhuma propriedade do mundo ao nosso redor.

Por que, então, as teorias abstratas são criadas?

Modelo e Interpretação


Veja algumas sugestões do nosso discurso cotidiano, por exemplo: "Um gato preto está sentado em uma janela". A mesma frase poderia ser escrita de forma diferente: "Há x e y tal que: [ x yavlyaetsya_koshkoy] e [ x imeet_chernyy_okras] e [ y yavlyaetsya_oknom] e [ x sidit_na y ]».

Como você pode ver, nossa frase cômica em sua segunda entrada tem algumas semelhanças com declarações lógicas formais. No entanto, deve-se notar que há uma diferença importante entre eles. Enquanto as variáveis formais e relações formais que compõem declarações formais não significam nada, as variáveis x e yno último exemplo, objetos empíricos são designados: um gato específico e uma janela, e cada uma das relações: "seja um gato", "seja uma janela", "have_black_color", "sit_on" - refere-se a uma qualidade empírica individual ou mútua desses objetos.

Por "empírico", quero dizer qualquer conceito que possa ser definido apenas em termos de dados empíricos e, além disso, para o qual existe um algoritmo para entender se ele está presente nos dados experimentais ou não. Todos os conceitos usados ​​na física macroscópica são tão longos que a massa, a força atual ou a quantidade de energia são empíricas, e os conceitos de "deus" e "verdade" não são considerados como tais no momento.

Variáveis ​​que denotam objetos empíricos e relacionamentos que chamam propriedades empíricas, é razoável chamar material. Assim, se todas as afirmações atômicas de uma determinada fórmula lógica são relações materiais entre variáveis ​​materiais, todas essas afirmações atômicas e, em geral, a própria fórmula lógica se tornam significativas, ou seja, elas adquirem significado e significado. Seu significado está na afirmação de uma certa propriedade do mundo circundante, e o significado é verdade ou falso.

A maneira mais simples é garantir que alguma afirmação lógica significativa seja verdadeira, seja repetidamente definida experimento ou observações de longo prazo do mundo. Por exemplo, para considerar a afirmação verdadeira: "Você não pode colocar um elefante em uma caixa de fósforos", basta tentar empurrá-lo para lá muitas vezes.

Sendo criaturas inteligentes por natureza, as pessoas rapidamente perceberam que verificar cada afirmação empiricamente era longo e nem sempre seguro para a vida. Portanto, eles descobriram rapidamente outra maneira. Na verdade, descobriu-se que, ao executar certas manipulações em conjuntos de declarações verdadeiras, é possível obter muitas novas declarações lógicas e todas elas magicamente se tornam verdadeiras.

A grande surpresa foi que o tipo das manipulações mencionadas e as regras para seu uso não exigiam conhecimento do significado das declarações, mas baseavam-se apenas na maneira de escrever suas fórmulas lógicas. Por exemplo, quaisquer que sejam as declarações significativas A e B , ou se as declarações " A " e "Se A , então B " forem ambas verdadeiras, a declaração " B " também será verdadeira .

Portanto, para entender se uma afirmação é verdadeira, não é mais necessário conhecer seu significado. Como resultado, agora qualquer um pode pegar uma lista arbitrária de fórmulas lógicas e considerá-las condicionalmente "verdadeiras" (em outras palavras, axiomas formais), com a ajuda de um certo conjunto de manipulações (regras formais de inferência) obtém outras fórmulas lógicas condicionalmente "verdadeiras".

O benefício de tais exercícios aparentemente sem sentido pode aparecer apenas quando outra pessoa que lida com o experimento decide por algum motivo usar variáveis ​​formais e relacionamentos formais como nomes de objetos reais e suas propriedades empíricas mútuas. Essa solução em si significa que a teoria formal tem uma interpretação significativae toda declaração em sua linguagem se torna significativa e adquire significado.

Se uma teoria é interpretada de tal maneira que todos os seus axiomas se tornam verdadeiros, então todos os seus teoremas serão verdadeiros, a própria interpretação é considerada consistente para essa teoria e serve como seu modelo (material) .

Exemplos
Vamos voltar à teoria abstrata do plano projetivo e de três maneiras "respirar" o significado para ele.

  1. . :
    «_» ;
    «_» — , , ;
    «» — ;
    «» «» «» — .
  2. .
    «» , - ;
    «» — , , , ;
    «» «» — , , .
  3. : , .
    «». , ;
    «» — , ;
    «» — ( );
    «» — .

A interpretação em 1) não é um modelo. De fato, em uma planilha Whatman plana, algumas linhas serão paralelas e não se cruzarão, mesmo que a planilha seja ilimitadamente grande. Os dois restantes servem de modelo para o plano projetivo.

Verificação de erros


O que acontece se um experimentador, tentando explicar suas observações, seleciona a teoria "errada"? Como regra, nesses casos, o pesquisador descobrirá rapidamente uma discrepância entre o que a teoria prevê e o que realmente acontece.

imagem
(Quando algo está errado com o seu modelo de mundo)

Pegue, por exemplo, um agrimensor. Enquanto ele lida com pequenas parcelas planas, a precisão das ferramentas de medição usadas por ele não permite detectar violações de axiomas ou teoremas da geometria euclidiana. No entanto, vale a pena o agrimensor realizar trabalhos em escala planetária, quando forem encontradas linhas retas que se cruzam duas vezes, nos grandes triângulos a soma dos ângulos muda e a circunferência deixa de ser igual a π r. A discrepância entre as previsões e os dados experimentais deve forçar o agrimensor a usar outra geometria como modelo.

Outro exemplo é um físico. Enquanto suas observações se relacionarem com corpos em movimento lento, ele poderá aplicar com segurança a regra galileana para adicionar velocidades e dinâmica newtoniana: dentro da precisão necessária, as previsões teóricas coincidirão com os resultados experimentais. No entanto, se um físico tentar aplicar as mesmas teorias (essencialmente abstratas) para prever a trajetória de um elétron em um acelerador de partículas elementares, sofrerá um fiasco esmagador: as leis do mundo lorentziano se aplicam aqui.

A reação da contradição ao uso inadequado é uma característica "cavalheiresca" de quase todas as teorias científicas naturais. Se eles não o possuírem, então, como você verá mais adiante, com base nos mesmos dados empíricos, os pesquisadores poderão tirar conclusões válidas, mas conflitantes.

Então, voltando ao nosso tópico principal. Tente desenhar em sua imaginação três matemáticos que pediram a um transeunte aleatório que jogasse uma das moedas que ele possuía cem vezes seguidas.

O primeiro matemático sugeriu que a moeda será descrita pela teoria de Bernoull com pesos 1/2 para a águia e a coroa. O segundo leu uma vez que a tecnologia de cunhagem viola a simetria das moedas, então ele escolheu a teoria do teste de Bernoulevsky, na qual as caudas têm um peso de 1/3 e uma águia tem um peso de 2/3. O terceiro matemático gostava de filosofia e, em nome de um experimento existencial, atribuiu o peso de 1 à águia e 0 à cauda. Como resultado, todos os três matemáticos foram selecionados de acordo com uma teoria abstrata, com a ajuda da qual iriam olhar para o resultado.

Em quarenta e sete dos cem lançamentos, a moeda caiu águia.

O primeiro matemático exclamou que o resultado se desvia da média calculada por ele em menos de "três sigma", e não há contradições entre sua interpretação e experiência.

O segundo matemático exclamou que o resultado se desvia da média calculada por ele em mais de "três sigma", que o peso total de tais resultados é inferior a 5/1000 e que não há contradições entre sua interpretação e experiência.

O filósofo exclamou que, de acordo com seus cálculos, o peso da sequência obtida no experimento é zero, o peso total de todas as seqüências, incluindo pelo menos uma treliça, também é zero, e não há contradições entre sua interpretação e experiência.

Aparentemente, é preciso admitir que cada um dos matemáticos está certo. Qual é então o significado das escalas atribuídas?

Evidência


Como já mencionado, ao escolher uma teoria adequada e construir sua interpretação, o pesquisador tem a oportunidade de provar a verdade das hipóteses usando apenas o procedimento formal de derivação. A confiança na verdade das afirmações derivadas dos axiomas é determinada apenas pela confiança em relação à verdade dos próprios axiomas em seu sentido interpretado.

O uso de métodos dedutivos não proíbe a busca de padrões diretamente nos dados e a tentativa de justificá-los experimentalmente. Além disso, essas duas abordagens não são equivalentes: o fato de uma hipótese ter uma justificativa experimental não significa que é possível provar formalmente essa hipótese, exatamente como o contrário. Por exemplo, através da experiência pessoal, tenho quase certeza de que todos os corvos são pretos e, graças aos teoremas da geometria, que a área de um círculo com raio de um quilômetro é π quilômetros quadrados. Ao mesmo tempo, não tenho teoria para provar formalmente a primeira afirmação e experiência para substanciar experimentalmente a segunda.

Nos casos em que a hipótese de uma regularidade empírica tem justificativa experimental e pode ser formalmente comprovada dentro da estrutura da teoria aceita, diz-se que essa regularidade recebeu uma explicação teórica . Por exemplo, o padrão descoberto por Kepler nas formas das órbitas dos corpos celestes tem uma explicação teórica no quadro da teoria da gravidade newtoniana.

Se você pensar bem, qualquer padrão é uma certa limitação dos possíveis resultados das observações: um corvo só pode ser preto, a área de um círculo não pode ser muito maior ou menor que π r 2 , os planetas não podem se mover exceto em uma elipse.

Também deve ficar intuitivamente claro que os métodos de inferência formal não têm o direito de introduzir restrições adicionais em comparação com as impostas pelo valor significativo dos axiomas. De fato, se fosse o contrário, uma situação teria surgido quando os axiomas são "verdadeiros" e um dos teoremas contradiz as observações.

De fato, declarações substantivas de teoremas são apenas reformulações convenientes das restrições agregadas do “axioma” aplicadas a um conjunto particular de circunstâncias. Por exemplo, a elipticidade das órbitas é uma conseqüência da Lei da Gravidade e das três leis dinâmicas de Newton em circunstâncias em que um dos dois corpos celestes é um pesado e "imóvel", e o segundo é leve e não se move muito "rápido".

A conclusão deste parágrafo será a seguinte afirmação: "As restrições impostas pelos axiomas da teoria não devem, em conjunto, ser mais fracas do que as restrições impostas por essas leis empíricas que o pesquisador vai explicar usando essa teoria.

O rei nu


“Na capital deste rei, a vida era muito alegre; quase todos os dias vinham convidados estrangeiros e agora apareciam dois enganadores. Eles fingiram ser tecelões e disseram que poderiam fazer um tecido tão maravilhoso que é impossível imaginar algo melhor: além do padrão e das cores incomumente bonitos, ele também tem uma propriedade incrível - tornar-se invisível para qualquer pessoa que esteja fora do lugar ou impenetrável estupidamente. . ”
.................................................. ........................ Hans Christian Anderson “O Novo Traje do Rei”


(os estudantes franceses exigem uma nova filosofia da ciência. Fonte: salamancartvaldia.es)

Vamos voltar à teoria da probabilidade e três matemáticas com uma moeda.

O que você acha que, se os matemáticos tentarem repetir seu experimento muitas vezes, eles descobrirão alguma lei empírica? Em outras palavras, eles serão capazes de chegar a uma conclusão razoável de que é impossível observar algum tipo de sequência em seus experimentos ?

E a segunda pergunta: se existem leis empíricas, qual delas pode ser explicada no quadro da teoria das probabilidades geralmente aceita?

Tenho medo de decepcioná-lo, mas a resposta para a segunda pergunta é extremamente simples: "Nenhuma".

De fato, tudo o que o significado significativo do axioma da probabilidade exige é que os pesos atribuídos à águia e à cauda sejam não negativos e, no total, dêem unidade. Quando esse requisito é cumprido, qualquer sequência de águias e caudas é admissível nas observações, pois não altera os pesos atribuídos e, portanto, não cria contradições com os axiomas. Isso leva à conclusão: em seu valor significativo, os axiomas da teoria da probabilidade não impõem exatamente nenhuma restrição aos possíveis resultados das observações e, portanto, em um sentido lógico estrito, não são capazes de explicar nenhum padrão nos dados.

No que diz respeito à questão da existência de leis empíricas, uma dupla opinião é possível aqui.

Por um lado, se uma moeda não é feita com truques especiais, em cada experimento ela pode cair, seja com uma águia ou com uma coroa, para que o experimento possa terminar com qualquer sequência delas, o que significa leis empíricas, em uma definição estrita desse conceito, - não.

Por outro lado, mesmo dedicando uma vida inteira a experimentos com uma moeda simétrica, é improvável que seja possível ver pelo menos uma série de 100 lançamentos, nos quais haverá mais de 10 águias (em uma única série, as chances são menores que 1 em 10 15) Este último significa que o pesquisador, com a consciência limpa, tem o direito de aceitar a afirmação: "Em uma série de 100 lançamentos, uma moeda simétrica cairá para cima com a águia pelo menos 11 vezes" como uma regularidade empírica bem fundamentada.

Aqui chegamos claramente à contradição entre a filosofia da ciência e o senso comum, qual das quais se segue?

Quando se trata de decisões específicas, temos que agir categoricamente: atacar - ou defender, operar - ou continuar a tratar medicamente, fazer um acordo - ou recusar a oferta. Em tais circunstâncias, você não poderá usar a teoria da probabilidade de nenhuma maneira sem primeiro cometer erros na interpretação. Em alguns casos, eventos improváveis ​​terão que ser considerados impossíveis; em outros, é necessário substituir a probabilidade por uma frequência ou pensar na expectativa matemática como o valor médio para uma série finita de experimentos.

Dificilmente vale a pena procurar a razão dessa estranha situação nos defeitos da teoria abstrata das probabilidades: há todas as razões para acreditar que essa disciplina matemática é apenas consistente. Outra questão é que é improvável que qualquer teoria baseada na filosofia do inequívoco "Sim" e "Não", a absoluta "Verdade" e "Realidade objetiva" corresponda à nossa compreensão intuitiva do que é a "probabilidade" e como mensurá-la. Não há sequer certeza absoluta de que esse conceito é real e não é uma simplificação de algum conceito que ainda não foi descoberto (como era antes com a "esfera celestial" ou "vento etéreo").

Se uma teoria não está totalmente desenvolvida e suas interpretações são muitas vezes contraditórias, vale a pena colocá-la em prática? Nos casos em que o resultado não difere muito do senso comum - provavelmente vale a pena! Por exemplo, Leibniz, Euler, Lagrange, Fourier e muitos de seus contemporâneos usaram com sucesso a "Análise dos Infinitesimais" muito antes de conseguirem criar pelo menos alguma teoria dos números reais.
Não tome ciência muito estritamente!

Como uma piada tardia de April Fool.
Sergey Kovalenko.

2020 ano
magnolia@bk.ru


(autor: Alexas_Fotos)

All Articles