Probabilidad empírica

imagen
(fotograma del programa de televisión Monty Hall: el invitado no pudo calcular correctamente las probabilidades, por lo que ganó la llama sorprendida en lugar del automóvil)

Analicemos a qué nos referimos cuando decimos la palabra " probabilidad ". Le pido que intente responder esta pregunta no desde la perspectiva de un estudiante o un matemático "puro", sino en la forma en que un ingeniero, investigador aplicado o cualquier otra persona que tenga que tomar una decisión sobre la base de datos empíricos debe entenderlo.

Enfoque ingenuo


En cuanto a mí personalmente, por ejemplo, el dicho: "una moneda simétrica con una probabilidad del 50% cae sobre el águila", entiendo lo siguiente:

"Si lanzas una moneda muchas veces, en aproximadamente la mitad del caso caerá para que el águila esté encima ".

Más precisamente, que suelen utilizar la norma de los seis sigma simplificado, según el cual en una serie, por ejemplo, de 100 lanzamientos, el número de águilas caídas será determinado por la fórmula:

10012±10012(112)


es decir, estar entre 35 y 65.

Sin duda, mi afirmación contiene un error lógico y, teóricamente, de acuerdo con los resultados del experimento, el número de águilas puede ser inferior a 35 o superior a 65. Sin embargo, si en la práctica en los primeros cien arroja el número Las águilas realmente van más allá de los límites especificados, me sorprenderá mucho esta circunstancia.

Perspectiva de ciencias académicas


Las contradicciones y los errores no son muy buenos, incluso si rara vez aparecen. ¿Quizás haya alguna forma mejor de dar sentido al concepto de probabilidad, un método desprovisto de errores lógicos y que no contradiga la experiencia? Permítanos recurrir a la ciencia exacta para obtener asesoramiento: ¡intente recordar un curso universitario!

Si nos limitamos a los casos en que el experimento solo tiene un número finito de resultados posibles , de acuerdo con los cursos universitarios tradicionales, el concepto de probabilidad se reducirá a asignar a cada resultado un cierto peso no negativo y el requisito adicional de que la suma de todos los pesos sea igual a uno.

Presentada de esta forma, la teoría de la probabilidad está realmente libre de contradicciones (tiene un modelo) y permite probar formalmente muchos resultados interesantes, como la Ley de números grandes o el Teorema del límite central. Sin embargo, para el experimentador, todos estos resultados siguen siendo puramente formales y no tienen sentido hasta que responde las siguientes preguntas:

  1. ¿Cómo elegir el peso adecuado para el resultado de un experimento en particular?
  2. Si los pesos se asignan incorrectamente, ¿se puede entender esto a partir de las observaciones?
  3. Si los pesos se asignan correctamente, ¿qué predicciones se pueden hacer con respecto a futuros experimentos?

Teorías abstractas


En este punto, me gustaría detenerme y hacer un pequeño comentario sobre las teorías abstractas en su sentido moderno. Según los matemáticos "puros", para crear una teoría abstracta (primer orden), solo tienes que hacer tres cosas:

  • Reserve palabras (cadenas de caracteres) que denoten variables formales

  • Reserve las palabras que denotarán (uno, dos, tres ... ... locales) relaciones formales entre variables formales
  • Usando relaciones formales entre variables formales como enunciados atómicos, escriba cualquier cantidad de fórmulas lógicas que sirvan como axiomas formales de su teoría abstracta


Dejame darte un ejemplo simple.

Reservamos todas las letras pequeñas del alfabeto latino como nombres de variables formales.

Reservamos dos palabras: "is_direct" e "is_point" - para relaciones formales únicas y dos palabras más: "pertenece" y "coincide" - para relaciones dobles de nuestra teoría.

Como axiomas, tomamos las siguientes declaraciones lógicas:

i) Para todo a , b : si [ a es_directo] y [ b es_directo] y no- [ a coincide_ con b ], entonces existe d tal que: [ d es_punto] y [ d pertenece a ] y [d pertenece a b ] y (para cualquier c : si [ c pertenece a un punto ] y [ c pertenece a a ] y [ c pertenece a b ], entonces [ c coincide_ con d ])

ii) Para todos a , b : si [ a es un punto] y [ b es un punto ] y no [ a coincide con b ], entonces existe d tal que: [ d es_directo] y [ a pertenece a d ] y [ b perteneced ] y (para todo c : si [ c yavlyaetsya_pryamoy] y [ un miembro c ] y [ b pertenece c ], entonces [ c sovpadaet_s d ])

imagen
(Las líneas paralelas se cruzan. Ilustración tomada de robinurton.com)

En aras de la legibilidad, incluí enunciados atómicos entre corchetes. Si estudiaste geometría proyectiva, probablemente aprendiste en este ejemplo la axiomática de un plano proyectivo abstracto. Traducido al ruso, el axioma i) dice que dos líneas rectas diferentes se cruzan exactamente en un punto, y el axioma ii), que exactamente una línea recta pasa a través de dos puntos diferentes.

Vale la pena recordar aquí que las variables formales y las relaciones formales son solo secuencias de caracteres impresos o escritos a mano. Cuando crea una teoría abstracta, ni siquiera es necesario suponer que las variables formales en realidad pueden significar algunas cosas, y las relaciones formales son relaciones reales entre estas cosas. Por lo tanto, cualquier significado en las declaraciones formales está inicialmente ausente.

Usando relaciones formales entre declaraciones formales como fórmulas atómicas, además de axiomas, puede construir otras declaraciones lógicas formales. Si alguna de estas afirmaciones puede deducirse de los axiomas de la teoría de acuerdo con las reglas de la lógica simbólica, entonces será un teorema (formal) para esta teoría. Al igual que los axiomas formales, los teoremas formales inicialmente no tienen ningún significado y no expresan ninguna propiedad del mundo que nos rodea.

¿Por qué entonces se crean teorías abstractas?

Modelo e Interpretación


Tome algunas sugerencias de nuestro discurso cotidiano, por ejemplo: "Un gato negro se sienta en una ventana". La misma oración podría escribirse de manera diferente: "Hay x e y tales que: [ x yavlyaetsya_koshkoy] y [ x imeet_chernyy_okras] y [ y yavlyaetsya_oknom] y [ x sidit_na y ]».

Como puede ver, nuestra oración cómica en su segunda entrada tiene algunas similitudes con las declaraciones lógicas formales. Sin embargo, debe tenerse en cuenta que existe una diferencia importante entre ellos. Mientras que las variables formales y las relaciones formales que forman declaraciones formales no significan nada, las variables x e yen el último ejemplo, se designan objetos empíricos: un gato específico y una ventana, y cada una de las relaciones: "ser un gato", "ser una ventana", "tener_color_negro", "sit_on" - se refiere a una calidad empírica individual o mutua bien definida de estos objetos.

Por "empírico" me refiero a cualquier concepto que pueda definirse únicamente en términos de datos empíricos, y además, para el cual existe un algoritmo para comprender si está presente en datos experimentales o no. Todos los conceptos utilizados en la física macroscópica son tan largos que la masa, la fuerza actual o la cantidad de energía es empírica, y los conceptos de "dios" y "verdad" no se consideran como tales en este momento.

Variables que denotan objetos empíricos, y relaciones que llaman propiedades empíricas, es razonable llamar material. Por lo tanto, si todas las declaraciones atómicas de una determinada fórmula lógica son relaciones materiales entre variables materiales, entonces todas estas declaraciones atómicas y la fórmula lógica en su conjunto adquieren significado, es decir, adquieren significado y significado. Su significado está en la declaración de cierta propiedad del mundo circundante, y el significado es verdadero o falso.

La forma más simple es asegurarse de que alguna afirmación lógica significativa sea verdadera, se establezca repetidamente experimentos u observaciones a largo plazo del mundo. Por ejemplo, para considerar verdadera la afirmación: "No puedes poner un elefante en una caja debajo de los fósforos", solo debes intentar empujarlo muchas veces.

Siendo criaturas inteligentes por naturaleza, la gente rápidamente se dio cuenta de que verificar cada declaración empíricamente era largo y no siempre era seguro para la vida. Por lo tanto, descubrieron rápidamente otra forma. En realidad, resultó que realizando ciertas manipulaciones en conjuntos de declaraciones verdaderas, uno puede obtener muchas declaraciones lógicas nuevas y todas ellas mágicamente resultan ser ciertas.

La gran sorpresa fue que el tipo de las manipulaciones mencionadas y las reglas para su uso de ninguna manera requerían conocimiento del significado de las declaraciones, sino que solo se basaban en la forma de escribir sus fórmulas lógicas. Por ejemplo, cualesquiera que sean las declaraciones significativas A y B , o si las declaraciones “ A ” y “Si A , entonces B ” son verdaderas, entonces la declaración “ Btambién resulta ser cierta .

Entonces, para entender si una afirmación es verdadera, ya no es necesario saber su significado. Como resultado, ahora cualquiera puede tomar una lista arbitraria de fórmulas lógicas y considerarlas condicionalmente "verdaderas" (en otras palabras, axiomas formales), utilizando un cierto conjunto de manipulaciones (reglas formales de inferencia), obtener otras fórmulas lógicas condicionalmente "verdaderas".

El beneficio de estos ejercicios aparentemente sin sentido solo puede aparecer cuando otra persona que se ocupa del experimento decide por alguna razón usar variables formales y relaciones formales como nombres para objetos reales y sus propiedades empíricas mutuas. Tal solución en sí misma significa que la teoría formal tiene una interpretación significativay cada declaración en su lenguaje se vuelve significativa y adquiere significado.

Si una teoría se interpreta de tal manera que todos sus axiomas resulten ser ciertos, entonces todos sus teoremas serán verdaderos, la interpretación en sí misma se considera consistente para esta teoría y sirve como su modelo (material) .

Ejemplos
Volvamos a la teoría abstracta del plano proyectivo y de tres maneras "respiremos" su significado.

  1. . :
    «_» ;
    «_» — , , ;
    «» — ;
    «» «» «» — .
  2. .
    «» , - ;
    «» — , , , ;
    «» «» — , , .
  3. : , .
    «». , ;
    «» — , ;
    «» — ( );
    «» — .

La interpretación en 1) no es un modelo. De hecho, en una hoja plana de Whatman, algunas líneas serán paralelas y no se intersecarán, incluso si la hoja es ilimitadamente grande. Los dos restantes sirven como modelos para el plano proyectivo.

Comprobación de errores


¿Qué sucede si un experimentador, tratando de explicar sus observaciones, selecciona la teoría "incorrecta"? Como regla, en tales casos, el experimentador descubrirá rápidamente una discrepancia entre lo que predice la teoría y lo que realmente sucede.

imagen
(Cuando algo está mal con su modelo del mundo)

Tome, por ejemplo, un topógrafo. Mientras trate con pequeñas parcelas planas, la precisión de las herramientas de medición utilizadas por él no permite detectar violaciones de ningún axioma o teorema de la geometría euclidiana. Sin embargo, vale la pena que el agrimensor emprenda el trabajo a escala planetaria, cuando se encuentran líneas rectas que se cruzan entre sí dos veces, en los triángulos grandes la suma de los ángulos cambia y la circunferencia deja de ser igual a π r. La discrepancia entre las predicciones y los datos experimentales debería obligar al topógrafo a tomar alguna otra geometría como modelo.

Otro ejemplo es un físico. Mientras sus observaciones se relacionen con cuerpos que se mueven lentamente, puede aplicar con seguridad la regla de Galilea para agregar velocidades y dinámicas newtonianas: dentro de la precisión requerida, las predicciones teóricas coincidirán con los resultados experimentales. Sin embargo, si un físico intenta aplicar las mismas teorías (esencialmente abstractas) para predecir la trayectoria de un electrón en un acelerador de partículas elementales, sufrirá un fiasco aplastante: las leyes del mundo lorentziano se aplican aquí.

La reacción de contradicción al uso inapropiado es una característica "caballerosa" de casi todas las teorías científicas naturales. Si no lo poseían, entonces, como verá más adelante, sobre la base de los mismos datos empíricos, los experimentadores podrían llegar a conclusiones válidas pero conflictivas.

Entonces, volvamos a nuestro tema principal. Intenta dibujar en tu imaginación a tres matemáticos que le pidieron a un transeúnte al azar que tirara una de las monedas que tenía cien veces seguidas.

El primer matemático sugirió que la moneda será descrita por la teoría de las pruebas de Bernoull con pesos 1/2 tanto para el águila como para las colas. El segundo leyó una vez que la tecnología de monedas viola la simetría de las monedas, por lo que eligió la teoría de prueba de Bernoulevsky, en la cual las colas tienen un peso de 1/3 y un águila tiene un peso de 2/3. El tercer matemático era aficionado a la filosofía y, en aras de un experimento existencial, asignó el peso de 1 al águila y 0 a las colas. Como resultado, los tres matemáticos fueron seleccionados de acuerdo con una teoría abstracta, con la ayuda de la cual iban a ver el resultado.

En cuarenta y siete de cada cien lanzamientos, la moneda cayó águila.

El primer matemático exclamó que el resultado se desvía del promedio calculado por él en menos de "tres sigma", y no hay contradicciones entre su interpretación y experiencia.

El segundo matemático exclamó que el resultado se desvía del promedio calculado por él en más de "tres sigma", que el peso total de tales resultados es inferior a 5/1000 y que no hay contradicciones entre su interpretación y experiencia.

El filósofo exclamó que, según sus cálculos, el peso de la secuencia obtenida en el experimento es cero, el peso total de todas las secuencias, incluido al menos una red, también es cero, y no hay contradicciones entre su interpretación y experiencia.

Aparentemente, uno tendrá que admitir que cada uno de los matemáticos tiene razón. ¿Cuál es entonces el significado de las escalas asignadas?

Evidencia


Como ya se mencionó, al elegir una teoría adecuada y construir su interpretación, el investigador tiene la oportunidad de demostrar la verdad de las hipótesis utilizando solo el procedimiento de derivación formal. La confianza en la verdad de las declaraciones derivadas de los axiomas está determinada solo por la confianza en relación con la verdad de los axiomas mismos en su sentido interpretado.

El uso de métodos deductivos no prohíbe buscar patrones directamente en los datos e intentar justificarlos experimentalmente. Además, estos dos enfoques no son equivalentes: el hecho de que una hipótesis tenga una justificación experimental no significa que sea posible probar esta hipótesis formalmente, al contrario. Por ejemplo, por experiencia personal, estoy casi seguro de que todos los cuervos son negros, y gracias a los teoremas de la geometría, que el área de un círculo con un radio de un kilómetro es π kilómetros cuadrados. Al mismo tiempo, no tengo ninguna teoría para probar formalmente la primera declaración, y no tengo experiencia para probar experimentalmente la segunda.

En los casos en que la hipótesis de una regularidad empírica tiene justificación experimental y puede demostrarse formalmente en el marco de la teoría aceptada, se dice que esta regularidad recibió una explicación teórica . Por ejemplo, el patrón descubierto por Kepler en las formas de las órbitas de los cuerpos celestes tiene una explicación teórica en el marco de la teoría de la gravedad newtoniana.

Si lo piensa, cualquier patrón es una cierta limitación de los posibles resultados de las observaciones: un cuervo solo puede ser negro, el área de un círculo no puede ser mucho más grande o más pequeña que π r 2 , los planetas no pueden moverse excepto en una elipse.

También debe ser intuitivamente claro que los métodos de inferencia formal no tienen derecho a introducir restricciones adicionales en comparación con las impuestas por el valor significativo de los axiomas. De hecho, si hubiera sido al revés, habría surgido una situación en la que los axiomas son "verdaderos" y uno de los teoremas contradice las observaciones.

De hecho, los enunciados sustantivos de los teoremas son solo reformulaciones convenientes de las restricciones agregadas de "axioma" aplicadas a un conjunto particular de circunstancias. Por ejemplo, la elipticidad de las órbitas es una consecuencia de la Ley de gravedad y las tres leyes dinámicas de Newton en circunstancias en que uno de los dos cuerpos celestes es pesado e "inmóvil", y el segundo es liviano y no se mueve demasiado "rápido".

La conclusión de este párrafo será la siguiente declaración: "Las restricciones impuestas por los axiomas de la teoría no deberían, en conjunto, ser más débiles que las restricciones impuestas por esas leyes empíricas que el experimentador va a explicar utilizando esta teoría.

El rey desnudo


“En la capital de este rey, la vida era muy alegre; Casi todos los días venían invitados extranjeros, y ahora aparecían dos engañadores. Fingieron ser tejedores y dijeron que podían hacer una tela tan maravillosa que es imposible imaginar algo mejor: además del patrón y los colores inusualmente hermosos, también tiene una propiedad increíble: hacerse invisible para cualquier persona que esté fuera de lugar o que sea estúpidamente impenetrable. . "
.................................................. ........................ Hans Christian Anderson "El nuevo vestido del rey"


(los estudiantes franceses exigen una nueva filosofía de la ciencia. Fuente: salamancartvaldia.es)

Volvamos a la teoría de la probabilidad y tres matemáticas con una moneda.

¿Qué crees que si los matemáticos intentan repetir su experimento muchas veces, descubrirán alguna ley empírica? En otras palabras, ¿podrán llegar a una conclusión razonable de que es imposible observar un cierto tipo de secuencia en sus experimentos ?

Y la segunda pregunta: si hay leyes empíricas, ¿cuál de ellas puede explicarse en el marco de la teoría de probabilidad generalmente aceptada?

Me temo decepcionarte, pero la respuesta a la segunda pregunta es extremadamente simple: "Ninguna".

De hecho, todo lo que requiere el significado significativo del axioma de probabilidad es que los pesos asignados al águila y la cola no sean negativos y, en total, den unidad. Cuando se cumple este requisito, cualquier secuencia de águilas y colas es admisible en las observaciones, ya que no cambia los pesos asignados y, por lo tanto, no crea contradicciones con los axiomas. Esto lleva a la conclusión: en su valor significativo, los axiomas de la teoría de la probabilidad no imponen exactamente ninguna restricción sobre los posibles resultados de las observaciones y, por lo tanto, en un sentido lógico estricto, no pueden explicar ningún patrón en los datos.

En cuanto a la cuestión de la existencia de leyes empíricas, aquí es posible una doble opinión.

Por un lado, si una moneda no está hecha con ningún truco especial, en cada experimento puede caerse, tanto con un águila como con una cola, por lo que el experimento puede terminar con cualquier secuencia de ellos, lo que significa leyes empíricas, en una definición estricta de este concepto, - No.

Por otro lado, incluso si dedica toda una vida a los experimentos con una moneda simétrica, es poco probable que pueda ver al menos una serie de 100 lanzamientos, en los que no habrá más de 10 águilas (en una sola serie, las posibilidades son menos de 1 en 10 15) Esto último significa que el experimentador con la conciencia tranquila tiene derecho a aceptar la afirmación: "En una serie de 100 lanzamientos, una moneda simétrica caerá hacia arriba con el águila al menos 11 veces" como una regularidad empírica bien fundada.

Aquí llegamos claramente a la contradicción entre la filosofía de la ciencia y el sentido común, ¿cuál de las cuales sigue?

Cuando se trata de decisiones específicas, tenemos que actuar categóricamente: atacar, o defender, operar, o continuar tratando médicamente, hacer un trato, o rechazar la oferta. En tales circunstancias, no podrá utilizar la teoría de la probabilidad de ninguna manera sin primero cometer errores al interpretarla. En algunos casos, los eventos improbables tendrán que considerarse imposibles; en otros, es necesario reemplazar la probabilidad con una frecuencia o pensar en la expectativa matemática como el valor promedio para una serie finita de experimentos.

No vale la pena buscar la razón de esta extraña situación en los defectos de la teoría de la probabilidad abstracta: hay muchas razones para creer que esta disciplina matemática es simplemente consistente. Otra cuestión es que cualquier teoría basada en la filosofía del inequívoco "Sí" y "No", la "Verdad" absoluta y la "Realidad objetiva" es poco probable que correspondan a nuestra comprensión intuitiva de lo que es la "probabilidad" y cómo medirla. Ni siquiera hay una certeza completa de que este concepto es real, y no es una simplificación de algún concepto que aún no se ha descubierto (como lo fue alguna vez con la "esfera celestial" o el "viento etéreo").

Si una teoría no está completamente desarrollada y sus interpretaciones son a menudo contradictorias, ¿vale la pena ponerla en práctica? En aquellos casos en que el resultado no difiere demasiado del sentido común, ¡probablemente valga la pena! Por ejemplo, Leibniz, Euler, Lagrange, Fourier y muchos de sus contemporáneos utilizaron con éxito el "Análisis de los infinitesimales" mucho antes de que lograran crear al menos alguna teoría de los números reales.
¡No tomes la ciencia demasiado estrictamente!

Como una broma tardía de April Fool.
Sergey Kovalenko.

2020 año
magnolia@bk.ru


(autor: Alexas_Fotos)

All Articles