Probabilité empirique

image
(cadre de l'émission de télévision de Monty Hall: l'invité n'a pas pu calculer correctement les probabilités, alors il a gagné le lama surpris au lieu de la voiture)

Discutons de ce que nous voulons dire lorsque nous disons le mot " probabilité ". Je vous demande d'essayer de répondre à cette question non pas du point de vue d'un étudiant ou d'un mathématicien «pur», mais de la manière dont un ingénieur, un chercheur appliqué ou toute autre personne qui doit prendre une décision sur la base de données empiriques doit la comprendre.

Approche naïve


Quant à moi personnellement, par exemple, le dicton: "une pièce symétrique avec une probabilité de 50% tombe dans l'aigle", je comprends comme suit:

"Si vous lancez une pièce plusieurs fois, alors dans environ la moitié du cas, elle tombera de sorte que l'aigle soit au-dessus ".

Plus précisément, j'utilise généralement la règle simplifiée des six sigma, selon laquelle dans une série, par exemple, de 100 lancers, le nombre d'aigles largués sera déterminé par la formule:

10012±10012(112)


c'est-à-dire se situer entre 35 et 65.

Sans aucun doute, ma déclaration contient une erreur logique et théoriquement, selon les résultats de l'expérience, le nombre d'aigles peut être inférieur à 35, ou supérieur à 65. Cependant, si en pratique dans les cent premiers lancers les aigles vont vraiment au-delà des limites spécifiées, je serai très surpris de cette circonstance.

Perspective scientifique académique


Les contradictions et les erreurs ne sont pas très bonnes, même si elles apparaissent rarement. Peut-être y a-t-il une meilleure façon de donner un sens au concept de probabilité, une méthode sans erreurs logiques et qui ne contredit pas l'expérience? Passons à la science exacte pour obtenir des conseils - essayez de rappeler un cours universitaire!

Si nous nous limitons aux cas où l'expérience n'a qu'un nombre fini de résultats possibles , alors selon les cours universitaires traditionnels, le concept de probabilité sera réduit à attribuer à chacun de ces résultats un certain poids non négatif et l'exigence supplémentaire que la somme de tous les poids soit égale à un.

Présentée sous cette forme, la théorie des probabilités est en effet exempte de contradictions (elle a un modèle) et permet de prouver formellement de nombreux résultats intéressants, comme la loi des grands nombres ou le théorème de la limite centrale. Cependant, pour l'expérimentateur, tous ces résultats restent purement formels et n'ont de sens que lorsqu'il répond aux questions suivantes:

  1. Comment choisir le bon poids pour le résultat d'une expérience particulière?
  2. Si les poids sont mal attribués, cela peut-il être compris à partir des observations?
  3. Si les poids sont correctement attribués, quelles prévisions peuvent être faites concernant les futures expériences?

Théories abstraites


À ce stade, je voudrais m'arrêter et faire une petite remarque sur les théories abstraites dans leur sens moderne. Selon les mathématiciens "purs", pour créer une théorie abstraite (premier ordre), il suffit de faire trois choses:

  • Réserver des mots (chaînes de caractères) qui désigneront des variables formelles

  • Réservez les mots qui dénotent (une, deux, trois ... locale) les relations formelles entre les variables formelles
  • En utilisant des relations formelles entre des variables formelles comme des déclarations atomiques, écrivez un certain nombre de formules logiques qui serviront d' axiomes formels de votre théorie abstraite


Permettez-moi de vous donner un exemple simple.

Nous réservons toutes les petites lettres de l'alphabet latin comme noms de variables formelles.

Nous réservons deux mots: «is_direct» et «is_point» - pour les relations formelles simples et deux autres mots: «appartient» et «coincides_s» - pour les relations doubles de notre théorie.

Comme axiomes, nous prenons les énoncés logiques suivants:

i) Pour tout a , b : si [ a is_direct] et [ b is_direct] et non- [ a coïncide_ avec b ], alors il existe d tel que: [ d is_point] et [ d appartient a ] et [d appartient à b ] et (pour tout c : si [ c appartient à un point ] et [ c appartient à a ] et [ c appartient à b ], alors [ c correspond_ à d ])

ii) Pour tout a , b : si [ a est un point] et [ b is_point] et not- [ a_ correspond à b ], alors il existe d tel que: [ d is_direct] et [ a appartient à d ] et [ b appartientd ] et (pour tout c : si [ c yavlyaetsya_pryamoy] et [ un membre c ] et [ b appartient c ], alors [ c sovpadaet_s d ])

image
(Les lignes parallèles se croisent. Illustration tirée de robinurton.com)

Pour des raisons de lisibilité, j'ai joint les déclarations atomiques entre crochets. Si vous avez étudié la géométrie projective, vous avez probablement appris dans cet exemple l'axiomatique d'un plan projectif abstrait. Traduit en russe, l'axiome i) dit que deux lignes droites différentes se coupent exactement en un point, et l'axiome ii) - que exactement toute ligne droite passe par deux points différents.

Il convient de rappeler ici que les variables formelles et les relations formelles ne sont que des séquences de caractères imprimés ou manuscrits. Lorsque vous créez une théorie abstraite, il n'est même pas nécessaire de supposer que les variables formelles peuvent en réalité signifier certaines choses, et les relations formelles sont de vraies relations entre ces choses. Ainsi, tout sens dans les déclarations formelles est initialement absent.

En utilisant des relations formelles entre des déclarations formelles comme formules atomiques, en plus des axiomes, vous pouvez construire d'autres déclarations logiques formelles. Si l'une de ces affirmations peut être déduite des axiomes de la théorie selon les règles de la logique symbolique, alors ce sera un théorème (formel) pour cette théorie. Tout comme les axiomes formels, les théorèmes formels n'ont initialement aucun sens et n'expriment aucune propriété du monde qui nous entoure.

Pourquoi alors des théories abstraites sont-elles créées?

Modèle et interprétation


Prenez quelques suggestions de notre discours de tous les jours, par exemple: "Un chat noir est assis sur une fenêtre." La même phrase pourrait s'écrire différemment: "Il y a x et y tels que: [ x yavlyaetsya_koshkoy] et [ x imeet_chernyy_okras] et [ y yavlyaetsya_oknom] et [ x sidit_na y ]».

Comme vous pouvez le voir, notre phrase comique dans sa deuxième entrée présente quelques similitudes avec des déclarations logiques formelles. Cependant, il convient de noter qu'il existe une différence importante entre eux. Alors que les variables formelles et les relations formelles qui composent les déclarations formelles ne signifient rien, les variables x et ydans le dernier exemple, des objets empiriques sont désignés: un chat et une fenêtre spécifiques, et chacune des relations: «être un chat», «être une fenêtre», «avoir_couleur_noir», «s'asseoir» - se réfère à une qualité empirique individuelle ou mutuelle bien définie de ces objets.

Par «empirique», j'entends tout concept qui peut être défini uniquement en termes de données empiriques, et en plus, pour lequel il existe un algorithme pour comprendre s'il est présent sur des données expérimentales ou non. Tous les concepts utilisés en physique macroscopique sont si longs, la masse, la force actuelle ou la quantité d'énergie est empirique, et les concepts de «dieu» et de «vérité» ne sont pas considérés comme tels pour le moment.

Les variables désignant des objets empiriques et les relations appelant des propriétés empiriques, il est raisonnable d'appeler matériel. Ainsi, si toutes les déclarations atomiques d'une certaine formule logique sont des relations matérielles entre des variables matérielles, alors toutes ces déclarations atomiques et, en général, la formule logique elle-même deviennent significatives, c'est-à-dire qu'elles acquièrent un sens et une signification. Leur sens est dans l'énoncé d'une certaine propriété du monde environnant, et le sens est vrai ou faux.

Le moyen le plus simple consiste à s'assurer que certaines déclarations logiques significatives sont vraies, à définir à plusieurs reprises l'expérience ou les observations à long terme du monde. Par exemple, afin de considérer la déclaration comme vraie: "Vous ne pouvez pas mettre un éléphant dans une boîte sous les allumettes", il vous suffit d’essayer de le pousser plusieurs fois.

Étant des créatures intelligentes par nature, les gens ont rapidement réalisé que vérifier empiriquement chaque déclaration était long et pas toujours sans danger pour la vie. Par conséquent, ils ont rapidement découvert une autre façon. En fait, il s'est avéré qu'en effectuant certaines manipulations sur des ensembles d'instructions vraies, on peut obtenir de nombreuses nouvelles instructions logiques et toutes se révèlent magiquement être vraies.

La grande surprise a été que le type des manipulations mentionnées et les règles de leur utilisation ne requièrent en aucune manière la connaissance de la signification des énoncés, mais ne reposaient que sur la manière d'écrire leurs formules logiques. Par exemple, quelles que soient les déclarations significatives A et B , ou si les déclarations « A » et «Si A , alors B » sont toutes les deux vraies, alors la déclaration « B » s'avère également vraie .

Ainsi, pour comprendre si une affirmation est vraie, il n'est plus nécessaire de connaître sa signification. Par conséquent, n'importe qui peut désormais prendre une liste arbitraire de formules logiques et les considérer conditionnellement comme «vraies» (en d'autres termes, les axiomes formels), en utilisant un certain ensemble de manipulations (règles formelles d'inférence), obtenir d'autres formules logiques conditionnellement «vraies».

L'avantage de tels exercices apparemment dénués de sens ne peut apparaître que lorsqu'une autre personne ayant affaire à l'expérience décide pour une raison quelconque d'utiliser des variables formelles et des relations formelles comme noms pour des objets réels et leurs propriétés empiriques mutuelles. Une telle solution en soi signifie que la théorie formelle a une interprétation significativeet chaque déclaration dans sa langue devient significative et acquiert un sens.

Si une théorie est interprétée de telle manière que tous ses axiomes se révèlent vrais, alors tous ses théorèmes seront vrais, l'interprétation elle-même est considérée comme cohérente pour cette théorie et sert de modèle (matériel) .

Exemples
Revenons à la théorie abstraite du plan projectif et «insufflons» de trois manières le sens.

  1. . :
    «_» ;
    «_» — , , ;
    «» — ;
    «» «» «» — .
  2. .
    «» , - ;
    «» — , , , ;
    «» «» — , , .
  3. : , .
    «». , ;
    «» — , ;
    «» — ( );
    «» — .

L'interprétation en 1) n'est pas un modèle. En effet, sur une feuille Whatman plate certaines lignes seront parallèles et ne se coupent pas, même si la feuille est infiniment grande. Les deux autres servent de modèles pour le plan projectif.

Vérification des erreurs


Que se passe-t-il si un expérimentateur, essayant d'expliquer ses observations, choisit la «mauvaise» théorie? En règle générale, dans de tels cas, l'expérimentateur découvrira rapidement un écart entre ce que la théorie prédit et ce qui se passe réellement.

image
(Quand quelque chose ne va pas avec votre modèle du monde)

Prenez, par exemple, un arpenteur. Tant qu'il traite de petites parcelles plates, la précision des outils de mesure qu'il utilise ne permet pas de détecter des violations d'axiomes ou de théorèmes de la géométrie euclidienne. Cependant, il vaut la peine que l'arpenteur-géomètre entreprenne des travaux à l'échelle planétaire, lorsque des droites se croisant deux fois se trouvent, dans les grands triangles, la somme des angles change et la circonférence cesse d'être égale à π r. L'écart entre les prévisions et les données expérimentales devrait obliger le géomètre à prendre une autre géométrie comme modèle.

Un autre exemple est un physicien. Tant que ses observations concernent des corps en mouvement lent, il peut appliquer en toute sécurité la règle galiléenne pour l'ajout de vitesses et de dynamique newtonienne: avec la précision requise, les prédictions théoriques coïncideront avec les résultats expérimentaux. Cependant, si un physicien tente d'appliquer les mêmes théories (essentiellement abstraites) pour prédire la trajectoire d'un électron dans un accélérateur de particules élémentaires, il subira un fiasco écrasant: les lois du monde lorentzien s'appliquent ici.

La réaction de contradiction à une utilisation inappropriée est une caractéristique «gentleman» de presque toutes les théories naturalistes. S'ils ne le possédaient pas, alors, comme vous le verrez plus loin, sur la base des mêmes données empiriques, les expérimentateurs pourraient tirer des conclusions valables mais contradictoires.

Revenons donc à notre sujet principal. Essayez de dessiner dans votre imagination trois mathématiciens qui ont demandé à un passant au hasard de lancer l'une des pièces qu'il avait cent fois de suite.

Le premier mathématicien a suggéré que la pièce serait décrite par la théorie des tests de Bernoull avec des poids 1/2 pour l'aigle et la queue. Le deuxième a lu une fois que la technologie de la monnaie violait la symétrie des pièces, alors il a choisi la théorie du test de Bernoulevsky, dans laquelle la queue a un poids de 1/3 et un aigle a un poids de 2/3. Le troisième mathématicien aimait la philosophie et, dans le but d'une expérience existentielle, a attribué le poids de 1 à l'aigle et de 0 à la queue. En conséquence, les trois mathématiciens ont été sélectionnés selon une théorie abstraite avec laquelle ils allaient examiner le résultat.

En quarante-sept sur cent lancers, la pièce est tombée aigle.

Le premier mathématicien s'est exclamé que le résultat s'écarte de la moyenne calculée par lui de moins de «trois sigma», et qu'il n'y a pas de contradiction entre son interprétation et son expérience.

Le deuxième mathématicien s'est exclamé que le résultat s'écarte de la moyenne calculée par lui de plus de «trois sigma», que le poids total de ces résultats est inférieur à 5/1000 et qu'il n'y a pas de contradiction entre son interprétation et son expérience.

Le philosophe s'est exclamé que selon ses calculs, le poids de la séquence obtenue dans l'expérience est nul, le poids total de toutes les séquences comprenant au moins un réseau est également nul, et il n'y a pas de contradiction entre son interprétation et son expérience.

Apparemment, il faut admettre que chacun des mathématiciens a raison. Quelle est alors la signification des échelles attribuées?

Preuve


Comme déjà mentionné, en choisissant une théorie appropriée et en construisant son interprétation, le chercheur a la possibilité de prouver la vérité des hypothèses en utilisant uniquement la procédure de dérivation formelle. La confiance dans la vérité des énoncés dérivés des axiomes n'est déterminée que par la confiance par rapport à la vérité des axiomes eux-mêmes dans leur sens interprété.

L'utilisation de méthodes déductives n'interdit pas de rechercher des motifs directement dans les données et d'essayer de les justifier expérimentalement. De plus, ces deux approches ne sont pas équivalentes: le fait qu'une hypothèse ait une justification expérimentale ne signifie pas qu'il est possible de prouver formellement cette hypothèse, tout comme l'inverse. Par exemple, par expérience personnelle, je suis presque sûr que tous les corbeaux sont noirs, et grâce aux théorèmes de la géométrie, que l'aire d'un cercle avec un rayon d'un kilomètre est de π kilomètres carrés. En même temps, je n'ai aucune théorie pour prouver formellement la première affirmation, et aucune expérience pour étayer expérimentalement la seconde.

Dans les cas où l'hypothèse d'une régularité empirique a à la fois une justification expérimentale et peut être formellement prouvée dans le cadre de la théorie acceptée, on dit que cette régularité a reçu une explication théorique . Par exemple, le motif découvert par Kepler dans les formes des orbites des corps célestes a une explication théorique dans le cadre de la théorie newtonienne de la gravité.

Si vous y réfléchissez, n'importe quel motif est une certaine limitation des résultats possibles des observations: un corbeau ne peut être que noir, l'aire d'un cercle ne peut pas être beaucoup plus grande ou plus petite que π r 2 , les planètes ne peuvent se déplacer que dans une ellipse.

Il devrait également être intuitivement clair que les méthodes d'inférence formelles n'ont pas le droit d'introduire des restrictions supplémentaires par rapport à celles imposées par la valeur significative des axiomes. En effet, si c'était l'inverse, une situation se serait produite lorsque les axiomes sont «vrais» et l'un des théorèmes contredit les observations.

En fait, les énoncés de fond des théorèmes ne sont que des reformulations pratiques des restrictions globales de «l'axiome» appliquées à un ensemble particulier de circonstances. Par exemple, l'ellipticité des orbites est une conséquence de la loi de la gravité et des trois lois dynamiques de Newton dans les circonstances où l'un des deux corps célestes est un lourd et "immobile", et le second est léger et ne se déplace pas trop "vite".

La conclusion de ce paragraphe sera la déclaration suivante: << Les restrictions imposées par les axiomes de la théorie ne devraient pas, dans l'ensemble, être plus faibles que les restrictions imposées par les lois empiriques que l'expérimentateur va expliquer en utilisant cette théorie.

Le roi nu


«Dans la capitale de ce roi, la vie était très gaie; presque tous les jours des invités étrangers venaient, et maintenant deux trompeurs apparaissaient. Ils prétendaient être des tisserands et ont dit qu'ils pouvaient faire un tissu si merveilleux qu'il est impossible d'imaginer quoi que ce soit de mieux: en plus du motif et des couleurs inhabituellement beaux, il a également une propriété incroyable - devenir invisible pour toute personne hors de propos ou impénétrable stupide . "
.................................................. ........................ Hans Christian Anderson «La nouvelle robe du roi»


(les étudiants français réclament une nouvelle philosophie des sciences. Source: salamancartvaldia.es)

Revenons à la théorie des probabilités et trois maths avec une pièce.

Que pensez-vous, si les mathématiciens tentent de répéter leur expérience plusieurs fois, découvriront-ils des lois empiriques? En d'autres termes, pourront-ils conclure raisonnablement qu'il est impossible d' observer un certain type de séquence dans leurs expériences ?

Et la deuxième question: s'il existe des lois empiriques, lesquelles d'entre elles peuvent être expliquées dans le cadre de la théorie des probabilités généralement acceptée?

J'ai peur de vous décevoir, mais la réponse à la deuxième question est extrêmement simple: "Aucune".

En effet, tout ce qui est requis par le sens significatif de l'axiome de probabilité est que les poids attribués à l'aigle et à la queue soient non négatifs et, au total, donnent l'unité. Lorsque cette exigence est remplie, toute séquence d'aigles et de queues est admissible dans les observations, car elle ne modifie pas les poids attribués et ne crée donc pas de contradictions avec les axiomes. Cela conduit à la conclusion: dans leur valeur significative, les axiomes de la théorie des probabilités n'imposent pas exactement de restrictions sur les résultats possibles des observations et, par conséquent, au sens logique strict, ne sont pas en mesure d'expliquer les tendances dans les données.

En ce qui concerne la question de l'existence de lois empiriques, une double opinion est possible ici.

D'une part, si une pièce n'est pas faite avec des tours spéciaux, alors dans chaque expérience, elle peut tomber, à la fois avec un aigle et une queue, de sorte que l'expérience peut se terminer avec n'importe quelle séquence d'entre eux, ce qui signifie des lois empiriques, dans une définition stricte de ce concept, - non.

En revanche, même en consacrant toute une vie à des expériences sur une pièce symétrique, il est peu probable qu'il puisse voir au moins une série de 100 lancers, dans lesquels il n'y aura pas plus de 10 aigles (dans une seule série, les chances sont inférieures à 1 sur 10 15) Ce dernier signifie que l'expérimentateur, en toute conscience, a le droit d'accepter la déclaration: "Dans une série de 100 lancers, une pièce symétrique tombera avec l'aigle au moins 11 fois" comme une régularité empirique bien fondée.

Ici, nous arrivons clairement à la contradiction entre la philosophie de la science et le bon sens, lequel des énoncés suivants?

Lorsqu'il s'agit de décisions spécifiques, nous devons agir de manière catégorique: attaquer - ou défendre, opérer - ou continuer à traiter médicalement, conclure un accord - ou refuser l'offre. Dans de telles circonstances, vous ne pourrez en aucun cas utiliser la théorie des probabilités sans avoir fait d’erreurs d’interprétation. Dans certains cas, des événements improbables devront être considérés comme impossibles, dans d'autres - remplacer la probabilité par une fréquence ou considérer l'attente mathématique comme la valeur moyenne d'une série finie d'expériences.

La raison de cette situation étrange ne vaut guère la peine d'être cherchée dans les défauts de la théorie abstraite des probabilités: il y a tout lieu de croire que cette discipline mathématique est juste cohérente. C'est une autre question que toute théorie basée sur la philosophie du «oui» et du «non» sans ambiguïté, de la «vérité» absolue et de la «réalité objective» ne correspondra probablement pas à notre compréhension intuitive de ce qu'est la «probabilité» et de la façon de la mesurer. Il n'y a même pas de certitude complète que ce concept est réel, et n'est pas une simplification d'un concept qui n'a pas encore été découvert (comme c'était le cas avec la «sphère céleste» ou le «vent éthéré»).

Si une théorie n'est pas entièrement développée et que ses interprétations sont souvent contradictoires, vaut-il la peine de la mettre en pratique? Dans les cas où le résultat ne diffère pas trop du bon sens - ça vaut probablement le coup! Par exemple, Leibniz, Euler, Lagrange, Fourier et beaucoup de leurs contemporains ont utilisé avec succès l '"Analyse des Infinitesimals" bien avant de parvenir à créer au moins une théorie des nombres réels.
Ne prenez pas la science trop strictement!

Comme une blague tardive du poisson d'avril.
Sergey Kovalenko.

2020 année
magnolia@bk.ru


(auteur: Alexas_Fotos)

All Articles