1. Introduction
Le raisonnement par analogie est un mode de raisonnement courant, explicite ou implicite dans nos pratiques épistémiques. L'histoire des sciences est riche de nombreux exemples, tels que le parallélisme de structure entre le son et la lumière ou entre les systèmes hydrauliques et électriques. La vie quotidienne recèle de nombreuses applications typiques du raisonnement par analogie, par exemple lorsqu'un enfant apprend à parler ou lorsqu'un juriste compare différents cas de jurisprudence. Des analogies variées sont utilisées également pour illustrer certaines idées, comme lorsque la sélection artificielle est comparée à la sélection naturelle. Les analogies permettent plus largement encore de former nos perceptions, de construire des taxinomies, d'inférer des relations ou de résoudre des problèmes.
Plus précisément, trois fonctions des analogies et du raisonnement par analogie peuvent être distinguées eu égard à leur rôle dans les processus de raisonnement. La fonction didactique consiste à offrir une image simple et compacte, réaliste ou poétique, d'un phénomène complexe, dans un but pédagogique ou de communication. La fonction heuristique suggère ex ante l'existence possible d'une nouvelle propriété d'un objet par similarité avec un autre objet. La fonction argumentative soutient ex post la croyance dans cette nouvelle propriété. L'article se concentre sur les deuxième et troisième fonctions, en considérant le raisonnement par analogie comme un processus d'inférence.
La pertinence du raisonnement par analogie est appréciée différemment selon les différentes conceptions philosophiques de son rôle et de sa justification. Ainsi, Mary Hesse (Reference Hesse1966) affirme que certains raisonnements analogiques profonds forment le cœur de la recherche scientifique. Au contraire, Jacques Bouveresse (Reference Bouveresse1999) dénonce nombre d'analogies en sociologie qui relèvent d'un mode de raisonnement fantaisiste. John D. Norton (Reference Norton2021) soutient que tout raisonnement par analogie doit être accepté ou refusé sur la base d'un jugement concret au cas par cas, et non à travers un quelconque schéma général. De nombreux autres travaux ont cherché à lier ou à réduire le raisonnement par analogie à des modes de raisonnement plus classiques, tandis que certains l'ont traité comme un mode de raisonnement spécifique (voir Bartha, Reference Bartha and Zalta2013, pour une revue de la littérature sur la question). Toutefois, aucune représentation formelle unifiée satisfaisante n'en a encore été proposée.
La théorie intuitive la plus courante affirme qu'une bonne inférence analogique s'appuie simplement sur une « bonne analogie », ce qui signifie notamment qu'elle repose sur le fait que deux objets partagent plusieurs propriétés communes. Mais il est évident que dans de nombreux cas, cette simple condition ne suffit pas, même intuitivement, pour défendre l'idée que les deux objets vont partager une autre propriété : des conditions complémentaires sont requises. Ainsi, plusieurs auteurs ont ajouté des contraintes structurelles aux affirmations analogiques et au raisonnement par analogie en identifiant des conditions qui les rendent à la fois plus pertinents et plus robustes.
Mary Hesse (Reference Hesse1966) a proposé par exemple une représentation « tabulaire » des arguments analogiques, qui distingue un domaine source et un domaine cible, chaque domaine incluant un ensemble d'objets, de propriétés et de relations. Cette représentation définit les « relations verticales » comme les relations entre les propriétés à l'intérieur de chaque domaine et les « relations horizontales » comme les relations entre les propriétés respectives des domaines. Elle propose ensuite sur cette base plusieurs conditions qualitatives pour accepter un argument analogique.
Paul Bartha (Reference Bartha2010, Reference Bartha and Zalta2013) a souligné que les propositions de Hesse, et plus généralement ce qu'il appelle les « principes de bon sens » du raisonnement par analogie, reposent trop sur les relations horizontales (établissant des similarités et des différences entre les objets) et sur des concepts vagues utilisés pour définir ce qu'est une bonne analogie. En réponse, il a proposé une théorie reposant sur un « modèle articulé », qui se concentre plutôt sur les différents types de relations verticales au sein des domaines source et cible, c'est-à-dire sur les types de liens entre les propriétés communes aux objets et la propriété projetée. Cependant, cette analyse repose sur une liste de critères qualitatifs qui échouent à fournir une représentation formelle montrant comment la combinaison de ces critères pourrait justifier une conclusion précise. En effet, ces critères dépendent de concepts ambigus et mal définis tels que « essentiel », « causal », « pertinent » ou « critique ». De plus, la plupart des philosophes considèrent qu'un raisonnement par analogie ne doit pas être redondant, sous peine de perdre son utilité. Or, l'analyse de Bartha manque elle-même de clarté sur ce point essentiel : le fait que l'objet cible sur lequel l'analogie est menée satisfait la propriété projetée sur l'objet source est une prémisse nécessaire pour parler de « raisonnement par analogie ».
L'idée de non-redondance est le point de départ de Todd Davies et Stuart Russel (Reference Davies and Russell1987), qui ont proposé une analyse formelle générale du raisonnement par analogie fondée sur des « règles de détermination », qui relient les propriétés communes et les propriétés projetées d'un raisonnement par analogie. Ils aboutissent cependant à une analyse purement déductive du raisonnement par analogie vu comme un enthymème, qui est critiquée par Bartha parce que la prémisse de cet enthymème n'est en général pas accessible dans les croyances d'arrière-plan. En outre, leur représentation formelle des règles de détermination est sujette à une ambiguïté qui est discutée dans le présent article.
Notre article est conforme à l'esprit des travaux de Bartha et de Davies et Russel sur deux points, soit l'importance des relations verticales et le rôle des règles de détermination. Toutefois, il propose une analyse plus formelle et plus générale qui s'applique même en l'absence de toute connaissance ou forte croyance dans ces règles, et échappe donc à toute réduction du raisonnement par analogie à la logique déductive. Il développe une analyse syntaxique de ce mode de raisonnement, qui se distingue par ailleurs des travaux qui étudient les aspects pragmatiques ou les schémas rhétoriques associés à certains exemples concrets, tels que ceux proposés dans le cadre des théories de l'argumentation par Henrique Jales Ribeiro (Reference Jales Ribeiro2014) et Fabrizio Macagno et al. (Reference Macagno, Walton and Tindale2017).
Dans le prolongement de l'analyse par Willard Quine (Reference Quine1969) des difficultés inhérentes à la recherche d'une définition logique de l'analogie absolue ou de la similarité, nous proposons une vision relative de l'assertion analogique, qui évite ces difficultés et rend mieux compte de la manière dont fonctionne le raisonnement par analogie. Nous montrons comment différents types d'assertions analogiques, incluant celles au sein desquelles les objets analogues sont prima facie différents, peuvent être unifiés par une définition universelle de l'analogie relative. Ce faisant, notre analyse évite de recourir à une liste sans fin de critères caractérisant ce qu'est une « bonne analogie » (Norton, Reference Norton2021).
Tout raisonnement par analogie repose sur l'assertion d'une telle « analogie relative » afin de justifier la projection d'une propriété nouvelle d'un objet sur un autre, en s'appuyant sur une méta-hypothèse d'arrière-plan explicite qui relie cette propriété nouvelle aux propriétés communes connues. Ces deux étapes (assertion analogique et inférence analogique) sont fortement liées lorsqu'une assertion analogique prépare une inférence analogique. Une telle procédure permet de mesurer notre croyance dans les conclusions par notre croyance dans ces méta-hypothèses.
Notre thèse est alors que le raisonnement par analogie ne doit pas être réduit à telle ou telle logique spécifique, c'est-à-dire à une relation de conséquence particulière. Il s'agit plutôt d'un schéma d'inférence qui peut être associé à différents types de relations de conséquence, en fonction du statut de la croyance dans la méta-hypothèse d'arrière-plan.
Dans la deuxième partie de l'article, nous introduisons un cadre général et considérons différentes formes d'assertions analogiques, en écartant le concept d'analogie absolue au profit du concept d'analogie relative. La troisième partie traite de l'inférence analogique : nous proposons un type général de schéma d'inférence qui relie les propriétés cibles et sources grâce à une hypothèse d'arrière-plan ; nous détaillons une spécification déductive de ce schéma d'inférence en identifiant l'hypothèse d'arrière-plan la plus pertinente pour ce contexte ; une analyse probabiliste de ce schéma d'inférence est ensuite proposée. La quatrième partie compare le raisonnement par analogie et l'induction à un cas, c'est-à-dire l'induction reposant sur une seule instance de confirmation. Finalement, la cinquième partie expose des conclusions sur la spécificité de notre approche et des pistes pour des approfondissements ultérieurs.
2. L'assertion analogique
2.1. Cadre général
Nous nous plaçons dans le cadre de la logique du premier ordre en supposant l'existence d'un univers X d'objets A, B, etc., qui sont des constantes du langage. Les objets peuvent être des entités concrètes (des personnes, des voitures, des monuments) ou des entités abstraites (des nombres, des énoncés, des valeurs). Ils peuvent être spécifiques (John, la tour Eiffel, le nombre 6) ou génériques (un être humain, un monument, un nombre). Un objet spécifique est une entité donnée de manière exogène, alors qu'un objet générique est une classe endogène d'objets spécifiques.
Soit par ailleurs un ensemble P de propriétés, définies sur l'univers X d'objets, et représentées par des prédicats unaires P, Q, etc., qui rendent vraie ou fausse la formule P(X) pour tout objet X. Il peut s'agir de propriétés concrètes (être rouge, être lourd) ou abstraites (être plus grand que 3, être vrai). Pour un objet donné X, la propriété P est dite pertinente ou non selon qu'elle s'applique ou non à cet objet. Par exemple, rouge est une propriété pertinente pour une balle, mais pas pour un nombre.
Soient enfin des relations entre les objets du même ensemble X, ou de deux ensembles X et Y, notées R, S, etc. Les relations sont des prédicats binaires ou à n places, associés à des formules de type R(X,Y) ou S(X, Y… T). Comme précédemment, ils peuvent être concrets ou abstraits. Par exemple, un mari est relié à sa femme par une relation de mariage, et 4 est lié à 2 par la relation « carré de ».
La première et la plus simple assertion analogique est appelée « analogie notionnelle ». Elle exprime le fait que « A est comme B », noté « A ~ B », et affirme qu'il existe une certaine forme de similarité entre deux objets spécifiques (John est comme Ophélia) ou génériques (un avion est comme un oiseau), ou entre des objets appartenant aux deux catégories (cet immeuble est comme un bateau). Les deux objets sont comparés eu égard à au moins une propriété pertinente. Pour une propriété donnée, les deux objets sont covalents si tous les deux la satisfont ou ne la satisfont pas, et contrevalents dans le cas contraire.
Une seconde forme plus élaborée d'assertion analogique est appelée « analogie relationnelle ». Elle exprime que « A est à B ce que C est à D », noté « A : B :: C : D », et indique en cela une relation similaire entre les deux couples d'objets. Cela peut s'appliquer à des objets spécifiques (Dante est à l'Italie ce que Shakespeare est à l'Angleterre) ou génériques (un sabot est à un cheval ce qu'un pied est à un être humain), voire à un mélange des deux catégories d'objets (la bière est à la Belgique ce que le vin est à la France). Dans ces exemples, A et C appartiennent à un univers d'objets X et B et D appartiennent à un autre univers Y. Cependant, les quatre objets peuvent aussi appartenir au même univers X, par exemple avec une relation de filiation : Alice est à Bob ce que Mary est à John (leur fille).
Ce type d'analogie est en fait logiquement équivalent au précédent, car il peut être redéfini comme une analogie notionnelle entre deux couples d'objets : « (A,B) ~ (C,D) », basée sur une relation similaire entre les deux couples. L'analogie relationnelle a souvent été assimilée à l'analogie en général, car elle a donné son nom à ce concept dans le travail d'Aristote, le terme αναλογία s'appliquant à une identité de proportion. C'est pourquoi elle est fréquemment appelée « analogie proportionnelle » bien qu'elle ne s'applique pas seulement au concept numérique de proportion.
Dans ce cadre, il est facile d’étendre l'analogie relationnelle à des relations entre deux ensembles ordonnés d'exactement n objets (des « n-uplets »), et d’écrire que (X1 … Xn) ~ (Y1 … Yn).
Dans le même esprit, mais sortant du présent cadre formel, il serait possible d’étendre ces définitions à des analogies entre propriétés telles que P1(X) : P2(X) :: P3(X) : P4(X). Plus généralement encore, des « analogies structurelles » pourraient exprimer des analogies au sein de modèles scientifiques, en y incluant un ensemble de relations analytiques entre différentes propriétés d'un objet, traitées comme des variables. L'exemple le plus simple en science serait l'expression quantitative d'une analogie relationnelle telle que la longueur d'une tige de métal est à sa température ce que l'allongement d'un ressort est à la force exercée, où la relation sous-jacente est une relation linéaire.
En gardant la même définition, les propriétés comparées de deux objets peuvent même ne pas être identiques mais seulement des « propriétés qui se correspondent ». Ce point a été souligné par plusieurs auteurs (Bartha, Reference Bartha2010 ; Juthe, Reference Juthe2005 ; Hesse, Reference Hesse1966). Il faut alors définir logiquement cette notion intuitive mais vague de « correspondance » entre propriétés, et montrer que cela implique seulement un raffinement de notre définition générale de l'assertion analogique.
Commençons par un exemple simple. Une analogie relationnelle peut énoncer par exemple que les poumons sont aux animaux vivant dans l'air ce que les branchies sont aux animaux vivant dans l'eau. La propriété d'avoir des poumons est différente de celle d'avoir des branchies, les processus chimiques associés à ces organes étant différents. Mais les poumons permettent aux animaux vivant dans l'air (A) de le respirer (P1), et les branchies permettent aux animaux vivant dans l'eau (B) d'en extraire de l'oxygène (P2). Ils impliquent une propriété identique : permettre l'extraction de l'oxygène du milieu ambiant.
Une telle correspondance peut être formalisée comme suit. Soient P un domaine de propriétés sur un univers d'objets X, P1 la restriction de P sur X1 ⊂ X, P2 la restriction de P sur X2 ⊂ X. Alors si P1 ε P1 et P2 ε P2, on peut dire que :
P1 correspond à P2 ssi il existe une propriété P dans P, telle que ∀ X ε X1, P1(X) → P(X) et ∀ X ε X2, P2(X) → P(X)
Si par ailleurs P1(A) et P2(B), alors P(A) et P(B), donc A ~ B.
Les analogies reposant sur des propriétés qui se correspondent sont fréquentes en science, par exemple quand les équations de deux domaines expriment la même forme mathématique entre des variables qui « se correspondent » de manière évidente. Considérons par exemples les réseaux électriques et hydrauliques. On peut dire qu'ils sont associés à un même type de mécanisme, celui des « flux réticulés ». L'intensité électrique correspond au débit hydraulique, car tous deux impliquent un potentiel de mouvement. La tension correspond à la différence de pression, car toutes deux impliquent un potentiel de mouvement. En outre, la loi des nœuds (pour les intensités comme pour les débits) et la loi des boucles (pour les tensions comme pour les différences de pression) s'appliquent aux deux types de phénomènes. Finalement la loi d'Ohm, qui lie de manière linéaire l'intensité à la tension, est analogue à la loi qui lie de manière linéaire le débit à la différence de pression.
Ce concept de correspondance permet de mieux comprendre la différence souvent citée dans la littérature entre l’« analogie formelle », qui se produit lorsque les propriétés associées (les variables) de deux modèles sont liées deux à deux par tout type de relation horizontale, et l’« analogie substantielle », qui a lieu lorsque de surcroît les propriétés associées « se correspondent ».
Par exemple, considérons la loi de Newton, énonçant que la force d'attraction entre deux corps est proportionnelle à leur masse et inversement proportionnelle au carré de leur distance. Une analogie avec la loi de Coulomb, qui énonce que la force d'attraction entre deux charges électriques est proportionnelle à leurs charges et inversement proportionnelle à leur distance, est substantielle, car les deux lois impliquent des forces d'attraction entre des masses ou des charges. Par contre, l'analogie avec la loi du trafic routier, qui indique que le trafic entre deux villes est proportionnel à leurs populations et inversement proportionnel à leur distance, est formelle, car ces deux lois ne suggèrent pas d'interprétation commune quant au phénomène physique sous-jacent.
2.2. Analogie absolue
Norton (Reference Norton2021), en remontant à George Joyce (Reference Joyce1936), fait remarquer qu'une assertion analogique a souvent été considérée comme un jugement absolu, tel que « A ressemble à B du fait qu'il satisfait P ». Elle peut différer de la simple similarité en ce qu'il s'agit d'un jugement énoncé pour préparer une inférence analogique : « B satisfait Q, A ressemble à B du fait qu'il satisfait P, donc A satisfait tout autant Q ». Cette inférence peut impliquer la mobilisation de critères additionnels tels que le fait d'avoir des similarités multiples ou peu de contre-similarités.
Cependant, comme cela a été solidement argumenté par Quine, on peut montrer qu'il n'est pas possible de proposer une définition logique de cette conception absolue de l'analogie, ni de la conception supposée plus faible de similarité.
La définition intuitive la plus simple serait la suivante :
(1) A ~ B ssi il existe une propriété P telle que P(A) & P(B)
L'analogie est définie par l'existence d'une propriété commune aux deux objets. Cette définition est bien trop laxiste et même triviale : il est toujours possible de trouver une propriété commune à deux objets quelconques, vidant ainsi l'analogie de tout intérêt spécifique pour différencier un couple d'objets d'un autre.
Une tentative plus stricte pourrait être :
(2) A ~ B ssi pour toute propriété P, P(A) ↔ P(B)
Or, cette covalence universelle entre propriétés conduit à une situation extrême opposée, en réduisant l'analogie à l'identité.
Quine propose alors d'essayer une définition intermédiaire :
(3) A ~ B ssi A et B ont « beaucoup » de propriétés en commun
Cependant, comme il le souligne, cette notion est trop vague, car on ne sait pas dire combien de propriétés sont requises. En outre, il est essentiel de savoir ce qui compte comme une propriété. Si tout ensemble d'objets est considéré comme une propriété (ce qui est logiquement possible), alors tout couple d'objets partagera le même nombre de propriétés qu'un autre couple. Si on limite les propriétés qui comptent à celles qui réunissent des objets similaires, nous aboutissons à une circularité.
Une tentative d’échapper aux problèmes posés par ces définitions générales consiste à restreindre les propriétés admissibles à un sous-ensemble unique W de propriétés, défini de manière exogène et pertinent pour tout objet. Ce faisant, les formules (1), (2) et (3) peuvent être complétées de la manière suivante :
(1a) A ~ B ssi il existe une propriété P appartenant à W telle que P(A) & P(B)
(2a) A ~ B ssi pour toute propriété P appartenant à W, P(A) ↔ P(B)
(3a) A ~ B ssi A et B ont « beaucoup » de propriétés communes P appartenant à W
Il est évident que (1a) échappe à la trivialité de (1), que (2a) évite la réduction de (2) à l'identité et que (3a) peut éviter le caractère arbitraire de (3). La question est alors de fournir une définition pertinente pour un tel ensemble universel W, car l'universalité de W est requise pour que ces définitions soient des définitions générales de l'analogie absolue.
Le seul candidat intuitif pour W identifié dans la littérature est l'ensemble des « espèces naturelles ». Quine étudie cette possibilité en soulignant la relation intuitive entre ce concept et la notion de similarité : une espèce naturelle serait un ensemble d'objets similaires (les pommes, mais pas l'ensemble fait d'un fruit et de ma lampe de chevet), et réciproquement les objets jugés similaires seraient ceux qui font partie de la même espèce naturelle (même exemple).
Cependant, cette notion fait l'objet de fortes controverses, à moins d'accepter une position philosophique totalement essentialiste (voir Bird et Tobin, Reference Bird, Tobin and Zalta2015 pour une présentation critique de cette position). Les propriétés qui définissent les espèces naturelles sont supposées être des propriétés réellement importantes pour classer les objets, d'une manière authentiquement naturelle. Mais les critiques de cette conception font valoir qu'il n'existe en fait aucune classification naturelle. Les classifications ne sont que des outils humains construits pour des objectifs pratiques dans le langage courant et scientifique ; elles sont évolutives, et ce ne sont pas des entités essentielles et éternelles du monde comme le pensait Platon (voir par exemple Dupré, Reference Dupré1993). Comme le souligne l'argumentation de Quine, la définition des espèces naturelles repose par ailleurs sur des notions trop vagues, ou sur une circularité évidente avec la notion de similarité que nous cherchons précisément à définir. Il n'y a donc pas de définition philosophique ni de définition logique satisfaisante de ce concept, et il n'est de ce fait pas possible d'identifier quel ensemble de propriétés permettrait de définir W.
Mais il existe une autre raison pour refuser toute définition absolue de l'analogie, qui apparaît lorsque l'on considère ce qui arrive quand une analogie est contestée par une contre-analogie. Une contre-analogie suggère l'existence d'un meilleur partenaire que celui proposé, aussi bien pour la source que pour la cible, en général en mettant en avant des propriétés plus pertinentes pour la comparaison. Dans le cas d'une analogie notionnelle, considérons l'exemple suivant :
– Bruges est la Venise du nord ; c'est une cité bâtie sur des canaux.
– Non, Bruges n'est pas la Venise du nord ; c'est une cité qui n'a jamais eu d'influence économique majeure.
– C'est Anvers qui est la Venise du nord, car elle fut une capitale économique européenne, comme Venise.
Ces débats soulignent la vacuité de toute tentative de définition de l'analogie absolue : même si A et B sont similaires d'un certain point de vue, ils différeront toujours d'un autre point de vue. Aucun couple d'objets non identiques n'est similaire du point de vue de toutes les propriétés pertinentes possibles, même si nous limitions ces propriétés aux catégories courantes ou « naturelles » : est-ce qu'une pomme est plutôt similaire à une poire car c'est un fruit, ou à une balle de tennis car elle est ronde ?
2.3. Analogie relative
Nous sommes ainsi conduits à considérer que toute analogie doit toujours être exprimée sous l'angle d'une certaine propriété, ou d'un domaine de propriétés. Cela apporte de manière évidente une réponse appropriée à la question des débats analogiques : aucune assertion analogique ne tient de manière universelle, mais seulement d'un point de vue relatif quant à la similarité entre deux objets.
La manière la plus simple de représenter formellement l'analogie relative est la suivante, en indiçant la définition (1) par la propriété P :
(1b) (A ~P B) ssi il existe une propriété P telle que P(A) & P(B)Footnote 1
Par exemple, une pomme est comme une poire, relativement à la « fructicité », c'est-à-dire au fait qu'elles sont des fruits.
Pour l'analogie relationnelle, la définition s’écrit :
(1b’) A : B :: r C : D ssi il existe une relation R telle que R(A,B) & R(C,D)
Par exemple, Paul est à Ana ce que Bob est à Julia, relativement à la « propriété d’être un fils », c'est-à-dire que c'est son fils.
Cette manière de définir l'analogie relative semble en réalité très restrictive. En effet, le sens d'une analogie est de pointer le fait que deux objets partagent une propriété particulière parmi une liste d'autres propriétés possibles eu égard à un certain axe de description. Ces deux voitures sont analogues relativement à leur couleur si elles sont toutes les deux bleues. Ces deux animaux sont analogues relativement à leur espèce s'ils sont tous les deux des chiens. Cependant, même si cela est vrai, il semble étrange d'affirmer que ces deux voitures sont analogues relativement à leur « bleuité » ou que ces deux animaux sont analogues relativement à leur « caractère canin ».
Ce qui est indiqué plutôt par une analogie relative, c'est le fait que deux objets sont analogues relativement à un certain « point de vue » qui peut être exprimé par un ensemble de propriétés disjointes (par exemple la couleur ou l'espèce animale). Ils partagent une même propriété de cet ensemble particulier alors qu'ils auraient pu en satisfaire d'autres (une voiture peut être bleue et l'autre rouge, un animal peut être un chien et l'autre un chat). Ce qui est souligné par l'analogie est que ces objets ne se différencient pas si on considère l'ensemble des propriétés possibles suggérées par cet ensemble précis. Ainsi, ces voitures sont analogues relativement à leur couleur et ces animaux sont analogues relativement à leur espèce.
Un « domaine » Z est alors défini comme un ensemble de propriétés disjointesFootnote 2, associées au même point de vue. Muni de cette notion, on peut de redéfinir ainsi l'analogie relative en l'indiçant cette fois par le domaine choisi :
(1c) (A ~Z B) ssi il existe une propriété P au sein du domaine Z, telle que P(A) & P(B)
Cette relativisation de toute analogie à un domaine donné exprime l'intention du locuteur de se restreindre à un point de vue de comparaison spécifique et de ne parler que de cet aspect des choses. Un « point de vue » représente à cet égard une attitude mentale, qui consiste à appliquer un filtre sur les propriétés des choses ou sur les événements du monde auxquels on prête attention.
On dira alors par exemple : une pomme est comme une poire relativement aux espèces végétales : ce sont des fruits.
Un domaine Z peut aussi être un ensemble de relations disjointes. On peut alors redéfinir l'analogie relative relationnelle de la façon suivante :
(1c’) A : B :: z C : D ssi il existe une relation R au sein de Z telle que R(A,B) & R(C,D)
Par exemple, Paul est à Ana ce que Bob est à Julia relativement aux types de relations de parenté : c'est son fils.
La combinaison de deux points de vue élémentaires, en considérant le produit de deux domaines Z1 et Z2, forme un nouveau point de vue composite Z, qui est également un domaine définissant un point de vue. Par exemple :
– Une pomme est comme une poire du point de vue des espèces végétales et de la couleur. Ce sont des fruits jaunes.
– Paul est à Ana ce que Bob est à Julia, du point de vue des relations de parenté et des relations sociales. C'est son fils et il ne la voit jamais.
Ces situations peuvent être exprimées plus simplement en utilisant une conjonction de prédicats : être jaune et être un fruit, être un fils et ne jamais voir sa mère. Le domaine unique Z est le produit de deux domaines représentant deux ensembles disjoints de propriétés : les couleurs et les espèces végétales, les relations de parenté et les relations sociales.
Mais ces domaines composites Z peuvent néanmoins apparaître comme des combinaisons hétérogènes de domaines élémentaires. Dans beaucoup d'exemples concrets, Z est formé à partir de points de vue élémentaires corrélés. Ces derniers sont liés par le fait qu'ils font partie d'une « structure » similaire ou contribuent à une « fonction » similaire partagée par les objets comparés. C'est le cas pour les réseaux électriques et hydrauliques lorsqu'ils sont analysés du point de vue composite des flux dans un réseau. De telles considérations sont toutefois d'ordre purement sémantique et pourront faire l'objet d’études ultérieures.
On peut vérifier que l'analogie relative exprimée par (1c) ou par (1c’) satisfait certains principes minimaux requis par une définition pertinente de l'analogie, et que ne respectaient pas les définitions possibles de l'analogie absolue :
– Elle n'est jamais réduite à l'identité ou à la trivialité.
– Elle n'est pas circulaire, car le domaine Z est choisi par l'agent eu égard au point de vue qu'il veut souligner, et ne requiert pas lui-même de définition de l'analogie.
En outre, il est facile de vérifier que l'analogie notionnelle est une relation d’équivalence qui satisfait les principes suivants :
- Réflexivité : A ~z A (un avion est comme un avion).
- Symétrie : si A ~z B, alors B ~z A (si un avion est comme un oiseau, alors un oiseau est comme un avion).
- Transitivité : si A ~z B et B ~z C, alors A ~z C (si un avion est comme un oiseau et qu'un oiseau est comme une abeille, alors un avion est comme une abeille).
Pour une analogie relationnelle, ces principes deviennent :
- Réflexivité horizontale : A : B :: z A : B
- Symétrie horizontale : si A : B :: z C : D alors C : D :: z A : B
- Transitivité horizontale : si A : B :: z C : D et C : D :: z E : F alors A : B :: z E : F
Ces principes ne sont pas des prérequis pour notre définition de l'analogie relative : ils découlent simplement de notre définition, qui a sa propre justification. Ils peuvent tous être considérés au minimum comme compatibles avec une analyse syntaxique des assertions analogiques, indépendamment de toute considération pragmatique d'assertabilité et d'intentionnalité.
En effet, la réflexivité est évidente : un objet est au moins analogue à lui-même, même si l'affirmer peut sembler étrange et inutile dans la conversation. La symétrie est généralement acceptée ex post, mais pas ex ante : l'analogie est associée à une intention illocutoire qui distingue une cible qui hérite d'une propriété bien connue pour la source. Par exemple, en déclarant « tes yeux sont bleus comme le ciel », on fait un compliment à une personne en lui attribuant une propriété évidente du ciel. Mais cette remarque concerne seulement l'aspect illocutoire de cette affirmation, et ne remet pas en cause la vérité syntaxique de la symétrie. La transitivité résulte du fait que les domaines Z sont des ensembles disjoints de propriétés. On peut remarquer qu'elle n'est pas respectée par les définitions de l'analogie absolue, car les propriétés que partagent respectivement A et B et B et C ne sont dans ce cas pas nécessairement les mêmes. En revanche, si l'analogie relative entre A et B et entre B et C est formulée du même point de vue, la transitivité devient une propriété tout à fait naturelle.
Dans de nombreux travaux philosophiques, des positions contextualistes ont été développées afin d'expliquer que la connaissance, la croyance, voire la vérité étaient relatives à un « contexte ». C'est une conception relativiste qui renvoie à l'idée que les conditions de vérité ou de croyance des énoncés « varient de certaines façons selon leur contexte d’énonciation » (DeRose, Reference DeRose, Greco and Sosa1999). Cependant, même si cela pourrait y faire penser, la notion de domaine utilisée pour définir l'analogie relative n'est pas du tout contextualiste : elle n'exprime pas le fait que les assertions d'analogie absolue sont vraies seulement dans un certain contexte, mais bien plus radicalement qu'il n'y a jamais rien de tel qu'une analogie absolue. Énoncer une analogie de manière cohérente consiste toujours à énoncer une analogie relative, et l'acceptabilité de celle-ci ne dépend pas du contexte.
3. L'inférence analogique
3.1. Schéma d'inférence général
Typiquement, l'inférence analogique consiste à utiliser une similarité entre deux objets comme prémisse pour en inférer de nouvelles. Sous cet angle, une assertion analogique est une variété particulière de jugement de similarité qui justifie son extension à d'autres propriétés : ce point permet de distinguer les simples similarités des analogies ou des « similarités pertinentes ». Comme l’écrit par exemple Bartha, « [u]n argument analogique est une représentation explicite d'un raisonnement analogique qui s'appuie sur des similarités reconnues entre deux systèmes en vue de la conclusion que d'autres similarités existent » (Bartha, Reference Bartha2010, p. 1 ; notre traduction).
L'inférence analogique utilise l'assertion analogique dans le but de « transférer » les propriétés d'un objet sur un autre. L'assertion analogique elle-même peut être explicite ou non, et par exemple être simplement représentée par des faits qui l'impliquent, comme l'illustre « l'argument du violoniste » (Thomson, Reference Thomson1971). Soit Q, un nouveau prédicat unaire, ou S, un nouveau prédicat binaire. Dans ses deux formes de base (analogie notionnelle et analogie relationnelle), les inférences analogiques s’écrivent respectivement ainsi :
(4) [A ~Z B, Q(B)] ➥ Q(A)
(4’) [A : B :: z C : D, S(C,D)] ➥ S(A,B)
L'inférence analogique hérite de manière syntaxique de la nature asymétrique intentionnelle de l'assertion analogique : elle est basée sur une propriété de la « source » transférée à la « cible ». Le symbole ➥ désigne une relation de conséquence entre les prémisses et la conclusion, qui reste à caractériser.
Par exemple, du fait qu’une poire est comme une pomme relativement aux espèces végétales et qu’une pomme est comestible, on pourrait en inférer qu’une poire est comestible. De la même manière, du fait qu’une poire est à un poirier ce qu'une pomme est à un pommier relativement à sa genèse, et qu’une pomme apparaît après qu'on ait semé des graines de pommier, on pourrait inférer qu’une poire apparait après qu'on ait semé des graines de poirier.
Dans le cas des analogies structurelles, une nouvelle variable dans le modèle source peut suggérer une nouvelle variable dans le modèle cible, ces deux variables étant en correspondance. Par ailleurs, une relation incluant cette nouvelle variable dans le modèle source peut être transposée dans une relation avec la nouvelle variable correspondante dans le modèle cible. Par exemple, pour un réseau électrique, la puissance est le produit de la tension et de l'intensité. Pour un réseau hydraulique, la variable correspondante est la même, la puissance, et elle est le produit de la pression et du débit.
En nous concentrant à nouveau sur les analogies notionnelles, pour les mêmes raisons qui nous ont conduit à introduire un domaine Z énumérant les propriétés considérées pour définir une analogie relative, nous introduisons un domaine Z’ qui énumère les propriétés qui seront considérées pour la conclusion. Le raisonnement analogique (4) peut alors être développé ainsi :
(5) [P ∊ Z, Q ∊ Z’, P(A), P(B), Q(B)] ➥ Q(A)
Pourquoi ce schéma d'inférence est-il acceptable ? Notre réponse ne repose pas sur la construction d'une nouvelle relation de conséquence, mais sur une hypothèse externe supplémentaire HE, utilisée par l'agent qui argumente en faveur de la conclusion. Cette hypothèse HE est intégrée dans le raisonnement de la manière suivante (pour les analogies notionnelles) :
(6) [(A ~Z B), Q(B), HE] ➲ Q(A)
Cela peut encore être développé ainsi :
(7) [P ∊ Z, Q ∊ Z’, P(A), P(B), Q(B), HE] ➲ Q(A)
Le symbole ➲ est utilisé à la place de ➥ pour insister sur le fait que l'inclusion de HE dans les prémisses est faite pour donner un meilleur statut épistémique au schéma d'inférence.
L'extension de ce schéma d'inférence aux analogies relationnelles ou structurelles est triviale si l'on remplace P et Q par des prédicats à 2 ou n places. Les formules (6) et (7) définissent un type de schéma d'inférence qui peut être transformé en schéma d'inférence formel d'une logique spécifique dès que le symbole ➲ est remplacé par une relation de conséquence spécifique.
En identifiant le contenu précis de HE, nous étudierons les relations entre HE et deux types de relations de conséquence qui valident ce schéma d'inférence, soit la déduction et l'inférence probabiliste. Ces deux cas ne sont conçus que comme des exemples des différentes manières dont ce schéma d'inférence type peut être activé, notre thèse étant indépendante de la relation de conséquence choisie par l'agent.
D'autres logiques, comme par exemple certains modèles de logique non monotone (tel que celui de Kraus, Lehmann et Magidor, Reference Kraus, Lehmann and Magidor1990) ou de révision des croyances (tel que celui proposé par Alchourrón, Gärdenfors et Makinson, Reference Alchourrón, Gärdenfors and Makinson1985), pourraient être étudiés dans des recherches ultérieures. Notre argument est que le raisonnement par analogie ne doit pas être réduit à l'une ou à l'autre de ces logiques, ni à une quelconque nouvelle logique associée à une nouvelle relation de conséquence en particulier : il doit être compris comme un type donné de schéma d'inférence qui peut, en fonction de la nature de HE, être valide dans l'une ou l'autre des logiques existantes.
3.2. Structure de la méta-hypothèse dans un cadre déductif
Afin que la méta-hypothèse HE puisse expliquer de manière pertinente l'inférence analogique, il faut qu'elle réponde aux deux principes additionnels suivants :
– Non-redondance : HE ne doit pas trivialiser le raisonnement d'une manière qui rendrait l'une des prémisses inutile pour conclure.
– Testabilité : il faut pouvoir exhiber des protocoles empiriques cohérents à l'origine de la croyance dans HE.
Considérons alors des expressions de plus en plus sophistiquées de HE. Soit le premier candidat suivant :
(8) HE1 : ∀X [P(X) → Q(X)]
Si l'on remplace HE par HE1 dans (7), le schéma d'inférence analogique est valide déductivement. Mais si P(A) est une prémisse, la conclusion Q(A) est alors obtenue sans avoir besoin de la prémisse P(B). La non-redondance n'est donc pas satisfaite. L'inférence analogique devient dans ce cas une opération de « focalisation » d'une croyance générique sur un cas spécifique.
Pour éviter la redondance, Davies et Russell proposent une autre candidate intéressante pour HE, appelée « clause de détermination ». Elle est écrite initialement de la manière suivante :
(9) HE2 : [∀X (P(X) → Q(X))] ou [∀X (P(X) → -Q(X))]
Si l'on remplace HE par HE1 dans (7), le schéma d'inférence analogique est valide déductivement. Mais cette fois il requiert l'usage de toutes les prémisses : la prémisse Q(B) est nécessaire pour inférer Q(A). Par exemple, si HE2 affirme que tout objet en or est insensible à l'acide ou tout objet en or est sensible à l'acide, le fait que ma montre en or est insensible à l'acide implique que la vôtre, qui est elle-même en or, est aussi insensible à l'acide.
Mais comment peut-on en venir à croire à une hypothèse telle que HE2 ? Si tous les objets X tels que P(X) ont été observés, le fait que Q(X) ou -Q(X) pour tous ces X est déjà connu, et le raisonnement par analogie est inutile pour savoir si Q(A). Bien entendu, si nous savons que -Q(A), HE2 n'est pas pertinent pour ce raisonnement par analogie, qui est faux. Mais si le fait que tous les X tels que P(X) sont aussi tels que Q(X) ou le fait que tous les X tels que P(X) sont aussi tels que -Q(X) est déjà connu, la croyance dans HE2 est réduite à la croyance dans l'une des deux possibilités, soit HE1 soit son contraire, et cette connaissance conduit à nouveau à la redondance. Si l'on a observé seulement certains X tels que P(X) et s'ils sont tous tels que Q(X) ou s'ils sont tous tels que -Q(X), la croyance dans HE2 peut venir d'un processus conduisant à un saut inductif, mais à nouveau, la croyance ne concernera que l'une des deux possibilités mentionnées. Chaque observation empirique qui ne réfute pas HE2 conduira à une croyance soit dans sa première partie uniquement, soit dans sa deuxième partie uniquement. Il n'est donc pas possible d'en venir de manière cohérente à croire une hypothèse telle que HE2. La testabilité n'est donc pas satisfaite.
Il en résulte que HE2 n'est pas la bonne méta-hypothèse pour compléter le raisonnement par analogie. Il s'agit à nouveau d'une question de bon niveau de propriétés pour exprimer le raisonnement. Les domaines Z et Z’, qui sont structurés comme des « points de vue » de méta-niveau, ont un rôle à jouer pour exprimer correctement cette méta-hypothèse. Ainsi, une méta-hypothèse plus pertinente, dont la différence essentielle avec HE2 n'est pas mentionnée par Davies et Russell, est la suivante :
(10) HE3 : pour tout P de Z, pour tout Q de Z’, [∀X, (P(X) → Q(X))] ou [∀X, (P(X) → -Q(X))]
En remplaçant HE par HE3 dans (7), le schéma d'inférence analogique est à nouveau déductivement valide. On peut noter que l'usage apparent d'une logique de second ordre ne pose pas de problème particulier dans ce cadre, car les ensembles de prédicats Z et Z’ sont supposés finis. En effet, dans ce cas, la quantification sur les prédicats peut être considérée comme un schéma d'axiomes qui peut être développé sous la forme d'une liste finie d'axiomes du premier ordre, chacun mentionnant explicitement un des prédicats dans chaque domaine de quantification.
L'usage de HE1, HE2 ou HE3 comme méta-hypothèse transforme le raisonnement par analogie en enthymème, c'est-à-dire en un type d'inférence déductive avec une prémisse manquante (selon l'acception contemporaine d'un concept créé par Aristote avec la signification plus large de « déduction à partir de vraisemblances et d'indices » — voir Boyer, Reference Boyer1995). Alan Musgrave (Reference Musgrave1989) fut l'un des premiers à suggérer la transformation des inférences inductives en enthymèmes, et dans le présent contexte, les inférences analogiques sont du même type. Nous verrons cependant dans la section 3.3 que cela ne traduit pas la situation la plus générale : elles peuvent être aussi bien des inférences probabilistes ou non-monotones.
En considérant sa signification, HE3 est une méta-hypothèse qui ne repose pas sur une relation directe entre P et Q, mais sur une relation entre l'ensemble des propriétés du domaine Z et l'ensemble des propriétés du domaine Z’. Étant donné cette quantification qui parcourt Z et Z’, HE3 peut être analysée comme un ensemble d'hypothèses pour chaque couple de prédicats, un dans Z et un dans Z’. Étant donné que Z et Z’ sont des listes de propriétés disjointes, chaque objet X ne peut satisfaire qu'une seule propriété de Z et une seule propriété de Z’. HE3 signifie que tous les objets satisfaisant une propriété donnée de Z doit satisfaire une autre propriété précise de Z’. En un sens, HE3 relie chaque propriété de Z avec (au plus) une propriété de Z’, et peut donc être réécrit de la manière suivante :
(11) HE3 : pour toute propriété P de Z, il existe une et une seule propriété Q de Z’ telle que [∀X (P(X) → Q(X)]
C'est exactement la situation décrite par Nelson Goodman (1947/Reference Goodman1983) dans le chapitre « Prospects for a Theory of Projection ». Supposons que nous nous intéressions aux couleurs k de billes tirées d'un sac numéroté h, qui appartient à un tas de sacs. Ce que Goodman appelle « sur-hypothèse » d'une hypothèse G telle que « toutes les billes dans le second sac sont rouges » est une hypothèse H telle que « toutes les billes d'un même sac sont de la même couleur ». Goodman étudie la situation dans laquelle plusieurs sacs du tas ont été observés (mais pas le sac en question) et où ces observations ont conduit à confirmer H. En ayant H à l'esprit, l'observation d'une seule bille rouge dans le second sac soutient l'hypothèse G. Dans ce cas, Z est l'ensemble des prédicats « appartenir au sac numéroté h » et Z’ est l'ensemble des prédicats « être de couleur k ». La sur-hypothèse ne fait qu'exprimer que chaque sac numéroté h est associé à une seule couleur k.
Autre exemple, considérons une voiture qui est de même modèle que la mienne, à savoir une Chevrolet Silverado. Je veux en inférer que cette autre voiture a un coût proche de la mienne. Une hypothèse sous la forme HE2 pourrait s’énoncer ainsi : « soit chaque Chevrolet Silverado coûte entre 28 000 $ et 32 000 $, soit aucune Chevrolet Silverado ne coûte entre 28 000 $ et 32 000 $ » ; ma Chevrolet Silverado coûte 30 000 $ ; donc cette autre Chevrolet Silverado devrait coûter entre 28 000 $ et 32 000 $. Une méta-hypothèse sous la forme HE3 énoncerait quant à elle que « le coût de toute voiture d'un modèle donné est situé dans un intervalle borné de prix ». Sachant que ma propre Chevrolet Silverado coûte entre 28 000 $ et 32 000 $, cette autre Chevrolet Silverado devrait également coûter entre 28 000 $ et 32 000 $. Les intervalles de prix sont définis de manière exogène par les modèles de voitures.
Les hypothèses HE2 et HE3 diffèrent par le protocole empirique requis pour les valider. Pour connaître HE2, il faut observer toutes les Chevrolet Silverado (ou un très grand nombre d'entre elles) et constater que toutes coûtent entre 28 000 $ et 32 000 $ (autrement, cela serait incompatible avec la prémisse qui affirme que la mienne coûte autour de 30 000 $).
Dans ce cas, ma croyance se porte sur une version restreinte de HE2 qui énonce que « toutes les Chevrolet Silverado coûtent entre 28 000 $ et 32 000 $ ». En outre, si je ne sais pas que ma Chevrolet Silverado coûte autour de 30 000 $, je n'ai aucune idée de l'intervalle de prix qu'il faut tester.
Pour apprendre HE3, par contre, il faut seulement observer que toutes les voitures d'un même modèle sont à peu près du même prix. Cette observation, qui semble plausible, conduirait à l'hypothèse générale que, pour toute voiture d'un certain modèle, le prix se situe dans un intervalle limité. Il est évident que, contrairement à HE2, le processus pour en venir à croire HE3 est réaliste et ne conduit pas à une mutilation de l'hypothèse, réduite à une seule partie de l'alternative qu'elle énonce.
Des méta-hypothèses telles que HE3 énoncent en effet fréquemment des régularités entre des classes d'objets, dont voici quelques exemples :
– La nationalité détermine la langue maternelle ;
– L’âge et les aptitudes déterminent la classe suivie par les élèves ;
– L'espèce, le genre et l’âge déterminent le poids d'un animal.
Chacun de ces exemples est un exemple de HE3 : un ensemble Z de propriétés disjointes est relié par une application injective à un autre ensemble Z’ de propriétés disjointes.
Ce type de croyance est en général acquis d'une manière très naturelle, comme cela est illustré par l'exemple de Goodman présenté plus haut : on observe que chaque fois que les objets satisfont une même propriété (quelle qu'elle soit) parmi une première liste de propriétés disjointes (un premier domaine), ils satisfont également une autre même propriété parmi une seconde liste de propriétés disjointes (un deuxième domaine). Il s'agit typiquement d'un processus inductif au sens où une loi générale est inférée d'un nombre limité (mais potentiellement très grand) de cas. Toutefois, la méta-hypothèse peut également résulter d'un processus abductif, dans lequel elle représente la meilleure explication des observations.
On pourrait se demander si cette manière de concevoir l'inférence analogique ne conduit pas à une régression à l'infini. En effet, elle repose sur une méta-hypothèse qui doit à son tour être justifiée et dont l'origine n'est pas interne au modèle. Tel n'est pas le cas, car notre objectif n'est pas de justifier la conclusion, mais d'en comprendre la cohérence. La manière dont nous en venons à croire HE3 n'est pas elle-même une partie du raisonnement par analogie : ce qui est requis est simplement le fait qu'il est possible d'attribuer à HE3 un degré de croyance grâce à un protocole empirique clair et sans redondance. Ce degré de croyance demeure cependant exogène.
3.3. Méta-hypothèse dans un cadre probabiliste
On pourrait essayer d’éviter le recours à une méta-hypothèse complexe telle que HE3 simplement en affaiblissant l'hypothèse HE1, trop forte, et en en donnant une version probabiliste telle que celle-ci :
(12) HE4 : Pr(Q(X) / P(X)) = α
dans laquelle Pr est la probabilité épistémique de l'agent retenant HE1 et non une probabilité objective attribuée à l'hypothèse HE1.
En remplaçant HE par HE4 dans le schéma d'inférence général (7), on en conclut que Pr(Q(A)) = α, selon une règle simple d'inférence probabiliste. Cette inférence n'est plus déductive car elle est défaisable : un fait nouveau concernant A et B peut conduire à changer la conclusion quant à la probabilité de Q(A) (comme cela a par exemple été souligné par Hempel, Reference Hempel1965). Une autre manière d'exprimer cela est de remarquer qu'il peut y avoir plusieurs hypothèses concurrentes de HE4, associées à des propriétés différentes P’(X), telles que le degré de croyance dans la conclusion change si P’(X) se produit. Toutefois, cette formule conduit encore à une situation de redondance : il n'est pas nécessaire d'avoir une information à propos de B pour conclure à un degré de probabilité de Q(A). HE4 n'est donc pas une meilleure candidate que HE1.
La seule manière d’échapper à la redondance est d'utiliser une méta-hypothèse du type de HE3 (la non-pertinence de HE2 ayant été démontrée). Mais dans de nombreuses, sinon dans toutes les situations empiriques de la science ou du raisonnement courant, nous ne disposons pas de telles hypothèses dans nos croyances d'arrière-plan, mais seulement de versions incertaines de ces hypothèses. On peut alors supposer que les agents rationnels utilisent plutôt des hypothèses de la forme suivante :
(13) HE5 : Pr(HE3) = α
En remplaçant HE par HE5 dans (7), on peut conclure que Pr(Q(A)) = α. À nouveau, ce schéma d'inférence n'est pas déductif et n'est pas un enthymème, car il est défaisable, en présence de toute nouvelle information concernant A ou B. Cette caractéristique est à l'origine de ce qui permet les débats analogiques. D'une manière générale, quatre situations typiques se présentent alors :
– Situation 1 : Pr(HE3) est suffisamment élevé pour que HE3 soit « accepté » (au sens, par exemple, que sa probabilité reste différente de 1, mais peut être aussi proche de 1 qu'on le souhaite, comme cela est exprimé dans la sémantique d'Adams [voir Pearl, Reference Pearl1988]). Dans ce cas, le raisonnement analogique aura une force argumentative décisive et la conclusion sera acceptée avec le même degré de croyance élevé : ma voiture est une Twingo comme la vôtre. Son prix est bien inférieur à 10 000 $. Donc, la vôtre doit coûter bien moins que 10 000 $, car le modèle de voiture détermine son prix. Le fait que le modèle de voiture détermine son prix est presque certain, c'est pourquoi je suis presque certain de la conclusion.
– Situation 2 : Pr(HE3) est simplement plus élevée que la probabilité a priori Pr(Q(A)). Dans ce cas, le degré de croyance dans Q(A) augmente jusqu'au degré de croyance dans HE3. Cela correspond à une confirmation relative (Zwirn et Zwirn, Reference Zwirn and Zwirn1996) pour laquelle la croyance dans la conclusion est renforcée bien qu'elle puisse rester insuffisamment élevée pour conduire à l'accepter (auquel cas elle conduirait à une confirmation absolue, ce qui correspond au cas précédent). La force du raisonnement par analogie dans la situation 2 est évidemment plus faible que dans la situation 1 : Bjorn et Anna sont des étudiants suédois dans des universités australiennes. Bjorn parle anglais couramment. Donc, je peux croire qu'Anna parle aussi anglais couramment (car la nationalité et le niveau d’étude déterminent assez bien le niveau général de compétence linguistique). A priori, je ne peux pas savoir si Anna, qui est suédoise, parle couramment anglais, et ma croyance à ce sujet est assez faible. Cependant, j'ai une croyance plus forte dans le fait que la nationalité et le niveau d’étude déterminent les niveaux linguistiques. C'est pourquoi, quand j'apprends que Bjorn, qui est un étudiant suédois comme Anna, parle couramment anglais, j'accrois mon degré de croyance dans le fait qu'Anna le parle couramment elle aussi.
– Situation 3 : Pr(HE3) peut être totalement inconnue : aucun degré de croyance n'est attribué à HE3. Dans ce cas, le raisonnement par analogie n'aura strictement aucune valeur probante, mais il peut avoir néanmoins un intérêt heuristique en pointant une possibilité qui vaut la peine d’être étudiée. Par exemple : Mars et la Terre tournent autour du soleil, pas trop loin de lui ; elles ont une gravité et une température de surface similaires. Il y a de la vie sur Terre. Donc, il y a peut-être de la vie sur Mars (parce que la distance de rotation autour du soleil, la gravité et la température de surface déterminent les chances d'apparition de la vie). En réalité, les conditions nécessaires pour l'apparition de la vie ne sont pas encore connues et nous n'avons pas d'opinion scientifique sur la valeur de cette règle de détermination. Donc, la méta-hypothèse utilisée est très incertaine, à un degré inconnu, et probablement fausse. Néanmoins, il peut sembler plus intéressant de vérifier si Mars peut accueillir des formes vivantes que de le faire sur Pluton, qui est totalement différente de la Terre.
– Situation 4 : Pr(HE3) est très basse, voir proche de 0. Dans ce cas, la conclusion du raisonnement par analogie n'est pas prise au sérieux et peut être considérée comme fantaisiste. Cela correspond aux situations dans lesquelles le raisonnement par analogie est considéré comme un raisonnement fallacieux. Par exemple : le tigre a une queue, comme mon chat. Mon chat est inoffensif, donc le tigre est inoffensif (cela suppose que la possession d'une queue détermine le comportement animal, ce qui est évidemment ridicule).
Il peut y avoir de nombreuses situations intermédiaires, mais le principe général est toujours le même : le degré de croyance dans Q(A) est déterminé par le degré de croyance dans HE3. Idéalement, les agents rationnels devraient prendre en compte toutes les données disponibles lorsqu'ils forment leur croyance dans HE3, ce qui les conduirait, directement ou à l'issue d'une discussion avec d'autres agents, à attribuer à la méta-hypothèse une probabilité qui anticipe sur tout débat analogique possible.
Bien entendu, HE3 n'est pas toujours explicitée par l'agent lorsqu'il formule son raisonnement. Mais même si ce n'est pas le cas, une hypothèse de type HE3 doit toujours être mobilisée dans la croyance d'arrière-plan de l'agent pour pouvoir conclure de manière cohérente un raisonnement par analogie. Cette hypothèse peut être « révélée » par un interlocuteur qui observe le raisonnement proposé par l'agent. Par exemple, un contradicteur peut révéler cette hypothèse pour montrer à l'agent la faiblesse de son raisonnement : « pour inférer ceci ou cela, tu dois t'appuyer sur cette méta-hypothèse d'arrière-plan, mais celle-ci est clairement absurde, ou au moins très peu probable. »
Étant donné qu'il repose sur des analogies relatives, le raisonnement par analogie est toujours sujet à révision. La méta-hypothèse en particulier peut être révisée aussi bien dans son contenu que dans le degré de croyance qui lui est attaché. Par exemple, une contre-analogie vraie pour A et B dans une domaine Z*, différent de Z, peut relativiser la conclusion d'une première inférence analogique, même si le degré de croyance dans la méta-hypothèse est au départ élevé, dans la mesure où cette contre-analogie peut être associée à une autre méta-hypothèse, qui conduit à une exception à la première et réduit son degré de croyance. C'est par exemple le cas si on considère la méta-hypothèse la nationalité détermine la langue maternelle, qui est réfutée par les immigrants qui ont adopté une nouvelle nationalité. La raison en est que certains des déterminants de la langue maternelle ont été ignorés et agissent comme des « facteurs cachés ».
Enfin, on peut aussi utiliser le raisonnement par analogie sous la forme d'un raisonnement par l'absurde. Considérons une situation dans laquelle les prémisses sont P ∊ Z, Q ∊ Z’, P(A), P(B), Q(B), et dans laquelle on a un degré de croyance β dans le fait que Q(A) est faux. On doit alors avoir le même degré de croyance β dans le fait que les propriétés P du domaine Z ne déterminent pas les propriétés Q du domaine Z’. En effet, dans ce cas, si HE3 était vraie, alors Q(A) ne pourrait pas être fausse (car l'inférence est déductive). Et si nous avons un certain degré de croyance dans le fait que Q(A) est faux, alors nous devons avoir le même degré de croyance dans le fait que HE3 est faux.
En conclusion, les règles de détermination expriment dans un cadre formel unifié de nombreuses intuitions vagues sur le raisonnement par analogie telle que, par exemple, la « pertinence » de l'analogie sur laquelle est basée le raisonnement. Elles montrent également qu'il est obligatoire, pour que le raisonnement par analogie soit utile, de faire référence aux propriétés de l'objet source B pour conclure à propos de l'objet cible A (non-redondance).
Toutefois, même si Davies et Russell ont bien mis en évidence cette idée, leur article échoue à fournir une analyse de la différence importante entre HE2 et HE3, ou même à remarquer cette différence. En effet, comme nous l'avons montré, il n'existe pas de protocole empirique cohérent qui permettrait de se forger une croyance à propos d'une hypothèse de type HE2. Leur première définition de ce qu'est une règle de détermination (Davies et Russell, Reference Davies and Russell1987, p. 265) est clairement équivalente à HE2 et n'est donc pas satisfaisante.
Par ailleurs, Davies et Russell ne présentent qu'une version déductive des règles de détermination, et font du raisonnement par analogie un processus purement déductif. Ce faisant, ils ignorent le fait que dans la plupart, voire dans tous les contextes empiriques, HE3 est incertaine et qu'il faut utiliser une version probabiliste de la méta-hypothèse, à l'image de HE5 (ou toute autre représentation de l'incertitude pertinente dans le contexte de croyance considéré). Pour cette raison, le raisonnement par analogie est en général un raisonnement révisable. Plus généralement, leur analyse exprime le raisonnement par analogie comme un schéma déductif unique, alors que la nôtre le traite à un méta-niveau comme une forme générale de schéma d'inférence qui peut être spécifié dans différents cadres logiques.
Bartha critique les règles de détermination proposées par Davies et Russell sur la base de l'argument suivant : « Les analogies scientifiques sont communément appliquées à des problèmes pour lesquels nous ne possédons pas de règles de détermination claires. Dans de (très) nombreux cas, les chercheurs ne sont pas conscients de tous les facteurs pertinents » (Bartha, Reference Bartha2010, p. 47 ; notre traduction). Cet argument introduit une confusion à propos du rôle joué par ces règles : même lorsqu'un agent ne les connaît pas, ne les formule pas explicitement ou a une forte incertitude à leur sujet, elles jouent toujours un rôle régulateur pour évaluer la force de la conclusion d'un argument analogique, en lui attribuant de manière externe un degré de croyance ou en montrant à titre de contre-argument qu'on ne peut lui attribuer aucun degré de croyance.
4. Comparaison avec l'induction à un cas
Les principaux modes de raisonnement traditionnellement discutés en épistémologie peuvent être représentés dans notre cadre général. Soit H, une hypothèse universelle telle que : ∀X, [P(X) → Q(X)]. Les schémas d'inférence suivants s'appliquent à tout A, B, C ∈ X :
– Déduction : H, P(A) ➥ Q(A)
– Induction à un cas : P(B), Q(B) ➥ H
– Abduction : H, Q(A) ➥ P(A)
(Le même symbole ➥ est ici utilisé pour indiquer une inférence dont la nature est variable : déduction, induction, abduction).
Dans « l'induction à un cas » (l'expression est par exemple utilisée par Bartha, Reference Bartha2010), l'hypothèse H est confirmée par une seule instance positive de confirmation. En combinant l'induction à un cas et la déduction, on obtient le schéma [P(A), P(B), Q(B)] ➥ Q(A), qui est exactement la forme syntaxique du raisonnement par analogie décrit par la formule (5). Ainsi, l'induction à un cas peut être une inférence du particulier vers le général ou du particulier vers le particulier, en étant identique à un raisonnement par analogie. L'abduction est par contre un schéma d'inférence différent, dans lequel l'inférence va en sens inverse, de H vers P(A) (Walliser, Zwirn et Zwirn, Reference Walliser, Zwirn and Zwirn2005).
Le raisonnement par analogie et l'induction à un cas consistent à transférer une propriété d'un objet vers un autre de la même manière, c'est-à-dire en s'appuyant sur le fait que ces deux objets ont déjà une propriété commune. Une propriété P observée pour un objet « de type P » est transférée vers un autre objet « de type P », comme dans l'exemple le plus utilisé de la littérature sur l'induction : ce corbeau en face de moi est noir, donc le prochain corbeau que je verrai devrait être noir (ce qui est une instance de « tous les corbeaux sont noirs »). Cela n'implique pas que le raisonnement par analogie soit réductible à un genre d'induction, mais au contraire que chaque étape d'une induction par énumération est un raisonnement par analogie. L'induction à un cas n'est rien d'autre qu'un raisonnement par analogie. Mais il y a différentes manières d'exprimer un raisonnement par analogie dans le langage courant, selon différents contextes pragmatiques, ce qui explique la différence apparente de leurs exemples types.
Dans l'induction à un cas, les objets de l'assertion analogique sont, dans les exemples types, directement désignés par la propriété qu'ils partagent selon cette assertion, précédée par un pronom démonstratif de temps, de lieu, de possession, etc. :
– Si ce P est un Q, cet autre P est aussi un Q
Un exemple type d'induction à un cas serait par exemple : puisque mon canari est jaune, le vôtre devrait être jaune aussi.
Dans d'autres types de raisonnement par analogie (les exemples qui sont les plus utilisés dans la littérature sur le raisonnement par analogie précisément parce qu'ils ont l'air d’être très différents des exemples types de l'induction à un cas), les objets sont au contraire désignés par leurs noms, ou par n'importe quel désignateur indépendant de leur propriété commune énoncée par l'assertion analogique, qui leur est attribuée après qu'ils aient été nommés :
– A est un P, B est un P, B est un Q, donc A est un Q
Un exemple type de raisonnement par analogie serait donc formulé ainsi : un avion a des ailes, un canari a des ailes et il est capable de voler, donc un avion devrait être capable de voler.
Dans l'induction à un cas, la propriété P partagée par deux objets est utilisée comme « désignateur principal » (le canari). Dans le raisonnement par analogie, la propriété partagée est utilisée au contraire comme qualificatif secondaire ; elle est explicitement mentionnée pour sa qualité de propriété commune des deux objets (avoir des ailes), qui sont d'abord désignés d'une autre manière (les canaris, les avions). Les propriétés communes utilisées dans les exemples types d'induction à un cas correspondent souvent à des catégories d'une taxinomie existante courante, et qui préexiste au raisonnement en cours. Ces taxinomies et ces catégories ont été construites ou sélectionnées dans le langage précisément parce qu'elles sont bien adaptées pour maximiser les interactions causales avec d'autres propriétés, et donc pour permettre l’émergence de règles de détermination de type HE. Les propriétés communes utilisées dans les autres types de raisonnement par analogie sont en général sélectionnées au moment où le raisonnement est fait. Elles ne sont pas utilisées comme désignateur principal courant d'une catégorie au sein d'une classification usuelle, et peuvent être des propriétés peu courantes.
Ceci permet de comprendre pourquoi l'induction à un cas est souvent jugée plus fiable que d'autres raisonnements par analogie. Les catégories courantes sont définies d'une manière qui prend précisément en compte les relations de détermination entre de multiples propriétés qui définissent chaque catégorie. Par exemple, la propriété d’être un canari a de nombreuses autres conséquences. C'est pourquoi cette catégorie est utile. Des hypothèses de type HE3 et HE5 qui portent sur ce genre de catégories permettent de tirer des conclusions du fait que l'objet est un canari.
En bref, l'induction à un cas n'est rien d'autre que le raisonnement par analogie dans un contexte normalisé où il repose sur des méta-hypothèses qui s'appuient sur des propriétés utilisées comme désignateurs principaux des objets comparés. Ces méta-hypothèses sont bien enracinées dans les croyances d'arrière-plan, car elles portent sur des catégories courantes du langage. Par contre, les méta-hypothèses utilisées dans d'autres cas de raisonnement par analogie peuvent porter sur des propriétés moins générales, être moins enracinées, et ainsi donner lieu à des raisonnements jugés plus souvent inappropriés. Les deux modes de raisonnement sont syntaxiquement équivalents, mais ils sont utilisés dans des contextes différents du point de vue pragmatique.
Bien entendu, cela ne signifie pas que l'induction à un cas, ainsi définie, ne peut pas être elle aussi inappropriée : cette pierre est petite, donc cette autre pierre est aussi petite. Le fait que le désignateur principal est une catégorie courante (une pierre) n'implique pas que toute méta-hypothèse qui s'appuie sur lui est pertinente. En l'espèce, le type de minéral ne détermine pas la taille d'un objet.
Enfin, le rôle de désignateur principal peut être contextuel. Prenons par exemple comme désignateur principal « être un New-Yorkais », auquel on pourrait attribuer une propriété secondaire « porter des shorts mauves ». En général, la première de ces propriétés peut être utilisée pour faire des inductions typiques (ce New-Yorkais fait de la course à pied, donc cet autre New-Yorkais aussi), alors que la deuxième de ces propriétés sera utilisée seulement après avoir désigné des individus par leurs noms (Paul porte des shorts mauves). Mais dans le contexte d'un match de basket où l'on peut voir des joueurs porter soit des shorts mauves, soit des shorts blancs, cette propriété devient un désignateur principal : en apprenant que ce porteur de short mauve fait partie de l’équipe A, j'en infère que cet autre porteur de short mauve fait aussi partie de l’équipe A. Ce type de cas ne contredit pas les remarques précédentes : le contexte particulier ajoute des données à la situation, et peut transformer localement des propriétés habituellement utilisées seulement de manière secondaire en désignateurs principaux. Ces propriétés peuvent alors être utilisées dans ce contexte pour mobiliser des méta-hypothèses de type HE3 ou HE5 (par exemple, l’équipe à laquelle appartient un athlète détermine la couleur du short qu'il porte).
5. Conclusion
Dans ce qui précède, nous avons étudié le schéma traditionnel de raisonnement par analogie tel qu'il se présente en deux étapes. Une assertion analogique suggère d'abord que deux objets sont similaires eu égard à un ensemble donné de propriétés. Une inférence analogique suggère ensuite qu'une autre propriété satisfaite par un de ces objets peut être transférée à l'objet similaire. Notre analyse de ce schéma se distingue des travaux existants sous plusieurs angles.
Premièrement, nous défendons l'idée qu'une assertion analogique n'est ni vraie ni fausse, ni bonne ni mauvaise de manière absolue, mais est relative à un point de vue exprimé par un domaine de propriétés. Si des débats surviennent à propos d'analogies et les rendent contestables, ils concernent des inférences analogiques rivales, et non pas les assertions analogiques en elles-mêmes.
Deuxièmement, nous proposons qu'une inférence analogique soit évaluée au regard d'une méta-hypothèse d'arrière-plan qui la soutient et qui relie les propriétés à un niveau supérieur. Cela évite de trivialiser ce mode de raisonnement tout en permettant de fournir de manière cohérente une explication des origines possibles, bien que multiples, de ces croyances d'arrière-plan.
Par conséquent, notre analyse permet de réconcilier les idées opposées selon lesquelles le raisonnement par analogie est soit un mode de raisonnement utile, en particulier en sciences, soit un raisonnement fantaisiste, en particulier dans les raisonnements ordinaires, alors qu'il utilise le même schéma d'inférence. Dans tous les cas, la plausibilité de la conclusion dépend seulement de la plausibilité de l'hypothèse d'arrière-plan utilisée dans ce schéma d'inférence. Ainsi nous réfutons l'idée que faire un bon ou un mauvais raisonnement par analogie dépend du fait de faire de bonnes ou de mauvaises analogies.
Enfin, notre analyse s’écarte de celles qui considèrent le raisonnement par analogie comme un mode de raisonnement spécifique, différent de la déduction et de l'induction. Au contraire, elle montre qu'il s'agit d'un type général de schéma d'inférence qui peut être inclus dans différents cadres logiques, déductif, probabiliste, ou encore non-monotone.
Des recherches ultérieures peuvent être envisagées dans plusieurs directions théoriques. Concernant l'assertion analogique, la définition formelle de l'analogie relative pourrait être étendue à l'analogie structurelle, en l'appliquant à des ensembles de relations analytiques entre plusieurs propriétés traitées comme des variables d'un « modèle ». Cela permettrait à notre définition de traiter des exemples scientifiques plus complexes d'analogie. Concernant l'inférence analogique, on pourrait analyser de manière plus approfondie quelles propriétés des méta-hypothèses la rendent plus probable et étudier comment exprimer le schéma d'inférence analogique dans certaines logiques non-monotones. Il serait également intéressant d’étudier les relations entre la présente analyse et les travaux sur l'analogie en intelligence artificielle ou ceux portant sur des modes de raisonnement potentiellement proches, comme le raisonnement par cas.
Des études empiriques peuvent aussi être menées sur des exemples concrets. D'un côté, on pourrait étudier sur la base d'exemples historiques la manière dont l'analogie est utilisée en science, en combinaison avec d'autres modes de raisonnement, en particulier dans le « contexte de la découverte », opposé au « contexte de la preuve ». D'un autre côté, on pourrait analyser la manière dont les analogies populaires ou scientifiques sont révisées au cours du temps, sous la pression de nouvelles informations et de débats, avant d’être largement acceptées ou définitivement écartées.