Dans trois études récentes (1977a, 1977b, 1979), J. Lemaire a appliqué à un ensemble d'observations du risque automobile quelques méthodes de sélection fréquemment utilisées en analyse de la régression. Les variables explicatives (traitées comme variables indépendantes) sont les variables décrivant le risque. Les variables étudiées (traitées comme variables dépendantes d'un modèle de régression) sont les deux variables généralement prises en considération dans ce contexte: le nombre des sinistres et leur montant cumulé.
Nous avons déjà souligné (Hallin, 1977) combien les hypothèses qui se trouvent à la base de l'analyse de la régression — normalité, homoscédasticité et linéarité de la régression — sont loin d'être remplies dans le contexte de l'assurance automobile. Le montant cumulé annuel prend la valeur zéro avec une probabilité proche de 0.9! Le nombre annuel de sinistres vaut 0, 1, 2, rarement plus! Même très approximativement, de telles variables peuvent difficilement être considérées comme normales. En outre, la plupart des variables explicatives sont de type nominal ou ordinal, ce qui rend délicate l'utilisation de modèles linéaires, les interactions de tous ordres étant très importantes, ainsi qu'on pourra le constater. Ces réserves sont d'ailleurs prévues par Jean Lemaire lui-même, qui ne propose ses conclusions qu'à titre de première approximation. Les mêmes données ont encore été soumises (Masure, 1978) aux méthodes de l'analyse discriminante, et les mêmes réserves peuvent être faites en ce qui concerne l‘utilisation des méthodes et l'interprétation des résultats (combinaisons linéaires, etc.).
Nous avons proposé dans Hallin (1977a, b) un ensemble de méthodes qui, selon les hypothèses distributionnelles pouvant être faites (et qui vont des hypothèses classiques de l'analyse de la variance à celles, beaucoup moins restrictives, des méthodes de rangs), constituent des généralisations de celles qui sont utilisées par Jean Lemaire. En particulier, celle que nous appliquons ici est entièrement “distribution free”. Ces méthodes sont également une extension de celle qu'a proposée Pitkänen (1975, 1976).