Discussion:Ajustement affine

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Motivation de création[modifier le code]

Cet article s'inspire en grande partie d'une ancienne version de l'article régression linéaire écrasée quand l'article s'est orienté vers le traitement de la régression linéaire en général (en dimension n, avec statistique inférentielle, hypothèse de normalité, test d'hypothèse, espérance conditionnelle). Durant cette refonte, l'article a gagné en complexité, la partie concernant la régression linéaire simple s'est d'abord réduite à quelques lignes avant de s'enrichir de considérations sur les estimateurs. Petit à petit, l'article, à mon avis, est devenu inaccessible pour les personnes cherchant à savoir comment s'effectue, simplement, un ajustement affine (bac, bac +1). Comme il existe une abondante littérature se bornant à la présentation de l'ajustement affine sans évocation des estimateurs, dans laquelle on parle que des moyennes et variances sans chercher à préciser si elles sont ou non empririques, il m'a semblé légitime de créer ce petit article peu ambitieux (et encore cela dépend pour qui) qui doit rester à mon avis modeste dans son développement : une personne intéressée par une théorie plus rigoureuse doit être orientée vers l'article central régression linéaire ou vers un article éventuellement à créer parlant de régression linéaire simple , avec hypothèse gaussienne et variance des estimateurs. HB (discuter) 29 avril 2014 à 12:42 (CEST)[répondre]

Quelques remarques[modifier le code]

0/ droite de Mayer ? 1/ On ne peut que difficilement parler d'un "comportement exponentiel d'un nuage de points" qui pourrait tout aussi bien n"être qu'un comportement polynomial de degré 2. 2/ on peut aussi expliquer pourquoi la somme des (x-xbar)(y-ybar) donne une indication sur l'adéquation d'un ajustement affine: dans le graphique centré sur le point moyen (xbar, ybar), si l'ajustement affine n'est pas légitime, il y aura grossièrement autant de points dans chacun des quadrants donc la somme des (x-xbar)(y-ybar) sera petite. Tandis que si l'ajustement affine est légitime, il y aura deux quadrants, de part et d'autre du point moyen, qui contiendront l'essentiel des points et les points correspondants seront donc caractérisés par le même signe dans le produit (x-xbar)(y-ybar), signe qui deviendra ainsi très largement majoritaire. 3/ lien entre coefficient de corrélation et inégalité de Cauchy-Schwarz. Explication que le coefficient de corrélation reste compris entre -1 et 1. Cordialement dit. Le tigre à dents de sabre.Claudeh5 (discuter) 25 juillet 2014 à 03:28 (CEST)[répondre]

✔️J'espère avoir compris tes attentes. J'avais volontairement allégé la partie sur le coefficient de corrélation qui bénéficie d'un article dédié, mais si la présence de ces observations te semble légitime ici, on pouvait les mettre. En revanche, je ne comprends pas ce que tu reproches au traitement de l'ajustement par la méthode de Mayer dans cet article. HB (discuter) 25 juillet 2014 à 09:20 (CEST)[répondre]
Ah euh, pour la droite de Mayer, j'ai dû sauter le paragraphe... Mea culpa. Donc je ne reproche rien. Remarque: il est curieux de la voir appelée méthode de Mayer ici et méthode de Wald (ou Tukey) ailleurs...
Je trouve cet article bien suffisant pour un ajustement linéaire, l'autre article est illisible voir incompréhensible à mon avis.Cordialement dit. Le tigre à dents de sabre.Claudeh5 (discuter) 26 juillet 2014 à 12:52 (CEST)[répondre]
Je ne sais plus exactement l'énoncé mais j'avais trouvé dans un livre un amusant exemple de calcul de régression affine entre le nombre des ventes de postes de radio entre 1920 et 1930 et le nombre des internés entre les mêmes dates ! Avec un coefficient de corrélation très proche de 1...Cordialement dit. Le tigre à dents de sabre.Claudeh5 (discuter) 26 juillet 2014 à 12:56 (CEST)[répondre]

Utile pour les utilisateurs[modifier le code]

Bonjour, L'expression "ajustement affine" me parait peu adaptée. Il s'agit ici d'ajustement linéaire. En effet, dans tous les cas, on abouti à devoir résoudre un système linéaire dont les inconnues sont a, b, c ... coefficients de la fonction Y=F(X1, X2 etc.). Je me suis intéressé à ces 2 articles parce que à l'occasion de lectures de forum, un informaticien devait écrire un module pour résoudre ce type de problème. Cela correspond effectivement à un besoin. Autre point, pour vérifier la "qualité" de la régression, on a l'habitude de calculer le "coefficient de détermination R²" (et non de corrélation). Je sais qu'il y a beaucoup de littérature sur le sujet, mais je sais aussi que les justifications fondamentales (et non pas les hypothèses de base) sont la moyenne et l'application de la méthode des moindres carrés. Je n'ai pas lu que la méthode de résolution passait par le calcul de la dérivée. Ceci est un point fondamental, par contre, je ne comprends pas pourquoi on parle de variance, écart-type, covariance etc., le critère de qualité étant le coefficient R², il permet de comparer plusieurs formules et de prendre la meilleure, mais il ne permet en aucun de donner un critère absolu. --Dlzlogic (discuter) 20 mai 2015 à 16:01 (CEST)[répondre]

Sur le titre de l'article :Il s'agit probablement d'un biais associé à ma propre formation et au milieu où j'ai enseigné (enseignement général, bac, bac + 1) où on parlait d'ajustement affine plutôt qu'ajustement linéaire. Idem pour les terme de varaince, écart-type, covariance. Idem pour l'indicateur choisi (coefficient de corrélation) c'est celui qui apparait dans la littérature Bac et bac + 1. Il doit s'agir d'un défaut de formation francophone puisque Wikipedia.fr ne possède pas d'article sur le en:coefficient of determination et juste un redirect vers Régression linéaire multiple. Mais si je ne m'abuse, pour le cas de cet article, les deux coefficients sont intimement liés car le coefficient de détermination est le carré du coefficient de corrélation. Il est d'ailleurs explicitement dit dans l'article que le carré de coefficient de corrélation est le rapport de la variance expliquée sur la variance totale (j'avais trouvé dans la littérature que ce rapport se nommait rapport de corrélation est-ce un synonyme de coefficient de détermination ? ai-je commis une mésinterprétion?). Enfin, je ne pense pas que cet article laisse penser qu'il s'agit d'un critère absolu. C'est juste un indicateur. Mais n'hésiste pas à corriger mes naivetés éventuelles tout en conservant l'accessibilité de l'article. HB (discuter) 20 mai 2015 à 17:57 (CEST)[répondre]