Discussion:Corrélation (statistiques)

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Transfert[modifier le code]

Dans le cadre du nettoyage de l'article statistiques , deux paragraphes issus de l'article statistique ont été déplacés et fusionnés à cet article. HB 6 juillet 2006 à 09:40 (CEST)[répondre]

Deux articles traitant du même sujet, ou presque. En fait, le second est à 95% le traitement du même sujet que le premier. Cependant, quelques lignes sur la notion de corrélation en sciences cognitives. La démarche serait donc : dans un premier temps, procéder à la fusion sous le premier nom : Corrélation (mathématiques). Puis création d'une page homonymie corrélation qui pointera vers corrélation (mathématiques) et corrélation (sciences cognitives), ce dernier étant créé pour recevoir les données de sciences cognitives - qui seront retirées alors de l'article fusionné. Bon courage Émoticône sourire. Grimlock 21 avril 2007 à 00:07 (CEST)[répondre]

La page corrélation aurait du être depuis longtemps une page d'homonymie. Les ajouts qui ont été faits (principalement par Carthur) n'apportent rien à l'article corrélation (mathématiques). La seule chose neuve est la notion de Corrélation de Spearman dont l'exposé est tellement obscur que je suis incapable de savoir s'il est valide De toute façon, la corrélation de Spearman si elle est pertinente doit donner lieu à un article à part . Inutile donc d'opérer une fusion avec l'article corrélation (mathématiques). Concernant la corrélation sciences cognitives, l'essentiel est déjà dit dans la version du 18 décembre 2004 1h12 de Jd. Techniquement je propose, suppression de l'article corrélation, restauration des versions jusqu'au 18 décembre 2004 1h12 , renommage en corrélation science cognitive (sans la page de discussion) , puis restauration des autres versions du 18 décembre 2004 jusqu'à la fin et nettoyage pour créer une page d'homonymie et signalement en page de discussion. D'autres avis? HB 21 avril 2007 à 09:21 (CEST)[répondre]
J'ai fait comme demandé, sauf le nettoyage. Jerome66 | causer 1 mai 2007 à 13:28 (CEST)[répondre]

cas particulier[modifier le code]

Je remarque que dans le cas particulier où toutes les valeurs du signal sont identiques (une image monochrome par exemple), le coeff de corrélation n´est pas défini (variance nulle). Est ce que quelqu´un sait ce qu´il est d´usage de faire dans ce cas là ? ca me semble être une limitation importante du coefficient de corrélation. Sylenius 29 juillet 2007 à 16:23 (CEST)[répondre]

Sans pouvoir m'appuyer sur un texte sourcé, le bon sens me fait dire qu'il est inutile de tenter un calcul de coefficient de corrélation lorsque l'une des variables est constante. Si elle est constante, elle est d'évidence non corrélée à l'autre variable. HB 29 juillet 2007 à 16:50 (CEST)[répondre]
ben non, prenons justement le cas d´une image monochrome, donc tous les pixels sont à une valeur constante (cas idéal) et d´une version bruitée de celle-ci (cas réel), où tous les pixels n´ont pas exactement la même valeur, mais ont une très faible variance. Les deux images d´évidence liées mais il n´est pas possible de calculer un coeff de corrélation... Enfin bref, c´est juste un cas particulier... Sylenius 30 juillet 2007 à 08:49 (CEST)[répondre]
Cette remarque concerne la corrélation entre signaux qui n'est pas traitée dans cet article (voir Autocorrélation, Corrélation croisée, Analyse spectrale). Dans ces domaines, on utilise souvent de manière abusive le terme corrélation à la place de covariance, ce qui résout élégamment le problème posé. Reste que, dans tous les cas, la covariance calculée sur les valeurs centrées est nulle pour un signal constant. Il est donc raisonnable de supposer que les deux signaux sont décorrélés même si la division indique mathématiquement une valeur indéterminée. D'un autre point de vue, deux signaux ne peuvent d'ailleurs être corrélés que par leurs fréquences communes, une constante ayant une fréquence nulle. Jct 30 juillet 2007 à 10:41 (CEST)[répondre]
Ok, Merci pour la réponse. C´est vrai que j´ai formulé le problème plus sous une forme signal, et que dans ce cas la covariance est une solution. Reste qu´un signal étant représenté par une variable aléatoire, tu peux très bien calculer un coefficient de corrélation, qui mesure qqchose de différent de la covariance. La raison de ma question était que je demandais si ce cas particulier méritait une mention dans l´article... Sylenius 30 juillet 2007 à 11:35 (CEST)[répondre]

La vie en temps de corrélations[modifier le code]

J'ai supprimé cette phrase

« D'autre part, les niveaux de corrélations influence sur la vie en temps de corrélations [1]. »
  1. A. Buda and A.Jarynowski (2010) Life-time of correlations and its applications vol.1, Wydawnictwo Niezalezne: 5–21, December 2010, (ISBN 978-83-915272-9-0)

D'une part car elle comporte des fautes de français (principalement d'accord) mais surtout car, en cherchant sur le net comment traduire "Life-time of correlations ", je me suis aperçue que les références à cette notion était très limitées et provenaient toutes de Wydawnictwo Niezalezne qui a écrit ici et sur en :en: Life-time of correlations. Il me parait judicieux d'attendre que la notion (très récente 2010) gagne ses lettres de noblesse avant de figurer sur wikipédia. HB (d) 24 juin 2011 à 18:59 (CEST)[répondre]

Question au sujet de l'interprétation géométrique du coefficient de corrélation[modifier le code]

Bonjour,

Le coefficient de corrélation est présenté comme étant le cosinus d'un angle, en principe l'angle formé entre la variance expliquée et la variance totale, cette dernière étant la somme de la variance expliquée avec la variance résiduelle. Question : cette définition ne correspond-elle pas plutôt au coefficient de détermination r² ?

Autre question : lequel de ces deux coefficients (corrélation ou détermination) exprime le mieux la relation entre 2 variables ?

D'avance merci pour la réponse.

--HM1955 (d) 17 octobre 2011 à 00:09 (CEST)[répondre]

Autres Corrélations[modifier le code]

Il devrait être fermement dit qu'une corrélation linéaire faible doit inciter à une corrélation par les rangs ou à une régression non linéaire pour tirer au clair la question de la dépendance / indépendance.

--Lf69100 (discuter) 25 juin 2016 à 17:50 (CEST)[répondre]

les maths dans wikipedia[modifier le code]

Je pense qu'aucune page mathématique de wikipedia n'est compréhensible.

Il faut rédiger ces page à l'attention des élèves, etc bref, "vulgariser". Expliquer.

Si ça ne s'améliore pas drastiquement, je ne soutiendrai plus Wikipédia car c'est un gros reproche et ça ne date pas d'hier. je veux qu'on puisse comprendre les mathématiques, qu'on se donne la peine de faire une réelle pédagogie, qu'on explicite toutes les variables qu'un novice puisse comprendre ! Actuellement, il n'y a pas UNE page de maths compréhensible et j'ai fait un bac mathématiques. Mais je n'ai pas envie de chercher midi à 14h le sens des variables.

Je trouve que c'est catastrophique, donnant prise à une disparition de la Science dans la société. C'est politiquement très grave, enfonçant la population dans l'ignorance propice aux dictatures.

Coefficient de corrélation[modifier le code]

Bonjour,

je remarque que la wikipedia francophone est l'une des rares à ne pas avoir d'article spécifique sur le coefficient de corrélation de Pearson. Je ne connais pas le sujet, mais il me semble que ceci est traité ici. Est-ce voulu ? Est-ce que cela doit changer ? Merci de vos avis ! --Roll-Morton (discuter) 18 janvier 2018 à 13:48 (CET)[répondre]

Dans les médias[modifier le code]

Dans la rubrique "Dans les médias", il est écrit :

"Par exemple, en 2018, des statisticiens d'épidémiologie nutritionnelle ont publié une étude mettant en lumière une corrélation inverse entre l'alimentation bio et le risque de développer un cancer : cette étude a été reprise par la quasi-unanimité de la presse française sous le titre « consommer bio réduit de 25% les risques de cancer », sans prendre en compte les probables causes communes, comme le fait que l'alimentation bio est l'apanage de populations plus aisées faisant attention à leur santé de manière générale et ayant donc moins de facteurs de risque à la base."

De là, plusieurs points :

1) le choix de l'exemple ne me semble pas neutre : il s'appuie sur un sujet qui fait régulièrement polémique sur le plan sociétal, avec des opinions très polarisées entre des "anti bio" et des "pro bio". Un autre exemple serait bienvenu, en lieu et place, ou en complément.

2) l'étude ne met pas en avant une corrélation, mais une association. En biostatistique, une corrélation est une association, mais une association n'est pas une corrélation (et on est sur la page Corrélation !). Un modèle de régression (linéaire ou logistique) ne donne pas une corrélation, mais une coefficient de régression (bien qu'il y ait un lien mathématique direct entre les deux).

3) Aucun problème à dénoncer une tendance de certains médias à la simplification des résultats scientifiques, ce que la rubrique commence par critiquer. Cependant, il y a une dérive en fin de phrase avec une attaque de l'étude qui n'a rien à voir avec la reprise média. Il est écrit : "sans prendre en compte les probables causes communes, comme le fait que l'alimentation bio est l'apanage de populations plus aisées faisant attention à leur santé de manière générale et ayant donc moins de facteurs de risque à la base", alors que l'étude utilise des modèles multivariés prenant en compte un très grand nombre de ces facteurs de risque.

En conclusion, cette rubrique et l'exemple choisi sont une attaque déguisée contre l'étude en question. Que "corrélation n'implique pas causalité" soit mentionné sur cette page (avec un lien vers une page ad hoc) est une chose. Insister autant sur ce point me semble hors sujet et ne pas adhérer au principe de neutralité. Jybernard (discuter) 6 octobre 2022 à 21:41 (CEST)[répondre]

Je ne partage pas votre conclusion. L'exemple choisi n'est pas une « une attaque déguisée contre l'étude en question ». C'est une attaque ouverte envers certains media qui contrairement à l'étude confondent association (ou corrélation) et causalité.
Cependant, j'y vois deux défauts. Le premier est le non respect de la source qui ne dit jamais que la quasi-unanimité de la presse française aurait mal traité l'information (la source pointe seulement deux journaux : Figaro santé qui expose honnêtement le sujet et Le Monde qui tombe dans le panneau). Le second est le problème classique de tout exemple dans wikipedia : sa pertinence. Pourquoi cet exemple plutôt qu'un autre? En quoi est-il représentatif du phénomène? Comme je n'ai pas de réponse évidente à ces deux questions, je ne défendrai pas la présence de cet exemple dans l'article. De la même façon, je ne défendrai aucun autre exemple qui ne répondrait pas aux deux questions que je pose.
Je suis donc favorable à la suppression de cette rubrique qui consiste à pointer du doigt une ou deux défaillances journalistiques anecdotiques alors que l'essentiel est déjà dit dans la section "relation de cause à effet" et dans l'article dédié Cum hoc ergo propter hoc. HB (discuter) 7 octobre 2022 à 10:09 (CEST)[répondre]
cette étude ne présente pas une corrélation, dire est cela est beaucoup trop simpliste au regard de la liste des covariables incluses (caractéristiques sociodémographiques et économiques, régime alimentaire, apports en nutriments, adéquation aux recommandations, modes de vie tels que tabac et activité physique mais aussi compléments nutritionnels, événements de santé, corpulence etc.) dans le modèle ainsi que les analyses en sous-groupe. Ecoutez donc la leçon inaugurale du Dr Rémy Slama au Collège de France pour la Chaire de Santé Publique 2022. 2001:861:3080:C6E0:BD07:7936:5553:6C23 (discuter) 31 mai 2023 à 18:37 (CEST)[répondre]