Signification statistique
Qu’est-ce que la signification statistique?
La signification statistique se réfère à l’affirmation selon laquelle un résultat à partir de données générées par des tests ou des expérimentations n’est pas susceptible de se produire au hasard ou par hasard, mais est plutôt susceptible d’être attribuable à une cause spécifique. Avoir une signification statistique est important pour les disciplines universitaires ou les praticiens qui s’appuient fortement sur l’analyse des données et de la recherche, telles que l’économie, la finance , l’investissement , la médecine , la physique et la biologie.
La signification statistique peut être considérée comme forte ou faible. Lors de l’analyse d’un ensemble de données et des tests nécessaires pour discerner si une ou plusieurs variables ont un effet sur un résultat, une forte signification statistique permet de confirmer le fait que les résultats sont réels et ne sont pas causés par la chance ou le hasard. En termes simples, si une statistique a une signification élevée, elle est considérée comme plus fiable.
Des problèmes surviennent dans les tests de signification statistique, car les chercheurs travaillent généralement avec des échantillons de populations plus importantes et non avec les populations elles-mêmes. Par conséquent, les échantillons doivent être représentatifs de la population, de sorte que les données contenues dans l’échantillon ne doivent en aucun cas être biaisées. Dans la plupart des sciences, y compris en économie, la signification statistique est pertinente si une allégation peut être faite à un niveau de 95% (ou parfois 99%).
Comprendre l’importance statistique
Le calcul de la signification statistique (test de signification) est sujet à un certain degré d’erreur. Le chercheur doit définir à l’avance la probabilité d’une erreur d’échantillonnage , qui existe dans tout test n’incluant pas l’ensemble de la population.
La taille de l’échantillon est un élément important de la signification statistique, car les échantillons plus gros sont moins sujets aux douves. Seuls des échantillons aléatoires et représentatifs doivent être utilisés dans les tests de signification. Le niveau auquel on peut accepter si un événement est statistiquement significatif est appelé niveau de signification.
Les chercheurs utilisent une statistique de test connue sous le nom de valeur p pour discerner si l’événement tombe en dessous du niveau de signification; si c’est le cas, le résultat est statistiquement significatif. La valeur de p est fonction des moyennes et des écarts-types des échantillons de données.
La valeur p indique la probabilité sous laquelle un résultat statistique s’est produit par hasard ou par erreur d’échantillonnage. En d’autres termes, la valeur de p indique le risque qu’il n’y ait pas de différence ou de relation réelle. La valeur de p doit être inférieure au seuil de signification pour que les résultats soient au moins considérés comme statistiquement significatifs.
L’opposé du niveau de signification, calculé comme 1 moins le niveau de signification, est le niveau de confiance. Il indique le degré de confiance que le résultat statistique ne s’est pas produit par hasard ou par erreur d’échantillonnage. Le niveau de confiance habituel dans de nombreux tests statistiques est de 95%, ce qui conduit à un niveau de signification ou à une valeur de p de 5%.
Retenons
- L’importance statistique fait référence à l’affirmation selon laquelle un résultat de données générées par des tests ou des expérimentations est susceptible d’être attribuable à une cause spécifique.
- Si une statistique a une signification élevée, elle est considérée comme plus fiable.
- Le calcul de la signification statistique est sujet à un certain degré d’erreur.
- L’importance statistique peut être mal interprétée lorsque les chercheurs n’utilisent pas le langage avec prudence pour communiquer leurs résultats.
- Plusieurs types de tests de signification sont utilisés en fonction des recherches menées
Considérations particulières.
Considérations particulières
La signification statistique n’indique pas toujours une signification pratique, ce qui signifie que les résultats ne peuvent pas être appliqués à des situations commerciales réelles. De plus, la signification statistique peut être mal interprétée lorsque les chercheurs n’utilisent pas le langage avec prudence pour communiquer leurs résultats. Parce qu’un résultat est statistiquement significatif n’implique pas qu’il n’est pas aléatoire, juste que la probabilité qu’il soit aléatoire est considérablement réduite.
Le fait que deux séries de données présentent une forte corrélation l’une avec l’autre n’implique pas de causalité. Par exemple, le nombre de films dans lesquels l’acteur Nicolas Cage joue dans une année donnée est très fortement corrélé avec le nombre de noyades accidentelles dans les piscines. Mais cette corrélation est fallacieuse car il n’y a aucune allégation causale théorique qui puisse être faite.
Un autre problème qui peut survenir avec la signification statistique est que les données passées et les résultats de ces données, statistiquement significatifs ou non, peuvent ne pas refléter les conditions actuelles ou futures. En investissant, cela peut se manifester par un modèle de tarification qui tombe en panne en période de crise financière, car les corrélations changent et les variables n’interagissent pas comme d’habitude. L’importance statistique peut également aider un investisseur à déterminer si un modèle de tarification des actifs est meilleur qu’un autre.
Types de tests de signification statistique
Plusieurs types de tests de signification sont utilisés en fonction des recherches menées. Par exemple, des tests peuvent être utilisés pour un, deux ou plusieurs échantillons de données de différentes tailles pour des moyennes, des variances, des proportions, des données appariées ou non appariées, ou différentes distributions de données.
L’hypothèse nulle
Tous ces facteurs ont ce qu’on appelle des hypothèses nulles , et la signification est souvent le but du test d’hypothèse en statistique . L’hypothèse nulle la plus courante est que la variable en question est égale à zéro (ce qui indique généralement qu’elle n’a aucun effet sur le résultat d’intérêt). Si vous pouvez rejeter l’hypothèse nulle avec une confiance de 95% ou mieux, les chercheurs peuvent invoquer une signification statistique. Des hypothèses nulles peuvent également être testées pour l’égalité (plutôt qu’égale à zéro) d’effet pour deux traitements alternatifs ou plus, par exemple entre un médicament et un placebo dans un essai clinique.
Le rejet de l’hypothèse nulle, même si un très haut degré de signification statistique ne peut jamais prouver quelque chose, ne peut qu’ajouter un support à une hypothèse existante. En revanche, le refus de rejeter une hypothèse nulle est souvent un motif de rejet d’une hypothèse.
Un test de signification statistique partage en grande partie les mêmes mathématiques que celui du calcul d’un intervalle de confiance. Une façon d’interpréter la signification statistique est que, disons 95% ou 99% du temps, l’intervalle de confiance ne contiendra pas la valeur zéro. Même si une variable s’avère statistiquement significative, elle doit tout de même avoir un sens dans le monde réel.
De plus, un effet peut être statistiquement significatif mais n’a qu’un très faible impact. Par exemple, il peut être très improbable en raison du risque que les entreprises qui utilisent du papier hygiénique à deux épaisseurs dans leurs salles de bain aient des employés plus productifs, mais l’amélioration de la productivité absolue de chaque travailleur sera probablement minuscule.