Maths : moyennes

Je voudrais comparer deux moyennes.

Exemple
joueur1 moyenne sur 2D6 : 7,8 sur 17 jets de dés
joueur2 moyenne sur 2D6 : 6,5 sur 10 jets de dés

Existe-t-il un moyen pour rendre comparables ces deux moyennes? DugGenre les pondérer avec le nombre de jets de dés, un truc comme ça?

Je précise : je suis une vrai bille en maths. Mais y'a-t-il vraiment besoin de préciser... :mrgreen:

Merci de vote aide.

Dans quel sens veux-tu les comparer ? Tu veux faire une étude statistique pour savoir si ces moyennes sont significativement différentes et en conclure que l'un des joueurs a des pouvoirs télékinétiques ?

Hello, si tu veux faire un test statistique pour savoir si 2 moyennes sont significativement différente, le plus simple est d'utiliser le test dit de student ou t-test. Voici le lien wikipedia http://fr.wikipedia.org/wiki/Loi_de_Student .

par contre tu entends quoi exactement par comparable, tu veux que ce soit les même ?

pour un test statistique tu n'as pas besoin d'être bon en math, tu rentres dans excel ou openexcel (c'est mieux :wink:) tous les jets de dé, 1 colonne par joueur, puis tu applique la fonction loi de student [sous excel c'est =TEST.STUDENT(colonne jet de dé joueur 1,colonne jet de dé joueur 2, 2, là tu mets 2 ou 3)], ça te donne un chiffre qui si il il est plus petit que 0.05 ça signifie que des deux moyennes sont statistiquement différente et que un de tes joueurs à des dés pipés ou que sur un très petit nombres de jet il a beaucoup de chance. Je ne sais pas si c'est clair.

autrement pourquoi comparer deux événements à priori similaire au niveau des probabilités et de leur distribution ?

A+ JFK

Quitte à faire des maths, autant prendre la base :
Les statistiques ne s'appliquent normalement qu'à un grand nombre d'événements. 17 n'est pas un grand nombre, la notion de "moyenne" ne s'y applique donc pas.

greuh

En plus, la moyenne « simple », c'est facile : deux dés, ça peut faire entre 2 et 12, soit une moyenne de 7 sur un très grand nombre de lancers. Tes moyennes (directement « comparables », soit dit en passant) n'en sont pas très éloignées.

greuh dit:Quitte à faire des maths, autant prendre la base :
Les statistiques ne s'appliquent normalement qu'à un grand nombre d'événements. 17 n'est pas un grand nombre, la notion de "moyenne" ne s'y applique donc pas.
greuh

C'est quoi un grand nombre ? 20, 76, 100, 10 000, 1 453 724, 10 E20 ?

Logan dit:
greuh dit:Quitte à faire des maths, autant prendre la base :
Les statistiques ne s'appliquent normalement qu'à un grand nombre d'événements. 17 n'est pas un grand nombre, la notion de "moyenne" ne s'y applique donc pas.
greuh

C'est quoi un grand nombre ? 20, 76, 100, 10 000, 1 453 724, 10 E20 ?


Pour moi, un nombre qu'on atteint que rarement dans une partie de jeux de plateau, c'est pour ça que les amoureux des dés qui mettent les stats sur le tapis me font chier :mrgreen:

ca dépend de la distribution de tes valeurs (ici 2 a 12)

Un mathématicien te dira une infinité
empiriquement voici des résultats:
itération / moyenne sur 2 dés

'100' [6.7900]
'500' [7.0680]
'1000' [6.9120]
'5000' [7.0648]
'10000' [6.9557]
'100000' [7.0087]

tu vois que ça dépends te la précisions que tu veux, mais dès 1000 tu es assez bon.

A+ JFK

Logan dit:
greuh dit:Quitte à faire des maths, autant prendre la base :
Les statistiques ne s'appliquent normalement qu'à un grand nombre d'événements. 17 n'est pas un grand nombre, la notion de "moyenne" ne s'y applique donc pas.
greuh

C'est quoi un grand nombre ? 20, 76, 100, 10 000, 1 453 724, 10 E20 ?


T'as 36 événements possibles sur 2d6. A partir de quelques centaines de lancer, ça devrait être acceptable. 3000 c'est mieux. 10e^20 encore mieux. L'idée de la loi des grands nombres (y'en a deux mais passons) c'est que ta déviation par rapport à la courbe théorique diminuera proportionellement avec le nombre de tirages de ta variable aléatoire.
Dans le cadre d'utilisation empiriques de probastats, on considère que faut relativiser par rapport au nombre d'événements possibles (cette idée là est encore plus vraie avec la notion de "faux positif" - ou négatif - dans les études bayesiennes de grande quantités de données : il faut que le test aie une précision proportionnelle à la probabilité de l'événement testé).

greuh

greuh dit:Quitte à faire des maths, autant prendre la base :
Les statistiques ne s'appliquent normalement qu'à un grand nombre d'événements. 17 n'est pas un grand nombre, la notion de "moyenne" ne s'y applique donc pas.
greuh


D'un point de vue théorique, si, sans problème. Il ne faut juste pas en attendre une grande précision statistique. Ceci dit, pour la manipulation de lois gaussiennes par exemple, les tests utilisant la loi de Student donnent même pour un petit nombre d'observations des valeurs exactes des probabilités d'erreur (qui du coup sont importantes, évidemment). Dans les autres cas c'est approximatif. D'ailleurs utiliser la table de Student pour 17 moyennes de variables de types jets de dés me semble assez douteux.

Concernant la discussion sur les "grands nombres", c'est très variable. La loi des grands nombres et les théorèmes de ce type sont des théorèmes limite (autrement dit, pour une infinité d'observations). Il y a deux types de phénomènes qui nécessitent des grands nombres.

D'abord, les modèles statistiques consistent pour la plupart à approcher la loi d'une moyenne par une loi gaussienne. Ils sont considérés comme valides pour un nombre d'observations supérieur ou égal à 30, ce qui n'est pas si gros.

Par ailleurs, avoir un grand nombre d'observations augmente la précision du test, et là, il n'y a pas réellement de limite : si on veut une grande précision, il faut faire beaucoup d'observations...

Faire des statistiques sur 27 observations n'est pas dénué de sens. Il faut juste savoir que c'est trop petit pour en tirer des conclusions précises et pour utiliser un modèle gaussien.

BananeDC ! Il faut que tu trouves un jeu avec 10E20 lancers de dés !!!

:mrgreen:

greuh dit:
Logan dit:
greuh dit:Quitte à faire des maths, autant prendre la base :
Les statistiques ne s'appliquent normalement qu'à un grand nombre d'événements. 17 n'est pas un grand nombre, la notion de "moyenne" ne s'y applique donc pas.
greuh

C'est quoi un grand nombre ? 20, 76, 100, 10 000, 1 453 724, 10 E20 ?

T'as 36 événements possibles sur 2d6. A partir de quelques centaines de lancer, ça devrait être acceptable. 3000 c'est mieux. 10e^20 encore mieux. L'idée de la loi des grands nombres (y'en a deux mais passons) c'est que ta déviation par rapport à la courbe théorique diminuera proportionellement avec le nombre de tirages de ta variable aléatoire.
Dans le cadre d'utilisation empiriques de probastats, on considère que faut relativiser par rapport au nombre d'événements possibles (cette idée là est encore plus vraie avec la notion de "faux positif" - ou négatif - dans les études bayesiennes de grande quantités de données : il faut que le test aie une précision proportionnelle à la probabilité de l'événement testé).
greuh


J'ai l'impression que tu mélanges des choses (mais comme tes termes sont vagues, c'est peut-être un simple malentendu).

L'écart par rapport à la courbe théorique décroît proportionnellement à la racine carrée du nombre d'observations (théorème de la limite centrée). Ceci dit, ça dépend de ce que tu appelles "courbe théorique".

Le problème des faux positifs n'est pas un problème de statistique lié à la taille des échantillons mais un problème purement probabiliste dû à la rareté des facteurs observés.

EDIT : (avertissement) je me suis relu, et je suis vraiment pas clair. Je pense que j'arriverais mieux à m'expliquer autour d'une bière que par écrit.

grolapinos dit:J'ai l'impression que tu mélanges des choses (mais comme tes termes sont vagues, c'est peut-être un simple malentendu).

Je ne suis pas statisticien. Et si je connais vaguement un peu de théorie (suffisamment pour mes besoins pros), je suis incapable, par exemple, de faire les calculs les plus risibles de probastats.
L'écart par rapport à la courbe théorique décroît proportionnellement à la racine carrée du nombre d'observations (théorème de la limite centrée).

C'est bien ce que je disais : plus t'observe, moins tu te trompes.
Le problème des faux positifs n'est pas un problème de statistique lié à la taille des échantillons mais un problème purement probabiliste dû à la rareté des facteurs observés.

Tout à fait. Mais tu précises un point de théorie et passe ainsi complètement à coté de ce que je voulais évoquer (le drame de ceux qui connaissent réellement un sujet*) :
- la notion de grand nombre dans le cas qui concerne le type tout en haut de la page, est une notion qu'il faut relativiser sur le nombre d'événements possibles. Après, tu relativises comme tu veux, mais dans mon milieu, on a du "nombre suffisant", complètement empirique, que tu choisis comme tu veux.
- dans le même ordre idée, mon exemple sur les faux positifs évoquait cette notion de proportionnalité.

Je sais pas si j'ai éclairci ce que je voulais dire.
greuh
* : j'ai le même problème avec certains potes musicos, qui ont du mal à comprendre que je dise qu'une même personne puisse jouer comme un dieu d'un instrument et, en même temps, produire de la musique sans âme. Je pense à Steve Vai, capable de pisser 300 notes à la seconde, mais dont le meilleur est sorti lorsqu'il était dans le groupe de Zappa. Moi, je comprends rien, mais alors que dalle, à la musique (sauf si on me parle de transformées de Fourier, et encore), mais je "ressens" la musique. Elle me fait vibrer ou non, et c'est indépendant du niveau technique. Un peu comme l'art abstrait.

greuh dit:Tout à fait. Mais tu précises un point de théorie et passe ainsi complètement à coté de ce que je voulais évoquer (le drame de ceux qui connaissent réellement un sujet*) :
- la notion de grand nombre dans le cas qui concerne le type tout en haut de la page, est une notion qu'il faut relativiser sur le nombre d'événements possibles. Après, tu relativises comme tu veux, mais dans mon milieu, on a du "nombre suffisant", complètement empirique, que tu choisis comme tu veux.
- dans le même ordre idée, mon exemple sur les faux positifs évoquait cette notion de proportionnalité.
Je sais pas si j'ai éclairci ce que je voulais dire.


Je te suis bien. Tu parles d'une autre notion de "grand nombre", liée à la rareté des événements observés (et qui conditionne d'ailleurs l'utilisation d'autres approximations statistiques comme la loi de Poisson). En l'occurrence, ce n'est pas directement lié à la question initiale mais à la seconde question posée (à partir de quand on a un grand nombre).

HS : par ailleurs ton exemple sur la musique me parle à point que tu n'imagines même pas mais c'est une autre affaire.

Bah voilà :)

greuh

Logan dit:BananeDC ! Il faut que tu trouves un jeu avec 10E20 lancers de dés !!!
:mrgreen:

Suffit que j'emprunte la collection d'Oscardejarjayes, un camion-benne, et le tour est joué :mrgreen:

Euh... Alors... Quand je disais comparable, je voulais dire, hum... comment dire... bah... euh... Un truc qui ferait que l'on intègre dans la moyenne de chaque joueur le poids du nombre de jets de dés. Vous sentez le truc? C'est ptet juste déja le principe de la moyenne... :oops:

:clownpouic:

C'est ici que l'on parle d'erreur alpha et béta ?

Ouistoto dit:Euh... Alors... Quand je disais comparable, je voulais dire, hum... comment dire... bah... euh... Un truc qui ferait que l'on intègre dans la moyenne de chaque joueur le poids du nombre de jets de dés. Vous sentez le truc? C'est ptet juste déja le principe de la moyenne... :oops:


Mmmmhhh...

J'ai peur que la solution à ton problème ne soit la moyenne bayésienne :twisted:

Une solution consiste à rajouter un nombre de "7" fictif (par exemple 10) à tes séries de lancers et de faire la moyenne avec ça. Demande à scand1sk de t'expliquer, il connaît ça mieux que moi :mrgreen: