Corrélation entre Notes et Complexité dans le top 100 BGG ?

Juillet dit :
jmguiche dit :@juillet
laisse tomber.
tu donnes des explications statistiques. Les outils statistique permettent d’analyser le réel. Tu te positionne avec une approche scientifique et rationnelle.

tu donnes ces explications à des gens qui « veulent avoir des résultats qui correspondent à leurs attentes » (cf intervention de Mastermindm ci dessus et d’autres dAcathla avant). 

Quand on veux avoir des résultats qui correspondent à son attente, on se fiche du réel, de la raison, de la démarche scientifique. On veut non pas connaître le réel mais le rendre conforme à son attente.

On n’est plus dans le biais de confirmation (je ne remarque que les infos allant dans le sens de ses avis ou préjugés), on est au delà, dans la construction de l’information qui va dans son sens.

C’est un dialogue de sourds.


 

Quelque part vous me rassurez sur le diagnostic, mais je trouve ce phénomène inquiétant... L'absence de culture scientifique, le manque de rigueur élémentaire, conduisent à des aberrations logiques et à l'impossibilité de raisonner autrement qu'en fonction du "ressenti" et des attentes individuelles. A quelle genre d'autres absurdités auront nous à faire à l'avenir ?

Au monde qui nous entoure !
🥴
Allez... Bonne déprime !

😄

Effectivement, au vue des messages précédents, je pense m’être mal exprimé à plusieurs reprises, et je pense comprendre le problème. Mes messages pouvaient effectivement suggérer que je voulais “corriger les données du classement BGG pour quelles correspondent plus à la réalité”. Or plusieurs messages ont raison de dire que la réalité, c’est celle qui a été mesuré par le classement.


Je vais donc essayer de présenter les choses autrement :

Il y a un classement, renseigné à partir des notes des votants sur BGG. Ce classement est un phénomène “observable”, au sens ou j’ai accès à l’ensemble des informations des notes données. Il constitue la réalité mesurée à travers le prisme de l’ensemble des votants.

Mon objectif est d’essayer d’avoir autre chose, un classement potentiel (qui n’existe actuellement pas donc) qui reflèterait théoriquement la moyenne des opinions de tous les joueurs. Ce classement potentiel est un phénomène “non observable” (par définition, je n’ai pas accès aux informations des joueurs qui ne votent pas).

Donc je vais essayer de construire un modèle théorique prédictif de ce que serait ce classement potentiel, qui se baserait sur les seules informations à ma disposition, le classement BGG. En sachant bien que le résultat ne sera pas un fait observé et vérifié, mais un résultat théorique. Ce nouveau classement obtenu ne correspond à rien d’autre que le résultat du modèle que j’ai voulu appliquer.

Dans une démarche ‘propre’, il faudrait ensuite se débrouiller pour obtenir l’avis d’un échantillon de joueur (qui pour moi, instinctivement ne correspond pas à la population qui vote sur BGG), et voir si les deux correspondent.

Sans aller jusque là, si certains utilisateurs en voyant le “deuxième classement” (qui je répète reste une projection hypothétique de ce que CE modèle considère, à juste titre ou non, comme ce que serait le classement de l’ensemble des joueurs, sans avoir la prétention de le démontrer), se disent “ah ouais ça me semble mieux car les jeux simples sont mieux représentés”, rien du tout n’est prouvé MAIS je peux voir un intérêt dans la démarche.

Et je ne comprends pas en quoi cette démarche serait problématique : je sors un algorithme qui pondère les notes des votants BGG par rapport à la complexité qu’ils ont eux mêmes attribué au jeu, et qui me donne en résultat un nouveau classement, sans prétention. Ni plus, ni moins.
 

On dérive en peu sur le hors sujet, mais vu que certains semblent plus calés en statistique, j’aimerais leur poser de nouveau cette question :

Si je suppose que la complexité est indépendante de la note, alors est-ce que pour un nombre de jeu et de votes assez grands, je suis bien censé retombé sur des notes moyennes sensiblement égales entre la population des jeux simples et la population des jeux complexes ?

Dans mes vagues souvenirs du lycée, il me semblait que c’était justement la définition de deux choses indépendantes : l’occurrence de la première n’a pas d’impact sur la probabilité d’occurrence de la deuxième (mais tout ça commence à dater…).



En espérant ne pas donner l’impression d’être de mauvaise foi ou autre, car ce n’est sincèrement pas le but.

MasterMindM dit :Effectivement, au vue des messages précédents, je pense m'être mal exprimé à plusieurs reprises, et je pense comprendre le problème. Mes messages pouvaient effectivement suggérer que je voulais "corriger les données du classement BGG pour quelles correspondent plus à la réalité". Or plusieurs messages ont raison de dire que la réalité, c'est celle qui a été mesuré par le classement.


Je vais donc essayer de présenter les choses autrement :

Il y a un classement, renseigné à partir des notes des votants sur BGG. Ce classement est un phénomène "observable", au sens ou j'ai accès à l'ensemble des informations des notes données. Il constitue la réalité mesurée à travers le prisme de l'ensemble des votants.

Mon objectif est d'essayer d'avoir autre chose, un classement potentiel (qui n'existe actuellement pas donc) qui reflèterait théoriquement la moyenne des opinions de tous les joueurs. Ce classement potentiel est un phénomène "non observable" (par définition, je n'ai pas accès aux informations des joueurs qui ne votent pas).

Donc je vais essayer de construire un modèle théorique prédictif de ce que serait ce classement potentiel, qui se baserait sur les seules informations à ma disposition, le classement BGG. En sachant bien que le résultat ne sera pas un fait observé et vérifié, mais un résultat théorique. Ce nouveau classement obtenu ne correspond à rien d'autre que le résultat du modèle que j'ai voulu appliquer.

Dans une démarche 'propre', il faudrait ensuite se débrouiller pour obtenir l'avis d'un échantillon de joueur (qui pour moi, instinctivement ne correspond pas à la population qui vote sur BGG), et voir si les deux correspondent.

Sans aller jusque là, si certains utilisateurs en voyant le "deuxième classement" (qui je répète reste une projection hypothétique de ce que CE modèle considère, à juste titre ou non, comme ce que serait le classement de l'ensemble des joueurs, sans avoir la prétention de le démontrer), se disent "ah ouais ça me semble mieux car les jeux simples sont mieux représentés", rien du tout n'est prouvé MAIS je peux voir un intérêt dans la démarche.

Et je ne comprends pas en quoi cette démarche serait problématique : je sors un algorithme qui pondère les notes des votants BGG par rapport à la complexité qu'ils ont eux mêmes attribué au jeu, et qui me donne en résultat un nouveau classement, sans prétention. Ni plus, ni moins.
 

On dérive en peu sur le hors sujet, mais vu que certains semblent plus calés en statistique, j'aimerais leur poser de nouveau cette question :

Si je suppose que la complexité est indépendante de la note, alors est-ce que pour un nombre de jeu et de votes assez grands, je suis bien censé retombé sur des notes moyennes sensiblement égales entre la population des jeux simples et la population des jeux complexes ?

Dans mes vagues souvenirs du lycée, il me semblait que c'était justement la définition de deux choses indépendantes : l'occurrence de la première n'a pas d'impact sur la probabilité d'occurrence de la deuxième (mais tout ça commence à dater...).



En espérant ne pas donner l'impression d'être de mauvaise foi ou autre, car ce n'est sincèrement pas le but.

 

C’est beau, mais cela suffira t il a calmer les ayatollah de la statistique ? :)

MasterMindM dit :(...et tout le reste...)

Et je ne comprends pas en quoi cette démarche serait problématique : je sors un algorithme qui pondère les notes des votants BGG par rapport à la complexité qu'ils ont eux mêmes attribué au jeu, et qui me donne en résultat un nouveau classement, sans prétention. Ni plus, ni moins.
C’était mon point de vue lorsque j’ai partagé l’article.

L’auteur concède des erreurs de terminologie, notamment sur le biais, et indique dans son article que la correction est totalement artificielle. Je pense qu’il faut juste y voir un exercice de style, le but n’était pas du tout de remplacer le classement bgg mais de faire ressortir quelques jeux aux règles plus simples.

(édit)

MasterMindM dit :
Vicen dit :
MasterMindM dit :
Si on suppose(1) 
 - que la complexité n'a aucun impact sur la qualité d'un jeu
 - que les gens notent la qualité(2) d'un jeu indépendamment de la complexité

alors la moyenne des notes des jeux complexes devrait être sensiblement égale à la moyenne des notes des jeux simples.

 

Faux de mon point de vue.

Si un groupe A a la caractéristique X et un Groupe B possède la caractéristique Y. Rien ne présuppose quand moyenne ils doivent être (ou seront) égaux vis à vis de la donnée Z.

J'ai tout a fait pu dire des bêtises !

Mais j'avoue ne pas avoir compris ton explication :)

Je suppose que A et B sont les jeux complexes et les jeux simples ? Et du coup Z doit représenter leur note ?


Si je prends un exemple : j'ai des pièces rouge (5 centimes) et des pièces jaune (20 centime), dans mon porte-monnaie (l'ensemble des pièces).

Je pars du principe que la couleur / le métal des pièces n'a pas d'influence sur la physique de la pièce, je dois logiquement avoir la même moyenne de faire des piles ou des faces en lançant des pièces. Si avec un grand échantillon un écart se distingue entre les deux groupes, c'est que probablement le couleur / le métal à une influence (même indirect, du style 'le lanceur de pièce lance plus fort les pièces jaune car il a l'impression d'être plus riche', ou autre).

Si je prends un autre exemple (parce que j'aime pas les pièces) : j'ai des gens qui vivent à Paris et des gens qui vivent à Marseille, qui sont dans ma population de français.

Je pars du principe que la situation géographique ne joue par sur le fait que les gens soient gauchers ou droitiers. Normalement je dois avoir sensiblement la même proportion de gaucher à Paris qu'à Marseille. Si ce n'est pas le cas, a priori une raison doit en être la cause (à Paris c'est stylé d'être gaucher donc les gens font semblant, au XIXeme siècle les gauchers étaient déportés à Marseille et la caractéristique est héréditaire, ... ).

Tu n'auras statistiquement sur un très grand groupe le même % de personne avec la même caractéristique que si tu as séparé les deux groupes de façon aléatoire. Et non pas en te basant sur un élément donné.
 

J’adore cette émission , merci pour cet épisode que je n’avais pas vu :slight_smile:

Dans notre cas nous sommes face à une étude rétrospective (qui plus est sans groupe témoin) : on analyse des données existantes. Je vois mal comment une étude prospective pourrait être menée …

toutefois les données ne font pas toute loi et on peut également se fier à notre intuition pour élaborer une théorie , même si elle n’est pas prouvée.

Mon postulat c’est que complexité et plaisir de jouer à un jeu sont decorrélées. 
Je ne peux pas le prouver, mais dans le cadre de ma théorie, cela implique que les notes bgg sont problématiques (hypothèse : sur bgg une population non négligeable préfère le complexe). Question : si je veux utiliser les données de l’échantillon  bgg , comment les extrapoler pour qu’elles reflètent un classement représentatif de l’ensemble des joueurs, ie qui respecte mon postulat  ?

Réponse : on ne peut pas :slight_smile:
La seule solution c’est de changer d’échantillon.
Et les notes de bgg ne sont pas problématiques puisque comme vous le soulignez : sur bgg une population non négligeable préfère les jeux complexes. CQFD
Pour résumer, vous voulez donc utiliser un échantillon d’une population préférant les jeux complexes afin “d’extrapoler” un classement “représentatif” d’une autre population de joueurs ce qui n’est pas du tout sérieux et sans valeur…
Je vous suggère d’utiliser d’autres bases de données représentant d’autres populations, sur Amazon par exemple vous pouvez classer les jeux de société par note des utilisateurs, vous obtenez un classement plus proche de ce que vous souhaitez :
https://www.amazon.fr/s?bbn=363587031&rh=n%3A322086011%2Cn%3A!322088011%2Cn%3A363587031%2Cp_72%3A184914031&dc&fst=as%3Aoff&qid=1556365595&rnid=184901031&ref=lp_363587031_nr_p_72_0

Je ne sais pas c’est compliqué car on a plusieurs éléments en interaction :

A. Poids estimé par les utilisateurs
B. Note donné par les utilisateurs
C. Nombre de vote effectué
D. Rank BGG

D dépend de B et C.
A et D sont corrélé par le graphique.
Corrélation n’implique pas forcément une causalité
Donc on ne peut pas déterminer avec certitude que A→B ou B→A
L’hypothèse A→C a aussi été avancée.
Puis un élément E qui irait mettre le bazar en influant sur le reste.

Alors pour extrapoler un modèle à partir de ça, j’avoue que j’en sais strictement rien.
(j’ai juste appris à garder un esprit critique face à des donnés, pour ce qui est de les calculer ou élaborer des méthodes, y a plus personne)

@Juliette : v’là le panel… la secte du monopole de l’hôtel de la paix sur le site d’une guerrière.

En fait le mieux reste encore de filtrer BGG comme certains le suggèrent : en catégorie.

Car peut on réellement comparé Gloomheaven à Azul ?


Abstract

Family

Party

Strategy

Thematic

“…[…] Et les notes de bgg ne sont pas problématiques puisque comme vous le soulignez : sur bgg une population non négligeable préfère les jeux complexes. CQFD…”

pardon mais cette phrase, avec de la rigueur scientifique…, comporte déjà une interprétation … :innocent:

mieux noter les jeux complexes, ne veut pas dire qu’ils les préfèrent…juste qu’ils (la population de bgg) les notent mieux…

hypothèses possibles :
- ils préfèrent les jeux complexes
- ils surnotent les jeux complexes et sous notent les jeux moins complexes
- …


cordialement :grin:

C’est bien que vous vous intéressiez à la “rigueur scientifique” et que vous essayiez de la mettre en application, cette discussion aura peut-être eu une utilité.


cordialement yes

Vicen dit :En fait le mieux reste encore de filtrer BGG comme certains le suggèrent : en catégorie.

Car peut on réellement comparé Gloomheaven à Azul ?

 

En effet c’est une excellente question également , bien plus large même ... peut on comparer 7 wonders , Terminator 2 , ou 10 petits negres ? Ou la joconde et les brocolis ?. 

A mon avis tout dépend des critères de comparaison. On peut trouver des critères (du style « quel plaisir ai-je pris ? ») qui permettent de comparer des œuvres de nature très diverses. (Mais j’étais nul en philo donc bon...)

Acathla dit :"...[...] Et les notes de bgg ne sont pas problématiques puisque comme vous le soulignez : sur bgg une population non négligeable préfère les jeux complexes. CQFD.."

pardon mais cette phrase, avec de la rigueur scientifique..., comporte déjà une interprétation ... 😇

mieux noter les jeux complexes, ne veut pas dire qu'ils les préfèrent...juste qu'ils (la population de bgg) les notent mieux...

hypothèses possibles :
- ils préfèrent les jeux complexes
- ils surnotent les jeux complexes et sous notent les jeux moins complexes
- ...


cordialement 😁

Ou autre hypothèse probable : il y a parmi les jeux simples une grosse masse de jeux ratés et/ou mauvais plombant la moyenne.

Et rien n'empêche la conjonction de divers autres points.

Bref vous vous focalisez trop sur les données et faites de la surinterprétation sans prendre de recul.

Edit https://tylervigen.com/spurious-correlations

D’ailleurs j’ai remarqué qu’à chaque fois vous omettez la possibilité : que se soit le poids du jeu qui soit surévalué quand il s’avère être bon.

C’est un parti prit que de se dire, il faut réajusté la note. Pourquoi la note et pas le poids ?
De toute façon y a moins de personne qui évaluent le poids que de personne qui notent les jeux.

Et de toute façon à titre personnel, il m’est impossible de m’aligner sur les notes moyennes des jeux, ni le poids estimé par BGG ou ailleurs. Tout simplement car la masse ou moi même n’avons pas toujours raison… on a même certainement tjs tord mais de façon distinct.

Juillet dit :C'est bien que vous vous intéressiez à la "rigueur scientifique" et que vous essayiez de la mettre en application, cette discussion aura peut-être eu une utilité.


cordialement yes

Elle ne m'a que rarement quittée

mais si cette discussion a permis que vous acceptiez l'existence de cette hypothèse dont découle le travail qui a suivi (de réajustement d'après cette hypothèse...) c'est qu'elle n'a pas été vaine.

😉

Vicen dit :
Acathla dit :"...[...] Et les notes de bgg ne sont pas problématiques puisque comme vous le soulignez : sur bgg une population non négligeable préfère les jeux complexes. CQFD.."

pardon mais cette phrase, avec de la rigueur scientifique..., comporte déjà une interprétation ... 😇

mieux noter les jeux complexes, ne veut pas dire qu'ils les préfèrent...juste qu'ils (la population de bgg) les notent mieux...

hypothèses possibles :
- ils préfèrent les jeux complexes
- ils surnotent les jeux complexes et sous notent les jeux moins complexes
- ...


cordialement 😁

Ou autre hypothèse probable : il y a parmi les jeux simples une grosse masse de jeux ratés et/ou mauvais plombant la moyenne.

Et rien n'empêche la conjonction de divers autres points.

Bref vous vous focalisez trop sur les données et faites de la surinterprétation sans prendre de recul.

Pardon mais interprétation et hypothèse sont différents (d'ailleurs édition du message pour rajouter le mot "hypothèse "...)

les données sont des observations, c'est un peu la base de tout, donc tout le monde se basent dessus.

l'hypothèse du poids est recevable, apres y a t-il une corrélation entre le poids, la complexité et la note..?
...cela montrerait un biais...😇
 

Avant toute chose faut toujours se poser la question n’y a t il pas un facteur de confusion.
https://sciencetonnante.wordpress.com/2013/04/29/le-paradoxe-de-simpson/



https://www.outils-pour-reflechir.fr/le-paradoxe-de-simpson/