Corrélation entre Notes et Complexité dans le top 100 BGG ?

jmguiche dit :
Acathla dit :Et si l'hypothèse est :
les "joueurs" surnotent les jeux complexes et sous notent(ou ne notent pas) les jeux simples, parce que (on s'en fout de la raison...) (parce que ca fait mieux...)
c'est une hypothèse valable...(manipulation ?🤔😇)

après le bidouillage...
un classement c'est déjà du bidouillage...
Je suis sur qu'il y a un calcul/algorithme dans le classement bgg...

mais du coup si on ne prend que les jeux des 12 derniers mois pour faire un classement  ...est ce que c'est considérer comme du bidouillage au même titre que vouloir annuler le "biais dû à la complexité"..?

Si tu souhaite obtenir « le classement des jeux sorti les douze derniers mois noté par la population de bgg », non. Tu as le droit.

tu ne modifie pas les notes, tu extrais un jeu de données pour étudier un phénomène plus réduit.

tu peux faire le même exercice avec « les jeux de tel auteur ».

Du coup en voulant retirer la corrélation "complexe = mieux noté" (observée avant toute "manipulation")
quelle difference avec retirer les jeux de tous les auteurs sauf 1

En tout cas du point de vue de certains c'est la même chose.

cordialement

Juillet dit :
Acathla dit :Et si l'hypothèse est :
les "joueurs" surnotent les jeux complexes et sous notent(ou ne notent pas) les jeux simples, parce que (on s'en fout de la raison...) (parce que ca fait mieux...)
c'est une hypothèse valable...(manipulation ?🤔😇)

après le bidouillage...
un classement c'est déjà du bidouillage...
Je suis sur qu'il y a un calcul/algorithme dans le classement bgg...

mais du coup si on ne prend que les jeux des 12 derniers mois pour faire un classement  ...est ce que c'est considérer comme du bidouillage au même titre que vouloir annuler le "biais dû à la complexité"..?

Il n'y a pas de "biais dû à la complexité" pour la raison que le classement BGG est basé sur les notes des utilisateurs et n'a pas de prétention à la rigueur scientifique. Le classement ne reflète que les goûts particuliers des utilisateurs de BGG. De plus, une corrélation ne constitue pas un biais. Un biais provient de la méthode d'échantillonnage ou des techniques de mesure.
On pourrait parler de biais (biais de sélection dans ce cas) uniquement si le classement BGG se positionnait explicitement comme un classement à valeur absolue.
Et en fait ce débat est lui-même faussé car sur BGG il s'agit en réalité d'un "geek rating", d'une notation, et non d'un classement. BGG ne prétend donc nullement établir un "classement" des jeux, il établit une notation en fonction des notes utilisateurs.
A la rigueur on pourrait s'interroger sur l'algorithme de ranking de BGG mais il ne semble pas soulever le débat outre mesure...

Si vous ne preniez que les jeux des 12 derniers mois, cela devrait apparaître clairement dans l'intitulé du ranking, sinon, cela constituerait effectivement un biais (biais de sélection) lié à des données partielles ou incomplètes.

Je l'ai appelé biais, j'aurais pu dire "truc dont on parle...

le fait est que la notation est biaisée par l'avis des joueurs (voir les hypothèses...la mienne enoncée par exemple...😇)

Ce geek ranking est d'ailleurs certainement soumis a un calcul/algorithme que l'on peut critiquer...ne pas apprécier...vouloir modifier...

sans dire le reste c'est n'importe quoi.

cordialement

 

Acathla dit :
jmguiche dit :
Acathla dit :Et si l'hypothèse est :
les "joueurs" surnotent les jeux complexes et sous notent(ou ne notent pas) les jeux simples, parce que (on s'en fout de la raison...) (parce que ca fait mieux...)
c'est une hypothèse valable...(manipulation ?🤔😇)

après le bidouillage...
un classement c'est déjà du bidouillage...
Je suis sur qu'il y a un calcul/algorithme dans le classement bgg...

mais du coup si on ne prend que les jeux des 12 derniers mois pour faire un classement  ...est ce que c'est considérer comme du bidouillage au même titre que vouloir annuler le "biais dû à la complexité"..?

Si tu souhaite obtenir « le classement des jeux sorti les douze derniers mois noté par la population de bgg », non. Tu as le droit.

tu ne modifie pas les notes, tu extrais un jeu de données pour étudier un phénomène plus réduit.

tu peux faire le même exercice avec « les jeux de tel auteur ».

Du coup en voulant retirer la corrélation "complexe = mieux noté" (observée avant toute "manipulation")
quelle difference avec retirer les jeux de tous les auteurs sauf 1

En tout cas du point de vue de certains c'est la même chose.

cordialement

Sérieux ? Y’en a qui ne comprennent pas la différence ? C’est pas évident pour qui ? Parce que dans la discussion qui précède, je n’ai lu cela nul part. Autant je comprend qu’on puisse se faire enfumer par le papier cité dans le premier post, qui cumule les erreurs d’hypothèse et de méthode mais habille tout cela de calculs savants, autant là cela me semble plus simple.


Mais bon, si tu veux connaître le classement des jeux de M X dans le classement bgg tu vas voir que le premier jeu de M x  est 27 iemme, que le deuxième jeu de M x est 55 ieme que le troisième est 89 ieme etc... mais ce qui t’interesse c’est de trouver le premier de M x, le second de M x etc.. et tu viens de le faire par une première méthode.

Et si tu ne garde que les notes des jeux de M x pour faire un classement tu obtiendras exactement le même résultat : les jeux sortirons dans le même ordre, avec les mêmes notes en plus!  Tu n’as pas bricolé les données. Tu obtiens le même résultat par une seconde méthode.


Pareil pour les jeux des douze dernier mois.

si tu étudie un phénomène (les jeux les plus apprécié de M x ou les jeux les plus appréciés des 12 derniers mois) et que tu fais une analyse sur les données qui concernent le phénomène etudié, tu peux faire une étude correcte.

pour étudier « l’avis sur les jeux de m x des internautateurs de bgg », tu n’as pas plus besoin d’etudier L’avis sur les jeux de tout les auteurs des internatateur de bgg que celui les internautateur de Darty sur les fer à repasser (pardon, les centrales vapeur)


et pour faire cela tu n’as pas arbitrairement décidé que « ha ben non, la moyenne de tel jeu c’est plus 7,6 c’est 8,90 parce que l’age du capitaine... »

 

@Acathla :

“le fait est que la notation est biaisée par l’avis des joueurs”

Pardon, êtes vous sérieux ??

 

Juillet dit :@Acathla :

"le fait est que la notation est biaisée par l'avis des joueurs"

Pardon, êtes vous sérieux ??

 

Y’a oui, là c’est vraiment joli !
 

jmguiche dit :
Acathla dit :
jmguiche dit :
Acathla dit :Et si l'hypothèse est :
les "joueurs" surnotent les jeux complexes et sous notent(ou ne notent pas) les jeux simples, parce que (on s'en fout de la raison...) (parce que ca fait mieux...)
c'est une hypothèse valable...(manipulation ?🤔😇)

après le bidouillage...
un classement c'est déjà du bidouillage...
Je suis sur qu'il y a un calcul/algorithme dans le classement bgg...

mais du coup si on ne prend que les jeux des 12 derniers mois pour faire un classement  ...est ce que c'est considérer comme du bidouillage au même titre que vouloir annuler le "biais dû à la complexité"..?

Si tu souhaite obtenir « le classement des jeux sorti les douze derniers mois noté par la population de bgg », non. Tu as le droit.

tu ne modifie pas les notes, tu extrais un jeu de données pour étudier un phénomène plus réduit.

tu peux faire le même exercice avec « les jeux de tel auteur ».

Du coup en voulant retirer la corrélation "complexe = mieux noté" (observée avant toute "manipulation")
quelle difference avec retirer les jeux de tous les auteurs sauf 1

En tout cas du point de vue de certains c'est la même chose.

cordialement

Sérieux ? Y’en a qui ne comprennent pas la différence ? C’est pas évident pour qui ? Parce que dans la discussion qui précède, je n’ai lu cela nul part. Autant je comprend qu’on puisse se faire enfumer par le papier cité dans le premier post, qui cumule les erreurs d’hypothèse et de méthode mais habille tout cela de calculs savants, autant là cela me semble plus simple.


Mais bon, si tu veux connaître le classement des jeux de M X dans le classement bgg tu vas voir que le premier jeu de M x  est 27 iemme, que le deuxième jeu de M x est 55 ieme que le troisième est 89 ieme etc... mais ce qui t’interesse c’est de trouver le premier de M x, le second de M x etc.. et tu viens de le faire par une première méthode.

Et si tu ne garde que les notes des jeux de M x pour faire un classement tu obtiendras exactement le même résultat : les jeux sortirons dans le même ordre.  Tu n’as pas bricolé les données. Tu obtiens le même résultat par une seconde méthode.


Pareil pour les jeux des douze dernier mois.

si tu étudie un phénomène (les jeux les plus apprécié de M x ou les jeux les plus appréciés des 12 derniers mois) et que tu fais une analyse sur les données qui concernent le phénomène etudié, tu peux faire une étude correcte.


et pour faire cela tu n’as pas arbitrairement décidé que « ha ben non, la moyenne de tel jeu c’est plus 7,6 c’est 8,9... »

 

Je m'attendais a une réponse de ce type. 😉

Certains cherchent un classement sans cette corrélation observée. Mieux pour eux, moins bien pour d'autres.
(la on parle de ressentis...donc non mathématique...)

Et si j'osais...je dirais que cette notation est faite sur un ressenti / avis de joueurs... 😇

(Aie pas tapé... 🤕)

Juillet dit :@Acathla :

"le fait est que la notation est biaisée par l'avis des joueurs"

Pardon, êtes vous sérieux ??

 

L'avis des joueurs est subjectif ou objectif avec tous le même principe de notation ?

Apres c'est pas grave...je peux avoir tort.
 

Acathla dit :
jmguiche dit :
Acathla dit :
jmguiche dit :
Acathla dit :Et si l'hypothèse est :
les "joueurs" surnotent les jeux complexes et sous notent(ou ne notent pas) les jeux simples, parce que (on s'en fout de la raison...) (parce que ca fait mieux...)
c'est une hypothèse valable...(manipulation ?🤔😇)

après le bidouillage...
un classement c'est déjà du bidouillage...
Je suis sur qu'il y a un calcul/algorithme dans le classement bgg...

mais du coup si on ne prend que les jeux des 12 derniers mois pour faire un classement  ...est ce que c'est considérer comme du bidouillage au même titre que vouloir annuler le "biais dû à la complexité"..?

Si tu souhaite obtenir « le classement des jeux sorti les douze derniers mois noté par la population de bgg », non. Tu as le droit.

tu ne modifie pas les notes, tu extrais un jeu de données pour étudier un phénomène plus réduit.

tu peux faire le même exercice avec « les jeux de tel auteur ».

Du coup en voulant retirer la corrélation "complexe = mieux noté" (observée avant toute "manipulation")
quelle difference avec retirer les jeux de tous les auteurs sauf 1

En tout cas du point de vue de certains c'est la même chose.

cordialement

Sérieux ? Y’en a qui ne comprennent pas la différence ? C’est pas évident pour qui ? Parce que dans la discussion qui précède, je n’ai lu cela nul part. Autant je comprend qu’on puisse se faire enfumer par le papier cité dans le premier post, qui cumule les erreurs d’hypothèse et de méthode mais habille tout cela de calculs savants, autant là cela me semble plus simple.


Mais bon, si tu veux connaître le classement des jeux de M X dans le classement bgg tu vas voir que le premier jeu de M x  est 27 iemme, que le deuxième jeu de M x est 55 ieme que le troisième est 89 ieme etc... mais ce qui t’interesse c’est de trouver le premier de M x, le second de M x etc.. et tu viens de le faire par une première méthode.

Et si tu ne garde que les notes des jeux de M x pour faire un classement tu obtiendras exactement le même résultat : les jeux sortirons dans le même ordre.  Tu n’as pas bricolé les données. Tu obtiens le même résultat par une seconde méthode.


Pareil pour les jeux des douze dernier mois.

si tu étudie un phénomène (les jeux les plus apprécié de M x ou les jeux les plus appréciés des 12 derniers mois) et que tu fais une analyse sur les données qui concernent le phénomène etudié, tu peux faire une étude correcte.


et pour faire cela tu n’as pas arbitrairement décidé que « ha ben non, la moyenne de tel jeu c’est plus 7,6 c’est 8,9... »

 

Je m'attendais a une réponse de ce type. 😉

Certains cherchent un classement sans cette corrélation observée. Mieux pour eux, moins bien pour d'autres.
(la on parle de ressentis...donc non mathématique...)

Et si j'osais...je dirais que cette notation est faite sur un ressenti / avis de joueurs... 😇

(Aie pas tapé... 🤕)


je suis étonné en fait que des gens ont besoin de faire un pseudo classement à base de données bidonnées pour faire correspondre la réalité a leur ressenti. Quel intérêt ? La réalité ne me plait pas ? Allez, je la bidouille à coup de règles de trois. 🤣 c’est l’approche stalinienne des statistiques 🥺

mais bon, je n’ai pas lu cela du tout dans la discussion précédente. Je n’y ai lu que des gens cherchant à établir un classement « sans biais ».

je pense que les gens sont assez futés  pour faire leur propre classement pour exprimer leur ressenti.

De plus je comprend que les gens s’interessent a la recherche d’un classement le plus consensuel possible.

Et un avis, c’est toujours subjectif ! Sinon ce n’est pas un avis, c’est une mesure.  Et les critères qui font un avis (subjectif) sont en effet subjectif. Bref, un classement d’avis c’est un travail sur des moyennes de subjectivité. On y apprend que les gens préférent (la subjectivité des gens à dans le sens d’aimer) pandémie legacy au jeu de l’oie. 
Que la subjectivité des gens tend vers tel ou tel jeu est une réalité qui elle est objective.
Oui, on peu mesurer la subjectivité mais la subjectivité n’est pas une mesure.
... avis objectif... cela s’appelle un oxymore 
 

KiwiToast dit :C'est marrant, moi je suis convaincu qu'un jeu complexe à plus de chances d'être un bon jeu qu'un jeu simple, et donc je ne vois aucun biais.

C'est une hypothèse qui à le mérite d'expliquer pourquoi les jeux complexes sont mieux notés en moyenne, et qui est parfaitement recevable :)

Par contre, un jeu 'simple' peut aussi être très 'profond'. A mon sens, le poker, les échecs, le go, hanabi, codenames sont tous des jeux très simples (en écrivant petit, les règles tiennes sur un post-it, pas ou quasiment pas de cas particuliers), et vont tous demander beaucoup d'investissement pour "bien" joué (au sens mettre en place des stratégies efficaces). Désolé si ça coulait de source et que j'énonce une évidence, mais j'avais peur qu'on puisse ne pas se comprendre sur ce qu'impliquent les termes 'simple', 'complexe', 'profond', etc. (et je suis ouvert à d'autres définitions bien sûr).


Concernant cette fameuse 'correction' des notations BGG, j'ai l'impression que le terme qui fait débat est justement le terme 'correction', car pour certains, les données fournies par BGG ont un sens (même si pas forcément celui que tout le monde attend), et que les données présentées retravaillées n'en auraient pas.

Personnellement, je ne comprends pas pourquoi, à partir du moment où on sait effectivement ce qui se cache derrière ces données retravaillées, avec une légende claire et des explications sur ce qui a été fait.

Mais si à la place de parler de correction des données, on parle d'un nouveau modèle de classement, qui pondèrerait les notes ? A ma connaissance, il existe déjà des examens où les épreuves sont communes pour plusieurs classements, et où chaque classement reprend individuellement les différentes notes et les pondère à sa guise. Ceci pour obtenir la vision qu'il estime être celle qui colle le plus au type de profil recherché.

Plusieurs se sont exprimés en disant qu'ils ne voyaient pas l'intérêt de ce classement retravaillé, et c'est bien sûr leur droit. Mais je ne vois pas à partir de quoi on peut décréter que ce nouveau classement n'a AUCUN intérêt... (où alors c'est la mise en abîme, et on fait un sondage pour savoir quel est le classement préféré des gens, et on ouvre un autre sujet pour discuter de la pertinence de ce nouveau sondage ^^).

 

Acathla dit :
Juillet dit :@Acathla :

"le fait est que la notation est biaisée par l'avis des joueurs"

Pardon, êtes vous sérieux ??

 

L'avis des joueurs est subjectif ou objectif avec tous le même principe de notation ?

Apres c'est pas grave...je peux avoir tort.
 

Je ne comprends pas bien. Les gens ont un avis, ils mettent une note à un jeu. Evidemment que leur avis est subjectif puisque c'est leur avis. Il se trouve que sur BGG les participants préfèrent les jeux complexes, on retrouve donc de nombreux jeux complexes dans le "top 100" des jeux les mieux notés. C'est parfaitement logique. Si ça vous pose un problème, changez de crèmerie, le monde n'a pas à s'adapter à vos désiderata, on appelle cela le principe de réalité.

MasterMindM dit :
KiwiToast dit :C'est marrant, moi je suis convaincu qu'un jeu complexe à plus de chances d'être un bon jeu qu'un jeu simple, et donc je ne vois aucun biais.

C'est une hypothèse qui à le mérite d'expliquer pourquoi les jeux complexes sont mieux notés en moyenne, et qui est parfaitement recevable :)

Par contre, un jeu 'simple' peut aussi être très 'profond'. A mon sens, le poker, les échecs, le go, hanabi, codenames sont tous des jeux très simples (en écrivant petit, les règles tiennes sur un post-it, pas ou quasiment pas de cas particuliers), et vont tous demander beaucoup d'investissement pour "bien" joué (au sens mettre en place des stratégies efficaces). Désolé si ça coulait de source et que j'énonce une évidence, mais j'avais peur qu'on puisse ne pas se comprendre sur ce qu'impliquent les termes 'simple', 'complexe', 'profond', etc. (et je suis ouvert à d'autres définitions bien sûr).


Concernant cette fameuse 'correction' des notations BGG, j'ai l'impression que le terme qui fait débat est justement le terme 'correction', car pour certains, les données fournies par BGG ont un sens (même si pas forcément celui que tout le monde attend), et que les données présentées retravaillées n'en auraient pas.

Personnellement, je ne comprends pas pourquoi, à partir du moment où on sait effectivement ce qui se cache derrière ces données retravaillées, avec une légende claire et des explications sur ce qui a été fait.

Mais si à la place de parler de correction des données, on parle d'un nouveau modèle de classement, qui pondèrerait les notes ? A ma connaissance, il existe déjà des examens où les épreuves sont communes pour plusieurs classements, et où chaque classement reprend individuellement les différentes notes et les pondère à sa guise. Ceci pour obtenir la vision qu'il estime être celle qui colle le plus au type de profil recherché.

Plusieurs se sont exprimés en disant qu'ils ne voyaient pas l'intérêt de ce classement retravaillé, et c'est bien sûr leur droit. Mais je ne vois pas à partir de quoi on peut décréter que ce nouveau classement n'a AUCUN intérêt... (où alors c'est la mise en abîme, et on fait un sondage pour savoir quel est le classement préféré des gens, et on ouvre un autre sujet pour discuter de la pertinence de ce nouveau sondage ^^).

 

+1

Juillet dit :
Acathla dit :
Juillet dit :@Acathla :

"le fait est que la notation est biaisée par l'avis des joueurs"

Pardon, êtes vous sérieux ??

 

L'avis des joueurs est subjectif ou objectif avec tous le même principe de notation ?

Apres c'est pas grave...je peux avoir tort.
 

Je ne comprends pas bien. Les gens ont un avis, ils mettent une note à un jeu. Evidemment que leur avis est subjectif puisque c'est leur avis. Il se trouve que sur BGG les participants préfèrent les jeux complexes, on retrouve donc de nombreux jeux complexes dans le "top 100" des jeux les mieux notés. C'est parfaitement logique. Si ça vous pose un problème, changez de crèmerie, le monde n'a pas à s'adapter à vos désiderata, on appelle cela le principe de réalité.

Certains pour un bon jeu vont mettre un 8
d'autres un 10, alors qu'ils l'apprecient au même "niveau"

donc pas tous la même manière de noter. Donc il y a déjà un truc (biais? Truc non absolu..?) et pourtant celui la est accepté.
(apres c'est dur de faire sans...🤔)

Edit
Le geek ranking est bidouillé/corrigé par un algorithme/calcul et cela derange certains et pas d'autres 

Concernant cette fameuse 'correction' des notations BGG, j'ai l'impression que le terme qui fait débat est justement le terme 'correction', car pour certains, les données fournies par BGG ont un sens (même si pas forcément celui que tout le monde attend), et que les données présentées retravaillées n'en auraient pas.

En fait il n'y a pas de débat, et il ne s'agit pas de "correction". Ce que vous dites n'a pas de sens. De même, manipuler des données pour leur faire dire ce qu'elle ne disent pas ou pour obtenir un résultat différent parce que le résultat initial ne "convient  pas" n'a pas de sens.

Personnellement, je ne comprends pas pourquoi, à partir du moment où on sait effectivement ce qui se cache derrière ces données retravaillées, avec une légende claire et des explications sur ce qui a été fait.

Oui, pourquoi ne pas surpondérer les jeux qui parlent de chameaux ou de temples égyptiens, ils sont sous-représentés dans le "top 100" du rating board game geek, je suis sûr que pour certains cela aurait du sens. On expliquerait clairement pourquoi (bah parce qu'il y a un biais contre les chameaux dans le classement initial, pardi) et à la place on parlerait de "nouveaux modèle de classement" ou de "modèle de classement alternatif chameaux friendly".
 

Juillet dit :

Personnellement, je ne comprends pas pourquoi, à partir du moment où on sait effectivement ce qui se cache derrière ces données retravaillées, avec une légende claire et des explications sur ce qui a été fait.

Oui, pourquoi ne pas surpondérer les jeux qui parlent de chameaux ou de temples égyptiens, ils sont sous-représentés dans le "top 100" du rating board game geek, je suis sûr que pour certains cela aurait du sens. On expliquerait clairement pourquoi (bah parce qu'il y a un biais contre les chameaux dans le classement initial, pardi) et à la place on parlerait de "nouveaux modèle de classement" ou de "modèle de classement alternatif chameaux friendly".

Effectivement, n'appliquons pas deux poids deux mesures, nous pouvons considérer cette option. Maintenant, deux points :
 - (A) est-ce que cela a véritablement un intérêt ?
 - (B) est-ce que ces jeux sont vraiment sous représentés ?
 - (B bis) si oui, est ce du au fait que 'les joueurs qui n'aiment pas les chameaux' vote plus que 'les joueurs' en proportion

Pour le point (A), autant je peux comprendre de ne pas avoir un classement qui 'occulterait' les jeux simples peut gêner certains, autant la sous représentation des chameaux ne ME semble pas être un problème.

Pour le point (B), pareil, j'arrive à concevoir que les joueurs de 'gros jeux', qui demandent généralement plus de temps et d'investissement, soient plus passionnées et vont donc plus facilement voter, laisser des avis, etc.(1) . Par contre, je ne pense pas que l'affection des joueurs pour les chameaux ait une influence (à la limite les chats ou les licornes pourquoi pas... ^^).

Charge à celui qui veut défendre ces deux points de le faire.

Pour rappel, ce n'est à l'origine pas parce que le top 100 ne plaisait pas à l'auteur de l'article posté dans le premier message de cette discussion qu'il a proposé un classement 'remanié', mais parce qu'il fait des hypothèses(2) :
 - Hypothèse : la complexité n'a PAS d'impact sur la qualité d'un jeu
 - Hypothèse (implicite) : la note traduit globalement la qualité d'un jeu
qui conduisent donc à l'hypothèse suivante :
 - Hypothèse (qui découle des deux autres) : la complexité n'a PAS d'impact sur la note d'un jeu

ce qui implique qu'avec un grand nombre de jeu, les jeux complexe et les jeux simples devraient avoir la même moyenne environ.

Remarque : je sais que le point ci dessus a fait débat, donc si quelqu'un peut le réfuter, qu'il n'hésite pas car c'est la base de ce qui suit.

Or il constate un écart significatif de note entre les jeux simple et complexe, ce qui n'est pas normal si ses hypothèses sont bonnes. Il en déduit donc que la note ne traduit pas la qualité d'un jeu, car un autre facteur intervient : la préférence des votants (et non pas de joueurs dans leur ensemble(3)) pour les jeux complexes. Il propose donc un nouveau modèle de classement qui selon lui compense ce facteur.


Désolé je me répète, mais en lisant "manipuler des données pour leur faire dire ce qu'elle ne disent pas ou pour obtenir un résultat différent parce que le résultat initial ne "convient  pas" n'a pas de sens.", je ne reconnais pas la démarche expliquée.

(1) : c'est mon sentiment personnel, absolument pas prouvé.
(2) : c'est les hypothèses telles que je les comprends
(3) : c'est comme ça que j'interprète ce que certains ont nommé 'erreur de corrélation', qui est un terme qui ne me convient pas


 

Juillet dit : Il se trouve que sur BGG les participants préfèrent les jeux complexes, on retrouve donc de nombreux jeux complexes dans le "top 100" des jeux les mieux notés. C'est parfaitement logique. Si ça vous pose un problème, changez de crèmerie, le monde n'a pas à s'adapter à vos désiderata, on appelle cela le principe de réalité.
Parfaitement d'accord ! Mais c'est exactement ce qui est proposé avec ce classement remanié : avoir des résultats qui répondent mieux aux attentes de certains, sans pour autant changer quoi de ce soit aux habitudes des gens (en tout cas, je n'ai vu personne dans cette discussion réclamer un changement officiel du classement chez BGG, mais simplement des retours du type 'ce classement me semble plus pertinent' ).

C’est quand même fous que certains ne tiennent absolument aucun compte des explications qui me semblent claires et détaillées, données par jmguiche et moi même sur ce sujet, j’ai vraiment l’impression de pisser dans un violon.
Je vous réexplique donc, ce qui pose problème c’est la manipulation des données du rating BGG pour leur faire dire ce qu’elles ne disent  pas, afin d’obtenir un résultat différent. C’est un peu comme si à l’issue d’une élection on changeait le résultat en surpondérant les votes obtenus par un candidat pour mieux “répondre aux attentes de certains”. On est là dans le délire le plus complet.
Quant aux hypothèses de l’auteur du classement remanié telles que vous les évoquez, là encore c’est du délire complet.

- Hypothèse : la complexité n’a PAS d’impact sur la qualité d’un jeu
 - Hypothèse (implicite) : la note traduit globalement la qualité d’un jeu
qui conduisent donc à l’hypothèse suivante :
 - Hypothèse (qui découle des deux autres) : la complexité n’a PAS d’impact sur la note d’un jeu

Vos hypothèses sont absurdes car elles contredisent la notation des membres de BGG, c’est à dire les données. Elles n’ont donc aucun sens.
On fait des hypothèses pour expliquer un résultat, ensuite on tente de les vérifier. On ne fait  pas d’hypothèses sans lien avec les données empiriques cela n’a absolument aucun sens (sauf si vous vous contrefichez des données, ce qui semble ici l’explication la plus évidente).
Vos hypothèses contredisent explicitement les données issues des notations des utilisateurs sur BGG. C’est l’inverse qu’il faut formuler :
1 la note traduit globalement la qualité d’un jeu.
2 la complexité semble avoir un impact sur la qualité d’un jeu au vu des notations attribuées sur BGG.
3 quelle est la nature du lien entre qualité d’un jeu et complexité ?
Ayant posé cette question, vous pouvez lancer une investigation, formuler des hypothèses sur la nature du lien et les tester, de manière à découvrir le lien entre complexité et qualité d’un jeu, ou l’absence de lien. Mais même formulée ainsi cette démarche n’est pas scientifiquement valide car l’hypothèse 1 est arbitraire et son  périmètre mal défini. La note traduit-elle aux yeux des votants la qualité d’un jeu ? Ne traduit-elle pas plutôt le  plaisir qu’ils ont pris à y jouer ? Que notent concrètement les votants lorsqu’ils attribuent une note à un jeu ?
Il est essentiel de définir correctement le 1 puisque le reste de la démarche d’investigation en découle. On peut définir le 1 par une enquête auprès des utilisateurs en leur demandant d’expliciter les éléments qu’ils prennent en compte lorsqu’ils attribuent une note à un jeu.
D’ailleurs, une telle investigation pourrait très bien être menée sur Tric trac, par exemple, cela apporterait de nombreux éclairages sur le “mystère de la note”.
En l’état actuel et en l’absence de grille de notation qualitative explicite, il serait ainsi plus juste de parler de “préférence des utilisateurs”, à propos du système de notation.
1 La notation reflète les préférences des utilisateurs de BGG
2 les jeux dits “complexes” (là aussi, c’est un terme qu’il faudrait définir précisément, est-ce que la complexité renvoie à la longueur des règles ? Aux possibilités stratégiques ? A la durée des parties ? A la rejouabilité ?) sont globalement  mieux notés sur le site BGG
3 la complexité des jeux semble donc corrélée avec les préférences des utilisateurs de BGG
4 on peut alors faire l’hypothèse que les utilisateurs de BGG préfèrent les jeux complexes
5 afin de vérifier cette hypothèse il faudrait que les utilisateurs BGG répondent à un questionnaire explicatif concernant leurs pratiques de notation.

Si vous voulez un classement alternatif au classement de BGG, la seule démarche valable et rigoureuse est d’effectuer un autre classement, avec un autre type de public, c’est à dire de produire de nouvelles données, mais pas de bidouiller et/ou manipuler des données existantes !
Vous pouvez par exemple effectuer le même type de classement sur des sous-catégories de jeux ou sur des sites plus grands publics, qui vous donneront probablement des résultats différents  parce que le public répondant sera différent.
Vous pouvez extraire un classement des notations amazon ou de tout autre site grand public proposant des notations, les résultats seront différents, les jeux simples seront davantage représentés, il y a même de fortes chance que le Monopoly figure dans le top 100…

@juillet
laisse tomber.
tu donnes des explications statistiques. Les outils statistique permettent d’analyser le réel. Tu te positionne avec une approche scientifique et rationnelle.

tu donnes ces explications à des gens qui « veulent avoir des résultats qui correspondent à leurs attentes » (cf intervention de Mastermindm ci dessus et d’autres dAcathla avant). 

Quand on veux avoir des résultats qui correspondent à son attente, on se fiche du réel, de la raison, de la démarche scientifique. On veut non pas connaître le réel mais le rendre conforme à son attente.

On n’est plus dans le biais de confirmation (je ne remarque que les infos allant dans le sens de ses avis ou préjugés), on est au delà, dans la construction de l’information qui va dans son sens.

C’est un dialogue de sourds.


Alfa dit :Voici le graphe indiquant la corrélation observée.
L’eneqemble des notes à été corrigé de manière à avoir une pente moyenne nulle

Tric Trac

Je n'ai pas verifié la source de ce graphique, mais cela est une donnée non ?

on voit qu'il y a une tendance quand même ? Avec un coefficient de pente "a" de y = ax+b non nul donc une influence...(de ce que je me souviens de "il y a longtemps..")

observation (une influence) => hypothèse (réponse possible a la problématique de pourquoi une influence)

en quoi les hypothèses sont elles absurdes ?

apres la manière de modifier et le sens que l'on y donne...c'est autre chose.

MasterMindM dit :
Juillet dit :

Personnellement, je ne comprends pas pourquoi, à partir du moment où on sait effectivement ce qui se cache derrière ces données retravaillées, avec une légende claire et des explications sur ce qui a été fait.

Oui, pourquoi ne pas surpondérer les jeux qui parlent de chameaux ou de temples égyptiens, ils sont sous-représentés dans le "top 100" du rating board game geek, je suis sûr que pour certains cela aurait du sens. On expliquerait clairement pourquoi (bah parce qu'il y a un biais contre les chameaux dans le classement initial, pardi) et à la place on parlerait de "nouveaux modèle de classement" ou de "modèle de classement alternatif chameaux friendly".

Effectivement, n'appliquons pas deux poids deux mesures, nous pouvons considérer cette option. Maintenant, deux points :
 - (A) est-ce que cela a véritablement un intérêt ?
 - (B) est-ce que ces jeux sont vraiment sous représentés ?
 - (B bis) si oui, est ce du au fait que 'les joueurs qui n'aiment pas les chameaux' vote plus que 'les joueurs' en proportion

Pour le point (A), autant je peux comprendre de ne pas avoir un classement qui 'occulterait' les jeux simples peut gêner certains, autant la sous représentation des chameaux ne ME semble pas être un problème.

Pour le point (B), pareil, j'arrive à concevoir que les joueurs de 'gros jeux', qui demandent généralement plus de temps et d'investissement, soient plus passionnées et vont donc plus facilement voter, laisser des avis, etc.(1) . Par contre, je ne pense pas que l'affection des joueurs pour les chameaux ait une influence (à la limite les chats ou les licornes pourquoi pas... ^^).

Charge à celui qui veut défendre ces deux points de le faire.

Pour rappel, ce n'est à l'origine pas parce que le top 100 ne plaisait pas à l'auteur de l'article posté dans le premier message de cette discussion qu'il a proposé un classement 'remanié', mais parce qu'il fait des hypothèses(2) :
 - Hypothèse : la complexité n'a PAS d'impact sur la qualité d'un jeu
 - Hypothèse (implicite) : la note traduit globalement la qualité d'un jeu
qui conduisent donc à l'hypothèse suivante :
 - Hypothèse (qui découle des deux autres) : la complexité n'a PAS d'impact sur la note d'un jeu

ce qui implique qu'avec un grand nombre de jeu, les jeux complexe et les jeux simples devraient avoir la même moyenne environ.

Remarque : je sais que le point ci dessus a fait débat, donc si quelqu'un peut le réfuter, qu'il n'hésite pas car c'est la base de ce qui suit.

Or il constate un écart significatif de note entre les jeux simple et complexe, ce qui n'est pas normal si ses hypothèses sont bonnes. Il en déduit donc que la note ne traduit pas la qualité d'un jeu, car un autre facteur intervient : la préférence des votants (et non pas de joueurs dans leur ensemble(3)) pour les jeux complexes. Il propose donc un nouveau modèle de classement qui selon lui compense ce facteur.


Désolé je me répète, mais en lisant "manipuler des données pour leur faire dire ce qu'elle ne disent pas ou pour obtenir un résultat différent parce que le résultat initial ne "convient  pas" n'a pas de sens.", je ne reconnais pas la démarche expliquée.

(1) : c'est mon sentiment personnel, absolument pas prouvé.
(2) : c'est les hypothèses telles que je les comprends
(3) : c'est comme ça que j'interprète ce que certains ont nommé 'erreur de corrélation', qui est un terme qui ne me convient pas


 

Juillet dit : Il se trouve que sur BGG les participants préfèrent les jeux complexes, on retrouve donc de nombreux jeux complexes dans le "top 100" des jeux les mieux notés. C'est parfaitement logique. Si ça vous pose un problème, changez de crèmerie, le monde n'a pas à s'adapter à vos désiderata, on appelle cela le principe de réalité.
Parfaitement d'accord ! Mais c'est exactement ce qui est proposé avec ce classement remanié : avoir des résultats qui répondent mieux aux attentes de certains, sans pour autant changer quoi de ce soit aux habitudes des gens (en tout cas, je n'ai vu personne dans cette discussion réclamer un changement officiel du classement chez BGG, mais simplement des retours du type 'ce classement me semble plus pertinent' ).

Je suis d’accord avec toi mastermind, (et acathla) mais en effet j’ai l’impression d’un dialogue de sourds. 
Je suis sûr qu’il y a de bons arguments côté juillet et jmaguiche, mais certains me désolent encore (non rien ne montre que statistiquement les chameaux soient sous representės ; on a ici une correlation qui va bien audela du top100 ; les aspects definitoires ne sont pas le centre du sujet, au passage les notions de complexite et de notation ont deja sont explicitees sur bgg...). Et certains de nos arguments restente sans reponse. (pas evident sur un forum cela dit...)

Selon moi
- la correlation observee a sans doute une realite (la quantite relative de joueurs velus sur bgg en est sans doute la cause, mais je me refuse a conclure que tous les votants sur bgg preferent la complexitė), mais elle ne me convient pas pour un classement utilisė a outrance (site de reference oblige...) en dehors de bgg.
- Le constat averė,  l'idee d'une correction pour extrapoler au joueur lambda m'interesse . (Oui c'est de la manipulation de data, mais non ce n'est du delire complet). Et d'autant plus que d'autres corrections / manipulations sont deja mises en place dans le classement public (notamment liee au nb de votants avec un seuil totalement arbitraire), donc pourquoi pas celle ci ?
- La maniere de corriger est un point qui pourrait egalement etre sujet a un debat passionnant :)

jmguiche dit :@juillet
laisse tomber.
tu donnes des explications statistiques. Les outils statistique permettent d’analyser le réel. Tu te positionne avec une approche scientifique et rationnelle.

tu donnes ces explications à des gens qui « veulent avoir des résultats qui correspondent à leurs attentes » (cf intervention de Mastermindm ci dessus et d’autres dAcathla avant). 

Quand on veux avoir des résultats qui correspondent à son attente, on se fiche du réel, de la raison, de la démarche scientifique. On veut non pas connaître le réel mais le rendre conforme à son attente.

On n’est plus dans le biais de confirmation (je ne remarque que les infos allant dans le sens de ses avis ou préjugés), on est au delà, dans la construction de l’information qui va dans son sens.

C’est un dialogue de sourds.


 

Quelque part vous me rassurez sur le diagnostic, mais je trouve ce phénomène inquiétant... L'absence de culture scientifique, le manque de rigueur élémentaire, conduisent à des aberrations logiques et à l'impossibilité de raisonner autrement qu'en fonction du "ressenti" et des attentes individuelles. A quelle genre d'autres absurdités auront nous à faire à l'avenir ?

Acathla dit :
Alfa dit :Voici le graphe indiquant la corrélation observée.
L’eneqemble des notes à été corrigé de manière à avoir une pente moyenne nulle

Tric Trac

Je n'ai pas verifié la source de ce graphique, mais cela est une donnée non ?

on voit qu'il y a une tendance quand même ? Avec un coefficient de pente "a" de y = ax+b non nul donc une influence...(de ce que je me souviens de "il y a longtemps..")

observation (une influence) => hypothèse (réponse possible a la problématique de pourquoi une influence)

en quoi les hypothèses sont elles absurdes ?

apres la manière de modifier et le sens que l'on y donne...c'est autre chose.

Le manque de rigueur sur l'existence d'une hypothèse...

Edit

c'est fou de ne pas accepter une hypothèse et d'y rester sourd...