Des chiffres et des modèles prédictif pour Kickstarter

Hé hé !! Tu vas te faire plaiz’ ! 



Voilà les chiffres pour Cthulhu wars 2. Le trending y était presque avec une légère surestimation.

Je vais voir si je rend disponible les chiffres bruts pour les données récupérées automatiquement sur toutes les campagnes tabletop. Mais pour le script automatique, je me limite à l’évolution backers/montant/commentaires pour éviter de surcharger le serveur et me prendre un ban IP (j’ai déjà dû rajouter un timer pour éviter de faire trop de requêtes à intervalle rapproché)

Je continue à suivre les très gros projets avec l’ancien script pour avoir les montants d’add-on et la distribution des pledges.

Quelques petites données rigolotes :
Pour arcadia quest, l’augmentation du pledge moyen est due uniquement aux add-on quasiment (cf Pledge/backer, la légende de gauchee st pour le pledge gloabl, celle de droite pour l’add-on par backer):



Pour dropfleet commander le pledge à 150 a bouleversé l’add-on moyen qui retourne tout de même à un niveau élevé :


Et pour Banner Saga, quasiment pas d’add-on :


EDIT : Je me cultive sur le machine learning via quelques bouquins, mais comme ça ne se lit pas aussi bien que des romans et qu’il y a beaucoup de choses qui ne m’intéressent pas trop (filtres bayesiens ou travail sur des données de type texte), je n’avance pas ultra vite.

D’ailleurs, si certains ont des lectures à conseiller sur le sujet, je suis preneur.

En français il y a le bouquin d’Antoine Cornuéjols qui est pas mal (mais pas libre) en tant que survey mais il commence à dater un peu. 

Sinon même si pas toujours en profondeur, je recommande le cours de Ng sur coursera
https://class.coursera.org/ml-003/lecture

Tiens marrant, j’avais fait des bouts de celui la :slight_smile: très interressant et tres facile a comprendre sur les bases (je n’ai pas un profil math a la base, plus tech)… et surtout facile une fois qu’on a compris les principes de base d’utiliser avec des librairies existantes :slight_smile:

Sinon d’ailleurs y’a un cours qui commence la semaine prochaine :) https://www.coursera.org/learn/machine-learning

Voilà un peu de chiffres pour Banner saga et dropfleet commander.





Pour ceux que ça intéresse, les données actualisées heure par heure lorsqu’on mon ordi est allumé (donc avec des trous la nuit et les week-end) des campagnes  dans la catégorie “jeu tabletop” depuis le 13 novembre.

Les références des projets sont dans active.csv (ou closed.csv) et ensuite il y a un fichier par projet référencé par son identifiant kickstarter.
http://agregationchimie.free.fr/fichiers/kickstarter.zip (1,4Mo)

J’ai pas eu le temps de m’en occuper pour faire de jolis graphiques et encore moins pour les analyser, le temps me manque, mais s’il y a des courageux.

Merci pour ce sujet très intéressant, même si je suis souvent largué niveau “technique & connaissances” ! 

Perso, j’aime bien juste avoir les graphiques de données “brutes”, simplement pour le plaisir de me faire ma propre analyse dans mon coin.
Et c’est vraiment top ce que tu as fait !


Après je me disais, mais ça risque d’être une grosse connerie vu ma maitrise de la chose, ne pourrait-tu pas essayer d’intégrer des paramètres externes aux campagnes pour affiner encore plus tes modèles prédictifs ?
Je pense par exemple à Conan, The 7th Continent ou le futur MB:P dont je pense que le (futur?) succès est en grande partie dû au travail de com pré-campagne.
Du coup, ça voudrait par exemple, pouvoir récupérer l’activité des sites d’infos comme TT, BGG, etc. sur ces jeux (à voir si l’on peut déterminer des critères pertinents et “abordables” : hotness ? nombre de posts ? d’articles ?), de prendre la durée séparant le début (à la louche) de la com et le départ de la campagne (si tant est que ce soit un critère pertinent), et que sais-je encore…



En espérant ne pas avoir dis trop de bêtises.

Un bilan de l’année 2015 en terme de jeux (un peu tard mais je viens de tomber dessus et les chiffres m’ont surpris) :


Eolindel dit :Pour ceux que ça intéresse, les données actualisées heure par heure lorsqu'on mon ordi est allumé (donc avec des trous la nuit et les week-end) des campagnes  dans la catégorie "jeu tabletop" depuis le 13 novembre.

Les références des projets sont dans active.csv (ou closed.csv) et ensuite il y a un fichier par projet référencé par son identifiant kickstarter.
http://agregationchimie.free.fr/fichiers/kickstarter.zip (1,4Mo)

J'ai pas eu le temps de m'en occuper pour faire de jolis graphiques et encore moins pour les analyser, le temps me manque, mais s'il y a des courageux.

Claaaaaaasseeeeee !!! P#### pourquoi j'ai pas des journées de 36h.... je télécharge ça tout cette semaine et je regarde mais c'est vraiment canon... plus qu'a trouver du temps pour regarder :(