Intelligence artificielle: l'Homme perd son dernier match contre la machine

gregyfun · Janvier 28, 2016, 9:09

Je relaye cette info qui me semble intéressante et que je n’ai pas vue dans ce forum :

Le jeu de go restait le dernier jeu de stratégie pour lequel l’Homme demeurait plus performant que la machine. C’est désormais du passé, puisqu’un programme conçu par une filiale de Google a battu un joueur professionnel.

Le jeu de go est connu pour être l’un des jeux de stratégie le plus difficile à simuler pour un ordinateur. D’où la résistance humaine, qui parvenait à contenir les assauts de l’informatique et des concepteurs d’algorithmes. Mais Google, via sa filiale DeepMind, spécialisée dans l’intelligence artificielle, a annoncé avoir trouvé la parade.

Ce défi pour les informaticiens a enfin été réalisé en octobre dernier, sans que Google ne communique sur le sujet. Il a fallu attendre le dernier numéro de la revue Nature pour que cette performance soit révélée au grand public. AlphaGo, le programme conçu par DeepMind, a battu par cinq victoires à zéro Fan Hui, un joueur professionnel considéré comme l’un des meilleurs joueurs européens.

Cette victoire est d’importance pour les informaticiens, car le jeu de go est bien plus compliqué à simuler que le jeu d’échecs, premier terrain de jeu de l’intelligence artificielle. Il a fallu pour battre le joueur professionnel que l’algorithme de DeepMind utilise plus d’un millier de processeurs en réseau. Lee Sedol, le meilleur joueur du monde, est la prochaine victime désignée par AlphaGo.

Source clubic.com

Plus d’info mais en anglais ici

tt-a591c296c9ef0a4de07abd2cc4aafd9e · Janvier 28, 2016, 9:51

C’est loin d’être le dernier. Pour le Hold’em par exemple il y a encore du travail à faire pour que l’ordinateur batte l’Homme. Les jeux à plus de deux joueurs n’ont pas non plus été beaucoup explorés.

tt-85e2f340c391ef7813432a8f2f7e1a10 · Janvier 28, 2016, 10:10

Cool, le terminator pourra s’occuper en attendant Sarah Connor.

gregyfun · Janvier 28, 2016, 10:11

Non mais on parle de jeux sérieux, pas de jeu de moule
Plus sérieusement, comment tu fais pour comparer des performances avec des distributions aléatoires ?
Tu fais jouer au “champion du monde” 1 000 000 de parties contre la machine pour lisser le hasard ?

Edit : Je viens de trouver ça sur le Hold’em :

Poker is a family of games that exhibit imperfect information, where players do not have full knowledge of past events. Whereas many perfect-information games have been solved (e.g., Connect Four and checkers), no nontrivial imperfect-information game played competitively by humans has previously been solved. Here, we announce that heads-up limit Texas hold’em is now essentially weakly solved. Furthermore, this computation formally proves the common wisdom that the dealer in the game holds a substantial advantage. This result was enabled by a new algorithm, CFR+, which is capable of solving extensive-form games orders of magnitude larger than previously possible.

tt-a591c296c9ef0a4de07abd2cc4aafd9e · Janvier 28, 2016, 10:54

GregyFun dit :Non mais on parle de jeux sérieux, pas de jeu de moule
Plus sérieusement, comment tu fais pour comparer des performances avec des distributions aléatoires ?
Tu fais jouer au "champion du monde" 1 000 000 de parties contre la machine pour lisser le hasard ?

Edit : Je viens de trouver ça sur le Hold'em :

Poker is a family of games that exhibit imperfect information, where players do not have full knowledge of past events. Whereas many perfect-information games have been solved (e.g., Connect Four and checkers), no nontrivial imperfect-information game played competitively by humans has previously been solved. Here, we announce that heads-up limit Texas hold’em is now essentially weakly solved. Furthermore, this computation formally proves the common wisdom that the dealer in the game holds a substantial advantage. This result was enabled by a new algorithm, CFR+, which is capable of solving extensive-form games orders of magnitude larger than previously possible.

Pas besoin d'un million de parties, mais oui c'est l'idée (mais même sur le Go ou les Échecs il faut/a fallu plus d'une victoire pour affirmer la suprématie). J'ai déjà assisté à un « tournoi » entre humains et machines justement pour tester des IA de Poker (limit, 2 joueurs, soit le cas le plus simple) lors d'une conférence, au bout de 4 heures de donnes ont commence à voir poindre des tendances, quand même. D'ailleurs c'était un peu comique dans la mesure où le joueur humain semblait complètement formaté et passait son temps à essayer d'intimider… un machine… Mais au final il a gagné quand même. C'était il y a une petite dizaine d'années, il faut dire.

Pour le Hold'em la variante « limit » est maintenant en partie résolue pour deux joueurs… Donc il y a encore du travail pour passer au no-limit et augmenter le nombre de joueurs. C'était surtout pour illustrer que les notions d'information imparfaite (et le bluff qui va avec), de hasard et de coopération était encore difficile à gérer pour des IA, mais nul doute que ça viendra.

tt-a591c296c9ef0a4de07abd2cc4aafd9e · Janvier 28, 2016, 11:15

Après, je ne remets pas du tout en cause l’exploit des auteurs de DeepMind, mais plutôt l’intro sensationnaliste de Clubic.

gregyfun · Janvier 28, 2016, 11:37

Ca ne m’a pas choqué car j’avais souvent entendu que le Go était la dernière barrière en terme de complexité.
Quand tu parles de Poker, c’est intéressant aussi mais ça ne joue pas dans la même catégorie imho…

tt-a591c296c9ef0a4de07abd2cc4aafd9e · Janvier 28, 2016, 11:44

GregyFun dit :Ca ne m'a pas choqué car j'avais souvent entendu que le Go était la dernière barrière en terme de complexité.
Quand tu parles de Poker, c'est intéressant aussi mais ça ne joue pas dans la même catégorie imho...

Un ordinateur ne fait pas la différence. En termes de complexité brute si on ne considère que le nombre d'options à chaque coup, le no-limit est supérieur au Go puisqu'on peut toujours relancer de n'importe quelle somme entre 0 et son tapis. À ça il faut ajouter la gestion des hasard et surtout des déductions que l'IA peut faire du jeu adverse en fonction de ses coups, de ce que l'IA croit que son adversaire croit et récursivement… Là on change effectivement de registre mais pour un ordinateur ça reste de la complexité…

yefy · Janvier 28, 2016, 3:28

Disons que les jeux à deux joueurs représentaient une symbolique"l’homme contre la machine" et ce n’est pas étonnant que cela ait été traité en premier.
En tout cas merci de l’info, cel

yefy · Janvier 28, 2016, 3:30

*cela fait longtemps que je m’intéresse au jeu de go et à son concept “d’invincibilité” contre l’ordinateur.Un bastion est tombé, je trouve cela un peu triste .Je suivrais le résultat du match contre Lee

noisettes · Janvier 28, 2016, 4:40

Je n y connais pas grand chose en go, mais l écart de niveau entre un top player européen et un top player asiatique n est il pas important?parce que si c’est comme a League of legend, ou starcraft l ordi va etre surpris!

eipi · Janvier 28, 2016, 4:46

noisettes dit :Je n y connais pas grand chose en go, mais l écart de niveau entre un top player européen et un top player asiatique n est il pas important? parce que si c'est comme a League of legend, ou starcraft l ordi va etre surpris!

Oui mais le top player Européen c'est un chinois, c'est juste qu'il vit en France

Blague à part, il est 6e mondial il me semble, mais ne connaissant pas la différence de niveau entre un 6e mondial et un premier mondial on est pas plus avancé pour répondre à cette question.

johangel · Janvier 28, 2016, 8:53

Fan a suivi une formation pour être pro en Chine étant jeune mais il a peu participé au circuit pro asiatique.
il est champion d’Europe depuis qu’il a acquis la nationalité française. Il est dans le top 10 du circuit amateur Européen.
Je pense qu’il y a quelques dizaines voire centaines de joueurs ou joueuses pro plus forts que lui dans le monde (Chine Japon Corée Taïwan).
En revanche, Lee Sedol est le meilleur de sa génération et encore jeune (32 ans). Ce match en 5 parties en mars sera similaire au Kasparov / Deep Blue de 1995.
Aujourd’hui franchement, on ne le voit pas perdre sauf une partie s’il tente des trucs bizarres ou fait le con.
le vainqueur remportera 1 millions d’euros.

jeremie · Janvier 28, 2016, 10:24

Le Go c’est fini. Le champion du monde gagnait encore en novembre, mais du temps c’est écoulé depuis et pour un match Google Deepmind ne laissera que peu de place au hasard (pas de problèmes techniques pour mobiliser plus de 10 000 cores et autant de GPUs et vu que l’algo se comporte très bien en de manière parallèle…)

Le Hold’em heads’up c’est plié depuis plus d’un an par M. Bowling (et sans réseaux à convolution).

Le multijoueur reste un véritable challenge. Les idées introduites par le papier de Deepmind (réseau à convolution pour l’estimateur des positions et second réseau pour l’estimateur des choix des politiques, pourraient amener des progrès dans d’autres jeux plus complexes)

johangel · Janvier 29, 2016, 2:55

jeremie dit :Le Go c'est fini.

In fine oui, mais le match a venir sera intéressant car le champion humain aura encore largement sa chance.

noisettes · Janvier 29, 2016, 9:22

si il a une chance c est pas plié…

johangel · Janvier 29, 2016, 9:50

En fait, l’évolution des programmes de go était assez constante ces dernières années et on se doutait bien que l’invincibilité d’un programme viendrait un jour.
Jusqu’à maintenant, on tablait sur dans 10 ans car les programmes actuels (Zen, crazyStone etc…) se font battre régulièrement par les meilleurs amateurs ce qui est déjà un très fort niveau.
Et là, on s’aperçoit que Google a fait le sous-marin avec son DeepMind. La victoire contre Fan Hui qui date d’octobre n’a été révélée que cette semaine. Je pense qu’ils ont du attendre la fin des tractations avec Lee Sedol pour annoncer en même temps ce match à la DeepBlue-Kasparov pour faire le buzz.
DeepMind a non seulement explosé tous les programmes actuels mais aussi un des meilleurs amateurs européens.
Le prochain match après 6 mois de développement contre un des meilleurs mondiaux sera passionnant. Même si Lee gagne, il ne faudra pas attendre 10 ans pour l’invicibilité informatique.

jeremie · Janvier 29, 2016, 12:45

Non ils attendaient la publication dans Nature qui est sortie mercredi soir.

L’algo présenté n’est pas incroyablement différent de CrazyStone (en fait c’est un ancien étudiant de Rémi Coulom qui avait le lead). Par contre le matos utilisé est peu commun. Leur “petite” machine fait 48 cores et 8 GPU (sans doute des Titans X). A 32 Cores comme CrazyStone, je ne suis pas certain que leur elo soit très supérieur.
En plus l’algo a été fait de manière distribué et la niveau de jeu augmente de manière intéressante avec la puissance investie. A 48/8 son elo est de 2890 alors qu’à 1202 CPUs et 176GPUs il est a 3140.

albatur · Janvier 30, 2016, 3:36

J’attends avec impatience le combat contre Lee Sedol car si lui perd s’en est vraiment fini de la domination de l’humain sur l’ordi au jeu de go.

johangel · Février 1, 2016, 9:13

Dans son match, Fan a déclaré que l’ordinateur jouait “comme un humain”. C’est nouveau car les meilleurs programmes actuels jouaient de temps en temps “bizarrement”, des coups que n’auraient pas joué des joueurs humains même s’il était difficile de démontrer que ces coups étaient mauvais (et peut-être ne l’étaient-ils pas).
Aujourd’hui, la puissance de calcul et le progrès semble éliminer ces coups atypiques ce qui montre à la fois la force des machines mais surtout celle des humains.
Autre remarque, Fan a fait 2-3 contre AlphaGo (de Deepmine) en partie rapide ce qui pourrait paraître étonnant car la limitation du temps de reflexion pourrait être favorable à l’oridnateur, l’humain étant plus sensible aux erreurs et approximations. En fait, ce n’est pas le cas.
Finalement, il se trouve que l’ordinateur a vraiment besoin d’une énorme puissance de calcul pour jouer des bons coups que l’humain voit en une fraction de seconde. En général, les humains passent leur temps à évaluer et vérifier les quelques coups qu’ils envisagent assez rapidement. L’ordinateur, lui n’envisage rien à priori, il doit énormément calculer pour aboutir à des coups parfois évident et il doit énormément calculer pour ne pas faire de mauvais coup ce qui est l’arme absolue au go. Tous les joueurs, même les meilleurs jouent de mauvais coups ou non optimaux (jugés comme tels à l’analyse fin de partie et commentaires autres pros).
A moi avis, la puissance de calcul rendra un jour l’ordinateur invincible au Go.