Auto-apprentissage roche - papier - ciseaux Robot Lego Mindstorms NXT ! (3 / 5 étapes)

Etape 3: Comment le robot apprend-il si elle n’est pas tricher? ! (Partie 2)

Il Croiriez-vous si je vous disais que pour rendre ce robot à apprendre comment jouer RPS, il nécessite seulement quatre variables? ! O_O.

La principale variable est appelée EPSILON. Cette variable est également connu comme le taux d’apprentissage. Mises en chantier de Epsilon out ridiculement élevé, ce qui provoque le robot rendre aléatoire se déplace au début du jeu. Comme le robot joue plus (et par conséquent apprend les meilleurs coups à faire contre le joueur), Epsilon diminue. Étant donné que Epsilon devient plus petit, au fil du temps, le robot commencera lentement à utiliser les probabilités de succès dans sa base de données contre le joueur.

Les trois autres variables sont : ALPHA, GAMMA et KAPPA.

Alpha conserve une trace de combien chaque geste influe sur l’apprentissage du robot. Cela semble confus ! En fait, Alpha est intentionnellement sur plus près de zéro que possible. Si un joueur se trouve (* soupir *) au robot (par exemple si le joueur a choisi rock et le robot a choisi le papier, mais le joueur affirme que le robot perdu), une faible valeur de Alpha provoquera le robot d’ignorer le mensonge ! Toutefois, si Alpha est trop faible, alors le robot n’apprendre pas aussi vite.

Gamma est un taux de récompense. Gamma est la valeur haute (0,80) parce que Gamma s’approche de 1, le robot est plus susceptible de commencer à utiliser les probabilités de succès plus tôt.

Kappa est une valeur de rigueur qui aide le robot à affiner ses probabilités.

Voir l'étape

Articles Liés

Fixation de poignée de porte cassée sur Toyota Corolla La voiture est âgée de 20 ans et a été maintenue près de l'eau salée dans le sud de la Floride. Poignée avant de côté pa ...
Prendre votre voiture de slot échelle HO suivi d’un cran à moindre coût si vous avez un tas de voiture slot track, c'est un amusant petit passe-temps, vite difficile et relativement bon marché ...
Pop peut Yo-yo Yo-yo est un plaisir pour tout le monde. Que vous soyez juste apprentissage ou un maître plein d'astuces, yo-yo de faire ...
Titulaire de la carte de circuit imprimé (4 Da pauvre) j'ai fait cela à la volée. J'espère que la photo et dessins rendent vraiment vraiment vraiment vraiment facile à compren ...
Fleurs fête des mères fête des mères est aujourd'hui... Oui, je suis un peu en retard avec mon cadeau, mais je ne pouvais pas finir la nuit de ...