capteurs :

        * distance (a découper en segments pour discrétisation)

        * mouvement (0*1)

        * magnetique (à découper en segments)

        * mesure lumineuse via webcam

        * direction via gps/boussole

        * en mouvement / pas en mouvement

        * position relative dans la piece; par rapport aux coins détectés maximum

        * son (micro)

actions :

        * avancer pendant une seconde

        * reculer une seconde

        * tourner 10°

        * tourner -10 °

        * crier / manifester émotion

algorithme

a partir de l’état de capteurs discrétisés (clustering sur l’ensemble des valeurs continues des capteurs) => chaque cluster correspond a un ensemble d’états des capteurs.

* estimation si action immédiate indispensable pour survie (selon capteurs et mémoires)

* estimation de l’objectif (diminue si objectif réalisé récemment)

=> plaisir (magnétique ou recherche d’équilibre (plaisir reçu => plaisir donné et inversement (vengeance) :) )

=> curiosité (but : faire diminuer l’inconnu (fonction) : diminue avec le temps (recuit simulé)

* estimation du cout pour chaque objectif (=moyenne nb actions*cout action pour atteindre le meme objectif par le passé)// taux de satisfaction de l’objectif.

* verification si humeur particuliere (émotion qui court circuite l’objectif, en cas de batterie faible, + enclin a ne rien faire ou a faire le plus simple).

1) choix de l’objectif et du nb d’étapes pendant lesquelles cet objectif sera maintenu

2) selon humeur, détermination choix de la meilleure action pour l’objectif :

* aléatoire

* ou d’après apprentissage déja fait (parcours des règles :

etats+action => consequence), 2 modes : meilleur gain de plaisir immédiat ou graphe du plus court chemin vers plaisir réalisé (un arc = une règle apprise)

=> après action, estimation si plaisir choisi croissant ou non voire réalisation de l’objectif. mémorisation de l’amélioration ou régression associée l’état+action.

=> en cas d’échec, recommencer n fois vers le meme objectif (n diminue avec l’age; persévérance)

et en permanence (thread) : sensible au stimuli exterieurs (bouton poussoirs/son reçu fort) : le bruit est associé à une contrainte, qui ajoute du déplaisir à la dernière action/état.

apprentissage

fonction sommeil, qui synthetise les données de la journées :

* parcours des états de la journée (tuples etat capteurs/action/synthese objectif). =>

* lissage des états (regroupement),

* tentative de généralisation pour générer des règles etat+action => plaisir ou déplaisir (parcours des différents états lissés possibles en otant un état et en vérifiant si la conséquence “reste ds états”+action => meme consequence

* éventuellement moteur logique pour déduire d’autres règles de l’ensemble de règles ainsi généré.