Mes Projets

Apprentissage semi-supervisé pour agent, Master 1, LIP6.

Implémenter les algorithmes Q-learning et Sarsa dans le simulateur Torcs (course de voiture 3D) en langage C++ pour que l’agent apprenne à conduire à partir de récompenses (apprentissage par renforcement).

Le contrôle du véhicule est effectué de manière automatique sans avoir été développé par des humains
mais uniquement via essaie-erreur.

Un joueur humain pourra ensuite prendre le contrôle du véhicule durant un temps pour montrer à l’agent la bonne façon de conduire (intégration de feedback).

Cahier des charges   Manuel du Programmeur  Manuel de l’Utilisateur  Plan Développement


Wumpus, Master 2.

Apprentissage par renforcement, modélisation et représentation du problème, réseau de neurones pour généraliser l’apprentissage dans Sarsa afin d’augmenter les capacités d’apprentissage, Java.

L’intelligence artificielle contrôle le chasseur afin de trouver le trésor d’une carte inconnue.


Slides Rapport


Simulation marché du Travail, Master 2.

Simulation multi-agent du marché du travail en Netlogo.

IAA

Rapport


PLATFORMER AI COMPETITION – Mario, Master 2.

Java

Le but est de générer un niveau du jeu mario de manière automatique et capable de s’adapter au joueur. Par exemple si le joueur aime beaucoup ramasser les pièces, il faut en mettre assez.

Pour cela, un système à base de règle est utilisé dans lequel les paramètres numériques sont appris par renforcement pour coller au mieux au joueur.

Exemple avec de niveaux générés sur un profil expert :
C’est un humain qui contrôle mario, mais le niveau est généré par une intelligence artificielle.
Rapport


Sous-ensembles flous, Master 2.

Implémentation d’une API (Application Programming Interface) de manipulation de sous-ensembles flous pour permettre de calculer le complémentaire, l’intersection, et l’unions, et de calculer de l’image d’un sous-ensemble flou par une fonction mathématique classique, Java

tiiapiad

Rapport


Casse brique, Master 2.

Implémenter un casse brique en ActionScript 3 avec FlashDevelop. Gestion des collisions, bonus.    Rapport


Analyse de traces d’usage web et Analyse des traces COFFEE 

Nous analysons automatique de traces d’usages (fichier « log » / fichier « arff », Weka) issues de serveurs web HTTP classiques. Plus nous misons en place d’un scénario d’apprentissage collaboratif à l’aide de l’outil COFFEE-soft et nous proposons une étude automatique des traces d’usages sur le logiciel COFFEE-sofe, Java.

cpm

Slides   Rapport


Ingénierie des connaissances, Master 2.

L’objectif du projet est de développer un modèle pour la représentation des connaissances pour le diagnostic du prélèvement urinaire pathogène, CmapTools(Cartes conceptuelles), Protégé(Ontologies).

Slides   Rapport


Réseaux Sociaux, Master 2.

L’objectif du projet est d’explorer les liens entre la structure des réseaux sociaux à partir des revues des utilisateurs et leur notes des produits pour construire un graphe de similarité. Grâce à la méthode de Louvain, nous arrivons à calculer la communauté pour le graphe précédent, Java.

Slides


Résolution de problèmes et programmation par contraintes, Master 2.


Rapports :
  1. Problème de placement sur deux dimensions avec des objets rectangulaires dans une boîteJava
  2. Problème de sac à dos, Java
  3. Problème d’affectation multi-agentsJava

Compression/Décompression Huffman Dynamique, Master 1.

Compresse et décompresse un texte avec l’algorithme de Huffman dynamique en construisant un arbre de Huffman adaptatif, en langage C.

Slides  Rapport