Une bonne représentation des données est une composante essentielle du succès d'un algorithme d'aprentissage automatique. Lorsque la représentation est apprise, son apprentissage est classiquement réalisé sur les données complètes, c'est à dire totalement observées. Or dans certaines situations on ne découvre les données que progressivement et on aimerait pouvoir prendre des décisions avant de connaitre la donnée complète, ce qui signifie d'être capable de construire une représentation de la donnée à la volée. C'est le cas par exemple de tâches de personnalisation où l'information sur un utilisateur n'est connue qu'au fur et à mesure de son interaction avec le système. Cet article s'intéresse à ce cadre et décrit une stratégie d'apprentissage de représentation qui permet (i) de sélectionner au fur et à mesure l'information qui serait la plus pertinente pour construire une représentation de la donnée, (ii) de mettre à jour la représentation de la donnée au fur et à mesure de la collecte d'informations sur celle-ci. Nous appliquons notre approche à la conception d'interviews statiques pour le problème de démarrage à froid en filtrage collaboratif mais notre point de vue est générique. Notre appproche peut en particulier permettre de concevoir des méthodes qui dépassent le cadre du démarrage à froid et s'adaptent au cadre plus classique du filtrage collaboratif au fur et à mesure que les données d'un utilisateur sont disponibles.
- Autre