Contexte
Le macaque japonais (Macaca fuscata) présente des comportements culturels transmis socialement depuis plus de quatre décennies, notamment la manipulation de pierres (stone-handling) et le toilettage social (grooming). L'étude de ces comportements nécessite traditionnellement des centaines d'heures d'observation manuelle et d'annotation vidéo, un processus chronophage et coûteux pour les chercheurs.
Notre équipe a développé avec succès un premier pipeline d'analyse automatique basé sur LabGym2 (Ardoin & Sueur, 2024), un outil de deep learning permettant la détection et la classification automatique de comportements animaux sans nécessiter de GPU. Les résultats préliminaires sont prometteurs avec un détecteur de macaques atteignant 95,4% de précision (mAP@0.5).
Ce stage vise à enrichir massivement le dataset d'entraînement pour améliorer la reconnaissance automatique des comportements de toilettage et de manipulation de pierres, en vue d'une publication dans l'American Journal of Primatology.
Missions
1. Annotation comportementale intensive avec LabGym2
Détection des macaques et objets :
• Annoter des macaques japonais sur des milliers d'images issues de vidéos de Kōjima (format COCO)
• Annoter les pierres manipulées lors des comportements de stone-handling
• Utiliser Roboflow pour l'annotation et la gestion du dataset
• Participer à l'amélioration du détecteur existant (actuellement à 95,4% mAP@0.5)
Classification des comportements :
• Annoter finement les séquences de toilettage social (grooming) :
• Annoter les séquences de manipulation de pierres (stone-handling) :
Objectifs quantitatifs :
• Enrichir le dataset existant
• Créer au minimum 2000 nouvelles annotations comportementales
• Équilibrer les classes sous-représentées (transitions, comportements rares)
2. Support à l'entraînement des modèles LabGym2
Détecteur (Detector) :
• Contribuer à l'entraînement/réentraînement du détecteur de macaques
• Tester la robustesse du détecteur sur différents contextes (luminosité, arrière-plans, poses)
• Documenter les performances (mAP, IoU, matrices de confusion)
Catégoriseur (Categorizer) :
• Participer à la création des datasets d'entraînement pour le categorizer
• Extraire et labelliser des "animations" (séquences de frames) représentant chaque comportement
• Générer des "pattern images" (images de patrons de mouvement) pour la classification
3. Validation et tests sur vidéos réelles
• Tester le pipeline complet LabGym2 sur de nouvelles vidéos
• Identifier les erreurs de classification et proposer des améliorations
• Produire des statistiques comportementales automatiques
• Documenter les limites et perspectives du système
4. Documentation scientifique
• Rédiger un rapport technique détaillé avec protocoles d'annotation
• Contribuer à la préparation d'un manuscrit
• Créer du matériel supplémentaire (vidéos annotées, guides méthodologiques)
Profil Recherché
Formation :
• Étudiant(e) en License ou Mastr en éthologie, biologie comportementale, écologie, sciences cognitives, ou informatique appliquée à la biologie
Compétences requises :
Compétences biologiques :
• Connaissances en éthologie et comportement animal (primates particulièrement apprécié)
• Capacité à identifier et discriminer des comportements complexes
• Intérêt pour la culture animale et la transmission sociale
Compétences techniques :
• Rigueur et précision dans l'annotation de données
• Expérience avec des outils d'annotation d'images (Roboflow, LabelImg, CVAT, ou similaires)
• Notions de base en Python (apprécié mais non obligatoire)
• Familiarité avec les concepts de machine learning et computer vision (souhaité)
Compétences organisationnelles :
• Excellentes capacités de gestion de projet et coordination d'équipe
• Aisance relationnelle pour encadrer des volontaires bénévoles
• Autonomie et sens de l'organisation pour gérer un volume important d'annotations
Qualités personnelles :
• Patience et minutie (l'annotation est chronophage et répétitive)
• Motivation pour contribuer à un projet innovant en conservation
• Curiosité scientifique et créativité pour résoudre des problèmes méthodologiques
Conditions du Stage
• Durée : Moins de 2 mois (8 semaines maximum)
• Gratification : Non rémunéré (stage < 2 mois)
• Période : Libre
• Lieu : Institut Pluridisciplinaire Hubert Curien (IPHC), Université de Strasbourg-CNRS, Strasbourg
• Type : Stage de de License, de Master 1 obligatoire ou stage volontaire
Ressources techniques disponibles :
• Accès à Roboflow pour l'annotation collaborative
• Plateforme LabGym2 installée sur machine virtuelle CNRS (16 processeurs Intel® Xeon® Gold 6242 + NVIDIA Tesla T4 GPU)
• +65 minutes de vidéos de comportements sociaux de macaques japonais (Kōjima)
• Dataset existant de 1862 images annotées (détecteur à 95,4% mAP)
• Guides d'annotation et protocoles déjà développés
• Réseau de volontaires potentiels pour le projet citoyen
Encadrement
Équipe d'encadrement :
• Cédric Sueur – Professeur à l'Université de Strasbourg (directeur de stage)
• Julien Paulet – Doctorant à l'Université de Strasbourg (encadrant principal, premier auteur de l'article)
Collaborations scientifiques :
• Dr. Yujia Hu (créatrice de LabGym2, Georgia Institute of Technology, USA)
• Dr. Bing Ye (créateur de LabGym2, Life Sciences Institute, University of Michigan, USA)
Atouts du Stage
✅ Projet innovant : Première utilisation de LabGym2 pour l'étude comportementale des primates
✅ Impact concret : Vos annotations alimenteront directement une publication scientifique (co-signature possible)
✅ Collaboration internationale : Travail avec les créateurs de LabGym2 (USA)
✅ Science citoyenne : Expérience unique de coordination d'un projet participatif
✅ Compétences transférables : Annotation de données (compétence très recherchée en IA)
✅ Terrain virtuel : Travailler sur des données de primates sauvages étudiés depuis 60 ans à Kōjima (Japon)
✅ Accessibilité technique : LabGym2 ne nécessite pas de GPU, approche plus accessible que d'autres outils IA
✅ Culture animale : Contribution à l'étude de comportements culturels transmis socialement
Candidature
Envoyer à cedric.sueur@iphc.cnrs.fr :
Dossier de candidature :
1. CV détaillé (mentionner toute expérience en éthologie, annotation de données, ou gestion de projet)
2. Lettre de motivation expliquant :
o Votre intérêt pour l'éthologie et les comportements culturels
o Votre expérience avec l'annotation ou l'observation comportementale
o Votre motivation pour un travail minutieux et répétitif
Vous venez de réussir votre master 2 éthologie, écologie, and coe, ce blog est le vôtre! Il vous permet de retrouver différentes offres de PhD, emplois, stages, et même post doc pour les "anciens"... Outil de mise en réseau des informations, ce blog offre à chacun de la liberté de participer et ainsi permettre à tous de trouver au plus vite sa prochaine étape professionnelle. Si vous avez une offre à poster, transmettez la à : marine.grandgeorge@univ-rennes1.fr