L'Utilisation de l'IA dans la Détection de Pose aux JO 2024

Photographie de Quentin Chalopin
Quentin CHALOPIN
22 janvier, 2023
4 minutes

L'année 2024 marque une étape majeure dans l'évolution de l'intégration de l'intelligence artificielle (IA) dans le monde du sport. Aux Jeux Olympiques de 2024 qui se tiendront à Paris, l'évaluation de la gymnastique artistique sera enrichie par une technologie révolutionnaire développée par Fujitsu Limited.Cette technologie, ayant fait ses premiers pas lors des championnats du monde de gymnastique artistique à Stuttgart en 2019, repose sur la détection de pose alimentée par l'IA. Cette innovation apporte un nouveau niveau de précision et d'objectivité à la notation des performances gymniques. Au cœur de cette avancée se trouvent les capteurs 3D, qui permettent une capture détaillée des mouvements des athlètes

1. La détection de Pose 2D vs 3D

Une composante essentielle de la détection de pose est la capacité à suivre et à analyser les mouvements corporels en temps réel. Dans ce domaine, un modèle bien connu est OpenPose. Il repose sur un réseau de neurones convolutif pour détecter et localiser les articulations clés du corps dans une image 2D. Les avantages de cette approche résident dans sa rapidité et sa simplicité d'implémentation, ainsi que sa capacité à fonctionner avec une seule caméra.

Cependant, l'approche 2D présente également des inconvénients. La principale limitation réside dans l'incapacité à capturer la profondeur des mouvements. Cela signifie que des informations cruciales sur la position réelle des parties du corps dans l'espace sont omises, limitant ainsi la précision et la fidélité de la détection.

En ce qui concerne la captation de données 3D, deux approches principales se distinguent : la captation monoculaire et la captation multi-vues. La captation monoculaire repose sur une seule caméra pour détecter les mouvements en 3D. Une technologie notable dans ce domaine est MotionBERT, un modèle basé sur les transformers qui peut estimer la pose en 3D à partir d'une seule image. Cette approche présente l'avantage de la simplicité matérielle, mais peut manquer de précision dans la reconstruction 3D.

D'un autre côté, la captation multi-vues implique l'utilisation de plusieurs caméras pour capturer les mouvements sous différents angles. Bien que plus complexe à mettre en œuvre, cette approche offre des résultats plus précis en termes de reconstruction 3D, en réduisant les ambiguïtés liées à une seule perspective.

L'approche 3D présente des avantages évidents, notamment une précision accrue dans la reconstruction des poses et des mouvements des athlètes. Cela permet aux juges d' évaluer les performances et de prendre des décisions plus éclairées en matière de notation. De plus, cette technologie offre une rétroaction plus détaillée aux athlètes, contribuant ainsi à leur amélioration continue.

Cependant, cette précision accrue vient souvent au prix d'une complexité technique plus grande et de besoins matériels plus importants, en particulier dans le cas de la captation multi-vues. De plus, la détection de pose en 3D peut être plus sensible aux conditions d'éclairage et aux occlusions partielles des caméras, ce qui nécessite des solutions d'ingénierie plus sophistiquées.

2. La technologie utilisée au JO 2024

La technologie de détection de pose de Fujitsu Limited repose sur des fondements solides, combinant des capteurs 3D avancés avec des algorithmes de deep learning. Cette combinaison permet une captation précise des mouvements corporels, enregistrant chaque articulation et chaque mouvement dans une représentation tridimensionnelle. Grâce à cette approche, les juges et les entraîneurs obtiennent une compréhension approfondie de la performance, sans dépendre uniquement de l'œil humain pour interpréter les actions des athlètes.

La plateforme de détection de pose de Fujitsu va au-delà de la simple capture de mouvements. Elle intègre des fonctionnalités avancées de suivi en temps réel, permettant une visualisation dynamique et en direct des performances. Cette caractéristique en temps réel offre une rétroaction immédiate aux athlètes et aux entraîneurs, favorisant une amélioration continue et une adaptation rapide des routines.

Un aspect crucial de cette technologie réside dans sa capacité à gérer des situations complexes. Les capteurs 3D de Fujitsu sont conçus pour fonctionner dans divers environnements et conditions, garantissant une précision constante même en présence d'occlusions partielles ou de variations d'éclairage. Les modèles de deep learning intégrés sont spécialement formés pour interpréter et corriger ces éventuelles perturbations, ce qui renforce la fiabilité de la solution.

En exploitant l'intelligence artificielle, Fujitsu a également développé des fonctionnalités de modélisation et d'analyse avancées. Cette technologie permet aux juges et aux entraîneurs d'examiner les performances sous différents angles et perspectives, décomposant les mouvements en détails pour une évaluation plus approfondie. De plus, la technologie permet d'identifier les points forts et les domaines à améliorer, offrant ainsi une base solide pour le développement des athlètes.


3. Conclusion

L'intégration de l'intelligence artificielle dans la détection de pose a apporté des transformations significatives dans l'évaluation de la gymnastique artistique, comme en témoigne l'utilisation prévue de la technologie de Fujitsu Limited aux Jeux Olympiques de 2024.

Alors que l'approche 2D offre simplicité et rapidité, l'approche 3D, grâce à la captation de données en 3D, améliore considérablement la précision et la fidélité des évaluations. En offrant une évaluation objective et précise des performances gymniques, cette technologie contribue à l'équité dans la notation et à la promotion de l'excellence athlétique. L'engagement de Fujitsu envers l'innovation et l'application pratique de l'intelligence artificielle dans le sport ouvre la voie à de nouvelles possibilités pour l'avenir de la détection de pose et de l'évaluation sportive dans son ensemble.

4. Références