Le constructeur chinois Xpeng vient de faire volte-face sur sa stratégie de conduite autonome. Après avoir été le premier au monde à intégrer des capteurs lidar dans ses véhicules électriques en 2020, l’entreprise mise désormais uniquement sur la vision par caméras et l’intelligence artificielle, à l’image de Tesla. Cette décision technique soulève de nombreuses questions sur l’avenir des technologies de conduite autonome dans l’industrie automobile.
Le revirement stratégique de Xpeng expliqué
Lors du salon IAA Mobility 2025 de Munich, Candice Yuan, directrice senior du centre de conduite autonome de Xpeng, a justifié ce changement radical d’approche. Selon elle, “les données lidar ne peuvent pas contribuer au système d’IA” développé par l’entreprise. Le système baptisé XNGP (Navigation Guided Pilot) s’appuie désormais exclusivement sur des vidéos courtes de 10 à 30 secondes, captées par les véhicules clients et utilisées pour entraîner les algorithmes d’apprentissage automatique.
Cette architecture repose sur ce que Xpeng appelle le modèle VLA : Vision, Language, Action. L’idée consiste à alimenter un grand modèle de langage avec des données purement visuelles, rendant incompatible l’intégration des informations lidar qui utilisent un format de données différent. Yuan précise que leur nouveau système n’a tout simplement pas été conçu pour absorber ce type d’informations tridimensionnelles.
Les arguments économiques derrière le choix technologique
Cette décision s’explique aussi par des considérations financières et pratiques. L’entraînement des systèmes d’IA avec des données lidar s’avère plus complexe et coûteux que l’approche basée sur la vision. Les capteurs lidar nécessitent un étiquetage intensif des données, une calibration précise et une intégration technique sophistiquée. Ajouter le lidar à un système conçu initialement sans cette technologie peut obliger à repenser entièrement l’architecture logicielle.
Tesla défend depuis longtemps cette philosophie économique. Elon Musk argue que les caméras et le traitement vidéo représentent une solution moins chère, plus simple et plus facilement déployable à grande échelle. Cette approche permet théoriquement de réduire les coûts de production tout en simplifiant la maintenance des véhicules sur le terrain.
La rivalité sino-américaine dans la conduite autonome
L’admiration mutuelle entre les deux constructeurs ne fait aucun doute. Xiaopeng He, PDG de Xpeng, s’est rendu dans la Silicon Valley l’année dernière pour tester le système FSD (Full Self-Driving) de Tesla, qu’il a qualifié d'”extrêmement performant”. Dans la foulée, Xpeng a publié un message taquin sur le réseau social X d’Elon Musk, demandant à “emprunter” une Tesla équipée du FSD tout en invitant le milliardaire à venir tester leur système XNGP en Chine.
Cette approche par vision pure ne se cantonne pas à Xpeng dans l’Empire du Milieu. D’autres marques chinoises comme Ji Yue, filiale du groupe Geely, développent des systèmes similaires. Lors de tests récents, ces véhicules se sont montrés relativement compétents pour gérer le chaos urbain chinois, avec ses piétons imprévisibles, ses cyclistes et ses conducteurs impatients qui respectent peu le code de la route.
Les limites actuelles de la technologie vision
Malgré les promesses, la réalité du terrain nuance l’enthousiasme. Les systèmes basés uniquement sur la vision rencontrent encore des difficultés dans les cas limites complexes, particulièrement en milieu urbain dense. Les tests du FSD de Tesla à Manhattan révèlent que le conducteur doit encore reprendre le contrôle à plusieurs reprises lors de situations imprévisibles.
À l’inverse, les robotaxis véritablement autonomes qui circulent aujourd’hui s’appuient massivement sur la technologie lidar. Waymo effectue déjà plus de 250 000 trajets entièrement autonomes par semaine dans plusieurs villes américaines, permettant aux passagers de lire, regarder Netflix ou dormir pendant le trajet. Cette performance reste inaccessible aux véhicules équipés uniquement de caméras.
Technologie
Avantages
Inconvénients
Coût
Vision + IA
Moins chère, plus simple
Limitations par mauvais temps
Faible
Lidar
Précision 3D élevée
Complexité d’intégration
Élevé
Les entreprises comme Waymo et Zoox continuent de défendre l’usage du lidar, arguant que cette technologie améliore significativement la lecture de l’environnement par mauvais éclairage ou conditions météorologiques défavorables. Ces capteurs laser offrent une cartographie tridimensionnelle précise qui complète efficacement les données visuelles, même si leur intégration demeure techniquement plus exigeante.
Le pari de Xpeng sur la vision pure reflète une philosophie industrielle différente, privilégiant la scalabilité économique à la redondance technologique. Reste à déterminer si cette approche permettra d’atteindre le niveau d’autonomie complet que promettent les constructeurs depuis une décennie, ou si elle restera cantonnée à une assistance à la conduite sophistiquée nécessitant une surveillance humaine constante.
Rédigé par François Zhang-Ming
J'ai toujours montré un vif intérêt pour les sciences et les technologies dès mon plus jeune âge. Je possède une double culture, chinoise par ma mère et française par mon père mais aussi par mes études, ce qui me permet d'être très familier avec les innovations technologiques de l'extrême orient.
Certains propriétaires de voitures électriques ont vu leurs factures d’assurance grimper de manière significative en 2025. Selon le baromètre annuel […]