Ce championnat japonais de voitures électriques de série a tout compris
Pendant que la Formule E prépare déjà sa quatrième génération de monoplaces sans avoir vraiment convaincu le grand public, un […]
Sommaire
Le constructeur chinois Xpeng vient de faire volte-face sur sa stratégie de conduite autonome. Après avoir été le premier au monde à intégrer des capteurs lidar dans ses véhicules électriques en 2020, l’entreprise mise désormais uniquement sur la vision par caméras et l’intelligence artificielle, à l’image de Tesla. Cette décision technique soulève de nombreuses questions sur l’avenir des technologies de conduite autonome dans l’industrie automobile.
Lors du salon IAA Mobility 2025 de Munich, Candice Yuan, directrice senior du centre de conduite autonome de Xpeng, a justifié ce changement radical d’approche. Selon elle, “les données lidar ne peuvent pas contribuer au système d’IA” développé par l’entreprise. Le système baptisé XNGP (Navigation Guided Pilot) s’appuie désormais exclusivement sur des vidéos courtes de 10 à 30 secondes, captées par les véhicules clients et utilisées pour entraîner les algorithmes d’apprentissage automatique.
Cette architecture repose sur ce que Xpeng appelle le modèle VLA : Vision, Language, Action. L’idée consiste à alimenter un grand modèle de langage avec des données purement visuelles, rendant incompatible l’intégration des informations lidar qui utilisent un format de données différent. Yuan précise que leur nouveau système n’a tout simplement pas été conçu pour absorber ce type d’informations tridimensionnelles.
Cette décision s’explique aussi par des considérations financières et pratiques. L’entraînement des systèmes d’IA avec des données lidar s’avère plus complexe et coûteux que l’approche basée sur la vision. Les capteurs lidar nécessitent un étiquetage intensif des données, une calibration précise et une intégration technique sophistiquée. Ajouter le lidar à un système conçu initialement sans cette technologie peut obliger à repenser entièrement l’architecture logicielle.
Tesla défend depuis longtemps cette philosophie économique. Elon Musk argue que les caméras et le traitement vidéo représentent une solution moins chère, plus simple et plus facilement déployable à grande échelle. Cette approche permet théoriquement de réduire les coûts de production tout en simplifiant la maintenance des véhicules sur le terrain.
L’admiration mutuelle entre les deux constructeurs ne fait aucun doute. Xiaopeng He, PDG de Xpeng, s’est rendu dans la Silicon Valley l’année dernière pour tester le système FSD (Full Self-Driving) de Tesla, qu’il a qualifié d'”extrêmement performant”. Dans la foulée, Xpeng a publié un message taquin sur le réseau social X d’Elon Musk, demandant à “emprunter” une Tesla équipée du FSD tout en invitant le milliardaire à venir tester leur système XNGP en Chine.
Cette approche par vision pure ne se cantonne pas à Xpeng dans l’Empire du Milieu. D’autres marques chinoises comme Ji Yue, filiale du groupe Geely, développent des systèmes similaires. Lors de tests récents, ces véhicules se sont montrés relativement compétents pour gérer le chaos urbain chinois, avec ses piétons imprévisibles, ses cyclistes et ses conducteurs impatients qui respectent peu le code de la route.
Malgré les promesses, la réalité du terrain nuance l’enthousiasme. Les systèmes basés uniquement sur la vision rencontrent encore des difficultés dans les cas limites complexes, particulièrement en milieu urbain dense. Les tests du FSD de Tesla à Manhattan révèlent que le conducteur doit encore reprendre le contrôle à plusieurs reprises lors de situations imprévisibles.
À l’inverse, les robotaxis véritablement autonomes qui circulent aujourd’hui s’appuient massivement sur la technologie lidar. Waymo effectue déjà plus de 250 000 trajets entièrement autonomes par semaine dans plusieurs villes américaines, permettant aux passagers de lire, regarder Netflix ou dormir pendant le trajet. Cette performance reste inaccessible aux véhicules équipés uniquement de caméras.
| Technologie | Avantages | Inconvénients | Coût |
|---|---|---|---|
| Vision + IA | Moins chère, plus simple | Limitations par mauvais temps | Faible |
| Lidar | Précision 3D élevée | Complexité d’intégration | Élevé |
Les entreprises comme Waymo et Zoox continuent de défendre l’usage du lidar, arguant que cette technologie améliore significativement la lecture de l’environnement par mauvais éclairage ou conditions météorologiques défavorables. Ces capteurs laser offrent une cartographie tridimensionnelle précise qui complète efficacement les données visuelles, même si leur intégration demeure techniquement plus exigeante.
Le pari de Xpeng sur la vision pure reflète une philosophie industrielle différente, privilégiant la scalabilité économique à la redondance technologique. Reste à déterminer si cette approche permettra d’atteindre le niveau d’autonomie complet que promettent les constructeurs depuis une décennie, ou si elle restera cantonnée à une assistance à la conduite sophistiquée nécessitant une surveillance humaine constante.
Réagissez à l'article