Basé sur la traduction d'un texte en anglais
Au cours des dernières décennies, la capacité des ordinateurs et des machines à traiter et analyser différents types de données s’est progressivement améliorée. Au départ, les données étaient stockées dans des applications dédiées. Il était nécessaire de les ressaisir manuellement dans des applications industrielles afin de les rendre accessibles aux bonnes personnes. Par ailleurs, les opérateurs ne pouvaient pas s’appuyer sur des données contextualisées pour prendre leurs décisions.
L’émergence récente de l'Internet des objets (IoT), de l'intelligence artificielle (IA) et l'informatique ubiquitaire alimentent les progrès rapides accomplis par la Computer Vision (CV) et les applications innovantes qu’elle augure.
La Computer Vision permet aux machines et aux individus de voir, d'interpréter et d'interagir avec le monde physique en convertissant des données visuelles en informations numériques. Cette technique nécessite généralement des capteurs de vision ou des systèmes tels que des caméras pour extraire ces pixels du monde physique. Elle peut aussi exploiter d'autres types d'images : IRM, radars d'imagerie, projets d’architecture, fichiers CAO et autres images satellite.
Généralement, ces images sont utilisées pour « entraîner » des modèles algorithmiques d'apprentissage par le biais de réseaux neuronaux (Deep Learning), et ainsi constituer des modèles d’IA à inférence. Ces modèles pourront alors être utilisés pour voir et comprendre le monde réel.
Pour John Schavemaker, Computer Vision Lead chez PTC, l’intelligence artificielle peut être associée à la Computer Vision ("AI for CV") par le biais de deux approches distinctes : la première consiste à reconnaître "ce qui est connu". La seconde cherche à "structurer l'inconnu", en s’appuyant sur des éléments visuels. Le premier modèle algorithmique est entraîné de manière "supervisée" avec des jeux de données d’entrainement étiquetées par l’homme. Dans la seconde approche, le modèle est entraîné de manière "non supervisée", la machine "regroupe" elle-même les ensembles de données à la recherche d’une corrélation significative.
Ces techniques basées sur l'IA sont particulièrement puissantes pour traiter d’immenses quantités de données visuelles non structurées, et d’une grande complexité. Elles sont à l'origine de la prochaine génération d'applications de Computer Vision - de la conduite autonome à la détection des maladies.
Dans cet article, nous allons explorer diverses applications de la Computer Vision et analyser leur impact sur les hommes, les machines et l’espace.
Que la Computer Vision puisse surpasser les capacités visuelles humaines peut être difficile à accepter. En effet, notre perception visuelle suit les lois de Gestalt, créant une image du monde en utilisant des données incomplètes. La CV peut aider les humains à dépasser cette vision limitée et anticiper certains événements - ce qui dans certaines situations peut sauver des vies.
Chaque année, plus de 1500 personnes perdent la vie dans l’un des quelque 100 000 accidents de la route liés à la somnolence au volant. Les systèmes de Computer Vision intégrés aux caméras de bord sont de plus en plus performants et permettent de détecter la somnolence au volant en analysant les intervalles de clignement des yeux, la position de la tête, les bâillements et signes avant-coureurs. La détection de ces attitudes peut déclencher une alerte sonore qui réveillera le conducteur.
La Computer Vision est également intégrée dans les systèmes avancés d'aide à la conduite (ADAS). Ces derniers utilisent un ensemble de capteurs, de plus en plus souvent des caméras orientées vers l'extérieur et des LiDAR, pour détecter des événements dans l'environnement de conduite. En cas de collision imminente ou de freinage d’urgence, ces systèmes déclenchent des actions immédiates, sonores ou visuelles. Leur délai de réaction est de quelques fractions de seconde, soit nettement plus rapide qu’un conducteur. Plus de 20 000 décès de la route par an pourraient ainsi être évités grâce aux systèmes d'aide à la conduite.
Ces exemples illustrent la façon dont l'IA et les capteurs peuvent œuvrer de concert pour anticiper les événements avec une efficacité dont l'homme seul ne sera jamais capable, créant à terme un monde plus sûr.
Si la CV peut être intégrée à nos machines (les véhicules que nous conduisons par exemple) dans le but de détecter des comportements humains, elle peut aussi être directement superposée à notre capacité visuelle grâce à la réalité augmentée (RA).
Grâce à ses capacités de vision informatisée en 3D, la réalité augmentée offre aux travailleurs de première ligne un nouvel œil numérique dans le monde physique. La Computer Vision est un levier de création de valeur ; associée avec l’intelligence artificielle (IA), son usage contribuera à étendre le champ des possibles.
La reconnaissance des pièces détachées en temps réel est l’un des exemples d’applications de la CV par l'équipe Vuforia Innovation Runway de PTC. Dans le secteur automobile, la combinaison de la Computer Vision et de l'IA peut être utilisée pour reconnaître les pièces d’une voiture (fusible, jante, vis, etc.), et ainsi fournir des informations pertinentes sur leurs caractéristiques spécifiques ou leur disponibilité en stock.
Eva Agapaki, Senior Software Development Engineer and innovation runway project owner, explique : "Nous avons entraîné ce modèle de Computer Vision en nous basant entièrement sur des données CAO, ce qui a permis de réduire considérablement les délais de développement du modèle d'IA, lequel nécessite généralement une quantité phénoménale d'images réelles des pièces détachées. Les entreprises industrielles disposent d’abondantes données CAO qu’elles peuvent utiliser pour entraîner des modèles d'IA et de Computer Vision à reconnaître automatiquement une grande quantité de produits, de pièces de rechange, d'objets et d'images."
Dans un univers industriel particulièrement complexe, les opérateurs de première ligne font face régulièrement à de nouveaux challenges qui peuvent impacter la productivité. ll n’est pas rare qu'un technicien soit obligé de se plonger dans des manuels de formation ou de consulter les procédures opérationnelles sous format papier pour trouver les bonnes informations concernant une pièce de rechange précise parmi des milliers de références similaires.
Grâce aux technologies de Computer Vision, d’intelligence artificielle et de réalité augmentée, le technicien peut visualiser instantanément toutes les informations dont il a besoin et réduire les risques de dysfonctionnement d’un bout à l’autre du processus.
La Computer Vision a pour rôle d’étendre nos capacités visuelles, pas de les remplacer. Associée à des applications connectées, elle peut rendre notre quotidien à la fois plus sûr et plus productif.
Les machines ont longtemps fonctionné indépendamment de leur environnement physique, pilotées exclusivement par des opérateurs humains. Mais grâce à la "sensorisation", à l’IoT Industriel (IIoT), à l’intelligence artificielle (IA) et à l'informatique spatiale, la "perception environnementale" des machines s'améliore.
La Computer Vision est une faculté que ces technologies convergentes et émergentes offrent aux machines pour les aider à appréhender le monde physique et y évoluer.
Les véhicules autonomes (AV) fournissent un bon exemple d'application évoluée de Computer Vision qui révolutionne le secteur de l'automobile et la mobilité. Un véhicule autonome doit capter et interpréter des volumes considérables de données visuelles dynamiques (véhicules ou piétons) et statiques (infrastructures, arbres ou panneaux) en vue de prendre des décisions de conduite en quelques fractions de seconde.
Collecter des volumes considérables de données réelles pour apprendre aux modèles d’IA à gérer de multiples scénarios de conduite requiert des ressources monumentales, ce qui crée des goulets d'étranglement lors des essais de véhicules autonomes. Face aux problèmes soulevés par le volume de données nécessaire à l’apprentissage des véhicules autonomes et autres applications d’IA, John Schavemaker estime que "ces systèmes d'IA peuvent, dans une large mesure, être formés à partir de données synthétiques, telles que des environnements numériques simulés qui reproduisent fidèlement l’environnement physique – des routes, par exemple". C’est ainsi que des robots mobiles automatisés utilisés dans des entrepôts peuvent préparer des commandes en synchronisation avec les opérateurs.
Toutes les applications de CV ne requièrent pas un tel déploiement technologique pour générer de la valeur. Des machines sont utilisées depuis un certain temps pour inspecter et vérifier le niveau de qualité (ce que l’on appelle parfois la "Vision industrielle"), et ces applications bénéficient de façon croissante des améliorations apportées par l'IA et le Deep Learning.
En apprenant à quoi doit ressembler un produit ou un objet à un moment donné du processus de fabrication, les machines peuvent rapidement détecter et éliminer tout ce qui ressemble à un défaut. Il s'agit d'une application essentielle de la CV dans les chaînes de production à grande vitesse qui traitent d’importants volumes d’articles, et où la disponibilité et le rendement font la différence. A titre d’exemple, il suffit d’imaginer un tracteur qui récoltera uniquement les fruits ayant atteint un certain degré de maturité, ou un drone capable de détecter les cultures pourries dans une parcelle d’un champ.
En améliorant la perception qu’ont les machines de leur environnement, la CV est source de création de valeur économique et sociétale, que ce soit sur le plan de la qualité, de la productivité ou de la mobilité.
La Computer Vision commence à gagner du terrain dans un autre domaine émergent, l’informatique spatiale, où l'analyse des interactions entre les espaces, les hommes, machines ou autres objets, ouvre de nouvelles possibilités d'optimisation et d'efficacité.
Pour John Schavemaker, le concept émergent d’informatique spatiale est une approche holistique dans laquelle "l’ensemble" est optimisé en "optimisant" soigneusement les entités qui le composent et leurs interactions en tant que parties de cet "ensemble" - de simples ajustements pouvant avoir un impact significatif sur l'ensemble du système".
L’exemple du drone utilisé pour survoler une zone agricole correspond peu ou prou à ce que voit un oiseau, mais avec un niveau de qualité qui permet d’améliorer le rendement des cultures, de surveiller et gérer les pesticides, ou de suivre le bétail. L'intégration d'un système de CV dans les infrastructures de transport permet d'analyser le flux de circulation et ainsi de réduire l’empreinte carbone d'une ville. A l’aide de la Computer Vision, il est possible de déterminer le taux d'occupation des parcs de stationnement et d’automatiser le fonctionnement des bornes d’accès, augmentant ainsi les recettes municipales. Dans le secteur de la grande distribution, la CV permet d’analyser les déplacements des clients et ainsi d'optimiser l'emplacement des produits pour favoriser les ventes.
Dans l'industrie manufacturière, l’optimisation de l’efficacité de la main-d'œuvre est une priorité. Désormais, grâce à la Computer Vision, les industriels peuvent capturer les données relatives au flux de travail et, à l’aide de l’informatique spatiale, identifier les possibilités d’optimiser et de réduire les goulets d'étranglement.
Dans la vidéo ci-dessous, Jim Heppelmann, président et directeur général de PTC, explique ce cas d’utilisation de la CV, ainsi que l’impact massif de l'analytique spatiale sur la mesure des performances des opérateurs.
La CV peut également détecter des événements potentiellement dangereux dans les usines, et veiller à la sécurité des travailleurs en première ligne en générant des alarmes. Associée à l'informatique spatiale, la Computer Vision apporte une compréhension plus fine des environnements, en créant un jumeau numérique puissant de ces espaces. Les industriels seront alors en mesure d’optimiser la gestion des espaces dans lesquels collaborent les hommes et les machines.
Tous ces exemples témoignent à quel point la CV fait déjà partie de notre quotidien. Elle enrichit notre perception du monde et nous permet de mieux anticiper les événements. Dans le monde industriel, ces applications sont multiples : qu’il s’agisse d’aider un opérateur à identifier un objet ou une pièce dans une usine, d’assister un robot mobile autonome dans ses déplacements, ou d’analyser le comportement d’objets dans un espace donné.
Au fil du temps, la Computer Vision s’imposera dans l'industrie et au sein de la société. Le déploiement de cas d'utilisation probants dans le cadre d'une stratégie de transformation numérique montre la voie à suivre pour tirer pleinement parti de ces innovations technologiques.