Comment l’IA se généralise dans l’industrie de l’infrastructure.

Comment l’IA se généralise dans l’industrie de l’infrastructure.

Traduction d’un article de Chintana Herrin publié le 3 juillet 2018. L’article original peut-être consulté ici.

Ce maillage de réalité 3D d'un parc d'activités permet la classification d'objets de type "arbre".

Ce maillage de la réalité en 3D d’un parc d’activités permet la classification d’objets de type “arbre”.

Pendant des années, les humains ont mieux reconnu les images que les ordinateurs. Notre taux d’erreur a été stable à 5% alors que les algorithmes informatiques étaient à 30%. Cependant, avec la montée de la vision par ordinateur et du deep learning, l’écart entre les humains et les ordinateurs s’est lentement réduit. Au cours des deux dernières années, les chercheurs ont vu des algorithmes informatiques montrer un taux d’erreur de moins de 5%, dépassant les humains. Ces progrès apportent un potentiel important à de nombreuses industries différentes.

Dans le secteur des infrastructures, les utilisateurs ont appliqué la modélisation de la réalité dans d’innombrables projets pour améliorer tous les flux de travail. Un modèle 3D peut fournir un contexte numérique réel avec les informations dont les parties prenantes ont besoin pour concevoir, construire et exploiter des actifs, contribuant ainsi à améliorer la prise de décision. Cependant, il existe encore des façons de maximiser la valeur de la modélisation de la réalité.

Au cours des cinq dernières années, l’IA (ou Intelligence Artificielle) est devenue dominante. Cela ne concerne plus seulement l’industrie de la technologie. Elle s’est adaptée et s’applique pour augmenter la valeur dans tous les secteurs, tels que le service à la clientèle, l’intelligence d’affaires, le marketing et les ventes, et même le service juridique. L’industrie de l’infrastructure doit suivre.

Classification d'objets d'arbres dans un maillage de réalité 3D d'une chaussée.

Classification d’objets d’arbres dans un maillage de réalité 3D d’une chaussée.

Comprendre le langage

Avant de pouvoir parler des avantages de la modélisation de la réalité, nous devons nous entendre sur quelques termes. Souvent, les gens confondent l’IA, l’apprentissage automatique (machine learning) et l’apprentissage approfondi (deep learning). Les termes peuvent être interconnectés, mais ils ont des significations très différentes.

« L’intelligence artificielle n’est que la terminologie générique pour faire quelque chose d’intelligent avec l’ordinateur », explique Renaud Keriven de Bentley, ingénieur en développement de logiciels des produits de modélisation de la réalité. « Chaque fois qu’un ordinateur fait une sorte de raisonnement, c’est de l’IA. »

Keriven explique que l’IA ne se contente pas de calculer les résultats ou de traiter les données, mais elle fait aussi en sorte que l’ordinateur raisonne avec les données. Par exemple, programmer un ordinateur pour parler n’est pas une IA. Cependant, si vous deviez programmer l’ordinateur pour qu’il donne une parole et comprenne sa signification, ce processus serait de l’AI.

Zheng Wu, ingénieur chez Bentley, définit l’IA comme un vaste sujet d’informatique: « L’IA elle-même contient de nombreux sujets, notamment l’optimisation, les systèmes experts, la robotique, le traitement du langage, la vision par ordinateur et l’apprentissage automatique ».

L’apprentissage automatique, un autre terme important, relève de l’IA. L’apprentissage automatique est le processus consistant à ce qu’un ordinateur apprenne par lui-même. « Une fois que l’ordinateur est programmé, explique Keriven, il est capable d’apprentissage automatique. Il suffit de lui montrer quelques exemples – par exemple, des images d’arbres et de voitures – et d’apprendre par lui-même la différence entre les arbres et les voitures. »Si vous avez un smartphone, il est probable que vous avez déjà vu la technologie d’apprentissage automatique. La plupart des caméras de smartphone peuvent identifier les visages et se concentrer sur eux.

L’apprentissage approfondi (deep learning), un sous-domaine de l’apprentissage automatique, est un autre pas en avant. Avec cette technologie, les chercheurs tentent d’imiter le cerveau humain en ajoutant plusieurs couches de neurones artificiels. « C’est cette idée des années 70 où les gens ont essayé de modéliser et de programmer les neurones, puis de relier les neurones et de les laisser évoluer naturellement pour apprendre quelque chose », explique Keriven. Malheureusement, la technologie était trop lente à l’époque et cela n’a pas fonctionné.

Cependant, au cours des dernières années, l’apprentissage approfondi a connu de grands progrès. « Vers 2006, il y a eu une percée dans la façon dont les neuro-réseaux peuvent être entraînés là où il y a plus de couches que dans les neuro-réseaux artificiels classiques », explique Wu. « Les chercheurs des universités peuvent former de très grands modèles de neuro-réseaux d’apprentissage approfondi pour faire toutes sortes de choses : reconnaissance d’image et de fonction, détection d’objets, traitement de langage, et bien plus encore. »

Enseigner aux ordinateurs à « voir »

La machine et l’apprentissage approfondi permettent à la vision par ordinateur et à la reconnaissance d’image d’identifier les problèmes sur des projets ou des équipements individuels avant qu’ils ne surviennent. La vision par ordinateur est un large sujet, avec la reconnaissance de l’image comme sous-domaine. Elle permet à la machine de détecter des types spécifiques d’objets. Le but est d’apprendre à l’ordinateur à voir comme les humains.

« Pour apprendre à un ordinateur à voir des choses, nous devons utiliser un modèle sémantique, un algorithme mathématique, pour détecter les caractéristiques et suivre ces caractéristiques. C’est la partie difficile. », dit Wu. Il ajoute qu’au cours de la dernière décennie, en particulier au cours des dernières années, il y a eu de grands progrès dans le développement de ces algorithmes de reconnaissance de caractéristiques. La raison est le nombre d’avancées faites dans l’apprentissage approfondi.

« Le deep learning (apprentissage approfondi) et la vision par ordinateur sont étroitement liés », explique-t-il. « Vous pouvez dire que l’apprentissage en profondeur fait partie de la vision par ordinateur ou que la vision par ordinateur utilise des techniques d’apprentissage approfondi pour enseigner à la machine. » Lui et ses collègues appliquent des techniques de vision par ordinateur classiques combinées avec du deep learning afin d’améliorer l’efficacité et le rendement pour en surmonter les défis.

Lorsque vous apprenez à un ordinateur à voir comme un humain, la reconnaissance d’image est la clé. C’est le processus d’identification et de détection d’un objet ou d’une caractéristique dans une image numérique ou une vidéo. Il y a trois étapes: la classification, la détection et la segmentation.

La classification consiste à demander à l’ordinateur d’identifier une seule catégorie dans une image. Keriven explique: « Vous classifiez votre maillage ou votre modèle 3D entre différentes catégories. Vous demandez à l’ordinateur : Est-ce un arbre? Est-ce une voiture? Est-ce un humain? » Wu explique également que la classification ne doit s’appliquer seulement aux images. « L’apprentissage approfondi et la vision par ordinateur peuvent également s’appliquer aux données de nuage de points. »

La détection est un peu plus ciblée. Cette fois, il y a une image et vous voulez que l’ordinateur détecte où se trouvent les objets dans l’image. « C’est comme si vous dessiniez des boîtes dans votre image, donc chaque boîte est autour d’un objet. Vous faites la même chose en 3D quand vous avez un maillage de la réalité », explique Keriven.

La segmentation est un pas de plus, explique Keriven. « Segmenter, c’est comme dessiner la forme exacte de l’objet, en 2D ou en 3D. Par exemple, lors de l’identification de tours de télécommunication et d’antennes, la détection est suffisante. Nous voulons juste savoir et trouver des boîtes dans notre maillage de réalité 3D pour déterminer où sont les antennes. La segmentation pourrait être utile si vous voulez détecter le sol dans un maillage ou dans une image. Vous identifiez les parties de votre maillage qui sont potentiellement le sol. Pour chaque partie du maillage, vous dites: ‘C’est le sol’ ou ‘Ce n’est pas le sol’ ».

Récemment, Bentley a utilisé ce type de vision par ordinateur pour détecter les défauts dans le béton. De nombreuses organisations utilisent la technologie pour identifier les fissures, y compris leur forme et leur profondeur.

Un maillage de réalité 3D d'un mur de briques intérieur.

Un maillage de réalité 3D d’un mur de briques intérieur.

Détection automatique des fissures dans le mur.

Détection automatique des fissures dans le mur.

« Pour mettre cela en perspective », dit Wu, « si nous essayons de détecter une fissure dans une image, nous pouvons détecter les fissures avec une boîte englobante. Vous pouvez voir ce qui est détecté dans la zone de délimitation. Cela ne vous dit pas exactement à quoi ressemble cette fissure ou ce défaut. Les chercheurs n’ont pas d’informations sur la forme ou la largeur de cette fissure. Maintenant, avec un maillage de réalité 3D, nous allons non seulement détecter cette fissure avec une boîte de délimitation, nous allons segmenter cette fissure, ce défaut, dans sa forme exacte, sa taille et son échelle. »

Wu et son équipe peuvent construire un modèle 3D en utilisant des images avec les fissures détectées et exécuter des statistiques pour déterminer sa longueur, sa largeur et d’autres informations critiques pour les ingénieurs.

L'analyse des données de détection automatique de fissures.

L’analyse des données de détection automatique de fissures.

Visualiser les avantages

Une caractéristique intéressante de la reconnaissance d’image est la capacité à former un réseau de neurones artificiels multicouches avec des milliers d’images pour reconnaître un objet. Une fois le modèle formé, il peut être utilisé pour reconnaître des objets similaires dans de nouvelles images.

Avec cette fonctionnalité, les chercheurs peuvent construire des modèles 3D schématiques. Ce modèle serait classé afin que les ingénieurs connaissent les détails de ce qu’ils voient dans le modèle tout en conservant la couleur et la texture de haute qualité d’un modèle 3D régulier. Cette fonctionnalité est extrêmement utile pour les inspections d’infrastructure.

Récemment, Wu et son équipe ont mené deux projets présentant ce type de modèle. Le premier était au siège social de Bentley Systems à Exton, en Pennsylvanie. L’équipe a collecté un ensemble de données de leur campus d’Exton.

« Nous avons analysé les données et classé les caractéristiques dans l’image pour séparer le pavement des autres caractéristiques. Nous pouvons classer les arbres, la végétation, les bâtiments. Nous espérons donc que cette classification nous aidera à construire un maillage sémantique 3D classifié. »

Un autre projet similaire a été réalisé avec CH2M Fairhurst en Europe. Leur équipe a fourni à Wu un jeu de données pour classer les arbres des deux côtés de la route en vue d’une amélioration de la route. « CH2M avait besoin d’un modèle 3D sans arbres des deux côtés des routes pour générer une nouvelle conception de route », explique Wu. « Pour enlever les arbres, vous devez d’abord savoir où sont les arbres, puis les classer. » Normalement, le processus serait d’aller dans le programme et d’enlever manuellement tous les arbres. Ce processus fastidieux a été éliminé en utilisant la modélisation de la réalité.

Détection automatique d'antennes de tour de télécommunication dans un maillage de réalité 3D, généré à partir d'images prises à partir d'un drone.

Détection automatique d’antennes de tour de télécommunication dans un maillage de réalité 3D, généré à partir d’images prises à partir d’un drone.

Des possibilités infinies

Wu et Keriven croient tous deux que l’industrie de l’infrastructure peut appliquer la vision par ordinateur ou l’IA en général pour que l’industrie continue d’aller de l’avant. Un endroit où ils voient des progrès est dans ContextCapture de Bentley et la capacité de l’application à classer les images dans les maillages de la réalité.

« Avec ContextCapture , nous utiliserons bientôt des neuro-réseaux qui ont déjà appris beaucoup de choses à partir de nombreuses images différentes », explique Keriven. « Nous pouvons utiliser ce ‘cerveau’ et lui apprendre comment détecter des objets qu’il n’a jamais vus auparavant. Si les utilisateurs veulent détecter leur propre objet, nous serons en mesure de fournir un moyen de sélectionner cet objet dans leurs images afin que ContextCapture apprenne ces objets et les détecte mathématiquement dans le futur. » L’équipe espère avoir une version bêta de cette nouvelle capacité bientôt.

Une autre façon dont l’IA peut aider l’industrie est de l’utiliser pour faire progresser les applications de modélisation de la réalité elles-mêmes. Keriven croit que l’IA peut aider à améliorer ContextCapture, aussi bien au niveau de la technologie que de l’expérience de l’utilisateur.

« Si vous comprenez le type d’objet auquel vous faites face, vous pourrez bien sûr obtenir de meilleurs maillages et modèles 3D. Si vous savez que vous êtes en train de reconstruire une route, un bâtiment, une tour de communication ou autre chose, vous pouvez adapter ce que vous faites pour trouver une meilleure route, un meilleur bâtiment,.. Vous pouvez mettre l’IA partout. »

Des progrès sont également réalisés dans la façon dont cette technologie peut être utilisée pour maximiser la valeur de la modélisation de la réalité et améliorer la productivité. En créant des modèles 3D, les utilisateurs auront une meilleure visibilité sur les progrès et les objectifs finaux de leur projet.

« Je suis confiant que nous sommes en bonne position pour réaliser un modèle sémantique 3D avec notre recherche et notre équipe de produit », explique Wu. « Nous espérons que, dans un très proche avenir, nous allons permettre à nos utilisateurs de classer toutes leurs données visuelles. Ils peuvent construire les modèles 3D sémantiques et avoir les modèles 3D non seulement pour la visualisation, mais aussi pour l’ingénierie, la conception, la maintenance et l’inspection des infrastructures. »

L’utilisation d’applications de modélisation de la réalité pour créer les modèles accélérera le processus de conception tout en informant les divers acteurs des changements. Mais, pour aller de l’avant, Wu espère mener plus de recherches sur la détection de différents défauts dans les infrastructures. Actuellement, lui et son équipe travaillent avec trois organisations en Asie du Sud-Est pour détecter divers équipements, notamment des voies ferrées de transport en commun rapide, des grues dans les principaux ports et des tunnels souterrains.

« Si nous prenons ces trois exemples, vous pouvez imaginer qu’il y a beaucoup d’autres possibilités – dans les infrastructures et les environnements bâtis – où nous pouvons appliquer ces techniques et les développer », dit-il.

La modélisation de la réalité à l’aide de l’IA peut être appliquée à de nombreux domaines différents de l’industrie de l’infrastructure et aider à toutes les étapes du cycle de vie d’un actif. À mesure que la technologie progresse, il devient clair qu’il n’y aura pas de limite à ce que la modélisation de la réalité peut faire.