Mi-juin, alors que le salon Vivatech réunissait à Paris le gratin de la deeptech avec un fort accent mis sur l’intelligence artificielle (IA), le congrès Computer Vision and Pattern Recognition (« vision par ordinateur et reconnaissance des formes », CVPR) réunissait à Nashville (Tennessee) plus de 7 000 universitaires et industriels spécialistes de la vision artificielle (VA), c’est-à-dire l’analyse automatique d’images et de vidéos par un ordinateur, domaine différent de l’infographie qui s’intéresse à la synthèse d’images.

La VA est depuis l’origine un des piliers de l’IA : point d’interaction avec le monde réel sans le « voir », point de robot, humanoïde, drone, voiture autonome, sans perception de l’environnement. Sa naissance est en général associée à la thèse de Larry Roberts en 1963, consacrée à l’identification de formes très simples (des parallélépipèdes et des prismes) dans des images et à l’estimation de leur position et de leur orientation dans l’espace. C’est historiquement le premier exemple d’un système de reconnaissance visuelle. Ce qui peut se décliner de différentes manières, par exemple pour décider si une photo montre un chat ou un chien ou si une personne entreprend une action particulière dans une vidéo.

La reconnaissance est un des deux axes majeurs du domaine – l’autre étant la reconstruction en trois dimensions d’une scène à partir de plusieurs images en deux dimensions (comme le font les deux yeux devant la projection d’un film 3D) – qui servent à des applications de réalité augmentée ou encore pour permettre à un robot en mouvement d’éviter des obstacles. De nombreux autres problèmes peuvent aussi être appréhendés par la VA – de l’analyse des couleurs et des textures à la restauration d’images – et ses applications vont de l’inspection industrielle à l’imagerie médicale et à l’astrophysique.

Précision et fiabilité

Il vous reste 52.26% de cet article à lire. La suite est réservée aux abonnés.

Share.
Exit mobile version