Parachat A'harei Mot

L'Institut Weizmann réussi à expliquer la reconnaissance visuelle de l'homme

Même si vous ne vous en rendez pas compte, votre cerveau est le plus puissant des outils. Il reconstruit automatiquement l'aspect tridimensionnel des images en deux dimensions. C'est ce qui nous permet notamment de reconnaître que des objets sont identiques, quels que soit l'angle duquel on les regarde. Cependant, pour un ordinateur, cette identification n'est pas si aisée.

En effet, notre cerveau extrapole la troisième dimension en se basant sur nos connaissances : la forme d'un cheval, d'une chaise, etc. Mais pour l'ordinateur, une image n'est pas un ensemble d'éléments distincts, mais une simple matrice de nombres.

Comment donc permettre à un ordinateur de reconnaître que deux objets sont identiques ? Le docteur Yaron Lipman de l'Institut Weizmann en Israël tente de résoudre ce problème grâce à des algorithmes de déformation, tenant compte de la variation de forme entre deux objets similaires ou entre le même objet mais avec différents angles de vue.

Ces algorithmes présentent de nombreuses applications, qui vous seront présentées dans la suite de l'article.

Application à la classification d'os et de dents

Le docteur Lipman et son équipe se sont intéressés à la classification d'os et de dents. La détermination l'espèce d'animal à laquelle appartient un certain fragment osseux n'est pas chose aisée et il est généralement nécessaire de faire appel à un paléontologue ou à un anatomiste talentueux. Les chercheurs ont proposé un algorithme basé sur la minimisation du taux de déformation des surfaces osseuses. Ils ont obtenu des résultats comparables à ceux obtenus par des experts, bien que l'ordinateur et les paléontologues utilisent des approches diamétralement opposées.

En effet, l'algorithme classifie en tenant compte de toute la surface osseuse tandis que les spécialistes utilisent des informations locales telles que la localisation et la forme des crevasses et protubérances.

Cet algorithme pourrait donc facilement permettre à des non spécialistes d'identifier facilement et sans erreur une espèce en se basant sur les os et les dents. Les chercheurs ont également montré des possibilités d'application dans le domaine de la phylogénie (étude des liens de parenté entre les différentes espèces). En effet, cet algorithme permet de calculer de manière objective la distance évolutive entre différentes structures osseuses.

Catégorisation d'images

Un autre chantier auquel s'est attelée l'équipe du docteur Lipman est la classification d'images. Ce domaine gagne en importance étant donné que, en raison notamment du développement des smartphones, une quantité de plus en plus grande d'images est disponible sur Internet, ce qui nécessite des algorithmes de classification de plus en plus performants.

L'un des problèmes classiques rencontré par ces algorithmes est le suivant : si nous nous servons d'indices locaux (tel que par exemple les yeux, la forme du visage, etc.) pour reconnaître des personnes, des animaux ou des objets, l'ordinateur attribue en général la même importance à tous les points d'une image.

Reconnaître une scène identique prise sous différents angles ou différents éclairages est donc ardu pour le programme informatique. La solution proposée par le docteur Lipman est d'introduire une limite mathématique de la déformation. En d'autres termes, un ensemble de points provenant d'une première image et un ensemble de points provenant d'une deuxième image peuvent être associés seulement s'ils se trouvent en-deçà de cette limite.

Création d'animations numériques
Un autre objectif des travaux du docteur Lipman est la modélisation tridimensionnelle de la déformation d'objets. Une telle recherche trouve bien évidemment des applications dans la création d'animations numériques, où le calcul de déformations en temps réel est un challenge constant, mais peut également être utilisé pour la représentation du comportement de différents matériaux et objets en physique et en ingénierie.

Pour parvenir à une telle modélisation, les auteurs représentent la surface de l'objet par un maillage de tétraèdres [2]. Une telle simplification permet de représenter le mouvement d'un objet, d'un animal ou d'une personne en termes de déformation de différents éléments tétraédriques.

Chaque tétraèdre ne peut subir qu'une déformation limitée ce qui permet de tenir compte des propriétés physiques de la matière. L'algorithme converge très rapidement, en seulement quelques itérations, une propriété essentielle pour la création d'animations numériques.


Conclusion

Les travaux menés par le laboratoire du docteur Lipman sur la modélisation d'objets trouvent de nombreuses applications, que ce soit pour la classification d'images et d'objets ou pour la création d'animations numériques.

De telles avancées sont représentatives de l'excellence de la recherche israélienne dans ce domaine, dont de nombreux laboratoires jouissent d'une renommée internationale.

Sources: bulletins-electroniques

Nous soutenir

Les H'agim - La Hagada
Les H'agim - La Hagada
28.00 € ~140 ₪