Document sans-titre

7. Conclusion

Dans ce rapport, nous avons présenté une approche de la stéréovision qui diffère sensiblement des méthodes généralement mises en oeuvre.

Les points forts de notre approche sont le fait de pouvoir mettre en correspondance deux images stéréoscopiques sans avoir à connaître ni les paramètres des appareils de prise de vue, ni leur positionnement relatif. La connaissance de quatre points de l'espace permet une approximation de l'ensemble des points homologues de l'image dans le cas de projection parallèle, et la connaissance de cinq point permet de faire le calcul dans le cas de projection centrale. Cependant l'instabilité du calcul des épipôles limite l'application de notre technique. Une amélioration de l'approximation des épipôles est donc le premier objectif à atteindre pour améliorer la qualité des calculs des points dans l'espace.

Les principales contraintes de notre méthode sont que les contours homologues doivent avoir approximativement la même taille et que les contours rectilignes ou fermés ne peuvent pas participer au choix des amers. Sur le plan du calcul des points dans l'espace, les résultats sont exploitables mais manquent encore de précision. Ceci est dû principalement aux déformations des plans images qui induisent des erreur dans le calcul du modèle géométrique associé au couple stéréoscopique.

Les perspectives de notre travail sont pour la mise en correspondance l'élaboration d'un critère pouvant s'appliquer à des contours rectilignes ou fermés, ce qui ouvrira notre technique à des images plus complexes à traiter. Pour le calcul des points dans l'espace, une amélioration de la robustesse des algorithmes d'évaluation des épipôles ouvre des perspectives très intéressantes pour la suite de ce travail. Le problème de la stéréovision peut être résolu dans l'espace projectif, le passage à l'espace cartésien se faisant par un simple changement de repère. Les erreurs dues aux approximations des point de référence dans l'espace sont donc reportées à la fin des calculs et n'influent pas sur la chaîne de traitement.

L'expérimentation de notre méthode est encore limitée mais les premiers résultats sont encourageants. Le découplage des phases du traitement des images permet de caractériser les points faibles de nos algorithmes et d'évaluer les améliorations obtenues sur les résultats intermédiaires (épipôles en 2D, centres optiques en 3D).

La modélisation est la prochaine étape de ce travail, cela suppose de transférer la connaissance du relief d'un scène à une scène voisine par l'intermédiaire d'une image commune comme pivot. Le problème sera alors de fermer le modèle en prenant en compte la dérive entre la première scène et la dernière. Cela suppose une correction globale du modèle en s'appuyant sur les points caractéristiques de chaque scène.

La vision en relief est très coûteuse en calculs, mais des cartes spécialisées réalisent déjà certaines parties du traitement à la cadence vidéo (ex: extraction de contours). L'implémentation de nos algorithmes sur des cartes images spécialisées améliorera grandement les performances en terme de temps de réponse. D'autre part, comme le montre le synoptique de la présentation des étapes de la méthode, les étapes du traitement des images peuvent être parallélisées très facilement ce qui laisse entrevoir d'importants gains de temps en implémentant notre chaîne traitement sur un multiprocesseur.

Le développement d'une chaîne complète de stéréovision par ordinateur pose d'énormes problèmes d'algorithmique, de gestion mémoire et de puissance de calcul. Ce travail n'a pas la prétention de résoudre tous les problèmes posés par la stéréovision, mais d'être le squelette d'un développement ultérieur demandant encore beaucoup de travail avant d'être pleinement exploitable.

8. Bibliographie

[ALIR85] Alireza, Zolghadrasli, (1985).
Correction et traitement d'images des circuits VLSI issues d'un microscope électronique à balayage.
Thèse de l'institut polytechnique de Grenoble.

[AYAC89] Ayache , Nicholas, (1989).
Vision stéréoscopique et perception multisensorielle.Inter éditions science informatique.

[BALL82] Ballard, Dana H. , Brown Christopher M. (1982).Computer vision.
Prentice Hall Inc, Englewood Cliffs New Jersey.

[BENA83] Benard, Michel. (1983). Restitution automatique en stéréophotogrammétrie.
Thèse ENST Département ISSV laboratoire Image.

[BONN90] Bonnin, B. Zavidovique. (1990).
Segmentation coopérative mixte région/contour spécifique à la reconstruction 3D de scènes.

[BORG88] Borgefors, Gunilla. (1988).Hierarchical chamfer matching: a parametric edge matching algorithm.
IEEE transactions on patterns analysis and machine intelligence vol 10 n°6 November.

[CANN86] Canny, John. (1986)
A computational approach to edge detection IEEE transactions on pattern analysis and intelligence
vol PAMI-8 NO 6 november 1986

[CARM91] Carmona-Moreno, César. (1991).
Etude de la stéréovision axiale, modélisation mathématique et résolution algorithmique.
Thèse Inst. National Polytechnique Toulouse.

[CARR71] Carré, Jean. (1971 ).Lecture et exploitation des photographies aériennes.
Editions EYROLLES Paris (2 volumes).

[CHAU89] Chaumette François (1989)
Réalisation et calibration d'un système expérimental de vision composé d'une caméra mobile embarquée sur un robot manipulateur.Rapport de recherche INRIA Rennes n°994 Mars 1989

[DERI87] Deriche, Rachid. (1987)
Using Canny'S criteria to derive recursively implemented optimal edge detector
International journal of computer vision 167-187 Kluwer Academic Publishers Boston

[DER'87] Deriche, Rachid. (1987)
Détection optimale de contours avec une mise en oeuvre récursive
Onzième colloque GRETSI Nice du 1 au 5 juin 1987

[DUDA70] Duda, Richard.O. HART, Peter E. (1970) Pattern classification and scene analysis
Artificial intelligence group Stanford research institute Menlo Park California December 1970

[EFIM81] Efimov. (1981).Géométrie supérieure.
Traduction française, éditions Mir Moscou.

[FAUG92] Faugeras, Olivier. (1992).
What can be seen in three dimensions with an uncalibrated stereo rig ?
Computer vision ECCV '92 Lecture notes in computer science 588. Springer Verlag

[FREEMA] Freeman, H.Analysis of line drawings.
Rensselaer Polytechnics Intitute Try, New York (USA).

[GOUY61] Gouyon. (1961).Précis de mathématiques spéciales.Librairie Vuibert Paris.

[GUIC07] Guichard. (1907).Compléments de géométrie.Vuibert et Nony éditeurs Paris.

[HURA60] Général Hurault, L. (1960).
L'examen stéréoscopique des photographies aériennes. Imprimerie de l'IGN Paris.

[HWAN80] Hwang, Juin-Jet. (1980)
Computer stereo vision for 3D object location Phd University of Tennessee, Knoxville August 1980

[KASS88] Kass, Michael., Witkin, Andrew., Terzopoulos, Demetri. (1988).
Snakes: active contour models. Schlumberger Palo Alto Research.

[LONG81] Longuet - Higgins,H.C., (1981).
A computer algorithm for reconstructing a scene from two projections Nature Vol. 293, 10 september 1981

[LUX_84] Lux. (1984).
Prédiction-vérification: une technique d'intelligence artificielle pour la vision par ordinateur.
RR n° 399 (IMAG) Avril 1984, RR LIFIA 5.

[MICL84] Miclet. (1984).Méthodes structurelles pour la reconnaissance des formes.
CNET ENST editions Eyrolles Paris.

[MICR85] Association nationale de la recherche technique. (1985 ).
Pratique du microscope électronique à balayage
Paris Groupement 8. Microanalyse et microscopie électronique à balayage.

[MILL91] Million, Claude. (1991).
La géométrie de la perspective centrale en photogrammétrie analytique. La transformation directe.
Revue ESGT N° 121 Juin 1991

[MOHR92] Mohr, Roger., Morin, Luce. (1992). Geometric solutions to some 3D vision problems.
LIFIA - IMAG Grenoble.

[MOHR93] Mohr, Roger. (1993) Projective geometry and computer vision
Handbook of Pattern Recognition and Computer Vision World Scientific Publishing Company

[MORI93] Morin, Luce. (1993)
Quelques contributions des invariants projectifs à la vision par ordinateur.
Thèse en informatique Institut National de Polytechnique de Grenoble

[PAPE07] Papelier, G. (1907).Précis de géométrie analytique.Vuibert et Nony éditeurs Paris.

[ROGE85] Rogers, David F.J., Adams, Alan. (1985).
Mathematical elements for computer graphics.Mc Graw Hill publishing company.

[SHEN91] Shen, Jun. Castan, Serge (1991)
An optimal linear operator for step edge detection
CVGIP graphical models and image processing vol. 54 No 2 march, pp.112-133 1992

[SHI_88] Shi, Jie. (1988)
Système stéréoscopique de localisation et de poursuite automatique d'objets mobiles en trois dimensions.
Thèse présentée à l'INSA Rennes en juillet 1988

[SHIR87] Shirai, Yoshiaki. (1987) Three dimensional computer vision Springer Verlag

[TOSC87] Toscani, Giorgio. (1987).
Systèmes de calibration et perception du mouvement en vision artificielle.
Thèse de l'Université de Paris Sud 15 Décembre 1987.

[VINE91] Vinet, Laurent. (1991).
Segmentation et mise en correspondance de régions de paires d'images stéréoscopiques
Thèse de l'université de Paris IX Dauphine 2 Juillet 1991

Stéréovision par ordinateur, géométrie et expérimentation

Résumé

La stéréovision par ordinateur pose deux problèmes fondamentaux fortement liés: l'identification des points homologues et la calibration du système de prise de vue. Cette étude propose une méthode de découplage de ces deux problèmes par la division de la calibration en deux étapes entre lesquelles s'insère la mise en correspondance.

La méthode de calibration proposée s'appuie sur la géométrie épipolaire, d'abord en deux dimensions en tirant parti des relations homographiques entre faisceaux de droites épipolaires homologues, puis en trois dimensions, après le calcul des épipôles et en s'appuyant sur la connaissance de cinq points non coplanaires dans l'espace.

La mise en correspondance consiste tout d'abord à extraire des points homologues sur les contours des objets suivant un critère de ressemblance de forme et la contrainte épipolaire, puis à généraliser la mise en correspondance point à point des deux images en mettant en relation les droites épipolaires homologues. Ces deux étapes font largement appel aux techniques de programmation dynamique.

Après une étude géométrique et une résolution théorique du problème de la stéréovision, nous présentons une expérimentation de mise en correspondance et de calcul de points dans l'espace sur des images réelles.

Les premiers résultats permettent d'envisager l'automatisation de la stéréovision et le calcul de la position des points dans un espace projectif sans connaissance préalable de points de référence. Ceci évite la propagation des erreurs dues aux incertitudes sur la position de ces points dans l'espace. Leur utilisation est reportée à la fin de la chaîne de traitement et consiste en un simple passage d'un espace projectif à l'espace cartésien.

Mots clefs: stéréovision, géométrie épipolaire, mise en correspondance

Computer stereovision, geometry and experimentation

Abstract

Computer stereovision has to solve two fundamental problems which are stongly related: matching of homologous points and calibration of the vision system. This study presents a method of separating these two problems. The calibration is divided into two steps and the image matching can be realized between these steps.

The calibration process is based on the properties of epipolar geometry, first two dimensional thanks to the relations between homologous pencils of lines, then three dimensional after calculating the epipolar centers and with the knowledge of five non coplanar points in the space.

The matching procedure is aimed first at extracting homologous points on object edges with a form similarity criterion and the epipolar constraint. Then the full matching of the two images is made along the homologous epipolar lines. These two steps of the image matching are done with the use of dynamic programming.

After a study of the geometry and a theoretical solution of the stereovision problem, we present an experimentation of image matching and 3D calculation from real images.

The first results enable to envisage the complete automation of stereovision and the calculation of points in a projective space without any preliminary knowledge of reference points. This avoids the propagation of errors due to approximations on the position of these points in the space. The use of the reference points is postponed at the end of the calculation and consists of a simple change from the projective space to the cartesian space.

Keywords: stereovision, epipolar geometry, image matching

Retour sommaire