|
ALLIEZ pierre : Etude de la représentation géométrique et texturelle
de scènes 3D pour les services de visualisation dans
un contexte télécommunicantThèse ou HDR soutenue le 07/07/2000 à ENST - salle B312 a 14h00, 46Contact : schmitt@tsi.enst.frManuscrit : http://www.tsi.enst.fr/publications/Schmitt/these_pierre_alliez.ps.gz (apre| Jury | Président
Didier ARQUES
Rapporteurs
Houman BOROUCHAKI
Rémy PROST
Examinateurs
Nathalie LAURENT
Francis LAZARUS
Fabrice NEYRET
Directeur
Francis SCHMITT | | Direction | Francis Schmitt | | Laboratoire | Laboratoire de recherche de France Télécom R&D DIH | | Résumé | La réalité virtuelle représente aujourd'hui une technologie
à part entière puisqu'elle autorise la simulation,
la navigation et l'interaction avec un univers sensoriel
synthétisé de toutes pièces. Les potentialités offertes
par la réalité virtuelle ont été très bien perçues
lorsque les ordinateurs graphiques ont été capables
d'assurer un rendu des images à une cadence interactive.
De plus, l'augmentation des capacités des machines
coïncide aujourd'hui avec un développement vertigineux
des réseaux, ce qui décuple littéralement le champ
d'application de la réalité virtuelle. Plusieurs
difficultés subsistent toutefois pour développer les
services de télécommunications associés : le volume
des données est considérable, l'affichage est coûteux
en calculs et la nature des données nécessite une prise
en compte spécifique dans le contexte client-serveur.
Si l'on ajoute à cela l'inégalité des capacités des
terminaux et la variabilité des réseaux, on obtient
une synthèse du triple challenge de la thèse : le
stockage, la transmission et la visualisation de
scènes 3D complexes. On pourrait aussi résumer
la problématique en endossant le temps d'une phrase,
le rôle d'un opérateur de télécommunication : "quels
que soient : le terminal, le volume de données à
transmettre et le débit du réseau, l'utilisateur
doit pouvoir visualiser à tout moment une image
attractive".
Ce mémoire relève le défi sous la forme de briques
technologiques susceptibles de s'assembler pour
composer un moteur de transmission et d'affichage
de scènes 3D en réseau. Il propose des solutions
correspondant à un schéma courant en codage de
l'information audiovisuelle : simplification,
approximation, et codage échelonnable. Il reste
cependant une spécificité propre à la 3D : la
visualisation. En effet, il est d'une part plus
coûteux de projeter un polygone à l'écran plutôt
que d'afficher un pixel, et d'autre part le point
de vue hautement variable d'une caméra influence
sensiblement la pertinence des données transmises.
Le premier chapitre, introductif, fournit une
compréhension naturelle de la problématique et
les trois autres suivent logiquement l'ordre des
opérations appliquées sur les scènes 3D : la
simplification et l'approximation, le codage et la
visualisation. Plus précisément, les maillages
composant les objets d'une scène sont simplifiés
par fusion d'arête et approximés par minimisation de
volume. Ils sont ensuite encodés par une technique
de conquête sur les arêtes exploitant les valences
des sommets. L'échelonnabilité est, quant à elle,
obtenue sur les positions par une technique apparentée
aux plans binaires de raffinement. Le codage des
textures est adressé par intégration d'une technique
développée au sein du laboratoire, cette dernière
combinant la transformée en cosinus discrète et
les éléments finis sur une hiérarchie de maillages
triangulaires. Sur le terminal, la visualisation
dépendant du point de vue est assurée par une
technique de reconstruction adaptative des surfaces
fonctionnant par subdivision successive des régions
d'intérêt et des silhouettes. Nous montrons qu'une
telle reconstruction s'applique en cours de transmission
et s'adapte aisément à la puissance graphique d'un
terminal.
| | Mots-Clefs | 3D, simplification de maillages, codage, compression, visualisation | | Abstract | Virtual reality now represents a whole technology since
it authorizes simulation, navigation and interaction
with a fully synthesized universe. The potentialities
offered by virtual reality were well understood when
graphic computers were able to display synthetic images
at an interactive rate. Moreover, the power growth of
computers coincides now with a rapid development of
networks, which increases tenfold the application
field based on virtual reality. Nevertheless, a
difficulty remains in developing these applications;
the associated telecommunication services appear
delicate to elaborate for various reasons: the data
volume may be huge, the display is CPU-intensive and
the graphic nature of data requires a specific
development adapted to the client-server framework.
And more, terminals are not equal in term of
capacities, and networks have limited and variable
flows. One thus obtains the triple challenge of the
thesis: storage, transmission and visualization of
3D scenes. One could also summarize the problematics
by endorsing during one sentence, the role of a
telecommunication operator: whatever be: the terminal,
the volume of data and the network flow, the user may
be able to visualize an appealing image.
This document takes on this challenge and describes
technological elements suitable for transmission and
the display of 3D scenes. Proposed solutions correspond
to a standard scheme in the field of audio-visual
information: simplification, approximation, and
scaleable coding. The visualization remains however
3D-specific and even represents an essential part.
Indeed, it is obviously more expensive to display a
polygon rather than a pixel, and the variable camera
point of view highly influences the relevance
of transmitted data.
The first chapter provides a natural understanding
of the problematic and the three others logically
follow the operations applied to 3D scenes :
simplification and approximation, coding and
visualization. The meshes composing the objects of
a 3D scene are simplified by edge collapse and
are approximated by volume minimization. They are
then encoded by an edge conquest technique exploiting
the vertex degrees distribution, the scalability
being obtained onto the positions by a bitplane
coding-like technique. Texture coding is addressed
by integration of a technique developed within
the laboratory, this one combining discrete
cosinus transform and finite elements associated
with a triangular mesh hierarchy. Visualization
depending on the point of view of the client is
ensured by successive subdivision of region of
interest and silhouette areas. We show that such
a technique also applies during transmission
and reconstruction, and easily adapts geometric
complexity to the graphic power of a client.
Lastly, future work concerns the interlacing of
coding with the adaptive subdivision technique,
and the deviation control during mesh simplification.
| | KeyWords | 3D, mesh simplification, coding, compression, visualization |
|