Anne Jaigu
07-25-2004, 02:49 AM
Thèse présentée devant IFSIC
Thesis submitted to IFSIC
Marc Chaumont - 13 novembre 2003
Représentation en objets vidéo pour un codage progressif et
concurrentiel des séquences d'images
http://www.irisa.fr/bibli/publi/theses/2003/chaumont/chaumont.html
Résumé
L'objectif de cette thèse est de valider l'hypothèse selon laquelle le
codage par objets vidéo peut permettre d'obtenir des gains significatifs
en utilisant le codage dynamique (mise en concurrence de plusieurs
codeurs pour chaque objet vidéo). Afin de répondre à cet objectif,
différents points ont été étudiés. Le premier point concerne l'étude de
la segmentation en objet vidéo de manière automatique. Nous avons
proposé un modèle d'objet faisant intervenir la notion de suivi long
terme via la représentation d'un objet sous la forme mouvement/texture
(avec l'utilisation d'un maillage actif pour représenter le
mouvement). Un algorithme de clustering 3D a été développé basé sur ce
modèle. Dans un deuxième temps, nous nous sommes attaché à
l'amélioration des techniques de codage objet via la hiérarchisation
("scalabilité") du flux vidéo. Pour cela, nous utilisons un schéma de
codage ondelette 3D et nousintroduisons notamment un codage de contours
avec perte. Enfin le dernier point étudié concerne le codage dynamique
d'objets vidéo (mise en concurrence de plusieurs codeurs pour chaque
objet vidéo). Les codeurs utilisés sont : le codeur H264/AVC, un codeur
ondelette 3D, un codeur 3D et un codeur par mosaïque. La répartition
automatique des débits permet d'obtenir des résultats dépassant ceux
produits par chaque codeur pris séparément, tout en offrant le découpage
du flux en objets vidéo.
Mots clefs: Segmentation en objets vidéo, segmentation long terme,
modèle d'objet vidéo, fonctionelle d'énergie, clustering, maillage
actif, mosaïque, codage vidéo, codage d'objet vidéo, décorrélation
mouvement texture forme, hiérarchisation : scalabilté, ondelettes
spatiotemporelles, ondelette 3D, codage de contour, codage de forme,
prolongement : padding, codage dynamique, codage concurrentiel,
optimisation débit-distorsion, répartition des débits, antialiasing
Abstract
Video object representation for a progressive and competing coding of
pictures sequences."The goal of this thesis is to valid the hypothesis
such that the video object coding allows significant improvement thanks
to the used of dynamic coding. The dynamic coding is the setting on
competition of a set of coders on each video object and the retaining of
the best coder for each object. To reach that goal, different points are
studied. The first one concerns the study of automatic video object
segmentation. We are proposing an object model with the notion of long
term tracking. This model represents an object thanks to its motion (by
the used of an active mesh) and its texture (by the used of a mosaic). A
3D clustering algorithm is developed based on that model. In a second
part, we are improving object coding techniques via the scalability on
the video bitstream. To that purpose, we are using a wavelet 3D coding
scheme and we are notably introducing a lossy contour coding. Finally
the last point studied concerns the dynamic coding. Coders used are
H264/AVC, a 3D wavelet coder, a 3D coder and a mosaic coder. The
automatic rate distribution allows to obtained better results than those
given by each coder took separately, in all offering a cut-out of the
bitstream in video objects.
Keywords: Video object segmentation, long term segmentation, video
object model, energetic function, clustering, active mesh, mosaic, video
coding, object video coding, decorrelation motion texture form,
scalability, spatio-temporal wavelet, 3D wavelet, contour coding, form
coding, padding, dynamic coding, competing coding, rate-distortion
optimization, rate distribution, antialiasing
Thesis submitted to IFSIC
Marc Chaumont - 13 novembre 2003
Représentation en objets vidéo pour un codage progressif et
concurrentiel des séquences d'images
http://www.irisa.fr/bibli/publi/theses/2003/chaumont/chaumont.html
Résumé
L'objectif de cette thèse est de valider l'hypothèse selon laquelle le
codage par objets vidéo peut permettre d'obtenir des gains significatifs
en utilisant le codage dynamique (mise en concurrence de plusieurs
codeurs pour chaque objet vidéo). Afin de répondre à cet objectif,
différents points ont été étudiés. Le premier point concerne l'étude de
la segmentation en objet vidéo de manière automatique. Nous avons
proposé un modèle d'objet faisant intervenir la notion de suivi long
terme via la représentation d'un objet sous la forme mouvement/texture
(avec l'utilisation d'un maillage actif pour représenter le
mouvement). Un algorithme de clustering 3D a été développé basé sur ce
modèle. Dans un deuxième temps, nous nous sommes attaché à
l'amélioration des techniques de codage objet via la hiérarchisation
("scalabilité") du flux vidéo. Pour cela, nous utilisons un schéma de
codage ondelette 3D et nousintroduisons notamment un codage de contours
avec perte. Enfin le dernier point étudié concerne le codage dynamique
d'objets vidéo (mise en concurrence de plusieurs codeurs pour chaque
objet vidéo). Les codeurs utilisés sont : le codeur H264/AVC, un codeur
ondelette 3D, un codeur 3D et un codeur par mosaïque. La répartition
automatique des débits permet d'obtenir des résultats dépassant ceux
produits par chaque codeur pris séparément, tout en offrant le découpage
du flux en objets vidéo.
Mots clefs: Segmentation en objets vidéo, segmentation long terme,
modèle d'objet vidéo, fonctionelle d'énergie, clustering, maillage
actif, mosaïque, codage vidéo, codage d'objet vidéo, décorrélation
mouvement texture forme, hiérarchisation : scalabilté, ondelettes
spatiotemporelles, ondelette 3D, codage de contour, codage de forme,
prolongement : padding, codage dynamique, codage concurrentiel,
optimisation débit-distorsion, répartition des débits, antialiasing
Abstract
Video object representation for a progressive and competing coding of
pictures sequences."The goal of this thesis is to valid the hypothesis
such that the video object coding allows significant improvement thanks
to the used of dynamic coding. The dynamic coding is the setting on
competition of a set of coders on each video object and the retaining of
the best coder for each object. To reach that goal, different points are
studied. The first one concerns the study of automatic video object
segmentation. We are proposing an object model with the notion of long
term tracking. This model represents an object thanks to its motion (by
the used of an active mesh) and its texture (by the used of a mosaic). A
3D clustering algorithm is developed based on that model. In a second
part, we are improving object coding techniques via the scalability on
the video bitstream. To that purpose, we are using a wavelet 3D coding
scheme and we are notably introducing a lossy contour coding. Finally
the last point studied concerns the dynamic coding. Coders used are
H264/AVC, a 3D wavelet coder, a 3D coder and a mosaic coder. The
automatic rate distribution allows to obtained better results than those
given by each coder took separately, in all offering a cut-out of the
bitstream in video objects.
Keywords: Video object segmentation, long term segmentation, video
object model, energetic function, clustering, active mesh, mosaic, video
coding, object video coding, decorrelation motion texture form,
scalability, spatio-temporal wavelet, 3D wavelet, contour coding, form
coding, padding, dynamic coding, competing coding, rate-distortion
optimization, rate distribution, antialiasing