User Settings
Open AccessArticle10.24348/coria.2008.393

Indexation de blocs extraits de pages Web en utilisant le rendu visuel.

Nicolas Faessel-2008-01-01-Association en Recherche d’Information et Applications
0

TL;DRAbstract

RÉSUMÉ. Cet article présente un modèle d'indexation de pages Web basé sur leur rendu visuel. Dans ce modèle, une page Web n'est plus considérée comme un tout, mais comme la combinai- son d'un ensemble de blocs dont chacun porte sa sémantique propre. L'indexation d'une page Web est réalisée en deux étapes : (1) construction d'un arbre hiérarchique de blocs visuels, en s'appuyant sur la disposition visuelle des blocs de la page (2) indexation textuelle de chaque bloc par un vecteur de termes et tenant compte de l'importance de ces blocs et de l'indexation des blocs contenants, contenus ou voisins.

Chat with Paper

AI Agents for this Paper

RÉSUMÉ. Cet article présente un modèle d'indexation de pages Web basé sur leur rendu visuel. Dans ce modèle, une page Web n'est plus considérée comme un tout, mais comme la combinai- son d'un ensemble de blocs dont chacun porte sa sémantique propre. L'indexation d'une page Web est réalisée en deux étapes : (1) construction d'un arbre hiérarchique de blocs visuels, en s'appuyant sur la disposition visuelle des blocs de la page (2) indexation textuelle de chaque bloc par un vecteur de termes et tenant compte de l'importance de ces blocs et de l'indexation des blocs contenants, contenus ou voisins.

Keywords

HumanitiesIndexationPhilosophyArtPolitical scienceEconomics

Chat

Click to start Chat