[ la page d'accueil | la thèse | R E C I T A L | le mémoire / Introduction ] |
| |
Thèse de Doctorat en Informatique présentée par Quentin DELACROIX |
Introduction |
La conservation sous forme électronique des diverses informations et documents que gère une entreprise est une étape indispensable au développement de son système d'information. Cependant, cette disposition n'est pas suffisante pour assurer la meilleure valorisation de l'information. Même lorsque toutes les informations sont gérées par des systèmes informatiques, un acteur du système d'information peut rencontrer des difficultés d’accès et de consultation. Partant de cette constatation, nous nous sommes intéressés aux problèmes que peuvent poser la recherche et la consultation des informations techniques dans un contexte industriel. Parmi les solutions mises en oeuvre pour palier à ces problèmes, nous constatons que ni les systèmes de recherche de documents, ni les systèmes plus récents de recherche d’informations basés sur le Web ne donnent pleinement satisfaction. Les premiers retrouvent les documents mais n'en permettent pas une consultation aisée. Les seconds offrent une consultation conviviale des documents mais ne sont pas adaptés aux caractéristiques particulières des documents d'entreprise. Les difficultés de gestion de l'information et des documents en milieu industriel sont nombreuses. Citons la diversité des systèmes de stockage, le respect des permissions d’accès, la gestion des versions, la mise à jour des références croisées entre documents. Le stockage sous forme électronique des documents pose en lui-même des problèmes supplémentaires. Par exemple, les nombreux formats de stockage ( .doc, .dat, ...) sont spécifiques aux contenus des documents (textes standards, signaux multidimentionnels, ...) et nécessitent des applications spécifiques. De plus ces applications évoluent fréquemment et des problèmes de compatibilité entre versions peuvent survenir. Les travaux présentés dans cette thèse ont pour objectif d’analyser ces diverses difficultés et de suggérer des améliorations pour les processus de recherche et de consultation d'informations techniques en contexte industriel. Ils considèrent aussi bien les attentes et les besoins des utilisateurs et des producteurs d'informations que les préoccupations des administrateurs des systèmes informatiques. D'une part, les besoins des acteurs du système d'information sont sans cesse plus pressants. Un utilisateur voudra toujours disposer d’une information où qu'il soit, où qu'elle soit, au plus tôt. Qu'il se déplace au sein de différents sites de l'entreprise, ou qu’il soit en visite chez un partenaire, l'information nécessaire doit être accessible rapidement afin de prendre les bonnes décisions. Quand aux producteurs d'informations, ils préfèrent ne pas avoir à se soucier, lors de la rédaction de leurs documents, des contraintes liées au stockage, à la recherche et à la consultation qui seront effectuées ultérieurement. D'autre part, les préoccupations des administrateurs de systèmes informatiques orientent leurs choix vers des logiciels nécessitant une maintenance minimum, perturbant le moins possible les utilisateurs et les autres systèmes informatiques, et économisant la bande passante des réseaux locaux et distants. Afin de faciliter la recherche et la consultation d'informations dans un contexte industriel, nous proposons un système nommé RECITAL (Recherche Et Consultation de l'Information Technique Aux Laboratoires) qui concilie la plupart des points évoqués ci-dessus. RECITAL combine la recherche en texte intégral à la consultation hypertexte des documents. Il offre ainsi une recherche sur l'intégralité des textes contenus dans les documents de l'entreprise et permet la consultation de ces documents dans un environnement hypertexte. Les documents pris en compte par RECITAL peuvent être répartis sur des serveurs de fichiers en réseau ou dans des bases de données. La recherche tient compte de l'identité de l'utilisateur afin de ne lui présenter que des documents qu'il a le droit de consulter. La consultation des documents se fait depuis n'importe quel poste de travail en réseau disposant d'un client universel hypertexte (typiquement un butineur Web). Les formats électroniques dans lesquels sont stockés les documents sont éventuellement convertis par RECITAL dans les formats universels compatibles avec le client universel. Des liens hypertextes vers les documents cités en référence, s’ils sont présents sur le réseau et si l'utilisateur a le droit d'y accéder, sont ajoutés dynamiquement par RECITAL lors de la consultation. Ainsi, l'utilisateur peut aisément accéder à d'autres documents liés à celui qu'il consulte. Organisation du mémoire. Le Chapitre 1 présente le contexte de notre étude et fait ressortir la nécessité de considérer les diverses difficultés rencontrées lors de la recherche et de la consultation d'informations techniques en milieu industriel. Une problématique plus générale de ces activités est alors présentée conjointement à l'exposé de nos objectifs. Le Chapitre 2 fait état de systèmes de recherche d'information et de consultation de documents. Les principales techniques pour l’indexation de textes et la construction d'hypertextes sont notamment présentées. Le Chapitre 3 décrit le système RECITAL que nous proposons pour effectuer la recherche et la consultation des informations contenues dans des documents techniques de l'entreprise. Nous suggérons d'abord un modèle de données adapté à notre contexte et à nos objectifs. Les fonctionnalités et les propriétés de RECITAL sont alors explicitées. L'architecture d'ensemble et le fonctionnement général de RECITAL sont ensuite présentés. Les étapes de l’utilisation de RECITAL sont décrites avant de développer les processus mis en oeuvre lors de l'indexation des textes et de l'hypertextualisation des documents. Enfin, les possibilités offertes pour l'administration de RECITAL sont évoquées. Le Chapitre 4 présente une maquette partielle de RECITAL. Les structures de données nécessaires à la mise en oeuvre des processus de recherche plein texte et de construction dynamique d'hypertextes sont proposées. Leur construction, leur utilisation et leur mise à jour sont expliquées. La mise en oeuvre des fonctionnalités innovantes de RECITAL est ensuite illustrée à travers des scénarios d'utilisation. La Conclusion de ce mémoire fait le bilan des travaux réalisés. Enfin, des évolutions du système RECITAL sont proposées. |
juillet 2002 | [ la page d'accueil | la thèse | R E C I T A L | le mémoire / Introduction ] | http://quentin.delacroix.online.fr/ |