Résumé

« Si ardu étant ce chemin qu’il serait difficile de le donner à entendre par des paroles ou de l’écrire avec la plume. La meilleure explication qu’ait trouvé pour cela le génie des hommes est de le donner en peinture sur une carte. »

Martin Cortès

Cette introduction a pour objectif de résumer chacune des huit parties qui composent ce site, à savoir :

  1. Positionnement de l’étude : dans un premier temps, nous situerons ce travail dans son contexte en présentant la problématique qui en est à l’origine. Ensuite nous définirons ce que nous entendons par la « cartographie sémantique », notre approche face à cette problématique.
  2. État de l’art : pour présenter le domaine, nous exposerons un état de l’art critique et plus particulièrement les approches et les solutions existantes au regard de nos besoins.
  3. Propositions : en réponse à cette problématique, nous décrirons l’ensemble de nos propositions qui loin d’être disparates constituent un tout cohérent c’est‑à‑dire, une méthode, un processus de cartographie sémantique, un formalisme de description, un langage de cartographie, deux nouveaux paradigmes pour l’exploration sémantique et enfin, une architecture d’agents logiciels.
  4. Réalisations des propositions : la quatrième partie détaillera les principales réalisations de nos propositions.
  5. Mises en œuvre & validations : puis, nous présenterons deux mises en œuvre qui ont permis de valider notre approche mais également de nous fournir de nombreux retours d’expériences sur l’application de la cartographie sémantique en milieu industriel.
  6. Conclusions & perspectives : pour conclure, nous synthétiserons ce travail et nous identifierons quelques perspectives possibles.
  7. Bibliographie : l’ensemble des travaux qui ont permis de réaliser ce travail sera listé dans cette partie.
  8. Annexes : en fin de document, nous rassemblons les annexes constituées des différents éléments complémentaires à l’étude dont un lexique des termes importants.

1.Positionnement de l’étude

À l’origine de cette étude se trouve un constat important : les organisations (publiques ou privées) sont de plus en plus submergées par le nombre toujours croissant d’informations qu’il est nécessaire de maîtriser pour mener à bien leurs activités. En effet, étant obligées de faire face à la mondialisation des flux et des services, elles perçoivent de plus en plus que la maîtrise des informations constitue le nouvel enjeu à relever. Les organisations découvrent alors de nouveaux besoins et développent rapidement de nouvelles activités : veille stratégique, gestion de l’innovation, capitalisation des savoirs, gestion du capital intellectuel et humain, intelligence économique, etc. L’objectif est toujours le même : valoriser les informations. C’est l’objet même de la gestion des connaissances. Cette évolution marque l’entrée de nos sociétés dans l’ère de l’information et dans l’économie de la connaissance.

Problématique : comment maîtriser un espace informationnel ?

Maîtriser ses informations devient alors le challenge incontournable auquel doit faire face toute organisation indépendamment de sa taille. La conséquence directe est un accroissement permanent de la quantité d’information à manipuler.

Nous nommons « espace informationnel » l’ensemble des informations manipulées par une organisation. Pour chaque organisation, cet espace est très vaste. Il va des informations collectées (comme les informations sur les collaborateurs, les clients, les fournisseurs, les partenaires, les concurrents, les marchés, etc.) aux savoir-faire (comme les descriptions des outils et des procédés, la documentation scientifique et technique, les brevets, etc.).

Face à des espaces informationnels toujours plus importants, comment gérer toutes ces informations ? Comment faire face à autant de données ? Comment maîtriser un espace informationnel ? Ces préoccupations constituent la problématique à l’origine de ce travail.

Notre approche : cartographier pour maîtriser

La maîtrise d’un espace est une problématique universelle qui préoccupe l’homme depuis son origine. La cartographie résulte de cette problématique. Cartographier un espace permet de le visualiser en une carte pour mieux l’appréhender[1].

« Une image vaut mille mots ». Cette constatation sur la valeur de la visualisation est d’autant plus vraie si l’on travaille avec un grand nombre d’informations. La synthèse des travaux sur la cartographie (géographique) et sur la visualisation permet de considérer les cartes comme un médium idéal entre un grand nombre d’informations et l’esprit. Chaque carte joue alors le rôle de support externe de la pensée pour amplifier la cognition[2] de ses utilisateurs.

Face à ce constat, notre approche consiste à étudier les différents paradigmes de la cartographie et de les appliquer aux informations manipulées par les organisations pour construire des cartes. Notre objectif est alors d’aider les collaborateurs à appréhender leur espace informationnel pour mieux le maîtriser.

Nous nommons « cartographie de données abstraites », le recours aux paradigmes de cartographie pour représenter un espace informationnel. Bien que cette nomination soit discutable, nous la choisissons en référence à la « visualisation de données abstraites » définie par la communauté de la visualisation d’informations.

Point de départ : besoins des utilisateurs

Le nombre de paradigmes de cartographie est très important, par conséquent il est possible de construire un nombre quasiment infini de cartes différentes d’un même espace de données. Dans un tel contexte, comment construire une carte qui aidera effectivement ses utilisateurs à appréhender leur espace informationnel ?

Face à cette profusion de paradigmes, nous avons débuté par l’étude du résultat recherché. Ainsi, nous avons identifié plusieurs besoins que toute carte devrait satisfaire pour répondre à notre problématique d’appréhension d’un espace informationnel :

›       Naviguer selon la sémantique du domaine entendue comme l’ensemble des concepts permettant d’appréhender le domaine : pour leurs activités, les collaborateurs doivent naviguer dans l’espace informationnel de leur organisation (comme lors d’une recherche d’informations). Pour faciliter cette navigation, il est nécessaire que les cartes véhiculent la sémantique du domaine. Si la cartographie respecte cette sémantique, les utilisateurs peuvent alors la comprendre, l’assimiler et l’exploiter. Utiliser une carte qui exploite la sémantique du domaine pour naviguer permet aux utilisateurs d’appréhender plus facilement l’espace informationnel.

›       Proposer une vision à plusieurs échelles : permettre aux utilisateurs de maîtriser un ensemble d’informations nécessite de leur fournir les moyens pour l’appréhender dans sa globalité mais aussi dans ses particularités. C’est pourquoi, une carte doit offrir simultanément une vision globale et synthétique de l’espace informationnel, et une vision particulière et détaillée de ce même espace.

›       Proposer une carte adaptée à l’utilisateur : tous les collaborateurs n’ont pas la même activité et le même niveau d’expertise. Chaque carte doit donc être adaptée à ses utilisateurs. De plus, une carte étant une représentation de l’espace informationnel, elle véhicule une signification. Il est alors nécessaire de bien choisir et adapter cette représentation pour maîtriser la signification qui sera finalement perçue.

Nous nommons « cartographie sémantique » la cartographie de l’espace informationnel d’une organisation répondant à ces besoins. Ainsi, elle devient une activité essentielle à la gestion des connaissances, permettant de tirer parti de toute la richesse des informations de l’organisation.

2.État de l’art

Au fil des siècles, la cartographie a perfectionné ses techniques et augmenté son champ d’application. À l’origine, la carte servait d’aide-mémoire en représentant graphiquement des éléments constitutifs d’un territoire limité (la cartographie antique). Ensuite, elle est devenue descriptive avec la couverture de l’ensemble du globe (la cartographie topographique). Puis, elle est devenue thématique en représentant des données de plus en plus « abstraites » (la cartographie thématique).

D’un point de vue général, la cartographie correspond à l’ensemble des études et des techniques qui permettent de construire une carte à partir d’informations. La carte est alors constituée de représentations graphiques de phénomènes (concrets ou abstraits) en positions relatives, localisables dans l’espace [Bertin, 1977; Bertin, 1999 (1re éd. 1969)]. Cette opération de construction est menée par un cartographe. Il arrive que la carte soit utilisée comme méthode de recherche lorsqu’elle apporte elle‑même une information nouvelle non encore prévue ou pressentie par son utilisateur. La carte devient alors un instrument de transmission de messages mais aussi un instrument de résolution [Poidevin, 1999].

La cartographie de données abstraites

Il existe de nombreux travaux qui traitent de la cartographie de données abstraites. Ils sont associés à deux communautés distinctes. La première, qui est aussi la plus ancienne, est la communauté de la « visualisation d’informations ». La deuxième est celle de la « visualisation de connaissances ». D’après leurs membres, ces deux communautés diffèrent par la nature des informations à cartographier. Pour la communauté de la visualisation d’informations, l’objectif est de visualiser graphiquement tous types de données abstraites. La cartographie est alors assimilée à un processus de transformation d’un ensemble d’informations en une carte. En revanche, pour la communauté de la visualisation de connaissances, l’objectif est de traiter uniquement des concepts. Ces derniers étant représentées par des données abstraites, leur cartographie exploite les techniques de la visualisation d’informations. Ainsi, la visualisation de connaissances peut être perçue comme une activité exploitant la visualisation d’informations à des fins de gestion de connaissances. Quoi qu’il en soit, les deux communautés partagent les mêmes paradigmes.

La construction d’une carte à partir d’un ensemble d’informations n’est pas immédiate. En effet, il est tout d’abord nécessaire de représenter[3] les informations sous forme graphique avant de les visualiser[4]. La cartographie d’un espace informationnel fait donc intervenir deux types de paradigmes : ceux qui permettent de représenter des informations (pour obtenir une représentation) et ceux qui permettent de visualiser ces représentations (pour obtenir une visualisation) sous forme de carte. Une fois la carte construite, l’utilisateur va interagir avec elle pour l’adapter à ses besoins. Toutes les techniques d’interactions constituent donc elles aussi un type de paradigme. Par conséquent, pour présenter les principaux paradigmes de la cartographie de données abstraites, nous avons choisi d’utiliser une classification principale basée sur le type des paradigmes : représentation, visualisation et interaction.

Synthèse & critiques

Notre objectif est d’aider les collaborateurs des organisations à appréhender leur espace informationnel au travers de cartes. D’après l’étude de l’existant, la cartographie de données abstraites permet de répondre en partie à cette problématique. En effet, il est déjà possible de construire une quasi-infinité de cartes pour un même espace. Cependant, nous avons besoin de cartes permettant aux utilisateurs de naviguer dans leur espace informationnel selon la sémantique de leur domaine avec une vision adaptée alliant différents niveaux d’échelles. Donc, pour répondre complètement à ces besoins, il subsiste alors deux problématiques :

›       Comment proposer une navigation basée sur la sémantique du domaine ? Les cartes doivent permettre aux utilisateurs de naviguer selon cette sémantique. Il est alors nécessaire qu’elle soit explicitée dans l’espace informationnel à travers une modélisation. La difficulté est alors de déterminer comment construire cette modélisation.

›       Comment déterminer les paradigmes à mettre en œuvre ? Les différentes approches ne nous indiquent pas comment fournir des cartes adaptées aux utilisateurs.

Les propositions associées à cette étude ont toutes pour objectif de répondre à cette double problématique.

3.Propositions

L’ensemble de nos propositions constitue un tout cohérent c’est‑à‑dire la cartographie sémantique proprement dite.

La première proposition est une méthode pour cartographier un espace informationnel selon nos besoins. Elle repose sur la prise en compte de la sémantique du domaine et sur les retours d’expérience. Nous nommons cette méthode la « cartographie sémantique ».

La seconde proposition est un processus de cartographie sémantique. La cartographie est alors assimilée à un ensemble d’opérations qui permettent de construire une carte d’un espace informationnel brut en passant successivement par un espace informationnel structuré puis un espace informationnel représenté et enfin un espace informationnel visualisé.

Ce processus de cartographie sémantique requiert un certain nombre de modélisations, doit répondre à des critères, et nécessite une architecture pour sa mise en œuvre.

C’est pourquoi, notre troisième proposition est notre formalisme de description dédié à la cartographie sémantique, nommé SNDF (Semantic Network Description Formalism). Ce formalisme permet de décrire d’une part les connaissances du domaine en un ensemble d’entités et de relations entre ces entités et d’autre part de décrire des propriétés de représentation pour ces entités et ces relations.

La quatrième proposition est la définition de critères pour la cartographie d’espaces informationnels structurés par une ontologie de domaine (comme l’utilisation de techniques « focus+context » avec une géométrie euclidienne) et la spécification de deux nouveaux paradigmes pour explorer un espace informationnel structuré : l’EyeTree et le RadialTree.

La cinquième proposition est un langage de haut niveau pour construire une carte en décrivant sa cartographie sémantique, nommé MDL (Map Description Language).

Enfin, la sixième et dernière proposition est une architecture de type système multiagents basée sur une extension du modèle MVC (Model View Controller). Elle permet d’intégrer la cartographie sémantique dans les solutions de gestion de connaissances à l’aide d’un ensemble d’agents logiciels.

Proposition 1 : la cartographie sémantique

Selon le principe de correspondance des représentations, une représentation graphique est d’autant plus efficace qu’elle correspond à la représentation mentale que se fait l’utilisateur de ces informations [Chabris & Kosslyn, 2005]. Pour un collaborateur, la représentation mentale d’un espace informationnel correspond à la sémantique de son domaine comprise comme l’ensemble des concepts permettant d’appréhender les objets du domaine. Pour être efficace, la carte doit donc respecter cette sémantique. Notre approche consiste à exploiter la sémantique du domaine pour déterminer les techniques à mettre en œuvre pour cartographier un espace informationnel.

Notre expérience de la cartographie nous a aussi révélé l’importance et la valeur des retours d’expérience pour construire une bonne carte. En effet, même si toutes les cartes sont basées sur la graphique (langage monosémique), une carte ne peut pas être considérée comme définitive et universelle. Depuis l’origine de la cartographie, les cartographes savent qu’une carte se doit d’être esthétique, intuitive et efficace [Tufte, 1986]. Malheureusement aucun système ne permet de garantir la satisfaction de ces trois propriétés et encore moins pour tous les individus. Face à cette problématique, il est donc important de toujours se laisser la possibilité de faire évoluer la cartographie selon les besoins des utilisateurs. Par conséquent, leurs retours d’expérience constituent un critère fiable pour juger de l’efficacité des cartes.

Nous proposons donc une cartographie basée d’une part, sur la sémantique du domaine pour déterminer les paradigmes à mettre en œuvre et d’autre part, sur la prise en compte des retours d’expérience pour améliorer et adapter les cartes. Nous qualifions notre approche de cartographie sémantique, c’est‑à-dire la cartographie de l’espace informationnel d’une organisation basée sur sa sémantique.

Proposition 2 : notre processus de cartographie sémantique

La cartographie sémantique est un processus qui permet de passer d’un espace informationnel à une carte. En accord avec les approches courantes, l’espace informationnel que l’on souhaite cartographier doit tout d’abord être représenté (à l’aide d’opérations de représentation). On obtient alors un ensemble d’objets graphiques nommés « structures visuelles ». Ensuite, cet « espace informationnel représenté » doit être visualisé (à l’aide d’opérations de visualisation) pour une obtenir une vue (la carte). La cartographie sémantique est donc assimilable à un ensemble d’opérations appliquées successivement à un espace informationnel que nous qualifions de « brut » (l’espace à cartographier). À chaque opération, l’espace informationnel est traduit vers un autre espace avec au minimum, un espace informationnel représenté et un espace informationnel visualisé.

Comme nous l’avons constaté, les approches courantes ne permettent pas de déterminer les techniques à mettre en œuvre pour obtenir une carte répondant à nos besoins. Le cœur de notre approche repose donc sur la prise en compte de la sémantique du domaine pour guider la cartographie selon les besoins des utilisateurs. Cet objectif implique d’expliciter la sémantique à l’aide d’une modélisation qui décrit les concepts du domaine ainsi que leurs relations.

Chaque collaborateur d’une organisation possède sa propre vision de son domaine et par conséquent, il possède aussi ses propres connaissances sur ce domaine. Il est donc nécessaire de proposer une cartographie capable de supporter plusieurs modélisations d’un même domaine correspondant à autant de points de vue théoriques différents. Pour illustrer la possibilité de concevoir plusieurs modélisations d’un même monde, il suffit de penser aux théories ondulatoires et corpusculaires de la lumière. Pour permettre aux utilisateurs de naviguer dans l’espace informationnel selon cette sémantique, il est alors nécessaire de restructurer l’espace informationnel de départ (brut) selon la modélisation du domaine. Le résultat est alors un nouvel espace que nous qualifions d’espace informationnel structuré.

Une fois structuré, l’espace informationnel doit être représenté graphiquement. C’est-à-dire qu’il est nécessaire de créer un nouvel espace constitué de structures visuelles. Comme nous le verrons dans notre état de l’art, il existe un très grand nombre de techniques de représentation pouvant être combinées pour construire une représentation. Chacune de ces représentations doit permettre de répondre à notre besoin d’adapter les cartes à l’utilisateur avec une navigation basée sur la sémantique du domaine. Chaque utilisateur possède un profil particulier (avec une activité et un niveau d’expertise donné). Une représentation unique ne peut pas convenir. Il est donc nécessaire de proposer un processus de cartographie capable de supporter plusieurs représentations d’un même espace informationnel correspondant à autant de cartes différentes. La modélisation permet alors de déterminer les opérations de représentations qui respectent la sémantique et par conséquent, elle permet de déterminer celles qui peuvent être utilisées.

Pour être perceptible par l’utilisateur, un espace informationnel représenté (par un ensemble de structures visuelles) doit être visualisé. Tout comme précédemment, cette opération de visualisation doit permettre de répondre à notre besoin d’adapter les cartes à l’utilisateur. En effet, chaque utilisateur possède un support particulier pour afficher la carte (écran, projecteur, papier, etc.) avec des dimensions tout aussi particulières. Une visualisation unique ne peut donc pas convenir. Il est alors nécessaire de proposer un processus de cartographie capable de supporter plusieurs visualisations d’un même espace informationnel représenté correspondant à autant de cartes différentes.

Lors de la navigation dans un espace informationnel, le point de vue des utilisateurs change tout comme leur activité et leur niveau d’expertise. De plus, il est possible qu’un même utilisateur appréhende simultanément un même espace informationnel selon plusieurs points de vue théoriques et pour différentes activités. Par conséquent, il est nécessaire que la cartographie ne soit pas un processus linéaire et unique. L’utilisateur doit pouvoir appréhender son espace informationnel selon différents points de vue simultanément correspondants à autant de cartes différentes.

De plus, l’utilisateur doit pouvoir adapter ou changer les différentes opérations de chacune des cartes pour répondre à ses besoins. Dans ce dessein, le processus de cartographie doit mettre en œuvre des techniques d’interaction pour adapter les différents espaces. La cartographie d’un même espace informationnel selon différentes cartes adaptables par l’utilisateur permet de répondre à notre approche basée sur les retours d’expérience. À tout moment l’utilisateur doit avoir une carte adaptée.

En synthèse, la cartographie sémantique peut être assimilée à un ensemble d’opérations permettant de passer successivement par :

  1. Un espace informationnel brut : il s’agit de l’espace initial que l’on souhaite cartographier.
  2. Un espace informationnel structuré : cet espace est obtenu par des opérations de structuration de l’espace informationnel basée sur une modélisation construite au préalable.
  3. Un espace informationnel représenté : cet espace est obtenu par des opérations de représentation de l’espace informationnel structuré (le choix des opérations est en accord avec la modélisation).
  4. Un espace informationnel visualisé : cet espace est obtenu par des opérations de visualisation de l’espace informationnel représenté (le choix des opérations est, lui aussi, déterminé en accord avec la modélisation).
  5. Une carte adaptée : l’utilisateur adapte ses cartes en interagissant avec les différents espaces de la cartographie.

Proposition 3 : SNDF, notre formalisme de description pour la cartographie sémantique

Le cœur de notre approche repose sur la prise en compte de la sémantique du domaine pour guider la cartographie. Cet objectif implique tout d’abord d’expliciter la sémantique à l’aide d’une modélisation puis de structurer l’espace informationnel brut selon cette modélisation (les concepts de la modélisation servent à décrire les éléments de l’espace brut). Tout ensemble d’informations (une modélisation ou un espace informationnel) se décrit selon une théorie. La difficulté est alors de définir une nouvelle théorie dédiée à la cartographie sémantique en accord avec notre processus et capable de répondre à nos besoins.

Pour cette problématique, nous proposons un formalisme de description, nommé SNDF (Semantic Network Description Formalism), permettant de décrire d’une part les connaissances du domaine en un ensemble d’entités et de relations entre ces entités et d’autre part de décrire des propriétés de représentation pour ces entités et ces relations.

Pour décrire les connaissances du domaine, SNDF a un double objectif. D’une part, il permet d’expliciter la sémantique du domaine en décrivant une modélisation et d’autre part, il décrit l’espace informationnel structuré selon cette modélisation. SNDF repose sur les principes des réseaux sémantiques et des systèmes à base de schémas. Des premiers, il exploite la capacité de décrire des connaissances par un ensemble d’entités et de relations entre ces entités et des seconds, il reprend la possibilité d’ajouter aux entités un ensemble d’attributs valués.

Pour permettre d’ajouter des propriétés de représentation pour chaque élément à cartographier, SNDF leur associe des informations dédiées à la cartographie comme une liste de descriptions de représentation (la description des futures structures visuelles) et une liste d’actions pour les interactions.

SNDF est notre formalisme de description dédié à la cartographie sémantique.

Proposition 4 : la cartographie sémantique pour l’exploration

La proposition quatre permet d’illustrer la cartographie d’un espace informationnel déjà structuré par une ontologie de domaine. En effet, la problématique de la navigation dans une base de connaissances a vivement motivé cette étude et plus particulièrement la navigation graphique dans une base de connaissances annotée sémantiquement par une ontologie de domaine. Par annotation sémantique, nous entendons l’indexation des éléments de la base de connaissances par les concepts de l’ontologie. Et par navigation graphique, nous entendons une exploration et une recherche au sein de la base de connaissances guidées par la modélisation du domaine sous la forme de visualisations interactives. Dans ce cas, la base de connaissances constitue un espace informationnel déjà structuré. La modélisation correspond à l’ontologie du domaine. La problématique est alors de définir la cartographie sémantique pour l’exploration d’un espace informationnel structuré selon une ontologie de domaine.

Pour résoudre cette problématique, nous avons appliqué une démarche en deux étapes. La première étape a été d’étudier et d’évaluer les différents paradigmes de visualisation existants. Pour cela, nous avons au préalable défini avec l’aide des utilisateurs les fonctionnalités attendues. La seconde étape a consisté quant à elle à réaliser plusieurs cartes interactives dont l’analyse des retours d’expérience nous a permis d’identifier de nouvelles fonctionnalités à mettre en œuvre.

Selon notre approche de cartographie sémantique, nous avons analysé les retours d’expérience des utilisateurs. Ils nous ont permis d’identifier, dans le cadre de notre application, quatre critères principaux pour la réalisation d’une cartographie sémantique interactive :

›       Utiliser une technique de type « focus + context » pour permettre à l’utilisateur de se concentrer sur certains éléments tout en facilitant l’accès aux autres éléments ;

›       Utiliser une géométrie euclidienne pour ne pas perturber la perception naturelle des manipulations du plan ;

›       Proposer une vue globale de l’ontologie (la modélisation) permettant à l’utilisateur de facilement appréhender l’ensemble de l’espace informationnel structuré ;

›       Pouvoir parcourir la base de connaissances tout en gardant un point fixe de référence.

Suite à ces retours d’expérience nous avons également pu identifier deux profils distincts d’utilisateurs : les « novices » et les « experts ». Les « novices » ont une certaine connaissance des concepts du domaine sans connaître exactement leur organisation ; alors que les « experts » ont une bonne maîtrise de l’ontologie de leur domaine. Ces deux profils n’ont pas les mêmes attentes concernant la vision globale de l’ontologie. Pour les novices, il est nécessaire de leur proposer une carte permettant une appréhension globale de cette modélisation. En revanche, il est nécessaire de proposer aux experts une carte de l’ontologie permettant de se situer rapidement dans l’espace informationnel. Ce constat nous a donc amené à réaliser deux cartographies différentes dédiées à la cartographie de bases de connaissances annotées sémantiquement : le « EyeTree » et le « RadialTree ».

EyeTree

Le « EyeTree » est une représentation avec déformation de type « Fisheye Polaire ». Il est basé sur une géométrie euclidienne offrant une vision globale de la structure conceptuelle. Cette technique fait partie des techniques de représentation avec déformation. Pour cela, les nœuds sont répartis radialement dans l’espace euclidien avant de subir une transformation via une fonction d’amplification continue appliquée aux coordonnées polaires des nœuds.

 

Exemple de carte avec l’EyeTree

Le résultat ressemble aux arbres hyperboliques [Lamping et al., 1995], mais les interactions de l’utilisateur (par exemple les translations) sont appliquées à un plan euclidien. Elles sont donc « naturellement » prévisibles par l’utilisateur. La transformation étant linéaire, le résultat n’est pas perturbant pour les utilisateurs (tout comme pour les « Perspective Wall » [Mackinlay et al., 1991]). La navigation s’effectue en parcourant la relation de généralisation/spécialisation entre les concepts et en glissant la projection de l’ontologie (« tree ») sur la représentation sphérique (« eye »), d’où le terme de « EyeTree ».

RadialTree

Par opposition à l’EyeTree, le « RadialTree » est plus particulièrement dédié aux experts du domaine. Il reprend les principales caractéristiques de l’EyeTree comme une cartographie globale de l’ontologie et l’utilisation d’une géométrie euclidienne. Cependant, le RadialTree n’applique pas de déformation globale à l’espace de représentation. En revanche, il propose une zone dite de « focus » permettant de magnifier une sous-partie de l’arbre.

Exemple de carte avec le RadialTree

Les nœuds de l’arborescence sont répartis radialement dans l’espace euclidien. Les éléments situés dans la zone de focus sont magnifiés par une fonction d’amplification continue appliquée aux coordonnées. De plus, les feuilles de l’arbre situées dans la zone de focus sont projetées sur l’extrémité droite de cette zone et leur taille subit une déformation pour donner un effet équivalent à celui des menus fisheye augmentant ainsi leur lisibilité.

La réalisation de ces deux propositions est présentée avec les autres réalisations associées à cette étude.

Proposition 5 : MDL, notre langage de cartographie sémantique

La mise en œuvre de notre processus nécessite un langage pour décrire les cartes. Il existe de nombreux langages répondant à ce besoin. Il est possible de citer des langages comme Flash (langage propriétaire), SVG ou X3D (langages ouverts). Ces langages permettent de définir des cartes par la description d’un ensemble de structures visuelles. Par rapport à notre processus de cartographie sémantique, ces langages ne permettent de décrire que des espaces informationnels représentés. Ils ne permettent pas de décrire l’espace informationnel et encore moins de décrire l’espace structuré par une sémantique de domaine. Par conséquent, la définition de la carte n’est plus porteuse des connaissances cartographiées.

Pour répondre à notre problématique, nous avons donc été amenés à créer notre langage nommé MDL (pour « Map Description Language » ou « langage de description de cartes »). L’objectif de ce nouveau langage est de décrire une cartographie entendue comme l’ensemble des opérations nécessaires à appliquer à un espace informationnel structuré (en accord avec notre processus) pour construire une ou plusieurs cartes. L’utilisateur peut alors interagir avec les structures visuelles (comme les langages existants) mais aussi avec les connaissances (l’espace structuré). Pour décrire l’espace informationnel structuré, MDL exploite SNDF notre formalisme de description. D’un point de vue plus technique, MDL est un langage à balises de la famille XML.

Proposition 6 : notre architecture à agents et MVC distribué

Au fil des années, les systèmes d’information des organisations ont fortement muté. Ils sont passés pour la plupart de systèmes monolithiques à des systèmes de plus en plus répartis. L’évolution majeure de ces dernières années dans les systèmes d’information est l’arrivée des services web qui permettent aux entreprises d’offrir leurs services comme des briques logicielles interconnectables. Chaque brique logicielle est assimilable à un agent logiciel évoluant sur Internet. Cette évolution permet avant tout de répondre à des besoins internes, mais elle permet aussi aux entreprises de sous-traiter certains de leurs traitements. La cartographie sémantique (entendue comme processus de gestion des connaissances) doit, elle aussi, être proposée comme un service pour intégrer les nouvelles architectures des systèmes d’information.

L’approche courante de cartographie de données abstraites consiste à appréhender la cartographie comme un processus séquentiel géré par une « boîte noire » permettant de passer d’un espace informationnel à une carte. Cette vision contraint à exécuter le processus complet de cartographie par une application sur le poste client et par conséquent, cela implique d’avoir un réseau performant pour transférer de grande quantité de données et des postes clients très performants pour supporter toute la cartographie.

Face à cette problématique, nous avons défini une nouvelle architecture dont le principe fondamental est la décomposition de la cartographie en différents services fournis par des agents logiciels. La finalité est de construire des cartes avec lesquelles les utilisateurs vont interagir. Pour permettre ces interactions, notre architecture met en œuvre des mécanismes d’interface homme-machine basés sur une extension du modèle MVC (Model View Controller) : notre « MVC distribué ». Cette évolution permet (à l’instar de l’original) de travailler simultanément sur plusieurs cartographies de sous-ensembles d’une même base constituant autant d’espaces informationnels cartographiés. Concrètement, nous avons décomposé notre architecture selon les principes de notre extension de MVC ce qui nous a permis de définir un ensemble d’agents logiciels qui interagissent entre eux pour construire des cartes.

4.Réalisations

Toutes les réalisations associées à cette étude ont été conçues dans une Équipe de Recherche Technologie (ERT) associée à une société de valorisation. « La recherche technologique a pour finalité de résoudre des problèmes posés par des entreprises industrielles ou de service ou liés à une demande sociétale. Elle se justifie par une demande du milieu socio-économique et ses thèmes sont donc inspirés par des objets industriels, produits, procédés, systèmes génériques ainsi que des services ». « Une équipe de recherche technologique (ERT) est une équipe de recherche qui, en partenariat avec des industriels, mène sur le moyen terme des recherches dans le cadre de projets visant à lever des verrous technologiques relatifs à des problèmes qui n’ont pas de solutions immédiates. Pour être reconnue, une ERT doit s’appuyer sur une recherche amont de qualité et justifier d’un engagement fort d’industriel(s) » (d’après les textes officiels[5]). Par conséquent, une ERT est contrainte de réaliser d’une part, une recherche technologique pour lever des verrous technologiques et d’autre part, de valoriser ses travaux dans le cadre du partenariat industriel.

Les travaux associés à cette étude ont été réalisés au sein de l’équipe Condillac d’ingénierie des connaissances qui a été reconnue ERT par le Ministère de la Recherche. Le partenariat industriel s’effectue avec l’entreprise Ontologos Corp. qui s’est engagé à valoriser l’ensemble des travaux de recherche de l’équipe Condillac.

La cartographie sémantique fait partie des verrous technologiques que l’équipe Condillac doit lever. Les réalisations présentées ici ont été guidées par la volonté de lever ce verrou, mais elles ont aussi été guidées par la volonté de répondre aux besoins du monde de l’entreprise. Les retours d’expérience de ces différentes applications constituent alors une validation efficace de notre approche.

Cartographie Sémantique avec Os Map

La première réalisation présentée est Os Map, notre service web de cartographie sémantique. Ce service met directement en œuvre l’ensemble de nos propositions. Tout d’abord, il exploite notre méthode et notre processus. Ensuite, il implémente une version de notre formalisme et de notre architecture à agents. Enfin, les cartes qu’il permet de construire sont décrites avec MDL, notre langage de cartographie et elles sont visualisées avec nos deux paradigmes d’exploration, l’EyeTree et le RadialTree.

Os Map est donc un service de cartographie sémantique conçu pour être intégré à toute application qui souhaite cartographier sémantiquement un espace informationnel.

Modélisation graphique avec SNCW

SNCW (Semantic Network Craft Workbench) correspond à notre deuxième réalisation. Il permet de modéliser graphiquement un domaine donné. Il exploite notre méthode de cartographie sémantique mais aussi notre formalisme de description et notre processus. Ainsi, il permet aux experts de modéliser leur domaine avec pour finalité la construction d’un système d’entités structurées capable d’exprimer leurs connaissances. Ce système produit alors ce que nous nommons une « base de connaissances ». SNCW est notre environnement graphique et interactif pour la modélisation et la représentation semi‑formelle de connaissances.

SNCW permet de décrire plusieurs modélisations d’un même monde, mais aussi plusieurs vues d’une même modélisation (à chaque vue correspond une cartographie). La théorie que nous avons retenue est donc celle que nous proposons avec notre formalisme SNDF. Les bases de connaissances construites avec SNCW sont composées de modélisations et de cartographies de ces modélisations, les vues.

La réalisation de SNCW est basée sur un ensemble d’agents logiciels qui communiquent à l’aide de deux langages dédiés à la manipulation de bases de connaissances et de réseaux sémantiques. Les bases ainsi construites reposent sur un format ouvert de type XML, elles sont donc aisément partagées avec des applications tierces.

Exploration sémantique avec EyeTree et RadialTree

Enfin, les deux réalisations présentées sont l’EyeTree et le RadialTree correspondant à l’implémentation de notre spécification de paradigmes pour l’exploration sémantique d’espaces informationnels structurés ontologiquement.

Ces deux nouveaux paradigmes utilisent un langage de descriptions d’arborescences de type XML. Par conséquent, bien que ces deux paradigmes soient dédiés à la cartographie d’espaces informationnels structurés ontologiquement, ils permettent de cartographier les connaissances manipulées par des applications tierces pour cartographier tous types d’arborescences (comme SNCW).

5.Mises en œuvre & validations en gestion des connaissances

En accord avec sa fonction d’équipe de recherche technologique, l’équipe Condillac met en œuvre des solutions de gestion de connaissances pour lever différents verrous technologiques. L’appréhension d’un espace informationnel fait partie de ces verrous à lever et la cartographie sémantique est notre solution.

Pour témoigner de l’efficacité de notre approche, nous présentons deux cas concrets de sa mise en œuvre dans le monde industriel.

Le premier cas correspond à la cartographie sémantique appliquée à la gestion des compétences. Ce cas est à l’initiative de deux organisations : SADEC, un groupe d’expertise comptable et la ville de Cran-Gevrier. Cette étude sur la gestion des compétences a abouti à la réalisation d’OS-SKILL, environnement logiciel dédié à la gestion prévisionnelle des emplois et des compétences, étendues à la gestion des connaissances (GPECC). L’ensemble des fonctionnalités d’Os-Skill est intégré à un environnement de cartes interactives accessibles par Internet et intranet.

Le second cas correspond à l’utilisation de la cartographie sémantique pour gérer des fonds documentaires. Cette mise en œuvre est à l’initiative du GRETh, une émanation du CEA dédiée à la recherche sur les échangeurs thermiques.

Ces deux cas valident notre approche de cartographie sémantique en milieu industriel. Le déploiement et la mise en œuvre de la cartographie sémantique constituent une occasion formidable pour valider cette étude. Les retours des utilisateurs ainsi que ceux des commanditaires de ces mises en œuvre sont très positifs. Ils sont depuis convaincus que la cartographie sémantique constitue un atout pour leurs démarches de gestion de connaissances et des compétences.

6.Conclusion & Perspectives

La finalité de ce travail est de résoudre la problématique de l’appréhension par des collaborateurs de l’espace informationnel de leur organisation. Nous avons alors proposé la cartographie sémantique que nous définissons comme la cartographie de l’espace informationnel d’une organisation basée sur sa sémantique.

Sa mise en œuvre dans le monde des entreprises, au travers de la réalisation de nos propositions, a permis de valider notre approche. Chaque mise en œuvre nous permet de s’assurer que ce verrou technologique identifié par le Ministère de la Recherche est bien levé. Nous pouvons d’ailleurs nous réjouir d’avoir des témoignages sur l’apport bénéfique de notre approche dans la presse spécialisée. Fort de ces résultats, il a été estimé que le verrou de la cartographie sémantique a été levé et par conséquent que l’objectif de ce travail est atteint.

Néanmoins, nous identifions trois perspectives pour l’étude de la cartographie sémantique :

›       Évaluer les paradigmes : il ne faut pas omettre la dimension psychologique de la cartographie, c’est pourquoi nous estimons qu’il est nécessaire d’évaluer par des expérimentations l’impact de chaque paradigme sur les utilisateurs ainsi que leurs effets combinés. Ainsi en supposant une évaluation des paradigmes, de leur combinaison et de leurs impacts, leur choix pour constituer la cartographie peut alors être optimisé. Bien qu’une telle évaluation semble utopique dans l’état actuel de nos connaissances, nous estimons néanmoins que toute évaluation d’un paradigme permet de mieux en comprendre l’impact et par voie de conséquence de mieux l’utiliser.

›       Adapter les cartes à chaque utilisateur : les utilisateurs interagissent avec leurs cartes (comme déplacer le point de vue ou changer de zoom) pour naviguer dans l’espace informationnel. Par soucis de construire des cartes adaptées, il nous paraît alors important d’étudier ces interactions. L’objectif final est de réduire au maximum le temps entre l’utilisation d’une carte et son adaptation c’est‑à‑dire adapter la cartographie en temps réel. Cette perspective de recherche est une approche de cognition située où le couple utilisateur/carte est à mettre en symbiose.

›       Définir de nouveaux paradigmes : pour augmenter les possibilités de cartographie et plus particulièrement pour changer les rapports entre l’utilisateur et l’espace informationnel il est nécessaire de définir de nouveaux paradigmes. Dans l’état actuel des choses, les cartes constituent une sorte d’interface entre les informations et l’utilisateur. Elle constitue alors le monde virtuel et l’utilisateur le monde physique. Pour être encore plus efficace, il est nécessaire de réduire au maximum la frontière entre ces deux mondes. Dans ce dessein nous identifions deux axes de recherche qui nous semblent très prometteurs : la « réalité virtuelle » et la « réalité augmentée ». La réalité virtuelle permet d’immerger l’utilisateur dans l’espace informationnel et la réalité augmentée permet d’immerger l’espace informationnel dans le monde réel.

Nous pensons qu’à l’avenir la recherche dans ces trois perspectives offriront de nouveaux travaux pour construire des cartes permettant aux utilisateurs de toujours mieux maîtriser leurs espaces informationnels ; c’est l’objectif de la cartographie sémantique.



[1] D’après le Trésor de la Langue Française, l’appréhension est la faculté de saisir par l’intelligence et plus particulièrement, toute opération intellectuelle relativement simple ou immédiate, soit de perception, soit de jugement, soit de mémoire, soit d’imagination, considérée comme s’appliquant à un contenu distinct de l’opération elle-même.

[2] Fonction complexe multiple regroupant l’ensemble des activités mentales (pensée, perception, action, volonté, mémorisation, rappel, apprentissage) impliquées dans la relation de l’être humain avec son environnement et qui lui permettent d’acquérir et de manipuler des connaissances (associations, rétroaction, traitement de l’information, résolution de problèmes, prise de décision etc.). (Le Grand Dictionnaire Terminologique)

[3] Représenter signifie « rendre présent sous la forme d’un substitut, en recourant à un artifice » (Trésor de la Langue Française).

[4] Le sens de « visualiser » ne correspond pas à l’action de voir – percevoir par le sens de la vue – mais bien à « rendre sensible à la vue ce qui n’est pas naturellement visible » (Trésor de la Langue Française).