Notre processus de cartographie sémantique

La section précédente présente notre approche de la cartographie qui consiste à exploiter la sémantique du domaine et les retours des utilisateurs pour cartographier un espace informationnel afin de répondre à leurs besoins. Face à ce nouvel enjeu et à la vue des travaux existants, nous avons été amenés à définir un cadre théorique général pour appréhender la cartographie sémantique.

Des données à la carte

La cartographie de données abstraites est un processus qui permet de passer d’un espace informationnel à une carte en appliquant certaines techniques de représentation et de visualisation. Dans la littérature, ces techniques sont assimilées à des opérations.

En accord avec les approches courantes, l’espace informationnel que l’on souhaite cartographier doit tout d’abord être représenté (à l’aide d’opérations de représentation). On obtient alors un ensemble d’objets graphiques nommés « structures visuelles ». Ensuite, cet « espace informationnel représenté » doit être visualisé (à l’aide d’opérations de visualisation) pour une obtenir une vue (la carte). Étant donné qu’il existe plusieurs opérations de représentation, il est possible d’obtenir un très grand nombre de représentations différentes d’un même espace informationnel. De même avec les opérations de visualisation, il est possible d’obtenir une grande quantité de visualisations différentes d’un même espace informationnel représenté.

La cartographie de données abstraites est donc assimilable à un ensemble d’opérations appliquées successivement à un espace informationnel que nous qualifions de « brut » (l’espace à cartographier). À chaque opération, l’espace informationnel est traduit vers un autre espace avec au minimum, un espace informationnel représenté et un espace informationnel visualisé (ces différents niveaux sont décrits à la page 33).

Voici un rappel du schéma qui décrit ce processus de cartographie de données abstraites :

Les niveaux de la cartographie de données abstraites : de l’information à sa visualisation. 

Le modèle de référence de la visualisation d’informations correspond à cette approche en niveaux. Les tables de données correspondent à l’espace informationnel. Cependant, ce modèle de référence possède un inconvénient majeur pour répondre à nos besoins : la structuration des informations à cartographier en tables de données.

Pour rappel, le cœur de notre approche repose sur la prise en compte de la sémantique du domaine pour guider la cartographie. Cet objectif implique d’expliciter cette sémantique (à l’aide d’une modélisation). Seulement avec les tables de données, la sémantique est explicitée par le nom des colonnes (nommées « métadonnées »). Par conséquent, elle est limitée et elle n’est pas facilement manipulable. Sans ou avec peu de sémantique, les données à cartographier restent des données « sans sens », c’est pourquoi nous nommons cette approche : « des données à la carte ».

Notre objectif est d’associer la sémantique du domaine à la cartographie ce qui revient à passer des données aux connaissances c’est pourquoi, nous nommons notre approche : « des connaissances à la carte ».

Dans ce dessein, nous proposons un nouveau processus dédié à la cartographie sémantique.

Des connaissances à la carte

Le cœur de notre approche repose sur la prise en compte de la sémantique du domaine pour guider la cartographie selon les besoins des utilisateurs. Cette approche implique tout d’abord d’expliciter cette sémantique.

Explicitation de la sémantique

Dans le cadre de nos travaux, nous définissons la sémantique du domaine comme l’ensemble des concepts permettant d’appréhender les objets du monde (le domaine). Par extension et en d’autres termes, la sémantique d’un domaine correspond à l’ensemble de ses concepts.

Pour expliciter la sémantique, nécessaire à notre approche, il faut donc décrire les concepts du domaine ainsi que leurs relations [Roche, 2005]. Cette description définit alors une modélisation des connaissances du domaine.

Pour rappel, nous considérons les connaissances d’une organisation comme l’ensemble de son patrimoine intellectuel caractérisé par ses connaissances explicites (l’espace informationnel contenant les documents, projets, retours d’expérience, etc.…) et les connaissances tacites détenues par les collaborateurs et les experts (les expériences, le savoir-faire, etc. …).

L’explicitation de la sémantique se fait par la modélisation des connaissances conceptuelles du domaine. La première étape dans le processus de cartographie sémantique consiste donc à modéliser le domaine.

Plusieurs modélisations (et structurations) d’un même espace informationnel

Chaque collaborateur d’une organisation possède sa propre vision de son domaine et par conséquent, chaque collaborateur possède aussi ses propres connaissances sur ce domaine. Il est donc nécessaire de proposer un processus de cartographie capable de supporter plusieurs modélisations du domaine correspondant à autant de points de vue théoriques différents.

Pour illustrer la possibilité de concevoir plusieurs modélisations d’un même monde, prenons l’exemple de la lumière. Dans un premier cas, la lumière peut être modélisée selon un point de vue corpusculaire : « la lumière est un flux qui contient des particules ». Dans un second cas, la lumière peut être modélisée selon un point de vue ondulatoire : « La lumière est une onde ». Ces deux points de vue théoriques produisent donc bien deux modélisations différentes.

Pour permettre aux utilisateurs de naviguer dans l’espace informationnel selon cette sémantique, il est alors nécessaire de restructurer l’espace informationnel de départ (brut) selon la modélisation des connaissances du domaine. Le résultat est alors un nouvel espace que nous qualifions d’espace informationnel structuré.

La deuxième étape dans le processus de cartographie sémantique consiste donc à structurer l’espace informationnel à cartographier. Nous nommons le résultat, « l’espace informationnel structuré ».

Plusieurs représentations d’un même espace informationnel structuré

Une fois structuré, l’espace informationnel doit être représenté graphiquement. C’est-à-dire, qu’il est nécessaire de créer un nouvel espace constitué de structures visuelles. Comme nous l’avons vu précédemment, il existe de nombreuses techniques de représentations qui peuvent être combinées pour réaliser une représentation.

La représentation de l’espace informationnel doit permettre de répondre à notre besoin d’adapter les cartes à l’utilisateur avec une navigation basée sur la sémantique du domaine.

Chaque utilisateur possède un profil particulier (avec une activité et un niveau d’expertise donné). Une représentation unique ne peut donc convenir. Il est donc nécessaire de proposer un processus de cartographie capable de supporter plusieurs représentations d’un même espace informationnel structuré correspondant à autant de cartes différentes. La modélisation permet alors de sélectionner les opérations de représentations qui respectent la sémantique.

L’application d’opérations de représentations permet de construire des espaces de nature graphique qui seront perçus par les utilisateurs au travers de leur visualisation. Par conséquent, chaque espace doit (en plus de respecter la sémantique) répondre à des critères esthétiques. En effet, de nombreux travaux dédiés à la représentation de graphes [Purchase, 1997; Ware et al., 2002], présentent le caractère déterminant de l’esthétique dans la compréhension d’un ensemble de données par des utilisateurs. Par conséquent, le choix des opérations doit être guidé par la sémantique du domaine mais aussi par le respect de propriétés esthétiques.

La troisième étape dans le processus de cartographie sémantique consiste donc à représenter l’espace informationnel structuré. Nous nommons le résultat, « l’espace informationnel représenté ».

Plusieurs visualisations d’un même espace informationnel représenté

Pour être perceptible par l’utilisateur, un espace informationnel représenté (par un ensemble de structures visuelles) doit être visualisé. Comme pour la représentation, cette opération de visualisation doit permettre de répondre à notre besoin d’adapter les cartes à l’utilisateur.

En effet, chaque utilisateur possède un support particulier pour afficher la carte (écran, projecteur, papier, etc.) avec des dimensions toutes aussi particulières. Une visualisation unique ne peut donc pas convenir. Il est alors nécessaire de proposer un processus de cartographie capable de supporter plusieurs visualisations d’un même espace informationnel représenté correspondant à autant de cartes différentes.

La quatrième étape dans le processus de cartographie sémantique consiste donc à visualiser l’espace informationnel représenté. Nous nommons le résultat, « l’espace informationnel visualisé » ou « vue » ou bien encore, « la carte ».

Points de vue simultanés & interactions

Lors de la navigation de l’espace informationnel, le point de vue des utilisateurs peut changer tout comme leur activité et leur niveau d’expertise. De plus, il est souvent nécessaire qu’un même utilisateur appréhende simultanément un espace informationnel selon plusieurs points de vue théoriques et pour différentes activités.

Par conséquent, il est nécessaire que le processus de cartographie sémantique ne soit pas linéaire et unique. L’utilisateur doit pouvoir appréhender son espace informationnel selon différents points de vue correspondant à autant de cartes différentes.

Par exemple, prenons le domaine de la cartographie de données abstraites. Imaginons des experts qui souhaitent modéliser graphiquement ce domaine en structurant tous ses concepts. On imagine vite le nombre de concepts à représenter. Étant donné que cette cartographie est pluridisciplinaire, elle met en jeu plusieurs domaines de compétences. Une approche de modélisation pourrait alors consister à représenter chaque domaine dans une vue dédiée ainsi que tous les concepts qui s’y rapportent. Les experts pourraient alors se concentrer sur leur domaine. De même, une vue pourrait aussi être utilisée pour visualiser tous les concepts ou entités liés par une relation particulière.

De plus, l’utilisateur doit pouvoir adapter la cartographie à ses besoins. Concrètement, il doit modifier ou changer les différentes opérations de chacune des cartes pour répondre à ses besoins. Dans ce dessein, notre processus de cartographie doit mettre en œuvre des techniques d’interaction pour adapter les différents espaces.

La cartographie d’un même espace informationnel selon différentes cartes adaptables par l’utilisateur permet de prendre en compte les retours d’expérience. À tout moment l’utilisateur doit avoir une carte adaptée.

La cinquième étape dans le processus de cartographie sémantique consiste donc à donner les moyens à l’utilisateur pour adapter sa carte (l’espace informationnel visualisé). À chaque interaction, la cartographie est mise à jour en réitérant les étapes nécessaires. Le processus de cartographie sémantique est donc cyclique.

Description du processus

Notre approche permet de cartographier sémantiquement en une ou plusieurs cartes un même espace informationnel.

La construction de chaque carte peut être assimilée à un ensemble d’opérations permettant de passer successivement par :

  1. Un espace informationnel brut : il s’agit de l’espace initial que l’on souhaite cartographier.
  2. Un espace informationnel structuré : cet espace est obtenu par une opération de structuration de l’espace informationnel basée sur une modélisation construite au préalable.
  3. Un espace informationnel représenté : cet espace est obtenu par des opérations de représentation de l’espace informationnel structuré (le choix des opérations est en accord avec la modélisation).
  4. Un espace informationnel visualisé : cet espace est obtenu par des opérations de visualisation de l’espace informationnel représenté (le choix des opérations est, lui aussi, déterminé en accord avec la modélisation).
  5. Une carte adaptée : l’utilisateur adapte ses cartes en interagissant avec les différents espaces de la cartographie.

Voici donc un schéma qui illustre notre processus de cartographie sémantique :

 

Notre processus de cartographie sémantique

Le processus de cartographie sémantique n’est pas un processus linéaire. Tout d’abord, pour un espace informationnel donné, notre processus permet d’en construire plusieurs structurations (selon plusieurs modélisations). Ensuite, pour un espace structuré donné, notre processus permet d’en construire plusieurs représentations. Et enfin, pour un espace représenté donné, il est possible d’en avoir plusieurs visualisations.

Voici une illustration avec un exemple simple de cartographie d’organigramme de collaborateurs selon différentes opérations :

 

Illustration de notre processus avec un organigramme

Notre proposition de processus assimile la cartographie sémantique à une succession de changements d’espaces effectués par des opérations.

Les espaces

Notre processus introduit la notion abstraite d’espace pour décrire le contenu de chaque étape de la cartographie. Cette notion abstraite permet de décrire symboliquement les espaces selon la nature de leurs éléments (abstraite, graphique ou visuelle). Ainsi dans notre processus, chaque espace possède sa propre théorie pour exprimer les éléments qu’il contient.

Remarque : cette approche symbolique permet pour décrire chaque espace, d’utiliser des théories issues de l’intelligence artificielle (comme la théorie des relations, la logique, les réseaux sémantiques, etc.) [Gordon, 2000; Sowa, 2000].

Dans notre processus, nous distinguons quatre natures d’espaces : brut, structuré, représenté et visualisé. Pour construire une carte, il est nécessaire de passer par au moins un espace de chaque nature. En effet, il est impossible de passer d’un espace informationnel à une carte sans passer par une représentation et une visualisation. Chaque espace est un prérequis pour construire l’espace suivant.

Les opérations

Les opérations sont les transformations appliquées aux espaces. D’un point de vue opérationnel, le processus de cartographie sémantique est assimilable à une succession d’opérations.

Chaque opération porte sur un espace et produit un nouvel espace. Par exemple, une opération de type zoom permet de passer d’une vue (espace informationnel visualisé) à une autre vue. De même, une opération de distorsion permet de passer d’un espace de représentation (espace informationnel représenté) à un espace de vue. Pour assurer la cohérence du processus, il est nécessaire de s’assurer qu’une opération sur un espace produit un nouvel espace de nature équivalente ou de nature immédiatement inférieure ou immédiatement supérieure.

Changements de nature d’espace possibles lors d’une opération

Chaque opération porte sur un espace (dit initial) et produit un nouvel espace. Elle peut aussi accepter en entrée un ensemble de paramètres utiles aux traitements associés. Par exemple, une opération de type « zoom » porte sur un espace visualisé et elle prend en entrée un vecteur pour paramétrer l’homothétie. De même, une opération de « filtrage » prend en paramètre le critère du filtre.

Cette approche permet de classer les opérations en fonction de la nature de l’espace initial et sur la nature de l’espace produit. Nous avons donc étendu des résultats existants [Card et al., 1999d; Chi & Riedl, 1998; Tweedie, 1997] pour fournir ce classement  des principales opérations possibles entre les espaces :

›       Un espace informationnel brut vers …

  • … un autre espace informationnel brut :
    • Nettoyage des données, traitement des données manquantes, filtrage des données ;
    • … un espace informationnel structuré :
      • Modélisation, structuration, clustering, classification, extraction des variables quantitatives, vectorisation ;

›       Un espace informationnel structuré vers …

  • … un autre espace informationnel structuré :
    • Classification, clustering, recherche de vecteurs, intersection de vecteurs, filtrage des éléments, normalisation ;
    • … un espace informationnel représenté :
      • Codage (création de structures visuelle), répartition dans l’espace de la carte ;
    • … un espace informationnel brut :
      • Construction de valeurs dérivées ;

›       Un espace informationnel représenté vers …

  • … un autre espace informationnel représenté :
    • Filtrage des structures visuelles (selon des propriétés graphiques), fusion, sélection ;
    • … un espace informationnel visualisé :
      • Visualisation, déformation ;
    • … un espace informationnel structuré :
      • Décodage ;

›       Un espace informationnel visualisé vers …

  • … un autre espace informationnel visualisé :
    • Changement de point de vue
      • Rotation, homothétie, défilement, zoom
      • Colorisation, filtrage, permutation d’axes, changement de niveau de détails, estompage, cacher sous arbre, pivoter sous arbre ;

Cette liste d’opération n’est pas exhaustive. Elle a seulement pour objectif de donner une idée des opérations possibles entre les espaces.

Synthèse

Le cœur de notre approche repose donc sur la prise en compte de la sémantique du domaine pour guider la cartographie selon les besoins des utilisateurs. Cet objectif implique d’expliciter cette sémantique à l’aide d’une modélisation qui décrit les concepts du domaine ainsi que leurs relations et ensuite de structurer l’espace informationnel selon cette modélisation.

Notre proposition de processus permet de prendre en compte la sémantique du domaine (au travers de sa modélisation) tout au long de la cartographie. De plus, ce processus permet d’assimiler la cartographie à un ensemble d’opérations permettant de passer successivement par : un espace informationnel brut, un espace informationnel structuré, un espace informationnel représenté et enfin, un espace informationnel visualisé.