SNDF : notre formalisme de description pour la cartographie sémantique

Le cœur de notre approche repose sur la prise en compte de la sémantique du domaine pour guider la cartographie. Cette approche nécessite deux phases importantes :

  1. Expliciter la sémantique : il faut décrire les concepts du domaine ainsi que leurs relations. Cette description définit une modélisation du domaine.
  2. Structurer l’espace informationnel : une fois la modélisation construite, il est nécessaire de structurer l’espace à cartographier selon cette modélisation.

La modélisation joue le rôle d’une lunette d’observation, au travers de laquelle, l’utilisateur va percevoir son espace informationnel (les objets sont décrits selon les concepts du domaine). Cette métaphore illustre l’importance de la modélisation dans la cartographie. La perception de la carte par l’utilisateur est fonction in fine de la modélisation utilisée pour structurer l’espace.

La problématique est alors de savoir quel formalisme de description utiliser pour décrire une modélisation et l’espace informationnel structuré associé.

Nécessité d’un formalisme dédié

Notre problématique nécessite un formalisme dédié car nous avons besoin de décrire des connaissances particulières. En effet, la cartographie sémantique nécessite d’une part de décrire les connaissances du domaine en un ensemble d’entités et de relations entre ces entités et d’autre part elle a besoin de décrire des propriétés de représentation propres aux éléments de l’espace.

Ces deux types de connaissances à décrire sont présentés dans les deux sections suivantes.

Décrire les connaissances du domaine

Notre approche de la cartographie sémantique nécessite un formalisme pour décrire des modélisations et des espaces informationnels structurés. Dans ce dessein, il doit permettre de décrire les concepts du domaine (la modélisation) et les éléments de l’espace informationnel selon ces concepts (espace informationnel structuré).

Toute description d’un ensemble d’informations (ou espace) repose sur un formalisme porteur d’une théorie qui conditionne la définition de concepts. Par exemple en génie logiciel, pour définir un modèle conceptuel des données (MCD), la théorie utilisée est de type entité-association ; une fois le MCD construit, il fournit les concepts (les tables) pour construire la base de données (structuration de l’espace informationnel ; les objets deviennent des tuples). Dans notre cas, les concepts définis selon la théorie doivent décrire la modélisation du domaine et ils sont utilisés pour décrire les objets de l’espace informationnel.

De plus, notre formalisme doit être adapté à notre processus. C’est-à-dire qu’il doit permettre de manipuler plusieurs modélisations simultanément d’un même espace informationnel. Chaque modélisation permet d’exprimer un « point de vue théorique » sur un domaine. Par conséquent, un même « objet » (instance), s’il est lié à un seul concept par la relation d’instanciation dans une modélisation donnée (ou du moins devrait l’être), peut être lié à un autre concept par la même relation dans une autre modélisation. Le même objet peut être appréhendé (conceptualisé) selon plusieurs points de vue théoriques différents. Notre formalisme doit donc permettre de partager les objets entre les modélisations.

Remarque : la théorie du formalisme est parfois aussi nommée « modèle ». Cependant, pour éviter toute confusion avec la modélisation de la cartographie, nous préférons utiliser le terme « théorie ».

Décrire les propriétés de représentation

Une fois structuré par la modélisation, l’espace doit être représenté puis visualisé pour produire des cartes. Les éléments de l’espace sont alors visualisés dans différentes cartes et l’utilisateur peut interagir avec leur représentation (les structures visuelles).

La difficulté avec la cartographie de données abstraites c’est que les données ne possèdent pas de représentation intrinsèque. La construction de l’espace de représentation permet alors d’associer arbitrairement des structures visuelles aux éléments de l’espace structuré (les descriptions d’espaces informationnels structurés vont servir à la construction d’espaces informationnels représentés puis visualisés). Pour assurer une cohérence de représentation et d’interaction entre les cartes, la cartographie attribue généralement aux éléments de l’espace des propriétés communes à leurs structures visuelles dans toutes les cartes. Cette démarche revient à définir une représentation intrinsèque aux éléments de l’espace informationnel. Par conséquent, notre formalisme doit permettre de décrire ces propriétés de représentation pour chaque élément de l’espace informationnel structuré.

Pour conclure sur les besoins, notre problématique est de proposer un formalisme pour d’une part décrire les concepts du domaine et structurer l’espace selon ces concepts et d’autre part, pour définir des propriétés graphiques pour les différents éléments de l’espace (concepts, objets, relations, etc.).

Face à cette problématique, nous avons commencé par étudier les différents formalismes de description existants (principalement les langages de représentation des connaissances issues de l’intelligence artificielle).

Les formalismes de description

La description d’un ensemble d’informations se fait dans un formalisme (ou langage) donné. Chaque formalisme repose sur une théorie qui définit ses principes de description. Le choix d’un formalisme et plus particulièrement sa théorie dépend directement de la nature des connaissances à décrire.

La typologie des connaissances

Il existe différents types de connaissances selon leur nature. À chaque type de connaissances sont associées une ou plusieurs théories et langages qui permettent de les décrire.

Nous pouvons distinguer quatre types correspondant à autant de niveaux de connaissances, chaque niveau reposant sur le ou les niveaux précédents :

›       Niveau ontologique : à ce niveau, les connaissances portent sur la définition des concepts et des relations nécessaires à la description des objets du monde. Ces connaissances sont toujours vraies quel que soit l’état du monde.

›       Niveau des faits : à ce niveau, les connaissances décrivent un état du monde c’est‑à‑dire des faits portant sur les objets (attributs valués) et des relations. Contrairement au niveau précédent, ces connaissances peuvent être vraies ou fausses selon l’état du monde à un moment donné.

›       Niveau des raisonnements : à ce niveau, les connaissances inférentielles (règles d’inférences) permettent de déduire de nouveaux faits.

›       Niveau des heuristiques : les heuristiques guident le raisonnement en gérant par exemple les règles d’inférences potentiellement applicables à un moment donné.

La cartographie sémantique d’un espace informationnel permet de produire des cartes contenant des représentations d’entités de l’espace et de leurs relations. La modélisation sous‑jacente ainsi que l’espace structuré associés à la carte, doivent décrire des entités et des relations entre ces entités. Notre formalisme de description (et sa théorie) doit donc appartenir aux deux premiers niveaux de notre typologie des connaissances.

Par conséquent, nous pouvons écarter les théories correspondant aux raisonnements et aux heuristiques. La carte peut être perçue comme une représentation descriptive et déclarative (ici graphique) du monde.

Remarque : bien que nous écartons les deux derniers niveaux, nous pouvons néanmoins cartographier un espace informationnel correspondant à un raisonnement (ou un heuristique) à condition que sa représentation le permette, par exemple sous la forme de graphes d’états.

Étant donné que nous écartons les deux derniers niveaux de la typologie, le lecteur peut s’interroger sur la cartographie d’un espace informationnel contenant des connaissances de raisonnements ou d’heuristiques. C’est par exemple le cas avec des représentations graphiques de raisonnements comme des graphes d’états ; l’espace informationnel structuré (selon la modélisation) associé à chaque carte contient des descriptions de raisonnement ou d’heuristiques. Dans ce cas, la description appartiendrait aussi aux deux premiers niveaux de notre typologie, niveau des descriptions des objets du monde (raisonnement ou heuristique) et de leurs relations.

La partie suivante présente les principales théories et leur formalisme qui permettent de décrire les objets du monde et leurs relations.

La description des objets du monde et leurs relations

Pour décrire les objets du monde et leurs relations, le domaine de l’intelligence artificielle (IA) offre plusieurs formalismes de description. Chacun d’eux repose sur une théorie propre.

Remarque : les formalismes de description sont généralement nommés « formalisme de représentations ». Cependant, bien que toute description soit nécessairement représentée et pour éviter toute confusion avec la notion de représentation de la cartographie, nous préférons parler de description plutôt que de représentation.

Pour décrire les objets du monde et leurs relations, il existe trois types de formalisme selon leur « degré de formalisation » :

›       Les formalismes « formels » : ces formalismes reposent sur des concepts théoriques forts (comme des opérations formelles de réécriture).

›       Les formalismes « semi-formels » : ces formalismes reposent sur des concepts théoriques plus faibles mais plus proches d’une représentation naturelle des choses.

›       Les formalismes « informels » : ces formalismes correspondent aux langages naturels.

Étant donné que notre objectif est de décrire des ensembles d’informations manipulables par une machine, nous pouvons écarter les formalismes informels.

Les sections suivantes présentent les principaux formalismes (formels puis semi-formels) de description utilisés en intelligence artificielle pour décrire les objets du monde et leurs relations.

Les formalismes « formels »

Les logiques

La logique est à l’origine une réflexion sur la cohérence du discours. Elle trouve ces origines à l’Antiquité grecque. Jusqu’au Moyen-âge, elle constitue une des plus grandes disciplines de la philosophie. La fonction première de la logique est d’assurer la cohérence dans les discours (logos). Par la suite elle est devenue un outil assurant la cohérence dans les raisonnements.

Depuis le XIXème siècle puis au XXème, elle est devenue une discipline mathématique et informatique. Dès lors, la logique se diversifie et de nombreux langages basés sur les principes de la logique voient le jour. On parle alors de logiques formelles ou de langages logiques ou tout simplement de logiques.

Les logiques formelles permettent de décrire des objets et leurs relations [Barr & Feigenbaum, 1982 (p.154)]. Une des raisons qui permettent d’expliquer le succès des descriptions basées sur les logiques, est que la déduction de nouveaux faits à partir d’anciens peut être automatisée. En effet en logique, il existe un ensemble de règles nommées règles d’inférences pour lesquelles les faits connus comme vrais peuvent être utilisés pour déduire d’autres faits alors nécessairement vrais.

Pour la description de connaissances, les deux logiques principales sont : le calcul des prédicats (ou logique des prédicats) et les logiques des descriptions.

Le calcul des prédicats

Le calcul des prédicats est une logique formelle proposée par Frege (1879) puis Russell (1910-1913). Elle est aussi parfois nommée calcul des prédicats du premier ordre ou logique du premier ordre.

Le calcul des prédicats a pour fonction initiale de formaliser des raisonnements logiques. Sa spécificité réside dans l’introduction de plusieurs éléments :

›       un ensemble de symboles désignant des variables,

›       un ensemble de symboles désignant des fonctions,

›       un ensemble de symboles désignant des prédicats,

›       des connecteurs logiques et,

›       deux quantificateurs (représentés par les symboles  » et $ ),

›       des règles d’inférences.

Remarque : on parle de logique du premier ordre car on ne peut quantifier que les variables.

Les logiques des descriptions

Tout comme le calcul des prédicats, les logiques des descriptions sont une logique formelle particulière [Baader et al., 2003; Napoli, 1997]. Elles forment une famille de langages de description de connaissances.

Les logiques des descriptions permettent de représenter les connaissances d’un domaine selon :

›       Des concepts : ils correspondent à des classes d’individus et ils sont organisés en hiérarchies selon une relation de subsomption.

›       Des rôles : ils correspondent aux relations entre les concepts et ils sont aussi organisés en hiérarchies selon une relation de subsomption.

›       Des individus : ils correspondent aux éléments d’un univers donné (le domaine).

Une sémantique est associée aux descriptions par l’intermédiaire d’une fonction d’interprétation.

Ces derniers temps, les logiques de description bénéficient d’un regain d‘intérêt par l’intermédiaire des travaux sur le Web Sémantique et plus particulièrement avec OWL (Resource Description Framework). OWL est un format d’échange basé sur les logiques des descriptions et il constitue la base du Web sémantique.

Les ontologies

Les ontologies sont associées au premier niveau de notre typologie des connaissances : descriptions des objets du monde. Bien que très anciennes, les ontologies font l’objet à l’heure actuelle d’un essor et d’un engouement sans précédent. Cette popularité grandissante n’a malheureusement toujours pas permis d’arriver à un consensus sur le sens même des ontologies [Guarino & Giaretta, 1995; Roche, 2003].

L’ontologie, étymologiquement « ontos » (être) et « logos » (science, langage), s’intéresse à la « science de l’être en tant qu’être ». Elle est donc du ressort de la métaphysique (le terme lui-même apparaît tardivement en 1692, emprunté au latin scientifique ontologia (1646)). Dans son acception actuelle et pour l’étude qui nous intéresse ici, le terme d’ « ontologie » a une signification plus large, il désigne l’ensemble des connaissances relatives à un domaine : objets, concepts, relations et propriétés [Roche, 2005].

Les ontologies ont une visée normative, mais quid de la définition du terme « ontologie » lui-même ? L’omniprésence des ontologies en est peut-être la principale raison.

Nous pouvons néanmoins citer quelques définitions, selon le point de vue considéré :

Celui de la Connaissance :

Les ontologies sont une branche de la gestion des connaissances qui s’intéresse à la représentation et à l’organisation des concepts d’un domaine. La définition la plus citée est celle de Thomas R. Gruber :

« An ontology is a specification of a conceptualization. […] That is, an ontology is a description (like a formal specification of a program) of the concepts and relationships that can exist for an agent or a community of agents. This definition is consistent with the usage of ontology as set-of-concept-definitions, but more general. » [Gruber, 1993]

Celui d’un Vocabulaire Commun :

« An [explicit] ontology may take a variety of forms, but necessarily it will include a vocabulary of terms and some specification of their meaning (i.e. definitions). »[Uschold & Grüninger, 1996]

Voici la définition de John F. Sowa :

« The subject of ontology is the study of the categories of things that exist or may exist in some domain. The product of such a study, called an ontology, is a catalogue of the types of things that are assumed to exist in a domain of interest D from the perspective of a person who uses a language L for the purpose of talking about D. The types in the ontology represent the predicates, word senses, or concept and relation types of the language L when used to discuss topics in the domain D. » [Sowa, 2000]

Pour conclure, voici la définition que nous avons adoptée :

« Une ontologie est une conceptualisation d’un domaine à laquelle sont associés un ou plusieurs vocabulaires de termes. Les concepts se structurent en un système et participent à la signification des termes. Une ontologie est définie pour un objectif donné et exprime un point de vue partagé par une communauté. Une ontologie s’exprime dans un langage (représentation) qui repose sur une théorie (sémantique) garante des propriétés de l’ontologie en termes de consensus, cohérence, réutilisation et partage. » [Roche, 2005]

L’ontologie est une théorie qui permet de décrire les objets du monde (leur essence et leur structure) indépendamment de leurs manifestations particulières.

Pour permettre l’échange et le partage d’ontologie, le W3C a spécifié un langage de description d’ontologies nommé OWL (Ontology Web Language). Il est basé sur les logiques des descriptions et il permet de décrire des ontologies comme étant des terminologies :

« An ontology defines the terms used to describe and represent an area of knowledge. »

Les ontologies OWL sont constituées de concepts et de propriétés (aussi appelés rôles en logiques de description). En OWL, un domaine se compose d’instance de concepts.

Les formalismes semi-formels

Les réseaux sémantiques

Les réseaux sémantiques ont été proposés par Quillian en 1968 pour représenter explicitement un modèle psychologique de la mémoire associative humaine [Barr & Feigenbaum, 1982 (p.156); Sowa, 2000].

Un réseau sémantique est composé d’une part, de nœuds qui peuvent représenter indifféremment des objets, des concepts ou des évènements et d’autre part, de liens (arcs orientés étiquetés) entre les nœuds qui représentent leurs relations. Chaque réseau sémantique est donc une structure de graphe dédiée à la description d’objets et de leurs relations binaires.

De plus, ils peuvent aussi servir de représentation graphique de prédicats binaires de la logique des prédicats [Nilsson, 1980 (p.370)]. Les symboles de variables, fonctions et prédicats sont alors représentés par un réseau de nœuds : les variables et les fonctions sont représentées par des nœuds et les prédicats binaires par des liens.

Les systèmes à base de schémas

Les systèmes à base de schémas ont été introduits en 1932 par le psychologue Frederic Bartlett et mis en œuvre en 1975 par Marvin Minsky [Minsky, 1975].

L’idée à l’origine de ces systèmes est d’imiter le comportement humain face à un problème donné : on recherche dans notre mémoire un modèle que l’on cherche à adapter en changeant un certain nombre de détails. Notre comportement n’est donc pas toujours inférentiel.

Dans le cadre de cette étude, nous nous intéressons aux systèmes à base de schémas pour leur finalité de représentation des connaissances.

Dans son article de référence, Marvin Minsky les définit comme suit :

“A frame is a data-structure for representing a stereotyped situation […]. Attached to each frame are several kinds of information. Some of this information is about how to use the frame. Some is about what one can expect to happen next. Some is about what to do if these expectations are not confirmed. […] Collections of related frames are linked together into frame-systems.” M. Minsky [Minsky, 1975]

Plus concrètement, les systèmes à base de schémas sont composés de structures de données (les schémas) combinant des informations déclaratives et procédurales avec des relations internes prédéfinies [Barr & Feigenbaum, 1982 (p.158)].

Dans leurs mises en œuvre, ils reposent sur quatre notions de base :

›       Les schémas : ils permettent de structurer des données complexes. Selon les approches, les schémas produisent un système uniforme (comme SRL) avec un seul type de schéma ou un système avec une dualité classe-instance (comme Unit).

›       Les attributs : associés aux schémas, ils permettent de définir la structure des données.

›       Les facettes : associées aux attributs, elles définissent leur sémantique.

›       Les relations : elles permettent d’associer des schémas et elles possèdent une sémantique d’héritage (les schémas héritent en général des attributs des autres schémas auxquels ils sont liés).

Remarque : certains auteurs trouvent des similitudes entre les systèmes à base de schémas et les langages de programmations orientés objets : tous deux représentent des classes (les schémas) avec des attributs. Néanmoins il existe de nombreuses différences (relations d’instanciation, mode d’activation des méthodes et des attachements procéduraux, etc.).

Présentation de SNDF

Pour rappel, notre problématique est de proposer un formalisme pour d’une part décrire les concepts du domaine et structurer l’espace selon ces concepts et d’autre part, pour définir des propriétés graphiques pour les différents éléments de l’espace (concepts, objets, relations, etc.).

Bien que notre objectif soit de décrire des connaissances, nous n’avons pas utilisé OWL et RDF. La première raison est qu’ils sont avant tout des formats d’échange. De plus, OWL ne permet pas de décrire des connaissances semi-formelles. RDF, quant à lui, ne permet pas de prendre en compte les contraintes spécifiques à notre problématique comme la définition et la manipulation de plusieurs théories ainsi que l’association d’actions aux entités de l’espace informationnel structuré. C’est donc pour ces raisons que nous avons choisi de proposer notre propre formalisme de description : SNDF pour Semantic Network Description Formalism. Néanmoins nous pouvons, à fin d’échange, traduire nos descriptions en RDF.

SNDF permet de décrire des espaces informationnels structurés par une variante des systèmes à schéma présentant deux facettes :

›       Les connaissances à cartographier :

›       La modélisation : SNDF décrit un ensemble de concepts (entités particulières) et de relations entre ces concepts ;

›       L’espace informationnel structuré : SNDF décrit un ensemble d’entités et leurs relations selon les concepts de la modélisation.

›       Les propriétés de représentations :

›       Descriptions de représentations : SNDF permet de décrire pour chaque élément de l’espace un ensemble d’informations pour construire ses représentations (les structures visuelles).

›       Descriptions des interactions : SNDF permet de décrire pour chaque élément de l’espace une liste d’actions et leur libellé pour décrire leurs interactions (via leurs représentations ; les structures visuelles).

Ces deux facettes de SNDF sont présentées dans les sections suivantes.

Décrire les connaissances du domaine

Les connaissances décrites selon notre formalisme ont pour finalité d’être représentées dans une carte. Nous n’avons alors pas besoin d’effectuer de traitement de type inférences sur ces connaissances. De plus, les formalismes dits « formels » n’introduisent pas de distinction entre prédicats et attributs or nous avons besoin de cette nuance pour exprimer la sémantique d’un domaine.

Par conséquent, nous pouvons écarter les formalismes « formels » (comme les ontologies ou les logiques) et orienter notre choix vers les théories de description semi-formelles. Ces dernières ont l’avantage de permettre de décrire tous types d’entités et de relations tout en proposant une approche souple et une description naturelle des choses.

Plus précisément, nous avons choisi une théorie basée sur les réseaux sémantiques. De plus, nous avons réutilisé la possibilité offerte par les systèmes à bases de schémas d’associer des propriétés aux entités (correspondant aux « slots »). Mais contrairement aux systèmes à base de schémas, nous n’avons pas introduit ici la notion d’attachement procédural mais plutôt la notion de méthode (au sens des langages à objets) pour associer des actions aux entités manipulées.

Ainsi, les connaissances décrites avec SNDF sont exprimées par un ensemble d’entités et un ensemble de relations dont les tuples décrivent les entités en relations. Ensuite, nous avons étendu notre théorie pour permettre à notre formalisme de définir des ensembles d’entités afin de spécifier un domaine pour chaque relation (contraignant ainsi la nature des entités dans la définition des tuples).

Les connaissances manipulées avec notre formalisme sont décrites par un réseau sémantique, c’est-à-dire sous la forme d’un ensemble d’entités liées par des relations (arcs orientés étiquetés).

Pour SNDF, un réseau sémantique est défini par :

›       Un ensemble d’entités (possédant des attributs),

›       Un ensemble de relations entre les entités,

›       Un ensemble d’ensembles contenant tous les ensembles d’entités (utilisés pour définir le domaine des relations).

Le schéma suivant illustre l’utilisation de notre formalisme pour construire une modélisation puis pour structurer l’espace informationnel selon cette modélisation :

 

SNDF pour décrire des modélisations et des espaces informationnels structurés

Chaque description (modélisation ou espace structuré) est construite avec les notions d’entité (ou schéma), d’attribut, d’ensemble et de relation. Ces notions sont décrites dans les sections suivantes.

Entité et attribut

Pour les réseaux sémantiques, les entités peuvent représenter différents types de connaissance : un concept, une idée, un objet, une action, un mot, un processus, une situation, etc.

En revanche dans notre formalisme, les entités ne sont pas que des simples nœuds. Il est possible de caractériser chaque entité par un ensemble d’attributs possédant des valeurs. Les entités peuvent alors être qualifiées de « schémas ». Dans ce cas, le réseau devient un réseau de schémas. De plus, les attributs sont hérités par les relations prédéfinies « est un » et « est instance de ».

Remarque : les attributs sont parfois qualifiés de « relations internes » au schéma pour les distinguer des « relations externes » entre schémas.

Ensemble

La définition de relations, comme décrit dans la section suivante, nécessite de pouvoir définir si besoin est ses propres ensembles d’entités sur lesquels reposent la définition des relations. C’est pourquoi, notre formalisme permet de définir des ensembles et de leur ajouter des éléments (entité, ensemble ou relation).

À la création de tout nouveau réseau sémantique, notre formalisme prédéfini trois ensembles particuliers :

›       « E » : il contient l’ensemble des entités. À la création de toute nouvelle entité, elle est nécessairement ajoutée à cet ensemble et ne peut en être enlevée (sauf si l’entité est supprimée). Une entité appartient donc à au moins un ensemble.

›       « R » : cet ensemble contient toutes les relations du réseau. Toute nouvelle relation est nécessairement ajoutée à cet ensemble. Une relation ne peut appartenir à aucun autre ensemble.

›       « S » : cet ensemble contient tous les ensembles du réseau (l’ensemble des ensembles). Tout nouvel ensemble créé est nécessairement ajouté à cet ensemble et ne peut en être enlevé (sauf si l’ensemble est supprimé). A l’exception de S, les ensembles ne peuvent contenir que des entités ou des relations.

Il existe différents types d’entités selon la nature de la connaissance qu’elles représentent : concept, objet (au sens d’instance d’un concept) et indéterminé (ni concept, ni instance). Toute entité d’un modèle est nécessairement d’un de ces trois types. L’ensemble E des entités est donc partitionné (au sens mathématique du terme) en trois ensembles : « Concepts », « Things » et « Unknown ». Par défaut une entité est de type indéterminé.

Les ensembles prédéfinis (en plus de E, R et S) sont donc :

›       « Concepts » : regroupe les entités déclarées comme étant des concepts ;

›       « Things » : ensemble des entités déclarées comme étant des instances.

Relation

Les entités sont liées entre elles par des relations. La richesse d’un formalisme de description de connaissances dépend directement de la diversité des relations proposées. C’est pourquoi, notre formalisme permet de définir de nouvelles relations et il possède deux relations prédéfinies :

›       « est un » : liant un concept, c’est-à-dire une entité de type concept, à un autre concept ;

›       « est instance de » : liant une « instance », c’est-à-dire une entité de type « things », à un concept ;

Notre formalisme permet également de définir d’autres relations. Chaque relation possède un domaine et un ensemble de tuples. Le domaine permet de contraindre la nature des entités mise en relations. Il est défini par un produit cartésien d’ensembles. Les tuples sont définit par un vecteur d’entité, où chaque entité appartient à l’ensemble correspondant dans le domaine de la relation.

Par exemple avec la relation binaire « est un », son domaine est défini par le produit cartésien de l’ensemble des concepts par lui-même. Ainsi, la relation « est un » ne peut lier entre eux que deux concepts.

La définition de relations nécessite donc de pouvoir définir (si besoin est) de nouveaux ensembles d’entités.

Remarque : notre formalisme est dédié à des descriptions semi-formelles de connaissances. Ce qui signifie qu’il est faiblement contraint. Ainsi, il vérifie que la définition des relations est bien respectée lors de la mise en relation d’entités. Cependant, si la relation « est un » est bien définie sur le produit cartésien Concepts x Concepts et la relation « est instance de » sur Things x Concepts, le formalisme ne contraint pas leur utilisation. Ainsi, même si « l’instanciation multiple dans une même théorie » est à éviter, un objet (entité de l’ensemble Things) peut-être « est instance de » plusieurs concepts. Ce cas ne doit pas être confondu avec celui où un même objet peut être appréhendé par rapport à des théories différentes (modélisations) et peut-être « est instance de » de plusieurs concepts pris dans des modélisations différentes. De même, un concept peut être « est un » de plusieurs autres concepts, même si cela est à éviter d’un point de vue conceptuel.

Partage d’instances entre modélisations

Notre processus ainsi que notre formalisme permettent de manipuler plusieurs modélisations simultanément. Chaque modélisation permet d’exprimer un « point de vue théorique » sur un domaine. Ainsi un même « objet » (instance), s’il est lié à un seul concept par la relation d’instanciation dans une modélisation donnée (ou du moins devrait l’être), peut être lié à un autre concept par la même relation dans une autre modélisation. Le même objet peut être appréhendé (conceptualisé) selon plusieurs points de vue théoriques différents. Notre théorie permet donc de partager les objets entre les modélisations.

 

SNDF : notre formalisme permet le partage d’objets entre deux modélisations

Décrire les propriétés de représentations

Une fois structuré par la modélisation, l’espace doit être représenté puis visualisé pour produire des cartes. Les éléments de l’espace sont alors visualisés dans différentes cartes et l’utilisateur peut interagir avec leur représentation.

La construction de l’espace de représentation permet d’associer des structures visuelles aux éléments de l’espace structuré (les descriptions d’espaces informationnels structurés vont servir à la construction d’espaces informationnels représentés puis visualisés). Pour assurer une cohérence de représentation et d’interaction entre les cartes, la cartographie attribue généralement aux éléments de l’espace des propriétés communes à leurs structures visuelles dans toutes les cartes.

Cette facette de notre formalisme permet d’attribuer une représentation intrinsèque aux éléments de l’espace informationnel.

SNDF permet de décrire ces propriétés pour chaque élément de la modélisation et de l’espace informationnel structuré.

Les descriptions de représentations

Lors d’une opération de représentation, des structures visuelles sont construites par une opération pour représenter des éléments de l’espace informationnel. Chaque structure visuelle peut être décrite par un ensemble de valeurs associées aux différentes variables visuelles (comme une forme, une taille, une couleur, etc.). Ces couples (variable et valeur) doivent être précisés lors des opérations qui permettent de construire les structures visuelles.

Par exemple, imaginons que l’on souhaite construire une carte contenant un ensemble d’entités représentées chacune par un cercle rouge. Dans ce cas, on utilise une opération de représentation pour construire les structures visuelles de chaque entité en lui passant en paramètre la couleur et la forme (cercle rouge). Ce mécanisme est simple et la description est courte.

Nous savons et c’est souvent le cas, qu’il est possible de construire plusieurs cartes différentes d’un même espace informationnel structuré. Pour assurer une certaine cohérence de représentation entre les cartes, une entité possède généralement une représentation similaire (mais pas nécessairement identique) entre les différentes cartes.

Par exemple imaginons la cartographie décrite par le schéma suivant :

 

Les cartes ont des structures visuelles similaires

Dans cet exemple, on souhaite produire deux cartes différentes du même espace informationnel. Ces deux cartes possèdent chacune un espace informationnel représenté différent obtenu par une série d’opérations de représentation. Néanmoins, les entités ont des représentations similaires dans toutes les cartes. Par exemple, l’entité « e1 » est représentée par un carré noir dans les deux cartes et les tuples de la relation « r2 » sont représentés en orange dans les deux cartes.

Notre objectif est alors de garantir cette cohérence graphique entre les cartes pour ne pas perturber les utilisateurs. De plus, pour construire les structures visuelles de chaque carte, il est nécessaire d’effectuer une série d’opérations de représentation paramétrée par la description des structures visuelles souhaitée (forme, taille, couleur). Si l’on construit plusieurs cartes d’un même espace, pour chaque carte et pour chaque élément à représenter, il faut utiliser des opérations de représentation paramétrées avec les mêmes valeurs.

Pour parvenir à notre objectif – garantir une cohérence graphique entre les différentes cartes et faciliter les opérations de cartographie –, SNDF permet d’associer aux éléments du réseau sémantique une liste de descriptions de représentation. Chaque description de représentation correspond alors à un ensemble de valeurs pour les variables visuelles.

Elles ne sont pas les représentations mais uniquement les différentes valeurs de quelques variables visuelles qui serviront pour construire chaque représentation (les structures visuelles). Le nombre de descriptions n’est pas limité étant donné qu’un élément (entité, relation ou tuple) peut avoir plusieurs représentations (à raison d’une ou plusieurs représentations par carte dans une ou plusieurs cartes).

Lors des opérations de création des structures visuelles, il suffit alors de préciser la description à utiliser.

Les éléments possèdent une liste de descriptions de représentations

Notre formalisme offre donc la possibilité d’associer une liste de descriptions de représentations à tous les éléments du réseau sémantique (entité, relation, tuple, etc.), et ainsi de garantir une cohérence graphique entre les différentes représentations d’un même élément de l’espace informationnel.

Les interactions par actions

Dans la section précédente, nous avons vu que pour des raisons de cohérence, un élément de l’espace informationnel possède généralement une représentation similaire dans toutes les cartes. Cette constatation est aussi valable pour les actions qui leur sont associées.

Avec l’informatique, les cartes sont devenues interactives et l’utilisateur peur interagir avec ses différents éléments (ces interactions se font généralement avec la souris). C’est par exemple le cas, lorsque l’on souhaite ouvrir une ressource externe associée à une entité (comme un document ou une page Internet). À chaque interaction correspond une action et par conséquent à chaque élément est associée une liste d’actions.

Ce mécanisme d’interaction est extrêmement fréquent et il est surtout très intuitif. On le retrouve par exemple dans les explorateurs de fichiers : le système de fichier est représenté dans un panneau latéral par une liste indentée et le contenu du répertoire courant est représenté dans un panneau central par des icônes. Chaque panneau correspond à une carte et les actions accessibles par l’utilisateur pour un objet donné (répertoire, fichier, etc.) sont communes aux deux cartes (les menus contextuels sont identiques).

Ces interactions sont donc assimilables à une liste d’actions proposées à l’utilisateur et cette liste est partagée par toutes les représentations d’un même élément. Par conséquent, SNDF permet de définir pour chaque élément du réseau sémantique une liste d’actions. À chaque action est associé un libellé descriptif.

Synthèse

Nous avons vu SNDF (Semantic Network Description Formalism) notre formalisme de description pour décrire d’une part, les connaissances du domaine en un ensemble d’entités et de relations entre ces entités et d’autre part des propriétés de représentation pour ces entités et ces relations.

Pour décrire les connaissances du domaine, SNDF a un double objectif. D’une part, il permet d’expliciter la sémantique du domaine en décrivant une modélisation et d’autre part, il décrit l’espace informationnel structuré selon cette modélisation. SNDF repose sur les réseaux sémantiques et les systèmes à base de schémas. Des premiers, il exploite la capacité de décrire des connaissances par un ensemble d’entités et de relations entre ces entités et des seconds, il reprend la possibilité d’ajouter aux entités un ensemble d’attributs valués. Pour véhiculer au mieux la sémantique du domaine dans la carte, notre formalisme permet aussi de définir un domaine (produit cartésien d’ensembles) pour chaque relation.

Pour décrire les propriétés de représentation pour les éléments du réseau sémantique, SNDF associe aux éléments (entités, relation ou tuple) des informations dédiées à la cartographie comme une liste de descriptions de représentation (la description des structures visuelles) et une liste d’actions pour les interactions.

Pour synthétiser, notre formalisme permet de décrire l’espace informationnel structuré par une variante de réseau sémantique présentant deux facettes :

  • Les connaissances à cartographier :
    • La modélisation : SNDF décrit un ensemble de concepts (entités particulières) et de relations entre ces concepts ce qui permet de gérer différentes théories pour modéliser un même ensemble d’objets ;
    • L’espace informationnel structuré : SNDF décrit un ensemble d’entités et leurs relations selon les concepts de la modélisation.
  • Les propriétés de représentations :
    • Descriptions de représentations : SNDF permet de décrire pour chaque élément de l’espace un ensemble d’informations pour construire ses représentations (les structures visuelles).
    • Descriptions des interactions : SNDF permet de décrire pour chaque élément de l’espace une liste d’actions et leur libellé pour décrire leurs interactions (via leurs représentations ; les structures visuelles).

SNDF est notre formalisme de description dédié à la cartographie sémantique.