« Concept Word Variant » : différence entre les versions

De Lillois Fractale Wiki
Aller à la navigation Aller à la recherche
Contenu ajouté Contenu supprimé
Aucun résumé des modifications
Aucun résumé des modifications
Ligne 20 : Ligne 20 :
Actually the concept level is the only level with significant inter-node connectivity.
Actually the concept level is the only level with significant inter-node connectivity.


== Mot ==
== Words ==


Word nodes make the second level of nodes.
Le mot représente le niveau nommable et indexable (OK pour HashSet HashMap...).


Words are namable, and indexable.
Le mot est en O-O un objet dont les attributs sont:


In OO logic, a word is an object whose attributes are:
*une chaine verbale (une chaine de caractères)
*un masque de ''variantes'' ''formelles''
*un identifiant de ''langue''
*des liens vers des concepts


*a string of characters
PAS de liens directs vers des mots, PAS de liens vers des variants. PAS d'état conscient, pas d'excitation.
*a language identifier
*one or many ''formal mission'' (like verb or noun... see below)
*links to concepts (CW links)
*links to variants (WV links)


A word is not directly linked to other words. For instance, the translation process in Alex II always goes (up and down) thru the concept level.
La clé d'identification du mot contient les 3 premiers attributs juxtaposés. Donc ''orange'' (en anglais) et ''orange'' (en français) sont des mots distincts. De même ''noyer'' (substantif) et ''noyer'' (verbe) sont des mots distincts.<br>

A word never receives excitation in a conscience or focus.

The indexation key contains the combination of the 3 first fields:

*string
*language
*formal mission

Thus orange (in french) and ornage (in english) are distinct words. Similarly, noyer (verb, french) and noyer (verb, noun) are distinct words.


== Variant ==
== Variant ==

Version du 28 février 2010 à 17:02

This page is part of the Alex II desciption.

It describes 4 levels of perceptions and 3 kind of nodes:

  • Concept (node)
  • Word (node)
  • Variant (node)
  • Input

Concept

By itself a concept has no name (and no indexation key).

However some concepts receive conventional names, and enter into some classification. Amon the concepts, some play a specific role: the connecting concepts.

At the conscience/focus level, concepts receive excitation figures.

A concept mainly exists thru the links it has with word nodes (CW links), and thru the qualified links it has with other concepts (QC links).

Actually the concept level is the only level with significant inter-node connectivity.

Words

Word nodes make the second level of nodes.

Words are namable, and indexable.

In OO logic, a word is an object whose attributes are:

  • a string of characters
  • a language identifier
  • one or many formal mission (like verb or noun... see below)
  • links to concepts (CW links)
  • links to variants (WV links)

A word is not directly linked to other words. For instance, the translation process in Alex II always goes (up and down) thru the concept level.

A word never receives excitation in a conscience or focus.

The indexation key contains the combination of the 3 first fields:

  • string
  • language
  • formal mission

Thus orange (in french) and ornage (in english) are distinct words. Similarly, noyer (verb, french) and noyer (verb, noun) are distinct words.

Variant

Le variant est le concept le plus simple et basique.

Un variant est rattaché à 1! mot, et n'existe que par ce lien.

Les variants représentent les variantes plurielles, féminines et conjuguées. Chevaux est un variant de cheval. Coquettes et un variant de coquet. Voyez est un variant de voir. Un variant peut être constitué d'une chaine verbale qui existe également en tant que mot. Donc été (forme conjuguée, variant de être) coexiste avec été (mot, substantif).

L'indexation des variants se fait sur un clé comprenant, outre la forme verbale du mot, l'identifiant de la langue et celui de la variante verbale.

Le variant est en O-O un objet dont les attributs sont:

  • une chaine verbale (une chaine de caractères)
  • un identifiant de variante verbale
  • un identifiant de langue
  • un lien vers un mot (un seul)

Objets mineurs complémentaires

langue: anglais, français,...  La langue caractérise un objet de classe mot ou un objet de classe variant.

variante formelle: verbe, nom, adjectif, ... La variante formelle caractérise un objet de classe mot.

variante verbale: pluriel, féminin, formes conjugées... La variante verbale caractérise un objet de classe variant.

Concepts Connecteurs

Les concepts connecteurs interviennent dans les liens comme tiers spécialisés. Ils ne constituent pas une extrémité du lien, mais plutôt ils caractérisent la nature du lien.

Du point de vue O-O, les concepts connecteurs constituent une sous-classe des concept (??note?? utile? ou bien tous les concepts sont susceptibles de devenir connecteurs?) 

Les concepts connecteurs sont relativement peu nombreux et on peut en faire un inventaire.

  • suivant (4 - suivant - 5)
  • précédent (5 - précédent -4)
  • double (4 - double -8)
  • moitié (8 - moitié - 4)
  • appartenance (élément membre d'un ensemble) (chat - appartenance - mammifère)
  • inclusion (un ensemble dans un ensemble) (mammifère - appartenance - vertébré - appartenance - animal)
  • contraire (~inverse ~opposé) (dessus - contraire - dessous)
  • négation (fini - négation - infini)
  • verbe->-nom (câbler - verbe-nom - câbler)
  • verbe->-nom (voir - verbe-adjectif - visible)
  • ...

Le nombre et la richesse des connecteurs détermine pour une bonne part les potentialités du réseau à construire.

Si le réseau doit être construit séquentiellement, les concepts connecteurs seront normalement créés en priorité.

Liens simples (bipolaires) et liens connections (tripolaires)

Un lien simple lie de manière floue 2 concepts

Un lien connection lie de manière spécialisée 2 concepts, sous la signification d'un troisième qui est un concept connecteur.

D'un point de vue O-O, une seule classe existe: le lien. Un lien bipolaire est un lien tripolaire dont le concept connecteur est resté indéfini (null).

Les liens tripolaires forment une sous-population (et non une sous-classe) des liens.

Dans tous les cas, et comme dans Alex I, les liens sont églamenet caractérisés par les attributs suivants:

  • deux perméabilités - grandeurs scalaires -, une pour chaque sens de parcours.
  • deux signaux - valeurs transitoire servant à propager les états excitations,  une pour chaque sens de parcours.

Identification des variants, mots et concepts

Pour nommer un variant on utilise: chaine|langue|variante-verbale.

Exemples :

  • chevaux|F|P         (F=Français P=Pluriel)
  • voyez|F|P2           (P2=Pluriel 2ème personne)

Pour nommer un mot utilise : chaine|langue|variante-formelle.

Exemples:

  • rose|F|N     (N=Nom)
  • rose|F|A      (A=Adjectif)
  • rose|E|N pink|E|A

On ne peut nommer directement un concept.

Evocation et manifestation

On ne peut nommer, mais on peut évoquer - de manière floue - divers concepts via les mots ou variants qui y sont directement ou indirectement liés. Un ensemble de mots et de variants évoque directement un ensemble de concepts, avec divers facteurs de pondération, et indirectement... beaucoup de choses interconnectées...

Par ailleurs lorsqu'il communique et se présente (lors d'états d'excitation par exemple), le concepts se manifeste par certains mots qui lui sont liés. Le choix des mots utilisés au moment de la manifestation du concept dépend éventuellement de la configuration des excitations au moment de la manifestation.

Cinq couches d'évocation/manifestation

Les 5 couches EM sont:

  1. input : n'importe quelle chaine de caratères (introduite sur un clavier ou générées par un canal sensoriel)
  2. u-variant (unqualified variant) : l'ensemble des mots-variants connus, organisés par langue, et sans plus de propriétés (1 HashSet par langue)
  3. q-variant (qualified variant) : l'ensemble des mots-variants connus, organisés par langue, avec spécification de variante verbale (1 HashSet par langue,avec la spécification de variante verbale dans la clé)
  4. mot : l'ensemble des mots de bases, soit à peu près la notion habituelle de dictionnaire (1 HashSet par langue, avec la spécification de variante formelle dans la clé).
  5. concept : le concept (pas de HashSet, pas de clé).

Processus ascendant (évocation):

  • 1-2: distance entre mots : lousse évoque louse(E) lousy(E) loss (E) pousse (F) mousse(F) loupe (F).... Parfois un variant est correct (distance 0) dans une ou plusieurs langue (plane(e) et plane(F)), mais cela n'empêche pas l'évocation des variants à distance non nulle.
  • 2-3: chaque u-variant possède un HashSet contenant les q-variants dont il partage l'écriture.
  • 3-4: chaque q-variant est lié à 1! mot
  • 4-5: chaque mot est lié à divers concepts, et conteint un ensemble de liens flous les liant à eux

Processus descendant (manifestation)

La manifestation a toujours lieu au sein d'un contexte de communication (choix de langue) et d'un contexte de conscience.

La manifestation part d'un contexte et va jusqu'au mot(s), parfois plus loin jusqu'aux q-variants.

La manifestation part d'un seul concept parfois, mais le plus souvent de tous les concepts significativement excités dans la conscience.

La manifestation cible sur plusieurs mots dont seul le (ou les) mieux liés seront exprimés.

Chaque concept contient un ensemble de liens à perméabilité variable vers divers mots.

La manifestion est un processus de pondération sélectif.

Construction du réseau

Le RRR se construit par étapes:

  1. L'ensemble des variants et l'ensemble des mots sont construits, langue par langue, sur base de dictionnaires spécialisés. Des dictionnaires sont téléchargeables sur Internet, sous le nom de corpus. En français, un corpus est disponible sur le site abu.cnam.fr.
  2. Les liens des variants vers les mots sont construits. Ceci se fait par un programme Java intégré à Alex.
  3. Divers connecteurs (liens tripolaires) sont définis à partir de fichiers de configuration.
  4. Sur base des mêmes fichiers de configuration, les concepts et mots liés par ces connecteurs sont créés, ainsi que les liens concepts-mots et les liens tripolaires.
  5. ... [ à développer]

Limites

Indépendemment des limites générales du projet Alex, la correspondance variants mots concepts soulève encore divers problèmes.

L'une d'eux est celui des expressions. Une expression est une combinaison de mots qui présente un sens distincts de celui qu'impliquent seuls les mots présents. Donc une expression a un lien vers un concept propre.

Exemples français : en avoir marre ; virage en épingle à cheveux ; bouc émissaire ; tête de turc...