Information sur le dictionnaire et son fonctionnement

Voir cette même page avec des illustrations

Sommaire de la page


Les données

Les données que nous proposons sont obtenues à partir de dictionnaires édités et reflètent la diversité des usages de la langue attestés par ces références.

Pour chacune des entrées du dictionnaire, nous avons regroupé les différents liens sémantiques fournis par l'ensemble des ouvrages cités et ajouté de nouveaux liens par une opération de symétrisation.

Cette liste de mots est séparée en composantes connexes. Par définition, deux termes appartiennent à des composantes différentes s'il n'existe aucun " chemin " ou suite de liens qui permettrait de passer de l'un à l'autre par analogie successive.

Pour la vedette distraction le logiciel distingue différentes composantes :

  1. absence, bévue, dispersion, dissipation, démembrement, erreur, gaffe, inadvertance, inapplication, inattention, irréflexion, légèreté, mégarde, négligence, omission, oubli, séparation, étourderie, évagation
  2. agrément, amusement, amusette, antidote, diversion, divertissement, délassement, dérivatif, désennui, détente, détournement, gaieté, jeu, loisir, passe-temps, plaisir, récréation, réjouissance, ébat, ébats, égaiement, évasion
  3. prélèvement
  4. retranchemen

Les unités de sens ou cliques

Les composantes connexes ne suffisent pas toujours à séparer les différents sens. Nous proposons donc des unités plus précises : les cliques.

Ces cliques représentent les unités minimales de sens (dans la perspective de ce modèle). Par définition, tous les termes d'une cliques sont synonymes ou analogues de tous les autres. D'un point de vue mathématique, une clique est un sous-graphe maximal complet connexe.

Pour la vedette faible on trouve, entre autres, les cliques suivantes

1 : abattu, anéanti, faible, fatigué, las
5 : abattu, déprimé, faible, fatigué
14 : affaibli, anémique, anémié, débile, faible
20 : amour, faible, goût, inclination, passion, penchant
34 : anémié, faible, fragile, pâle
50 : bas, bouché, faible, médiocre
51 : bas, faible, insignifiant, modique, médiocre, petit
54 : bas, faible, mauvais, méchant, médiocre
62 : bon, doux, délicat, faible, tendre
109 : chétif, dérisoire, faible, pauvre, petit, piètre
117 : complaisance, faible, faiblesse, prédilection
124 : critiquable, faible, mauvais
131 : doux, facile, faible, malléable, mou
141 : défaut, faible, faiblesse, imperfection, travers, vice
145 : déficient, faible, insuffisant, mauvais, médiocre
151 : délicat, faible, fragile, frêle, grêle, léger, menu, mince
155 : dérisoire, faible, insignifiant, minime, négligeable, petit
171 : faible, faiblesse, goût, inclination, préférence
233 : faible, insuffisant, maigre, méchant, médiocre, pauvre
277 : faible, vulnérable, ébranlable
278 : faible, étouffé

On pourra remarquer sur cet exemple que chaque ligne figure un sens assez précis de contexte et d'emploi.

Le modèle

La géométrie du modèle

Une méthode d'analyse des données, dont on trouvera les détails dans les références citées sur la page de garde, permet d'associer à la requête un espace géométrique. Cette carte (multidimensionnelle) dispose les différents emplois du mot suivant leur voisinage sémantique.

Le logiciel de visualisation affiche les cliques (qui forment les points de la carte) et les mots (qui sont représentés par une région de la carte).

L'origine des axes est le lieu (quand il existe) d'un sens " moyen " ou générique. En s'écartant de ce centre, on trouve des sens plus spécifiques.

Carte de faible : l’emploi nominal à distance de l’emploi d’adjectif. De plus le deuxième axe sépare la notion de quantité du caractère moral ou physique de la valeur quantitative.

La projection de l'espace total sur les deux premières dimensions ne suffit pas toujours à figurer toutes les acceptions du mot requête. Elle privilégie les distinctions principales. L'utilisateur pourra utiliser le bouton " choix des axes " pour générer une nouvelle projection et mettre en évidence des sens qui n'auraient pas été révélés sur la première carte.

Pour la vedette maison on trouvera dans la projection sur les axes 3 et 4 une mise en évidence du sens figuré par les termes : commerce, firme, etc...

Les clusters

Une méthode de catégorisation est aussi disponible. L'utilisateur est invité à choisir un nombre n de classes (compris entre 2 et 6). Le logiciel propose alors une séparation de l'espace en n régions qui sont étiquetées par leur éléments les plus représentatifs.

Pour le terme faible la séparation en deux clusters sépare l’emploi nominal de celui d’adjectif.