Réseaux de similitude -- Aide

Les réseaux de similitude

Les réseaux de similitude sont commandés à la suite de l'obtention d'une matrice (Générateur de matrices). Toutes les matrices obtenues par le générateur de matrice peuvent être analysées par les réseaux de similitude.

Les réseaux de similitude mesurent la ressemblance entre les colonnes d'une matrice. Les réseaux de similitude utilisent les rangées de cette matrice comme des comparateurs. L'algorithme va organiser en réseaux les couples de colonnes en fonction de la ressemblance qu'elles obtiennent de la part des rangées.

On trouvera sur cette page :

Un corpus pour la démonstration
La production d'une matrice
L'algorithme des réseaux de similitude
Première étape - La construction d'une liste des unités comparées avec leurs gains de similitude
Seconde étape - La construction séquentielle des réseaux de similitude
Les fichiers tableurs et graphiques reliés aux résultats des réseaux de similitude
L'analyse discriminante des comparateurs
La relativisation des fréquences
Le retrait progressif des comparateurs les moins discriminants
Les réseaux de similitude sur les matrices de cooccurrences

1. Un corpus pour la démonstration

Nous avons construit un corpus rassemblant 12 courts textes. Ce petit corpus nous permettra de suivre exhaustivement toutes les étapes de l'algorithme des réseaux de similitude.

Les 12 textes ont pour origine :

un article sur le médicament Ritalin,
une allocution de Lucien Bouchard (ex-premier ministre du Québec),
un article sur l'huile d'olive et
un éditorial sur la montée du dollar canadien.

De chacun de ces 4 ouvrages, nous avons extrait 3 paragraphes de longueur semblable. Nous avons ainsi un corpus constitué de 12 textes :

ritalin-1, ritalin-2 et ritalin3;
bouchard-1, bouchard-2 et bouchard-3;
huile-1, huile-2 et huile-3;
dollar-1, dollar-2 et dollar-3.

Puisque, par groupe de 3, les textes ont la même origine, nous espérons que les réseaux de similitude vont réussir à retrouver cette origine (huile, ritalin, bouchard et dollar).

Chacun des textes a reçu 3 catégories de projet :

une catégorie origine, dont les valeurs sont : ritalin, bouchard, huile et dollar;
une catégorie genre dont les valeurs sont : article, allocution et éditorial;
une catégorie document dont les valeurs sont : ritalin-1, ritalin-2, ritalin-3, bouchard-1, bouchard-2, bouchard-3, huile-1, huile-2, huile-3, dollar-1, dollar-2 et dollar-3.

Nous appelons rsdemo ce petit projet Sémato. Voici le corpus en format tableur ou en format linéaire. Examinez rapidement ce corpus dans le format qui vous est le plus familier pour mieux comprendre la suite de la présentation. Vous pouvez aussi ouvrir un projet sur la base de ce corpus et effectuer pas à pas toutes les étapes de la production des réseaux de cette présentation.

2. La production d'une matrice

Une compréhension minimale du générateur de matrices de Sémato est nécessaire à celle des réseaux de similitude. Nous utilisons toutefois des matrices élémentaires pour la présentation des réseaux. Gardez à l'esprit que toutes les matrices produites par le générateur peuvent être analysées par l'algorithme des réseaux de similitude, à l'exception des matrices pondérées, l'algorithme des réseaux de similitude possédant son propre paramètre de pondération.

Pour construire une matrice, on doit exécuter un script. La commande est sous Analyses -- Générateur de matrices -- Saisie des scripts de génération de matrices. Un script contient l'ensemble des fonctions nécessaires à la production d'une matrice et de ses réseaux de similitude. Un script commence et se termine par une parenthèse. À l'intérieur de cette liste, chaque fonction est elle-même une liste (aussi identifiée par des parenthèses) dont le premier élément est le nom de la fonction et les autres éléments la ou les valeurs de son ou de ses arguments. Exemple :

((rangée lemme) (colonne document) (analyse rs) (projet rsdemo))

Nous désirons ici produire une matrice dont les rangées sont les lemmes du corpus et les colonnes, les valeurs de la catégorie de projet document et commander les réseaux de similitude en analyse sur cette matrice.

Construisons cette matrice. Exécuter le script ouvre la fenêtre dans laquelle nous écrivons le script.

Les FM : rangée, colonne, cooccurrence, condition, projection, fréquence-minimum, intervalle-centiles, période-rangée,
période-colonne, matrice-avec-null, construire-concordance, matrice-voir-textes, analyse.

Les VM : notxt, nophr, nopha, catgram, lexème, lemme, lemsem, synap1, synap2, thème, concordance, fréquence,
décade, document, genre, origine.

Entrez ci-dessous le script d'une matrice ou la fonction multi-matrices et ses scripts comme arguments.

Voilà tout ce qu'il faut faire pour obtenir les réseaux de similitude entre les documents de rsdemo sur la base d'une comparaison des lemmes. La page des résultats est présentée ci-dessous. Vous pouvez l'examiner brièvement mais revenez ici pour comprendre l'algorithme.

3. L'algorithme des réseaux de similitude

Étape 1 - La construction d'une liste des unités comparées avec leur degré de similitude
Étape 2 - La construction séquentielle des réseaux de similitude entre les unités comparées

La construction des réseaux de similitude repose sur la matrice construite par le générateur de matrices. La table ci-dessous présente les premières rangées de cette matrice.

La matrice est triée par défaut dans l'ordre alphabétique de la première colonne. Nous l'avons triée ici par l'ordre numérique descendant de la colonne Fréquence qui rapporte dans cette matrice la fréquence totale des lemmes au corpus. Les colonnes Fréquence et Gain de similitude (nous reviendrons sur cette colonne) sont ajoutées par l'algorithme des réseaux de similitude. La matrice obtenue sans la construction des réseaux ne les contiendrait pas. Pour cette raison, le nom du fichier matriciel contient les lettres matrice-réseaux.

lemme/document	Fréquence	bouchard-1	bouchard-2	bouchard-3	dollar-1	dollar-2	dollar-3	huile-1	huile-2	huile-3	ritalin-1	ritalin-2	ritalin-3	Gain de similitude
méditerranéen	12	0	0	0	0	0	0	5	4	3	0	0	0	10
régime	9	0	0	0	0	0	0	4	2	3	0	0	0	7
premier	8	4	1	2	0	0	0	0	0	0	0	1	0	7
Québec	7	2	2	3	0	0	0	0	0	0	0	0	0	6
ministre	6	4	1	1	0	0	0	0	0	0	0	0	0	3
américain	5	0	0	0	1	0	4	0	0	0	0	0	0	1
dollar	5	0	0	0	1	3	1	0	0	0	0	0	0	3
enfant	5	0	0	0	0	0	0	0	0	0	0	0	5	0
taux	5	0	0	0	0	0	4	1	0	0	0	0	0	1
baisse	4	0	0	0	1	0	3	0	0	0	0	0	0	1
canadien	4	0	0	0	2	0	2	0	0	0	0	0	0	2
devise	4	0	0	0	1	2	1	0	0	0	0	0	0	3
économie	4	0	1	0	0	0	3	0	0	0	0	0	0	1

Version complète de cette matrice. Fichier Excel.

4. Première étape - La construction d'une liste des unités comparées avec leurs gains de similitude

Le calcul de similitude

Pour les réseaux de similitude, les colonnes de la matrice (les 12 documents dans notre exemple) sont les unités comparées et les rangées (les lemmes dans notre exemple) sont les comparateurs. Si vous désirez obtenir l'inverse (les lemmes en colonnes et les documents en rangées), vous n'avez qu'à commander une matrice en conséquence.

La matrice nous montre que le comparateur méditerranéen apparaît 12 fois, 5 fois au document huile-1, 4 fois au document huile-2 et 3 fois au document huile-3.

Les réseaux de similitude cherchent la ressemblance entre les couples d'unités comparées, dans notre exemple : la ressemblance entre les valeurs de la catégorie de projet : document. Les réseaux de similitude vont calculer la ressemblance entre chaque couple de documents. Pour ce faire, on devra commencer par examiner la ressemblance que procure chaque comparateur à chaque couple de documents.

Chaque comparateur donne à chaque couple la plus petite des deux fréquences que les membres du couple réalisent. Le principe de similitude est simple : deux unités comparées se ressemblent sur la base de la fréquence minimum du comparateur qu'ils ont en commun, on appellera ce minimum leur gain en similitude. Ainsi, le couple huile-1 huile-2, dont les deux membres réalisent respectivement 5 et 4 occurrences du comparateur méditerranéen, reçoit 4 points de similitude de cette comparaison. Le couple huile-1 huile-3 reçoit 3 points et le couple huile-2 huile-3 reçoit aussi 3 points. Le comparateur méditerranéen ne donne pas de points à d'autres documents (que des 0 dans les autres cellules de la rangée). Si la plus petite des deux valeurs est 0, le couple ne reçoit aucun point du comparateur. Au total, le comparateur méditerranéen aura donné 10 points de gain en similitude (4 + 3 + 3). Ce total se retrouve dans la dernière colonne (Gain de similitude) et on expliquera ci-dessous l'apport de cette colonne au calcul global de similitude.

L'algorithme rassemble par la suite, pour chaque couple (il y en a 55 dans notre petit corpus), tous les points donnés par les comparateurs. Par exemple, le couple huite-1 huile-3 obtient 16 points de la part de 12 comparateurs (somme de la colonne minimum) :

Comparateur	huile-1	huile-3	minimum
régime	4	3	3
méditerranéen	5	3	3
Willett	1	1	1
pyramide	1	2	1
professeur	2	1	1
présenter	1	1	1
nutrition	1	1	1
montrer	1	1	1
étude	2	1	1
année	1	1	1
alimentation	2	1	1
alimentaire	1	1	1

L'algorithme des réseaux de similitude construit ainsi une liste de tous les couples avec pour chacun le total des points de similitude que leur auront donné les comparateurs. Voici le début de cette liste pour notre exemple (la liste complète contient 55 couples) :

Unité-1	Unité-2	Gain en similitude
huile-1	huile-3	16
huile-1	huile-2	13
huile-2	huile-3	11
dollar-1	dollar-3	10
bouchard-1	bouchard-3	9
ritalin-2	ritalin-3	6
dollar-1	dollar-2	6
bouchard-1	bouchard-2	6
ritalin-1	ritalin-2	5
dollar-3	huile-1	5
dollar-2	dollar-3	5
bouchard-2	bouchard-3	5
bouchard-2	dollar-2	4
dollar-2	ritalin-3	4
ritalin-1	ritalin-3	4
bouchard-1	dollar-2	3

Cette liste ordonnée des couples d'unités comparées munis de leur gain en similitude alimentera la séquence de construction des réseaux de similitude.

5. Seconde étape - La construction séquentielle des réseaux de similitude

L'ensemble de couples et de valeurs peut être représenté comme un réseau, un ensemble de noeuds et de liens. Dans notre exemple, chaque valeur de la catégorie de projet document est un noeud et les noeuds sont liés entre eux par des liens qui ont comme valeur le résultat du calcul de similitude expliqué ci-dessus et qui relie, par exemple, les deux noeuds huile-1 et huile-3 par la valeur 16. Voici le graphe de l'ensemble des 12 valeurs de la catégorie document reliées par les points de similitude trouvés à l'étape #1 :

Comment peut-on isoler dans ce graphe les relations de ressemblance les plus fortes ? Globalement, c'est à cette question que tente de répondre l'algorithme des réseaux de similitude. Dans le réseau total, toutes les relations de similitude sont exprimées. Le réseau qui montre tous les liens entre tous les noeuds contient des relations de similitude fortes et des relations de similitude faibles. Chacun des documents du réseau total ressemble minimalement à un autre document, mais dans ce groupe de 12 textes, certains se ressemblent plus que d'autres. Peut-on trouver le seuil de ressemblance en deçà duquel deux unités comparées se dissemblent relativement plus qu'elles ne se ressemblent ? Quand on aura trouvé ce seuil, on pourra retirer les relations dont la valeur est en deçà et le graphique des réseaux ne conservera alors que les liens de ressemblance les plus significatifs. C'est ce que l'on cherche. On cherche la configuration des réseaux construits par les liens de similitude les plus forts. C'est ce qu'on appelle la configuration focus, suivant la métaphore de l'image la plus nette, de l'image nettoyée des relations faibles. La configuration focus montre le maximum de proximité dans chaque réseau pour un maximum de réseaux différents.

La configuration focus est un point de bascule, un seuil en quelque sorte. Il n'y a pas toujours de configuration focus. Cela dépend du groupe d'objets comparés et de la base de la comparaison. Nous verrons ci-dessous l'ensemble des conditions formelles requises.

Les réseaux de similitude se construisent par une séquence d'inscriptions. Une inscription est composée d'un couple d'unités comparées muni de son gain de similitude. Les inscriptions sont ordonnées par gain de similitude décroissant.

Le résultat consiste en une table où chaque rangée correspond à un couple d'unités comparées. Il y aura autant d'inscriptions dans cette table que de couples ayant reçu un degré de similitude non nul dans la liste construite à l'étape #1 (55 couples). La séquence d'inscription suit l'ordre descendant des gains de similitude.

Retour sur la présentation de l'algorithme des réseaux de similitude

Vous trouverez ci-dessous la page de résultats de la construction de la matrice suivie des réseaux de similitude. Cette page est le résultat global des réseaux de similitude. Elle donne accès à la matrice construite et présente l'ensemble des inscriptions. Elle informe s'il y a eu configuration focus ou non. Dans l'affirmative, un lien vous y mène directement. Examinez rapidement cette page avant de poursuivre...

Script de la matrice
((rangée lemme) (colonne document) (analyse rs) (projet rsdemo))

Construction de la matrice

Matrice : rangées = 514, colonnes = 12, total des fréquences = 738

Voici le lien pour récupérer la matrice en version WEB : G0196576521-matrice-réseaux.asp
Voici le lien pour récupérer la matrice en format texte (.txt) : G0196576521-matrice-réseaux.txt (17323 octets)

Construction des réseaux de similitude sur cette matrice
L'option relativisation (sur 100) des fréquences des comparateurs est désactivée.
L'option retrait progressif des comparateurs les moins discriminants est désactivée.

Nombre de comparateurs retenus pour les réseaux = 514
Configuration focus trouvée au poids = 109.33
Les fichiers associés aux réseaux sont accessibles au bas de cette page.

Numéro de l'inscription et lien sur les comparateurs Inscription Gain Configuration des réseaux Poids de la configuration Nombre de réseaux Nombre d'inscrits (sur 12)

1 huile-1, huile-3 16
Réseau Poids du réseau
huile-1, huile-3 8

8 1 2

2 huile-1, huile-2 13
Réseau Poids du réseau
huile-1, huile-3, huile-2 9.67

9.67 1 3

3 huile-2, huile-3 11
Réseau Poids du réseau
huile-1, huile-3, huile-2 13.33

13.33 1 3

4 dollar-1, dollar-3 10
Réseau Poids du réseau
huile-1, huile-3, huile-2 13.33

dollar-1, dollar-3 5

36.67 2 5

5 bouchard-1, bouchard-3 9
Réseau Poids du réseau
huile-1, huile-3, huile-2 13.33

dollar-1, dollar-3 5

bouchard-1, bouchard-3 4.5

68.5 3 7

6 ritalin-2, ritalin-3 6
Réseau Poids du réseau
huile-1, huile-3, huile-2 13.33

dollar-1, dollar-3 5

bouchard-1, bouchard-3 4.5

ritalin-2, ritalin-3 3

103.33 4 9

7 dollar-1, dollar-2 6
Réseau Poids du réseau
huile-1, huile-3, huile-2 13.33

dollar-1, dollar-3, dollar-2 5.33

bouchard-1, bouchard-3 4.5

ritalin-2, ritalin-3 3

104.67 4 10

8 bouchard-1, bouchard-2 6
Réseau Poids du réseau
huile-1, huile-3, huile-2 13.33

dollar-1, dollar-3, dollar-2 5.33

bouchard-1, bouchard-3, bouchard-2 5

ritalin-2, ritalin-3 3

106.67 4 11

9 ritalin-1, ritalin-2 5
Réseau Configuration focus Poids du réseau
huile-1, huile-3, huile-2 13.33

dollar-1, dollar-3, dollar-2 5.33

bouchard-1, bouchard-3, bouchard-2 5

ritalin-2, ritalin-3, ritalin-1 3.67

109.33 4 12

10 dollar-3, huile-1 5
Réseau Poids du réseau
dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3 10.17

bouchard-1, bouchard-3, bouchard-2 5

ritalin-2, ritalin-3, ritalin-1 3.67

56.5 3 12

11 dollar-2, dollar-3 5
Réseau Poids du réseau
dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3 11

bouchard-1, bouchard-3, bouchard-2 5

ritalin-2, ritalin-3, ritalin-1 3.67

59 3 12

12 bouchard-2, bouchard-3 5
Réseau Poids du réseau
dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3 11

bouchard-1, bouchard-3, bouchard-2 6.67

ritalin-2, ritalin-3, ritalin-1 3.67

64 3 12

13 bouchard-2, dollar-2 4
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3 10

ritalin-2, ritalin-3, ritalin-1 3.67

27.33 2 12

14 dollar-2, ritalin-3 4
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 8.75

8.75 1 12

15 ritalin-1, ritalin-3 4
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 9.08

9.08 1 12

16 bouchard-1, dollar-2 3
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 9.33

9.33 1 12

17 bouchard-3, ritalin-2 3
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 9.58

9.58 1 12

18 bouchard-3, dollar-3 3
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 9.83

9.83 1 12

19 bouchard-2, huile-1 3
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 10.08

10.08 1 12

20 huile-3, ritalin-3 3
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 10.33

10.33 1 12

21 dollar-3, ritalin-3 3
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 10.58

10.58 1 12

22 dollar-2, ritalin-2 2
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 10.75

10.75 1 12

23 huile-3, ritalin-2 2
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 10.92

10.92 1 12

24 bouchard-1, huile-1 2
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 11.08

11.08 1 12

25 bouchard-2, ritalin-2 2
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 11.25

11.25 1 12

26 dollar-2, ritalin-1 2
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 11.42

11.42 1 12

27 bouchard-2, huile-3 2
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 11.58

11.58 1 12

28 bouchard-3, dollar-1 2
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 11.75

11.75 1 12

29 bouchard-3, ritalin-3 2
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 11.92

11.92 1 12

30 dollar-1, ritalin-2 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12

12 1 12

31 dollar-3, ritalin-2 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.08

12.08 1 12

32 dollar-2, huile-1 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.17

12.17 1 12

33 bouchard-2, dollar-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.25

12.25 1 12

34 huile-1, ritalin-2 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.33

12.33 1 12

35 bouchard-1, ritalin-2 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.42

12.42 1 12

36 bouchard-3, dollar-2 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.5

12.5 1 12

37 bouchard-1, dollar-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.58

12.58 1 12

38 bouchard-3, huile-1 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.67

12.67 1 12

39 dollar-1, ritalin-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.75

12.75 1 12

40 dollar-1, huile-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.83

12.83 1 12

41 bouchard-2, huile-2 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 12.92

12.92 1 12

42 huile-2, ritalin-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13

13 1 12

43 huile-2, ritalin-1 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.08

13.08 1 12

44 bouchard-1, dollar-1 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.17

13.17 1 12

45 huile-1, ritalin-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.25

13.25 1 12

46 dollar-3, huile-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.33

13.33 1 12

47 bouchard-3, ritalin-1 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.42

13.42 1 12

48 dollar-2, huile-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.5

13.5 1 12

49 dollar-1, huile-1 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.58

13.58 1 12

50 bouchard-1, huile-2 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.67

13.67 1 12

51 bouchard-3, huile-2 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.75

13.75 1 12

52 bouchard-1, ritalin-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.83

13.83 1 12

53 bouchard-2, dollar-1 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 13.92

13.92 1 12

54 bouchard-2, ritalin-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 14

14 1 12

55 bouchard-3, huile-3 1
Réseau Poids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-3 14.08

14.08 1 12

Fichier des gains : rsdemo/sorties/G0196576521-gains.txt
Fichier construction de la courbe des poids de configurations : rsdemo/sorties/G0196576521-courbe.txt
Fichier cumul des gains : rsdemo/sorties/G0196576521-cumul-gains.txt

Fichiers graphml (logiciel yEd pour lire les graphml) :
Fichier graphml - configuration focus: rsdemo/sorties/G0196576521-graphml-focus.graphml
Fichier graphml - réseau total : rsdemo/sorties/G0196576521-graphml-total.graphml

Au début de la page de résultat, Sémato présente le script de votre requête :

((rangée lemme) (colonne document) (analyse rs) (rs-action-comparateurs 3) (projet rsdemo))

La fonction (analyse rs) signifie que la construction de la matrice sera suivie de l'analyse en réseaux de similitude. La valeur 3 pour action-comparateurs indique qu'aucune action n'a été programmée (la valeur 1 aurait ordonné la relativisation (sur 100) des fréquences des comparateurs et la valeur 2 le retrait progressif des comparateurs les moins discriminants. On peut lire cette page pour plus d'information sur le mode script.

Chaque expérience de construction de matrice porte un numéro. Dans notre exemple, c'est le G0196576521. Ce numéro servira à nommer des fichiers associés. Par exemple, le premier fichier accessible est celui qui contient la matrice. Dans notre exemple : G0196576521-matrice-réseaux.txt. Nous examinerons ces fichiers plus loin ci-dessous.

Résumons les éléments de définition nécessaires à la compréhension de l'algorithme des réseaux de similitude :

Noeuds : les unités comparées par l'analyse en réseaux de similitude; dans notre exemple, ce sont les 12 unités textuelles identifiées par la catégorie document. Les noeuds correspondent aux noms des colonnes de la matrice d'origine.
Liens : les liens relient les noeuds en portant pour chaque couple le nombre de points de similitude accordés par les comparateurs (les noms des rangées de la matrice d'origine).
Réseau : ensemble de noeuds reliés par des liens. Deux noeuds unis par un lien forment déjà un réseau.
Inscription : ajout dans l'espace de calcul d'un couple de noeuds avec son lien. L'inscription a un numéro. La première inscription a le numéro 1. Les numéros d'inscription sont soulignés. Ce sont des liens. Chaque lien d'inscription commande la construction de la table des comparateurs ayant octroyé les points de similitude au couple de l'inscription.
Gain : dans la table de résultat, nom de la colonne où on retrouve la valeur de chaque nouvelle inscription. Le gain est la somme des points donnés par les comparateurs au couple inscrit.
Liste des inscriptions : liste de tous les couples possibles d'unités comparées; cette liste est ordonnée par le gain descendant de similitude.
Poids d'un réseau : mesure de densité d'un réseau : somme des liens divisée par le nombre de noeuds.
Configuration des réseaux : l'ensemble des réseaux correspondant à chaque inscription.
Poids de la configuration : mesure de densité de la configuration des réseaux : somme des poids des réseaux multipliée par le nombre de réseaux.
Nombre de réseaux : nombre de réseaux constitués au moment de chacune des inscriptions.
Nombre d'inscrits : nombre de noeuds à chacune des inscriptions. Ce nombre n'augmente pas si l'inscription est un nouveau lien entre deux noeuds déjà présents.
Configuration focus : configuration de réseaux contenant minimalement 2 réseaux et correspondant au plus haut poids de configuration obtenu dans la séquence des inscriptions.
Courbe de la configuration focus : ensemble des données permettant de calculer la configuration focus.

Examinons la première inscription de la séquence :

Numéro de l'inscription et lien sur les comparateurs

Inscription

Gain

Configuration des réseaux

Poids de la configuration

Nombre de réseaux

Nombre d'inscrits (sur 12)

huile-1, huile-3

Réseau	Poids du réseau
huile-1, huile-3	8

Sommaire d'une inscription :

Colonne #1 : Numéro de l'inscription dans la séquence. Ce numéro est aussi un lien qui commande la construction de la table des comparateurs responsables du gain obtenu par le couple inscrit.
Colonne #2 : Inscription; nouveau couple inscrit, il n'y a qu'un couple par inscription.
Colonne #3 : Gain : gain de similitude du couple inscrit. Il s'agit du gain de similitude obtenu à l'étape 1.
Colonne #4 : Configuration des réseaux. Dans cette sous-table, il y a autant de rangées que de réseaux construits au moment de cette inscription. Pour chaque rangée :
- Réseau : liste des unités ou noeuds du réseau.
- Poids du réseau (en détail ci-dessous).
Colonne #5 : Poids de la configuration (en détail ci-dessous).
Colonne #6 : Nombre de réseaux : nombre de réseaux distincts au moment de cette inscription.
Colonne #7 : Nombre d'inscrits : nombre d'unités comparées (les documents dans notre exemple) et nombre total possible (12 documents dans notre exemple).

La première inscription concerne le couple huile-1 et huile-3, ce couple est celui qui a gagné le plus de points de similitude (16 points). À cette étape, les autres unités comparées ne sont pas encore inscrites aux réseaux de similitude. Nous n'avons ici qu'un seul réseau : deux noeuds reliés par un lien.

Un réseau a un poids. Le poids du réseau est la somme de toutes les valeurs trouvées sur les liens du réseau, somme divisée par le nombre de noeuds du réseau. Notre premier réseau a deux noeuds et un lien dont la valeur est de 16, le poids de ce réseau est donc de (16 / 2) = 8. Le poids du réseau est une mesure de la similitude globale interne des membres (noeuds) du réseau.

Il peut y avoir plus d'un réseau qui coexiste à une étape donnée. Nous appelons configuration l'ensemble des réseaux à une étape donnée de la succession des inscriptions. Le poids d'une configuration est la somme des poids des réseaux trouvés à cette étape, multipliée par le nombre de réseaux. À cette étape-ci, puisqu'il n'y a qu'un réseau inscrit à la configuration, le poids de celle-ci est identique à celui de son réseau. L'évolution du poids de la configuration est une donnée qui permettra de déterminer l'existence ou pas d'une configuration focus. Nous y reviendrons.

Ce couple (huile-1, huile-3) constitue le premier réseau de la configuration. Une seconde inscription vient ajouter un noeud au premier réseau (huile-1, huile-2 pour un gain de 13) :

Numéro de l'inscription et lien sur les comparateurs

Inscription

Gain

Configuration des réseaux

Poids de la configuration

Nombre de réseaux

Nombre d'inscrits (sur 12)

huile-1, huile-3

Réseau	Poids du réseau
huile-1, huile-3	8

huile-1, huile-2

Réseau	Poids du réseau
huile-1, huile-3, huile-2	9.67

9.67

À la seconde inscription, il n'y a toujours qu'un seul réseau à la configuration. Il a pris du poids. Le poids du réseau est = 9.67 = ((16 + 13) / 3) ; la somme des valeurs des gains divisée par le nombre de noeuds (3). Le poids de la configuration est égal à celui de son unique réseau. Il variera lorsqu'un second réseau s'installera.

La troisième inscription viendra fermer le premier réseau: (huile-2, huile-3) avec un gain de similitude de 11. Le poids de la configuration augmente à 13.33 :

Numéro de l'inscription et lien sur les comparateurs

Inscription

Gain

Configuration des réseaux

Poids de la configuration

Nombre de réseaux

Nombre d'inscrits (sur 12)

huile-2, huile-3

Réseau	Poids du réseau
huile-1, huile-3, huile-2	13.33

13.33

La quatrième inscription voit naître un second réseau (dollar-1, dollar-3) :

Numéro de l'inscription et lien sur les comparateurs

Inscription

Gain

Configuration des réseaux

Poids de la configuration

Nombre de réseaux

Nombre d'inscrits (sur 12)

dollar-1, dollar-3

Réseau	Poids du réseau
huile-1, huile-3, huile-2	13.33
dollar-1, dollar-3	5

36.67

Le poids de la configuration est maintenant de 36.67. L'ajout d'un réseau est toujours bénéfique pour l'augmentation du poids de la configuration. En effet, le poids de la configuration est la somme des poids des réseaux multipliée par le nombre de réseaux. À l'inverse, lorsque 2 réseaux qui étaient disjoints se retrouvent liés lors d'une nouvelle inscription, le poids de la configuration chute. Voici les inscriptions #5, #6 et #7 :

Numéro de l'inscription et lien sur les comparateurs

Inscription

Gain

Configuration des réseaux

Poids de la configuration

Nombre de réseaux

Nombre d'inscrits (sur 12)

bouchard-1, bouchard-3

Réseau	Poids du réseau
huile-1, huile-3, huile-2	13.33
dollar-1, dollar-3	5
bouchard-1, bouchard-3	4.5

68.5

ritalin-2, ritalin-3

Réseau	Poids du réseau
huile-1, huile-3, huile-2	13.33
dollar-1, dollar-3	5
bouchard-1, bouchard-3	4.5
ritalin-2, ritalin-3	3

103.33

dollar-1, dollar-2

Réseau	Poids du réseau
huile-1, huile-3, huile-2	13.33
dollar-1, dollar-3, dollar-2	5.33
bouchard-1, bouchard-3	4.5
ritalin-2, ritalin-3	3

104.67

Nous avons maintenant 4 réseaux distincts et le poids de la configuration augmentera maintenant jusqu'à l'inscription #9 grâce au resserrement interne de ces 4 réseaux. Et voici l'inscription #9 qui se verra allouer le poids le plus élevé de la construction des réseaux : 109.33. Elle sera déclarée configuration focus :

Numéro de l'inscription et lien sur les comparateurs

Inscription

Gain

Configuration des réseaux

Poids de la configuration

Nombre de réseaux

Nombre d'inscrits (sur 12)

ritalin-1, ritalin-2

Réseau Configuration focus	Poids du réseau
huile-1, huile-3, huile-2	13.33
dollar-1, dollar-3, dollar-2	5.33
bouchard-1, bouchard-3, bouchard-2	5
ritalin-2, ritalin-3, ritalin-1	3.67

109.33

À l'inscription suivante (#10), deux réseaux vont se fondre (par la liaison entre dollar-3 et huile-1) et, par la suite, le poids de la configuration ne sera jamais aussi élevé :

Numéro de l'inscription et lien sur les comparateurs

Inscription

Gain

Configuration des réseaux

Poids de la configuration

Nombre de réseaux

Nombre d'inscrits (sur 12)

dollar-3, huile-1

Réseau	Poids du réseau
dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3	10.17
bouchard-1, bouchard-3, bouchard-2	5
ritalin-2, ritalin-3, ritalin-1	3.67

56.5

Suivez ce lien pour examiner une représentation graphique des 10 premières inscriptions, suivies de la dernière inscription : #55.

Et suivez celui-ci pour examiner la courbe d'évolution du poids de la configuration au fil des inscriptions.

Nous appelons configuration focus la configuration ayant le poids le plus élevé et regroupant au minimum deux réseaux.

La configuration focus correspond au plus haut pouvoir séparateur de l'algorithme des réseaux de similitude. La configuration focus représente la partition la plus significative du réseau global des relations de ressemblance. Dans notre exemple, les réseaux ont bien classé les 12 textes du corpus dans leur catégorie d'origine. On remarque toutefois une différence au niveau des poids des 4 réseaux. Le réseau sur l'huile est de loin le plus lourd (13.33) près de 4 fois plus lourd que celui du ritalin (3.67).

6. Les fichiers tableurs et graphiques reliés aux résultats des réseaux de similitude

À la fin de la page de résultats des réseaux de similitude, des liens sont donnés sur des fichiers que les réseaux de similitude ont déposés dans le dossier SORTIES de votre dossier projet. Les trois premiers fichiers peuvent être ouverts par un chiffrier (tel Excel) en mode texte avec tabulateurs. Dans les fichiers tableurs, Sémato représente les décimales avec un point, exemple 5.67 ; il se peut que votre tableur (Excel par exemple) préfère les virgules. Vous devrez alors remplacer tous les points de ces fichiers par des virgules ou encore, changer l'option liée à la représentation des décimales dans les préférences d'Excel.

Fichier texte #1 - Les données pour la construction de la courbe liée à la configuration des réseaux

Un fichier tableur contient toutes les données requises pour construire la courbe de la progression des poids de configurations. Nous avons examiné cette courbe et les données requises ci-dessus.

Fichier construction de la courbe des poids de configurations : rsdemo/sorties/G0196576521-courbe.txt.

Fichier texte #2 - Les gains en similitude des différentes unités

À la fin des inscriptions, lorsque tous les noeuds ont reçu toutes les relations qui les unissent, il peut être intéressant de calculer pour un noeud donné le total de ses gains c'est-à-dire le total des valeurs trouvées sur tous les liens qui le touchent. Ce résultat est remis sur 100 et présenté sous forme de table :

Unité	Gain absolu	Gain relatif
huile-1	44	13.02
huile-3	38	11.24
dollar-3	30	8.88
bouchard-3	29	8.58
huile-2	29	8.58
dollar-2	29	8.58
ritalin-3	27	7.98
bouchard-2	26	7.69
bouchard-1	25	7.40
ritalin-2	24	7.10
dollar-1	24	7.10
ritalin-1	13	3.85
Total :	338	100

On voit que c'est le document huile-1 qui reçoit le plus de points de similitude.

Fichier cumul des gains : rsdemo/sorties/G0196576521-cumul-gains.txt.

Fichier texte #3 - Les gains en similitude des couples

Unité-1	Unité-2	Gain-absolu	Gain-relatif
huile-1	huile-3	16	9.47
huile-1	huile-2	13	7.69
huile-2	huile-3	11	6.51
dollar-1	dollar-3	10	5.92
bouchard-1	bouchard-3	9	5.33
ritalin-2	ritalin-3	6	3.55
dollar-1	dollar-2	6	3.55
bouchard-1	bouchard-2	6	3.55
ritalin-1	ritalin-2	5	2.96
dollar-3	huile-1	5	2.96
dollar-2	dollar-3	5	2.96
bouchard-2	bouchard-3	5	2.96
bouchard-2	dollar-2	4	2.37
dollar-2	ritalin-3	4	2.37
ritalin-1	ritalin-3	4	2.37
bouchard-1	dollar-2	3	1.78
bouchard-3	ritalin-2	3	1.78
bouchard-3	dollar-3	3	1.78
bouchard-2	huile-1	3	1.781
huile-3	ritalin-3	3	1.78
dollar-3	ritalin-3	3	1.781
dollar-2	ritalin-2	2	1.18
huile-3	ritalin-2	2	1.18
bouchard-1	huile-1	2	1.18
bouchard-2	ritalin-2	2	1.18
dollar-2	ritalin-1	2	1.18
bouchard-2	huile-3	2	1.18
bouchard-3	dollar-1	2	1.18
bouchard-3	ritalin-3	2	1.18
dollar-1	ritalin-2	1	0.59
dollar-3	ritalin-2	1	0.59
dollar-2	huile-1	1	0.59
bouchard-2	dollar-3	1	0.59
huile-1	ritalin-2	1	0.59
bouchard-1	ritalin-2	1	0.59
bouchard-3	dollar-2	1	0.59
bouchard-1	dollar-3	1	0.59
bouchard-3	huile-1	1	0.59
dollar-1	ritalin-3	1	0.59
dollar-1	huile-3	1	0.59
bouchard-2	huile-2	1	0.59
huile-2	ritalin-3	1	0.59
huile-2	ritalin-1	1	0.59
bouchard-1	dollar-1	1	0.59
huile-1	ritalin-3	1	0.59
dollar-3	huile-3	1	0.59
bouchard-3	ritalin-1	1	0.59
dollar-2	huile-3	1	0.59
dollar-1	huile-1	1	0.59
bouchard-1	huile-2	1	0.59
bouchard-3	huile-2	1	0.59
bouchard-1	ritalin-3	1	0.59
bouchard-2	dollar-1	1	0.59
bouchard-2	ritalin-3	1	0.59
bouchard-3	huile-3	1	0.59

Fichier des gains : rsdemo/sorties/G0196576521-gains.txt.

Deux fichiers graphiques sont construits par les réseaux de similitude. Ces fichiers en format GraphMl peuvent être ouverts avec le logiciel yEd (gratuit).

Fichier graphml #1 - configuration focus

Ce fichier permet de dessiner la configuration focus des réseaux. Nous l'avons présenté ci-dessus.

Fichier graphml-focus : rsdemo/sorties/G0196576521-graphml-focus.graphml

Fichier graphml #2 - réseau total

Ce fichier permet de dessiner le réseau total, c'est-à-dire toutes les relations entre les noeuds. Nous l'avons présenté ci-dessus.

Fichier graphml-total : rsdemo/sorties/G0196576521-graphml-total.graphml

7. L'analyse discriminante des comparateurs

L'analyse discriminante des comparateurs permet de forcer l'émergence d'une configuration focus. Les cas de réseaux de similitude sans configuration focus sont habituellement causés par des comparateurs très fréquents répartis dans plusieurs des unités comparées. Nous avons développé deux algorithmes dont l'objectif est de contrer les effets de ces comparateurs faiblement discriminants, qui nuisent à la création de réseaux distincts.

Le premier algorithme agit en relativisant la fréquence des comparateurs alors que le second agit en éliminant les comparateurs les moins discriminants.

Une fonction matricielle, rs-action-comparateurs, permet d'activer l'un ou l'autre de ces deux algorithmes, on aura les scripts :

((rangée lemme) (colonne document) (analyse rs) (rs-action-comparateurs 1)) 1 = relativisation de la fréquence des comparateurs
((rangée lemme) (colonne document) (analyse rs) (rs-action-comparateurs 2)) 2 = retrait progressif des comparateurs

8. La relativisation des fréquences des comparateurs

La relativisation consiste à donner à chaque comparateur la même importance; chaque comparateur a 100 points à donner. Sans relativisation, le comparateur méditerranéen a 12 points à donner (5, 4 et 3 pour les 3 textes sur l'huile), alors que le comparateur ministre, par exemple, n'a que 6 points à donner. Avec la relativisation ils ont tous les deux 100 points à distribuer, ils acquièrent ainsi la même importance :

lemme/document	Fréquence	ritalin-1	ritalin-2	ritalin-3	bouchard-1	bouchard-2	bouchard-3	huile-1	huile-2	huile-3	dollar-1	dollar-2	dollar-3
méditerranéen	12	0	0	0	0	0	0	41.67	33.33	25	0	0	0
régime	9	0	0	0	0	0	0	44.44	22.22	33.33	0	0	0
premier	8	0	12.5	0	50	12.5	25	0	0	0	0	0	0
Québec	7	0	0	0	28.57	28.57	42.86	0	0	0	0	0	0
ministre	6	0	0	0	66.67	16.67	16.67	0	0	0	0	0	0
taux	5	0	0	0	0	0	0	20	0	0	0	0	80

La relativisation des fréquences permet d'augmenter la ressemblance entre deux unités qui partagent des comparateurs rares et de réduire l'importance des comparateurs très fréquents. C'est donc une forme de discrimination favorable aux comparateurs moins fréquents. Cela peut permettre l'émergence d'une configuration focus. Si une expérience sans relativisation et une autre avec relativisation donnent toutes les deux une configuration focus, la configuration focus qui a le plus haut poids est à privilégier.

9. Le retrait progressif des comparateurs les moins discriminants

Le second algorithme est appelé lorsqu'aucune configuration focus n'a été trouvée.

Notre petit projet rsdemo ne permet pas de démontrer l'algorithme de discrimination par retrait progressif des comparateurs. Nous utiliserons plutôt le projet des photographes. Il s'agit d'un corpus de 12 entrevues. Vous trouverez ici la description de ce projet de démonstration.

Nous appliquons les réseaux de similitude sur un ensemble de 20 thèmes qui agiront à titre de comparateurs. Voici ces 20 thèmes :

Attention : les liens ne sont pas fonctionnels sur cette représentation de la table des thèmes.

th-photos	818	photo, photogénie, photogénique, photographe, photographiable, photographie, photographié, photographier, photographique
th-période	242	époque, ère, moment, période, temps
th-personne	203	gens, personnalité, personne, personnel, personnellement
th-travail	165	boulot, emploi, fonction, métier, occupation, profession, travail, travailler, travailleur
th-sentiment	161	émotion, impression, senti, sentiment, sentimental, sentir, tendresse
th-vie	157	existence, vécu, vie, vif, vitalité, vivable, vivant, vivre
th-beauté	155	beauté, beau, esthétique, harmonie, charme, joliesse, joli, esthétisme, harmonieux, attirance, charmant, séduction, admirable, séduire, admirer, divin, *punition divine / divin, *erreur divine / divin, extraordinaire, formidable, magnifique, merveilleux, parfait, superbe, admiration, splendide, fasciner, exalter, fabuleux, magique, perfection, émerveillement, fascinant, ravir, magie, émerveiller, enchanter
th-regard	125	regard, regarder
th-vérité	117	authenticité, réalité, véritablement, vérité, vrai
th-idée	78	conception, idéal, idée, notion, pensée
th-essentiel	77	capital, central, essence, essentiel, essentiellement, fondamental, important, indispensable, nécessaire, primordial, principal
th-liberté	75	liberté, indépendance, libre, possibilité, choix, indépendant, libérer, choisir
th-passion	67	amour, chaleur, intéressant, passion, passionnant, passionné, passionnel, passionner, penchant, rage
th-souffrance	64	souffrance, douleur, souffrir, douloureux, douloureusement
th-angoisse	49	angoissant, angoisse, crainte, détresse, horreur, inquiétude, peur, torture, trac
th-peinture	48	peindre, peintre, peinture, pittoresque, tableau
th-instant	43	instant, instantané, instantanéité, instantanément, immédiat, bref
th-aide	37	aide, aider, appoint, apport, assistant, collaboration, coopération, participation, second, support
th-affrontement	29	affrontement, bataille, combat, guerre
th-valeur	26	coût, importance, mérite, prix, valeur, valoir

Chacune des 12 entrevues a reçu une catégorie document dont la valeur est le nom du photographe interviewé.

Nous commandons une matrice : ((rangée thème) (colonne document) (projet photographes))

On désire donc comparer entre eux les colonnes, c'est-à-dire les documents (12 documents, 1 par photographe) selon les thèmes qu'on y trouve.

Nous désirons savoir si des réseaux de similitude peuvent se former entre les photographes selon les thèmes retenus. Dans un premier temps, nous demandons des réseaux de similitude sans action sur les comparateurs. Aucune configuration focus ne sera trouvée. Page des résultats :

Script de la matrice
((rangée thème) (colonne document) (analyse rs) (projet photographes))

Construction de la matrice

Matrice : rangées = 20, colonnes = 12, total des fréquences = 2736

Voici le lien pour récupérer la matrice en version WEB : G08190619191-matrice-réseaux.asp
Voici le lien pour récupérer la matrice en format texte (.txt) : G08190619191-matrice-réseaux.txt (919 octets)

Construction des réseaux de similitude sur cette matrice
L'option relativisation (sur 100) des fréquences des comparateurs est désactivée.
L'option retrait progressif des comparateurs les moins discriminants est désactivée.

Nombre de comparateurs retenus pour les réseaux = 20
Aucune configuration focus
Les fichiers associés aux réseaux sont accessibles au bas de cette page.

Numéro de l'inscription et lien sur les comparateurs Inscription Gain Configuration des réseaux Poids de la configuration Nombre de réseaux Nombre d'inscrits (sur 12)

1 koudelka, riboud 219
Réseau Poids du réseau
koudelka, riboud 109.5

109.5 1 2

2 riboud, rubinstein 214
Réseau Poids du réseau
koudelka, riboud, rubinstein 144.33

144.33 1 3

3 boubat, riboud 209
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat 160.5

160.5 1 4

4 newton, riboud 207
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton 169.8

169.8 1 5

5 koudelka, witkin 201
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin 175

175 1 6

6 boubat, koudelka 199
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin 208.17

208.17 1 6

7 doisneau, riboud 193
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau 206

206 1 7

8 giacomelli, koudelka 192
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli 204.25

204.25 1 8

9 giacomelli, riboud 192
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli 228.25

228.25 1 8

10 koudelka, rubinstein 190
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli 252

252 1 8

11 boubat, newton 190
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli 275.75

275.75 1 8

12 riboud, witkin 188
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli 299.25

299.25 1 8

13 mccullin, witkin 188
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin 286.89

286.89 1 9

14 doisneau, koudelka 187
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin 307.67

307.67 1 9

15 koudelka, newton 186
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin 328.33

328.33 1 9

16 boubat, witkin 183
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin 348.67

348.67 1 9

17 koudelka, sieff 182
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 332

332 1 10

18 doisneau, newton 179
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 349.9

349.9 1 10

19 boubat, doisneau 178
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 367.7

367.7 1 10

20 riboud, sieff 178
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 385.5

385.5 1 10

21 boubat, rubinstein 177
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 403.2

403.2 1 10

22 newton, rubinstein 177
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 420.9

420.9 1 10

23 doisneau, witkin 176
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 438.5

438.5 1 10

24 doisneau, giacomelli 174
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 455.9

455.9 1 10

25 giacomelli, witkin 174
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 473.3

473.3 1 10

26 boubat, giacomelli 174
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 490.7

490.7 1 10

27 newton, witkin 173
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 508

508 1 10

28 giacomelli, sieff 172
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 525.2

525.2 1 10

29 doisneau, sieff 172
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 542.4

542.4 1 10

30 sieff, witkin 172
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 559.6

559.6 1 10

31 mccullin, riboud 169
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 576.5

576.5 1 10

32 rubinstein, sieff 167
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 593.2

593.2 1 10

33 newton, sieff 165
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 609.7

609.7 1 10

34 boubat, sieff 165
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 626.2

626.2 1 10

35 rubinstein, witkin 164
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 642.6

642.6 1 10

36 boubat, mccullin 162
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 658.8

658.8 1 10

37 doisneau, mccullin 162
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 675

675 1 10

38 doisneau, rubinstein 160
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 691

691 1 10

39 giacomelli, newton 160
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff 707

707 1 10

40 moon, riboud 156
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 656.90

656.90 1 11

41 giacomelli, mccullin 155
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 671

671 1 11

42 giacomelli, rubinstein 154
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 685

685 1 11

43 mccullin, newton 154
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 699

699 1 11

44 mccullin, rubinstein 153
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 712.90

712.90 1 11

45 koudelka, mccullin 153
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 726.82

726.82 1 11

46 mccullin, sieff 153
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 740.73

740.73 1 11

47 doisneau, moon 150
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 754.36

754.36 1 11

48 giacomelli, moon 144
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 767.45

767.45 1 11

49 koudelka, moon 143
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 780.45

780.45 1 11

50 moon, sieff 143
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 793.45

793.45 1 11

51 moon, rubinstein 143
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 806.45

806.45 1 11

52 moon, newton 141
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 819.28

819.28 1 11

53 moon, witkin 140
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 832

832 1 11

54 mccullin, moon 137
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 844.45

844.45 1 11

55 boubat, moon 134
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon 856.64

856.64 1 11

56 hamaya, riboud 114
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 794.75

794.75 1 12

57 doisneau, hamaya 114
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 804.25

804.25 1 12

58 hamaya, koudelka 112
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 813.58

813.58 1 12

59 hamaya, sieff 112
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 822.92

822.92 1 12

60 giacomelli, hamaya 110
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 832.08

832.08 1 12

61 boubat, hamaya 110
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 841.25

841.25 1 12

62 hamaya, mccullin 107
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 850.17

850.17 1 12

63 hamaya, newton 106
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 859

859 1 12

64 hamaya, witkin 104
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 867.67

867.67 1 12

65 hamaya, rubinstein 103
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 876.25

876.25 1 12

66 hamaya, moon 94
Réseau Poids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya 884.08

884.08 1 12

Fichier construction de la courbe des poids de configurations : photographesx/sorties/G08190619191-courbe.txt
Fichier cumul des gains : photographesx/sorties/G08190619191-cumul-gains.txt
Fichier des gains : photographesx/sorties/G08190619191-gains.txt

Fichiers graphml (logiciel yEd pour lire les graphml) :
Fichier graphml - réseau total : photographesx/sorties/G08190619191-graphml-total.graphml

Nous reprenons l'exercice, mais en demandant le retrait progressif des comparateurs les moins discriminants.

Nouvelle page de résultats :

Script de la matrice
((rangée thème) (colonne document) (analyse rs) (rs-action-comparateurs 2) (projet photographes))

Construction de la matrice

Matrice : rangées = 20, colonnes = 12, total des fréquences = 2736

Voici le lien pour récupérer la matrice en version WEB : G08190029176-matrice-réseaux.asp
Voici le lien pour récupérer la matrice en format texte (.txt) : G08190029176-matrice-réseaux.txt (919 octets)

Construction des réseaux de similitude sur cette matrice
L'option relativisation (sur 100) des fréquences des comparateurs est désactivée.
L'option retrait progressif des comparateurs les moins discriminants est activée.

Nombre de comparateurs avant réduction par l'algorithme sur les comparateurs les moins discriminants = 20
Nombre de comparateurs après réduction par l'algorithme sur les comparateurs les moins discriminants = 9
Plus haut gain de similitude admis = ≤ 246
Configuration focus trouvée au poids = 71
Les fichiers associés aux réseaux sont accessibles au bas de cette page.

Numéro de l'inscription et lien sur les comparateurs Inscription Gain Configuration des réseaux Poids de la configuration Nombre de réseaux Nombre d'inscrits (sur 12)

1 mccullin, witkin 39
Réseau Poids du réseau
mccullin, witkin 19.5

19.5 1 2

2 riboud, rubinstein 32
Réseau Poids du réseau
mccullin, witkin 19.5

riboud, rubinstein 16

71 2 4

3 riboud, witkin 30
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin 25.25

25.25 1 4

4 rubinstein, witkin 29
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin 32.5

32.5 1 4

5 giacomelli, riboud 28
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli 31.6

31.6 1 5

6 giacomelli, witkin 28
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli 37.2

37.2 1 5

7 boubat, witkin 27
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat 35.5

35.5 1 6

8 koudelka, riboud 26
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka 34.1429

34.1429 1 7

9 giacomelli, sieff 24
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff 32.88

32.88 1 8

10 moon, riboud 24
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon 31.89

31.89 1 9

11 boubat, giacomelli 24
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon 34.5556

34.5556 1 9

12 newton, riboud 23
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 33.4

33.4 1 10

13 boubat, riboud 23
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 35.7

35.7 1 10

14 newton, rubinstein 23
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 38

38 1 10

15 giacomelli, koudelka 22
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 40.2

40.2 1 10

16 giacomelli, rubinstein 22
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 42.4

42.4 1 10

17 giacomelli, moon 22
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 44.6

44.6 1 10

18 riboud, sieff 22
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 46.8

46.8 1 10

19 sieff, witkin 22
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 49

49 1 10

20 rubinstein, sieff 21
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 51.1

51.1 1 10

21 moon, rubinstein 21
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 53.2

53.2 1 10

22 moon, witkin 20
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 55.2

55.2 1 10

23 moon, sieff 20
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 57.2

57.2 1 10

24 newton, witkin 20
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 59.2

59.2 1 10

25 koudelka, moon 19
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 61.1

61.1 1 10

26 mccullin, rubinstein 18
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 62.9

62.9 1 10

27 boubat, rubinstein 18
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 64.7

64.7 1 10

28 koudelka, rubinstein 18
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 66.5

66.5 1 10

29 koudelka, witkin 17
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton 68.2

68.2 1 10

30 doisneau, riboud 17
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 63.5455

63.5455 1 11

31 koudelka, sieff 17
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 65.0909

65.0909 1 11

32 doisneau, giacomelli 17
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 66.64

66.64 1 11

33 moon, newton 16
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 68.0909

68.0909 1 11

34 boubat, koudelka 16
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 69.5455

69.5455 1 11

35 giacomelli, newton 16
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 71

71 1 11

36 boubat, mccullin 16
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 72.45

72.45 1 11

37 newton, sieff 16
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 73.90

73.90 1 11

38 boubat, moon 15
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 75.28

75.28 1 11

39 doisneau, moon 15
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 76.64

76.64 1 11

40 doisneau, koudelka 15
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 78

78 1 11

41 giacomelli, mccullin 15
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 79.36

79.36 1 11

42 mccullin, riboud 14
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 80.64

80.64 1 11

43 boubat, sieff 14
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 81.90

81.90 1 11

44 koudelka, newton 13
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 83.0909

83.0909 1 11

45 boubat, doisneau 13
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 84.28

84.28 1 11

46 doisneau, witkin 13
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 85.45

85.45 1 11

47 doisneau, sieff 13
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 86.64

86.64 1 11

48 doisneau, rubinstein 12
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 87.73

87.73 1 11

49 mccullin, sieff 12
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 88.82

88.82 1 11

50 mccullin, moon 12
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 89.90

89.90 1 11

51 doisneau, newton 11
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau 90.90

90.90 1 11

52 hamaya, riboud 11
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 84.25

84.25 1 12

53 giacomelli, hamaya 11
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 85.17

85.17 1 12

54 doisneau, hamaya 10
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 86

86 1 12

55 mccullin, newton 10
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 86.83

86.83 1 12

56 boubat, newton 10
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 87.67

87.67 1 12

57 koudelka, mccullin 9
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 88.42

88.42 1 12

58 hamaya, witkin 9
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 89.17

89.17 1 12

59 hamaya, koudelka 9
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 89.92

89.92 1 12

60 hamaya, moon 9
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 90.67

90.67 1 12

61 boubat, hamaya 9
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 91.42

91.42 1 12

62 hamaya, rubinstein 8
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 92.08

92.08 1 12

63 hamaya, sieff 8
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 92.75

92.75 1 12

64 doisneau, mccullin 7
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 93.33

93.33 1 12

65 hamaya, newton 5
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 93.75

93.75 1 12

66 hamaya, mccullin 5
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya 94.17

94.17 1 12

Fichier construction de la courbe des poids de configurations : photographesx/sorties/G08190029176-courbe.txt
Fichier cumul des gains : photographesx/sorties/G08190029176-cumul-gains.txt
Fichier des gains : photographesx/sorties/G08190029176-gains.txt

Fichiers graphml (logiciel yEd pour lire les graphml) :
Fichier graphml - configuration focus: photographesx/sorties/G08190029176-graphml-focus.graphml
Fichier graphml - réseau total : photographesx/sorties/G08190029176-graphml-total.graphml

L'algorithme de retrait progressif des comparateurs les moins discriminants s'applique sur la matrice de base construite dans un premier temps par le générateur de matrices. Ouvrons cette matrice que nous avons au préalable triée par les valeurs descendantes de la dernière colonne (Gain de similitude) :

thème/document	Fréquence	boubat	doisneau	giacomelli	hamaya	koudelka	mccullin	moon	newton	riboud	rubinstein	sieff	witkin	Gain de similitude
th-photos	818	77	67	49	41	77	60	61	80	102	82	56	66	3864
th-période	242	29	22	27	11	35	11	10	24	30	17	18	8	977
th-personne	203	17	15	7	12	28	17	3	14	16	29	25	20	815
th-travail	165	9	18	11	8	28	9	15	12	9	7	13	26	658
th-sentiment	161	6	13	16	8	7	16	16	7	30	30	8	4	566
th-vie	157	9	14	25	10	25	16	2	8	9	3	12	24	556
th-beauté	155	18	14	13	3	5	16	8	18	15	2	9	34	534
th-regard	125	13	8	18	2	21	7	7	7	7	13	10	12	489
th-vérité	117	6	11	13	3	7	7	9	8	22	7	12	12	471
th-idée	78	6	4	5	3	12	4	2	7	14	5	5	11	289
th-essentiel	77	6	5	9	3	15	1	5	5	14	6	7	1	260
th-liberté	75	1	5	6	3	15	2	9	6	12	8	7	1	246
th-passion	67	3	2	4	1	3	0	2	10	12	15	5	10	185
th-peinture	48	7	4	7	4	6	0	3	0	7	2	2	6	162
th-instant	43	3	3	6	0	2	2	8	3	3	1	6	6	146
th-angoisse	49	7	1	3	0	2	6	4	2	4	5	0	15	127
th-valeur	26	2	1	3	1	3	4	1	0	1	2	4	4	89
th-aide	37	1	0	1	1	0	6	3	4	2	5	2	12	86
th-souffrance	64	3	0	3	0	0	19	0	0	2	3	2	32	68
th-affrontement	29	1	1	1	1	0	23	0	0	1	0	0	1	21

La dernière colonne appelée Gain de similitude est ajoutée à la matrice de base par l'algorithme des réseaux de similitude. Nous avons vu qu'un couple d'unités comparées obtient des points de la part des comparateurs en fonction du minimum de leurs deux fréquences. Ainsi, th-photos donne 67 points au couple boubat-doisneau, le minimum de leurs deux fréquences, respectivement 77 et 67. Si on additionne tous les points ainsi donnés par th-photos, on obtient 3864 points. Th-photos donne plusieurs points à tous les couples. Il occurre partout dans les 12 documents. Il aura un pouvoir d'attraction élevé entre les noeuds des réseaux et empêchera l'émergence d'une configuration focus. La configuration focus cherche des réseaux distincts constitués de relations discriminantes (spécifiques à ces réseaux). Th-photos est le thème le moins discriminant des 20 thèmes. Un comparateur est discriminant dans la mesure qu'il a de s'associer significativement à peu d'unités comparées. Nous faisons l'hypothèse ici que le gain en similitude d'un comparateur est en relation inverse avec sa portée discriminante (sa "discriminance" pour utiliser un terme anglophone).

L'algorithme tente un premier essai, sans réduction aucune, pour voir s'il n'y a pas de configuration focus. Si oui, le travail est terminé; tout se passe comme si l'option de retrait progressif n'avait pas été programmée. Si non, on retire le premier comparateur de la matrice triée par Gain de similitude, th-photos (dans notre exemple) et on retente la construction des réseaux sans ce dernier. Et on recommence ainsi jusqu'à l'émergence d'une configuration focus. Si, à la fin du processus, aucune configuration focus n'a émergé, les réseaux de similitude sont construits comme si aucune réduction n'avait été programmée. Dans notre exemple, une configuration focus surviendra au gain de similitude 246 (au niveau du comparateur th-liberté), après le retrait des 11 premiers comparateurs.

Le gain en similitude est une meilleure mesure que la fréquence lorsque l'on veut juger du caractère discriminant d'un comparateur. Comparons dans la matrice ci-dessus les comparateurs th-passion et th-souffrance. Les deux thèmes ont des fréquences proches (67 et 64) mais des gains très différents (185 et 68). Th-passion est moins discriminant, car il saupoudre sa fréquence dans plusieurs documents alors que deux documents seulement absorbent 75% de la fréquence de th-souffrance.

10. Les réseaux de similitude sur les matrices de cooccurrences

Au moment de construire la matrice, si vous choisissez une même VM (variable matricielle) sémantique (thème, lemme ou lemsem) en rangée et en colonne, vous pouvez opter pour l'obtention d'une matrice de cooccurrences et ceci, soit dans les phrases, soit dans les textes (voir : Générateur de matrices - Les cooccurrences)). Une fonction matricielle, rs-gain-cooccurrence, permet d'indiquer de quelle manière les cooccurrents gagneront-ils leurs points. On aura les scripts :

((rangée thème) (colonne thème) (cooccurrence nopha) (analyse rs) (rs-gain-cooccurrence 1))
1 = par la stricte fréquence des cooccurrences
((rangée thème) (colonne thème) (cooccurrence nopha) (analyse rs) (rs-gain-cooccurrence 2))
2 = seulement par les points obtenus des comparateurs
((rangée thème) (colonne thème) (cooccurrence nopha) (analyse rs) (rs-gain-cooccurrence 3))
3 = par l'addition de la fréquence des cooccurrences et des points des comparateurs

Et nous obtenons la page de résultats avec (rs-gain-cooccurrence 3) :

Script de la requête
((rangée thème) (colonne thème) (cooccurrence nopha) (analyse rs) (rs-gain-cooccurrence 3) (projet photographes))

Construction de la matrice

Matrice : rangées = 20, colonnes = 20, total des fréquences = 1010

Voici le lien pour récupérer la matrice en version WEB : G08197056215-matrice-réseaux.asp
Voici le lien pour récupérer la matrice en format texte (.txt) : G08197056215-matrice-réseaux.txt (1325 octets)

Construction des réseaux de similitude sur cette matrice
Le gain correspond à l'addition de la fréquence de cooccurrence des unités comparées et de la contribution des comparateurs des unités comparées.
L'option relativisation (sur 100) des fréquences des comparateurs est désactivée.
L'option retrait progressif des comparateurs les moins discriminants est désactivée.

Nombre de comparateurs retenus pour les réseaux = 20
Aucune configuration focus
Les fichiers associés aux réseaux sont accessibles au bas de cette page.

100 premières inscriptions affichées.

Numéro de l'inscription et lien sur les comparateurs Inscription Gain Configuration des réseaux Poids de la configuration Nombre de réseaux Nombre d'inscrits (sur 20)

1 th-période, th-photos 197
Réseau Poids du réseau
th-période, th-photos 98.5

98.5 1 2

2 th-personne, th-photos 174
Réseau Poids du réseau
th-période, th-photos, th-personne 123.67

123.67 1 3

3 th-période, th-personne 152
Réseau Poids du réseau
th-période, th-photos, th-personne 174.33

174.33 1 3

4 th-photos, th-vie 135
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie 164.5

164.5 1 4

5 th-photos, th-sentiment 127
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment 157

157 1 5

6 th-période, th-vie 125
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment 182

182 1 5

7 th-période, th-sentiment 122
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment 206.4

206.4 1 5

8 th-photos, th-travail 121
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail 192.17

192.17 1 6

9 th-personne, th-sentiment 115
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail 211.33

211.33 1 6

10 th-personne, th-vie 115
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail 230.5

230.5 1 6

11 th-sentiment, th-vie 112
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail 249.17

249.17 1 6

12 th-période, th-travail 112
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail 267.83

267.83 1 6

13 th-beauté, th-photos 107
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté 244.86

244.86 1 7

14 th-photos, th-regard 107
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 227.63

227.63 1 8

15 th-sentiment, th-travail 106
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 240.88

240.88 1 8

16 th-beauté, th-période 105
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 254

254 1 8

17 th-personne, th-travail 102
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 266.75

266.75 1 8

18 th-beauté, th-vie 102
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 279.5

279.5 1 8

19 th-période, th-regard 100
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 292

292 1 8

20 th-personne, th-regard 99
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 304.38

304.38 1 8

21 th-regard, th-vie 99
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 316.75

316.75 1 8

22 th-travail, th-vie 99
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 329.13

329.13 1 8

23 th-beauté, th-sentiment 98
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 341.38

341.38 1 8

24 th-regard, th-sentiment 96
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 353.38

353.38 1 8

25 th-beauté, th-personne 95
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 365.25

365.25 1 8

26 th-regard, th-travail 95
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 377.13

377.13 1 8

27 th-beauté, th-travail 93
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 388.75

388.75 1 8

28 th-beauté, th-regard 87
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard 399.63

399.63 1 8

29 th-vérité, th-vie 80
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité 364.11

364.11 1 9

30 th-photos, th-vérité 80
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité 373

373 1 9

31 th-personne, th-vérité 78
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité 381.67

381.67 1 9

32 th-période, th-vérité 77
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité 390.22

390.22 1 9

33 th-sentiment, th-vérité 76
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité 398.67

398.67 1 9

34 th-beauté, th-vérité 76
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité 407.11

407.11 1 9

35 th-travail, th-vérité 73
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité 415.22

415.22 1 9

36 th-regard, th-vérité 71
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité 423.11

423.11 1 9

37 th-essentiel, th-vie 69
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel 387.7

387.7 1 10

38 th-essentiel, th-photos 69
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel 394.6

394.6 1 10

39 th-essentiel, th-période 69
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel 401.5

401.5 1 10

40 th-essentiel, th-sentiment 69
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel 408.4

408.4 1 10

41 th-essentiel, th-personne 68
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel 415.2

415.2 1 10

42 th-beauté, th-essentiel 67
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel 421.9

421.9 1 10

43 th-essentiel, th-travail 66
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel 428.5

428.5 1 10

44 th-essentiel, th-regard 64
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel 434.9

434.9 1 10

45 th-photos, th-souffrance 58
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance 400.64

400.64 1 11

46 th-liberté, th-vie 57
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté 372

372 1 12

47 th-liberté, th-photos 57
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté 376.75

376.75 1 12

48 th-liberté, th-période 57
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté 381.5

381.5 1 12

49 th-période, th-souffrance 57
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté 386.25

386.25 1 12

50 th-liberté, th-travail 56
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté 390.92

390.92 1 12

51 th-passion, th-sentiment 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion 365.08

365.08 1 13

52 th-beauté, th-passion 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion 369.31

369.31 1 13

53 th-idée, th-vie 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 346.86

346.86 1 14

54 th-liberté, th-personne 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 350.79

350.79 1 14

55 th-passion, th-vie 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 354.71

354.71 1 14

56 th-passion, th-travail 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 358.64

358.64 1 14

57 th-liberté, th-sentiment 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 362.57

362.57 1 14

58 th-idée, th-photos 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 366.5

366.5 1 14

59 th-sentiment, th-souffrance 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 370.43

370.43 1 14

60 th-passion, th-photos 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 374.36

374.36 1 14

61 th-passion, th-personne 55
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 378.29

378.29 1 14

62 th-liberté, th-regard 54
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 382.14

382.14 1 14

63 th-passion, th-regard 54
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 386

386 1 14

64 th-idée, th-sentiment 54
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 389.86

389.86 1 14

65 th-idée, th-personne 54
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 393.71

393.71 1 14

66 th-idée, th-travail 54
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 397.57

397.57 1 14

67 th-passion, th-période 54
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 401.43

401.43 1 14

68 th-idée, th-période 54
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 405.29

405.29 1 14

69 th-personne, th-souffrance 54
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 409.14

409.14 1 14

70 th-beauté, th-idée 53
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 412.93

412.93 1 14

71 th-souffrance, th-vie 53
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 416.71

416.71 1 14

72 th-beauté, th-liberté 53
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 420.5

420.5 1 14

73 th-souffrance, th-travail 51
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 424.14

424.14 1 14

74 th-beauté, th-souffrance 51
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 427.79

427.79 1 14

75 th-regard, th-souffrance 51
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 431.43

431.43 1 14

76 th-essentiel, th-passion 50
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 435

435 1 14

77 th-idée, th-vérité 49
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée 438.5

438.5 1 14

78 th-instant, th-photos 48
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 412.47

412.47 1 15

79 th-instant, th-personne 48
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 415.67

415.67 1 15

80 th-instant, th-période 48
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 418.87

418.87 1 15

81 th-instant, th-vie 48
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 422.07

422.07 1 15

82 th-instant, th-sentiment 48
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 425.27

425.27 1 15

83 th-instant, th-travail 46
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 428.33

428.33 1 15

84 th-liberté, th-vérité 46
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 431.4

431.4 1 15

85 th-beauté, th-instant 46
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 434.47

434.47 1 15

86 th-instant, th-regard 45
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 437.47

437.47 1 15

87 th-essentiel, th-idée 44
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 440.4

440.4 1 15

88 th-essentiel, th-instant 44
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 443.33

443.33 1 15

89 th-souffrance, th-vérité 43
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 446.2

446.2 1 15

90 th-instant, th-vérité 40
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 448.87

448.87 1 15

91 th-essentiel, th-souffrance 40
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 451.53

451.53 1 15

92 th-idée, th-passion 39
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 454.13

454.13 1 15

93 th-instant, th-liberté 39
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 456.73

456.73 1 15

94 th-idée, th-souffrance 38
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 459.27

459.27 1 15

95 th-idée, th-liberté 38
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 461.8

461.8 1 15

96 th-passion, th-souffrance 37
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant 464.27

464.27 1 15

97 th-aide, th-beauté 37
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant, th-aide 437.56

437.56 1 16

98 th-aide, th-travail 37
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant, th-aide 439.88

439.88 1 16

99 th-aide, th-photos 37
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant, th-aide 442.19

442.19 1 16

100 th-aide, th-période 36
Réseau Poids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant, th-aide 444.44

444.44 1 16

Fichier construction de la courbe des poids de configurations : photographesx/sorties/G08197056215-courbe.txt
Fichier cumul des gains : photographesx/sorties/G08197056215-cumul-gains.txt
Fichier des gains : photographesx/sorties/G08197056215-gains.txt

Fichiers graphml (logiciel yEd pour lire les graphml) :
Fichier graphml - réseau total : photographesx/sorties/G08197056215-graphml-total.graphml

La question peut être reformulée ainsi : qu'est-ce qui fait que deux unités cooccurrentes se ressemblent ? Une première réponse est la fréquence de cooccurrence. Plus les deux unités se retrouvent dans les mêmes phrases (ou textes, dépendant de la matrice programmée), plus elles gagnent de points de similitude. Une seconde option est de considérer que les deux membres d'un couple de cooccurrents cooccurrent aussi avec un autre comparateur, celui-ci procure aussi des points de similitude, à la hauteur minimale de cette cooccurrence.

Examinons la matrice de cooccurrences pour comprendre cette contribution.

thème/thème	Fréquence	th-affrontement	th-aide	th-angoisse	th-beauté	th-essentiel	th-idée	th-instant	th-liberté	th-passion	th-peinture	th-période	th-personne	th-photos	minimum entre th-personne et th-photos	th-regard	th-sentiment	th-souffrance	th-travail	th-valeur	th-vérité	th-vie	Gain de similitude
th-affrontement	28	0	0	0	0	0	1	0	1	0	0	3	1	12	1	1	2	3	0	0	2	2	63
th-aide	37	0	0	1	1	0	0	1	1	0	2	3	2	11	2	3	3	3	4	1	0	1	135
th-angoisse	36	0	1	0	2	1	0	1	1	1	0	3	3	9	3	3	2	4	2	1	0	2	152
th-beauté	107	0	1	2	0	2	2	2	2	4	3	15	8	28	8	5	8	3	4	1	8	9	439
th-essentiel	69	0	0	1	2	0	2	4	0	2	0	8	7	26	7	3	5	1	2	0	0	6	189
th-idée	55	1	0	0	2	2	0	1	1	1	1	2	9	18	9	0	2	1	3	0	4	7	168
th-instant	48	0	1	1	2	4	1	0	1	1	0	8	3	11	3	1	4	0	2	1	1	6	181
th-liberté	57	1	1	1	2	0	1	1	0	1	0	10	2	17	2	4	1	0	7	1	2	5	183
th-passion	55	0	0	1	4	2	1	1	1	0	0	4	5	23	5	2	4	3	1	0	0	3	159
th-peinture	27	0	2	0	3	0	1	0	0	0	0	3	0	10	0	1	0	0	4	1	1	1	62
th-période	197	3	3	3	15	8	2	8	10	4	3	0	8	60	8	12	17	2	13	1	7	18	821
th-personne	174	1	2	3	8	7	9	3	2	5	0	8	0	66	0	14	10	8	9	1	6	12	661
th-photos	479	12	11	9	28	26	18	11	17	23	10	60	66	0	0	33	40	11	40	7	27	30	2726
th-regard	107	1	3	3	5	3	0	1	4	2	1	12	14	33	14	0	6	3	6	0	2	8	383
th-sentiment	127	2	3	2	8	5	2	4	1	4	0	17	10	40	10	6	0	5	5	1	5	7	506
th-souffrance	58	3	3	4	3	1	1	0	0	3	0	2	8	11	8	3	5	0	4	1	3	3	280
th-travail	121	0	4	2	4	2	3	2	7	1	4	13	9	40	9	6	5	4	0	4	4	7	514
th-valeur	23	0	1	1	1	0	0	1	1	0	1	1	1	7	1	0	1	1	4	0	1	1	94
th-vérité	80	2	0	0	8	0	4	1	2	0	1	7	6	27	6	2	5	3	4	1	0	7	267
th-vie	135	2	1	2	9	6	7	6	5	3	1	18	12	30	12	8	7	3	7	1	7	0	636
															108

Nous avons mis en gras les colonnes th-personne et th-photos (déplacez le curseur latéral vers la droite). Nous avons ajouté à la matrice, pour la démonstration, une colonne minimum entre th-personne et th-photos. Cette colonne sert à expliquer les points donnés à th-personne et th-photos par les autres comparateurs. Th-affrontement, par exemple, cooccurre 1 fois avec th-personne et 12 fois avec th-photos. Il donnera donc 1 point (minimum entre 1 et 12) au couple th-personne th-photos. Au total, les comparateurs donneront 108 points de similitude au couple th-personne th-photos. C'est ce qu'on a appelé la contribution des comparateurs. Les deux thèmes th-personne et th-photos cooccurrent 66 fois (cellules au croisement des 2 thèmes). Puisque nous avons choisi d'additionner les deux contributions, le total du gain obtenu par les deux thèmes est de 174 (66 + 108). Ils construisent le premier réseau de similitude enregistré. Si on clique sur le numéro de l'inscription (#2) de ces deux thèmes, Sémato ouvrira la page qui montre la table de la collaboration des comparateurs :

Points des comparateurs aux 2 unités : th-personne et th-photos

Total des points gagnés par les 2 unités comparées (somme de minimum) = 108

Comparateur	th-personne	th-photos	minimum
th-regard	14	33	14
th-vie	12	30	12
th-sentiment	10	40	10
th-travail	9	40	9
th-idée	9	18	9
th-souffrance	8	11	8
th-période	8	51	8
th-beauté	8	28	8
th-essentiel	7	26	7
th-vérité	6	27	6
th-passion	5	23	5
th-instant	3	11	3
th-angoisse	3	9	3
th-liberté	2	17	2
th-aide	2	11	2
th-valeur	1	7	1
th-affrontement	1	12	1