Sémato v3.0 Projet  Thèmes Analyses Sondages Entretiens Projet :
aucun




Les réseaux de similitude

Les réseaux de similitude sont commandés à la suite de l'obtention d'une matrice (Générateur de matrices). Toutes les matrices obtenues par le générateur de matrice peuvent être analysées par les réseaux de similitude.

Les réseaux de similitude mesurent la ressemblance entre les colonnes d'une matrice. Les réseaux de similitude utilisent les rangées de cette matrice comme des comparateurs. L'algorithme va organiser en réseaux les couples de colonnes en fonction de la ressemblance qu'elles obtiennent de la part des rangées.

On trouvera sur cette page :
  1. Un corpus pour la démonstration
  2. La production d'une matrice
  3. L'algorithme des réseaux de similitude
  4. Première étape - La construction d'une liste des unités comparées avec leurs gains de similitude
  5. Seconde étape - La construction séquentielle des réseaux de similitude
  6. Les fichiers tableurs et graphiques reliés aux résultats des réseaux de similitude
  7. L'analyse discriminante des comparateurs
  8. La relativisation des fréquences
  9. Le retrait progressif des comparateurs les moins discriminants
  10. Les réseaux de similitude sur les matrices de cooccurrences




1. Un corpus pour la démonstration

Nous avons construit un corpus rassemblant 12 courts textes. Ce petit corpus nous permettra de suivre exhaustivement toutes les étapes de l'algorithme des réseaux de similitude.

Les 12 textes ont pour origine :

  • un article sur le médicament Ritalin,
  • une allocution de Lucien Bouchard (ex-premier ministre du Québec),
  • un article sur l'huile d'olive et
  • un éditorial sur la montée du dollar canadien.
De chacun de ces 4 ouvrages, nous avons extrait 3 paragraphes de longueur semblable. Nous avons ainsi un corpus constitué de 12 textes :
  • ritalin-1, ritalin-2 et ritalin3;
  • bouchard-1, bouchard-2 et bouchard-3;
  • huile-1, huile-2 et huile-3;
  • dollar-1, dollar-2 et dollar-3.
Puisque, par groupe de 3, les textes ont la même origine, nous espérons que les réseaux de similitude vont réussir à retrouver cette origine (huile, ritalin, bouchard et dollar).

Chacun des textes a reçu 3 catégories de projet :
  • une catégorie origine, dont les valeurs sont : ritalin, bouchard, huile et dollar;
  • une catégorie genre dont les valeurs sont : article, allocution et éditorial;
  • une catégorie document dont les valeurs sont : ritalin-1, ritalin-2, ritalin-3, bouchard-1, bouchard-2, bouchard-3, huile-1, huile-2, huile-3, dollar-1, dollar-2 et dollar-3.
Nous appelons rsdemo ce petit projet Sémato. Voici le corpus en format tableur ou en format linéaire. Examinez rapidement ce corpus dans le format qui vous est le plus familier pour mieux comprendre la suite de la présentation. Vous pouvez aussi ouvrir un projet sur la base de ce corpus et effectuer pas à pas toutes les étapes de la production des réseaux de cette présentation.






2. La production d'une matrice

Une compréhension minimale du générateur de matrices de Sémato est nécessaire à celle des réseaux de similitude. Nous utilisons toutefois des matrices élémentaires pour la présentation des réseaux. Gardez à l'esprit que toutes les matrices produites par le générateur peuvent être analysées par l'algorithme des réseaux de similitude, à l'exception des matrices pondérées, l'algorithme des réseaux de similitude possédant son propre paramètre de pondération.

Pour construire une matrice, on doit exécuter un script. La commande est sous Analyses -- Générateur de matrices -- Saisie des scripts de génération de matrices. Un script contient l'ensemble des fonctions nécessaires à la production d'une matrice et de ses réseaux de similitude. Un script commence et se termine par une parenthèse. À l'intérieur de cette liste, chaque fonction est elle-même une liste (aussi identifiée par des parenthèses) dont le premier élément est le nom de la fonction et les autres éléments la ou les valeurs de son ou de ses arguments. Exemple :

((rangée lemme) (colonne document) (analyse rs) (projet rsdemo))

Nous désirons ici produire une matrice dont les rangées sont les lemmes du corpus et les colonnes, les valeurs de la catégorie de projet document et commander les réseaux de similitude en analyse sur cette matrice.

Construisons cette matrice. Exécuter le script ouvre la fenêtre dans laquelle nous écrivons le script.

Les FM : rangée, colonne, cooccurrence, condition, projection, fréquence-minimum, intervalle-centiles, période-rangée,
période-colonne, matrice-avec-null, construire-concordance, matrice-voir-textes, analyse.

Les VM : notxt, nophr, nopha, catgram, lexème, lemme, lemsem, synap1, synap2, thème, concordance, fréquence,
décade, document, genre, origine.


Entrez ci-dessous le script d'une matrice ou la fonction multi-matrices et ses scripts comme arguments.





Voilà tout ce qu'il faut faire pour obtenir les réseaux de similitude entre les documents de rsdemo sur la base d'une comparaison des lemmes. La page des résultats est présentée ci-dessous. Vous pouvez l'examiner brièvement mais revenez ici pour comprendre l'algorithme.






3. L'algorithme des réseaux de similitude

  • Étape 1 - La construction d'une liste des unités comparées avec leur degré de similitude
  • Étape 2 - La construction séquentielle des réseaux de similitude entre les unités comparées

La construction des réseaux de similitude repose sur la matrice construite par le générateur de matrices. La table ci-dessous présente les premières rangées de cette matrice.

La matrice est triée par défaut dans l'ordre alphabétique de la première colonne. Nous l'avons triée ici par l'ordre numérique descendant de la colonne Fréquence qui rapporte dans cette matrice la fréquence totale des lemmes au corpus. Les colonnes Fréquence et Gain de similitude (nous reviendrons sur cette colonne) sont ajoutées par l'algorithme des réseaux de similitude. La matrice obtenue sans la construction des réseaux ne les contiendrait pas. Pour cette raison, le nom du fichier matriciel contient les lettres matrice-réseaux.

lemme/documentFréquencebouchard-1bouchard-2bouchard-3dollar-1dollar-2dollar-3huile-1huile-2huile-3ritalin-1ritalin-2ritalin-3Gain de similitude
méditerranéen1200000054300010
régime90000004230007
premier84120000000107
Québec72230000000006
ministre64110000000003
américain50001040000001
dollar50001310000003
enfant50000000000050
taux50000041000001
baisse40001030000001
canadien40002020000002
devise40001210000003
économie40100030000001

Version complète de cette matrice. Fichier Excel.






4. Première étape - La construction d'une liste des unités comparées avec leurs gains de similitude

Le calcul de similitude

Pour les réseaux de similitude, les colonnes de la matrice (les 12 documents dans notre exemple) sont les unités comparées et les rangées (les lemmes dans notre exemple) sont les comparateurs. Si vous désirez obtenir l'inverse (les lemmes en colonnes et les documents en rangées), vous n'avez qu'à commander une matrice en conséquence.

La matrice nous montre que le comparateur méditerranéen apparaît 12 fois, 5 fois au document huile-1, 4 fois au document huile-2 et 3 fois au document huile-3.

Les réseaux de similitude cherchent la ressemblance entre les couples d'unités comparées, dans notre exemple : la ressemblance entre les valeurs de la catégorie de projet : document. Les réseaux de similitude vont calculer la ressemblance entre chaque couple de documents. Pour ce faire, on devra commencer par examiner la ressemblance que procure chaque comparateur à chaque couple de documents.

Chaque comparateur donne à chaque couple la plus petite des deux fréquences que les membres du couple réalisent. Le principe de similitude est simple : deux unités comparées se ressemblent sur la base de la fréquence minimum du comparateur qu'ils ont en commun, on appellera ce minimum leur gain en similitude. Ainsi, le couple huile-1 huile-2, dont les deux membres réalisent respectivement 5 et 4 occurrences du comparateur méditerranéen, reçoit 4 points de similitude de cette comparaison. Le couple huile-1 huile-3 reçoit 3 points et le couple huile-2 huile-3 reçoit aussi 3 points. Le comparateur méditerranéen ne donne pas de points à d'autres documents (que des 0 dans les autres cellules de la rangée). Si la plus petite des deux valeurs est 0, le couple ne reçoit aucun point du comparateur. Au total, le comparateur méditerranéen aura donné 10 points de gain en similitude (4 + 3 + 3). Ce total se retrouve dans la dernière colonne (Gain de similitude) et on expliquera ci-dessous l'apport de cette colonne au calcul global de similitude.

L'algorithme rassemble par la suite, pour chaque couple (il y en a 55 dans notre petit corpus), tous les points donnés par les comparateurs. Par exemple, le couple huite-1 huile-3 obtient 16 points de la part de 12 comparateurs (somme de la colonne minimum) :

Comparateurhuile-1huile-3minimum
régime433
méditerranéen533
Willett111
pyramide121
professeur211
présenter111
nutrition111
montrer111
étude211
année111
alimentation211
alimentaire111


L'algorithme des réseaux de similitude construit ainsi une liste de tous les couples avec pour chacun le total des points de similitude que leur auront donné les comparateurs. Voici le début de cette liste pour notre exemple (la liste complète contient 55 couples) :

Unité-1Unité-2Gain en similitude
huile-1huile-316
huile-1huile-213
huile-2huile-311
dollar-1dollar-310
bouchard-1bouchard-39
ritalin-2ritalin-36
dollar-1dollar-26
bouchard-1bouchard-26
ritalin-1ritalin-25
dollar-3huile-15
dollar-2dollar-35
bouchard-2bouchard-35
bouchard-2dollar-24
dollar-2ritalin-34
ritalin-1ritalin-34
bouchard-1dollar-23


Cette liste ordonnée des couples d'unités comparées munis de leur gain en similitude alimentera la séquence de construction des réseaux de similitude.






5. Seconde étape - La construction séquentielle des réseaux de similitude

L'ensemble de couples et de valeurs peut être représenté comme un réseau, un ensemble de noeuds et de liens. Dans notre exemple, chaque valeur de la catégorie de projet document est un noeud et les noeuds sont liés entre eux par des liens qui ont comme valeur le résultat du calcul de similitude expliqué ci-dessus et qui relie, par exemple, les deux noeuds huile-1 et huile-3 par la valeur 16. Voici le graphe de l'ensemble des 12 valeurs de la catégorie document reliées par les points de similitude trouvés à l'étape #1 :



Comment peut-on isoler dans ce graphe les relations de ressemblance les plus fortes ? Globalement, c'est à cette question que tente de répondre l'algorithme des réseaux de similitude. Dans le réseau total, toutes les relations de similitude sont exprimées. Le réseau qui montre tous les liens entre tous les noeuds contient des relations de similitude fortes et des relations de similitude faibles. Chacun des documents du réseau total ressemble minimalement à un autre document, mais dans ce groupe de 12 textes, certains se ressemblent plus que d'autres. Peut-on trouver le seuil de ressemblance en deçà duquel deux unités comparées se dissemblent relativement plus qu'elles ne se ressemblent ? Quand on aura trouvé ce seuil, on pourra retirer les relations dont la valeur est en deçà et le graphique des réseaux ne conservera alors que les liens de ressemblance les plus significatifs. C'est ce que l'on cherche. On cherche la configuration des réseaux construits par les liens de similitude les plus forts. C'est ce qu'on appelle la configuration focus, suivant la métaphore de l'image la plus nette, de l'image nettoyée des relations faibles. La configuration focus montre le maximum de proximité dans chaque réseau pour un maximum de réseaux différents.

La configuration focus est un point de bascule, un seuil en quelque sorte. Il n'y a pas toujours de configuration focus. Cela dépend du groupe d'objets comparés et de la base de la comparaison. Nous verrons ci-dessous l'ensemble des conditions formelles requises.

Les réseaux de similitude se construisent par une séquence d'inscriptions. Une inscription est composée d'un couple d'unités comparées muni de son gain de similitude. Les inscriptions sont ordonnées par gain de similitude décroissant.

Le résultat consiste en une table où chaque rangée correspond à un couple d'unités comparées. Il y aura autant d'inscriptions dans cette table que de couples ayant reçu un degré de similitude non nul dans la liste construite à l'étape #1 (55 couples). La séquence d'inscription suit l'ordre descendant des gains de similitude.

Retour sur la présentation de l'algorithme des réseaux de similitude

Vous trouverez ci-dessous la page de résultats de la construction de la matrice suivie des réseaux de similitude. Cette page est le résultat global des réseaux de similitude. Elle donne accès à la matrice construite et présente l'ensemble des inscriptions. Elle informe s'il y a eu configuration focus ou non. Dans l'affirmative, un lien vous y mène directement. Examinez rapidement cette page avant de poursuivre...


Script de la matrice

((rangée lemme) (colonne document) (analyse rs) (projet rsdemo))


Construction de la matrice

  • Matrice : rangées = 514, colonnes = 12, total des fréquences = 738
Voici le lien pour récupérer la matrice en version WEB : G0196576521-matrice-réseaux.asp
Voici le lien pour récupérer la matrice en format texte (.txt) : G0196576521-matrice-réseaux.txt  (17323 octets)



Construction des réseaux de similitude sur cette matrice

L'option relativisation (sur 100) des fréquences des comparateurs est désactivée.
L'option retrait progressif des comparateurs les moins discriminants est désactivée.


Nombre de comparateurs retenus pour les réseaux = 514

Configuration focus trouvée au poids = 109.33

Les fichiers associés aux réseaux sont accessibles au bas de cette page.

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 12)
1 huile-1, huile-316
RéseauPoids du réseau
huile-1, huile-38
812
2 huile-1, huile-213
RéseauPoids du réseau
huile-1, huile-3, huile-29.67
9.6713
3 huile-2, huile-311
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
13.3313
4 dollar-1, dollar-310
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-35
36.6725
5 bouchard-1, bouchard-39
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-35
bouchard-1, bouchard-34.5
68.537
6 ritalin-2, ritalin-36
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-35
bouchard-1, bouchard-34.5
ritalin-2, ritalin-33
103.3349
7 dollar-1, dollar-26
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-3, dollar-25.33
bouchard-1, bouchard-34.5
ritalin-2, ritalin-33
104.67410
8 bouchard-1, bouchard-26
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-3, dollar-25.33
bouchard-1, bouchard-3, bouchard-25
ritalin-2, ritalin-33
106.67411
9 ritalin-1, ritalin-25
Réseau Configuration focus Poids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-3, dollar-25.33
bouchard-1, bouchard-3, bouchard-25
ritalin-2, ritalin-3, ritalin-13.67
109.33412
10 dollar-3, huile-15
RéseauPoids du réseau
dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-310.17
bouchard-1, bouchard-3, bouchard-25
ritalin-2, ritalin-3, ritalin-13.67
56.5312
11 dollar-2, dollar-35
RéseauPoids du réseau
dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-311
bouchard-1, bouchard-3, bouchard-25
ritalin-2, ritalin-3, ritalin-13.67
59312
12 bouchard-2, bouchard-35
RéseauPoids du réseau
dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-311
bouchard-1, bouchard-3, bouchard-26.67
ritalin-2, ritalin-3, ritalin-13.67
64312
13 bouchard-2, dollar-24
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-310
ritalin-2, ritalin-3, ritalin-13.67
27.33212
14 dollar-2, ritalin-34
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-38.75
8.75112
15 ritalin-1, ritalin-34
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-39.08
9.08112
16 bouchard-1, dollar-23
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-39.33
9.33112
17 bouchard-3, ritalin-23
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-39.58
9.58112
18 bouchard-3, dollar-33
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-39.83
9.83112
19 bouchard-2, huile-13
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-310.08
10.08112
20 huile-3, ritalin-33
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-310.33
10.33112
21 dollar-3, ritalin-33
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-310.58
10.58112
22 dollar-2, ritalin-22
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-310.75
10.75112
23 huile-3, ritalin-22
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-310.92
10.92112
24 bouchard-1, huile-12
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-311.08
11.08112
25 bouchard-2, ritalin-22
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-311.25
11.25112
26 dollar-2, ritalin-12
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-311.42
11.42112
27 bouchard-2, huile-32
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-311.58
11.58112
28 bouchard-3, dollar-12
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-311.75
11.75112
29 bouchard-3, ritalin-32
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-311.92
11.92112
30 dollar-1, ritalin-21
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312
12112
31 dollar-3, ritalin-21
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.08
12.08112
32 dollar-2, huile-11
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.17
12.17112
33 bouchard-2, dollar-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.25
12.25112
34 huile-1, ritalin-21
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.33
12.33112
35 bouchard-1, ritalin-21
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.42
12.42112
36 bouchard-3, dollar-21
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.5
12.5112
37 bouchard-1, dollar-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.58
12.58112
38 bouchard-3, huile-11
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.67
12.67112
39 dollar-1, ritalin-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.75
12.75112
40 dollar-1, huile-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.83
12.83112
41 bouchard-2, huile-21
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-312.92
12.92112
42 huile-2, ritalin-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313
13112
43 huile-2, ritalin-11
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.08
13.08112
44 bouchard-1, dollar-11
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.17
13.17112
45 huile-1, ritalin-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.25
13.25112
46 dollar-3, huile-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.33
13.33112
47 bouchard-3, ritalin-11
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.42
13.42112
48 dollar-2, huile-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.5
13.5112
49 dollar-1, huile-11
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.58
13.58112
50 bouchard-1, huile-21
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.67
13.67112
51 bouchard-3, huile-21
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.75
13.75112
52 bouchard-1, ritalin-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.83
13.83112
53 bouchard-2, dollar-11
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-313.92
13.92112
54 bouchard-2, ritalin-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-314
14112
55 bouchard-3, huile-31
RéseauPoids du réseau
bouchard-1, bouchard-2, bouchard-3, dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-3, ritalin-1, ritalin-2, ritalin-314.08
14.08112


Fichier des gains : rsdemo/sorties/G0196576521-gains.txt
Fichier construction de la courbe des poids de configurations : rsdemo/sorties/G0196576521-courbe.txt
Fichier cumul des gains : rsdemo/sorties/G0196576521-cumul-gains.txt

Fichiers graphml (logiciel yEd pour lire les graphml) :
Fichier graphml - configuration focus: rsdemo/sorties/G0196576521-graphml-focus.graphml
Fichier graphml - réseau total : rsdemo/sorties/G0196576521-graphml-total.graphml


Au début de la page de résultat, Sémato présente le script de votre requête :

((rangée lemme) (colonne document) (analyse rs) (rs-action-comparateurs 3) (projet rsdemo))

La fonction (analyse rs) signifie que la construction de la matrice sera suivie de l'analyse en réseaux de similitude. La valeur 3 pour action-comparateurs indique qu'aucune action n'a été programmée (la valeur 1 aurait ordonné la relativisation (sur 100) des fréquences des comparateurs et la valeur 2 le retrait progressif des comparateurs les moins discriminants. On peut lire cette page pour plus d'information sur le mode script.

Chaque expérience de construction de matrice porte un numéro. Dans notre exemple, c'est le G0196576521. Ce numéro servira à nommer des fichiers associés. Par exemple, le premier fichier accessible est celui qui contient la matrice. Dans notre exemple : G0196576521-matrice-réseaux.txt. Nous examinerons ces fichiers plus loin ci-dessous.

Résumons les éléments de définition nécessaires à la compréhension de l'algorithme des réseaux de similitude  :
  • Noeuds : les unités comparées par l'analyse en réseaux de similitude; dans notre exemple, ce sont les 12 unités textuelles identifiées par la catégorie document. Les noeuds correspondent aux noms des colonnes de la matrice d'origine.
  • Liens : les liens relient les noeuds en portant pour chaque couple le nombre de points de similitude accordés par les comparateurs (les noms des rangées de la matrice d'origine).
  • Réseau : ensemble de noeuds reliés par des liens. Deux noeuds unis par un lien forment déjà un réseau.
  • Inscription : ajout dans l'espace de calcul d'un couple de noeuds avec son lien. L'inscription a un numéro. La première inscription a le numéro 1. Les numéros d'inscription sont soulignés. Ce sont des liens. Chaque lien d'inscription commande la construction de la table des comparateurs ayant octroyé les points de similitude au couple de l'inscription.
  • Gain : dans la table de résultat, nom de la colonne où on retrouve la valeur de chaque nouvelle inscription. Le gain est la somme des points donnés par les comparateurs au couple inscrit.
  • Liste des inscriptions : liste de tous les couples possibles d'unités comparées; cette liste est ordonnée par le gain descendant de similitude.
  • Poids d'un réseau : mesure de densité d'un réseau : somme des liens divisée par le nombre de noeuds.
  • Configuration des réseaux : l'ensemble des réseaux correspondant à chaque inscription.
  • Poids de la configuration : mesure de densité de la configuration des réseaux : somme des poids des réseaux multipliée par le nombre de réseaux.
  • Nombre de réseaux : nombre de réseaux constitués au moment de chacune des inscriptions.
  • Nombre d'inscrits : nombre de noeuds à chacune des inscriptions. Ce nombre n'augmente pas si l'inscription est un nouveau lien entre deux noeuds déjà présents.
  • Configuration focus : configuration de réseaux contenant minimalement 2 réseaux et correspondant au plus haut poids de configuration obtenu dans la séquence des inscriptions.
  • Courbe de la configuration focus : ensemble des données permettant de calculer la configuration focus.

Examinons la première inscription de la séquence :

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 12)
1 huile-1, huile-316
RéseauPoids du réseau
huile-1, huile-38
812


Sommaire d'une inscription :
  • Colonne #1 : Numéro de l'inscription dans la séquence. Ce numéro est aussi un lien qui commande la construction de la table des comparateurs responsables du gain obtenu par le couple inscrit.
  • Colonne #2 : Inscription; nouveau couple inscrit, il n'y a qu'un couple par inscription.
  • Colonne #3 : Gain : gain de similitude du couple inscrit. Il s'agit du gain de similitude obtenu à l'étape 1.
  • Colonne #4 : Configuration des réseaux. Dans cette sous-table, il y a autant de rangées que de réseaux construits au moment de cette inscription. Pour chaque rangée :
    • Réseau : liste des unités ou noeuds du réseau.
    • Poids du réseau (en détail ci-dessous).
  • Colonne #5 : Poids de la configuration (en détail ci-dessous).
  • Colonne #6 : Nombre de réseaux : nombre de réseaux distincts au moment de cette inscription.
  • Colonne #7 : Nombre d'inscrits : nombre d'unités comparées (les documents dans notre exemple) et nombre total possible (12 documents dans notre exemple).
La première inscription concerne le couple huile-1 et huile-3, ce couple est celui qui a gagné le plus de points de similitude (16 points). À cette étape, les autres unités comparées ne sont pas encore inscrites aux réseaux de similitude. Nous n'avons ici qu'un seul réseau : deux noeuds reliés par un lien.

Un réseau a un poids. Le poids du réseau est la somme de toutes les valeurs trouvées sur les liens du réseau, somme divisée par le nombre de noeuds du réseau. Notre premier réseau a deux noeuds et un lien dont la valeur est de 16, le poids de ce réseau est donc de (16 / 2) = 8. Le poids du réseau est une mesure de la similitude globale interne des membres (noeuds) du réseau.

Il peut y avoir plus d'un réseau qui coexiste à une étape donnée. Nous appelons configuration l'ensemble des réseaux à une étape donnée de la succession des inscriptions. Le poids d'une configuration est la somme des poids des réseaux trouvés à cette étape, multipliée par le nombre de réseaux. À cette étape-ci, puisqu'il n'y a qu'un réseau inscrit à la configuration, le poids de celle-ci est identique à celui de son réseau. L'évolution du poids de la configuration est une donnée qui permettra de déterminer l'existence ou pas d'une configuration focus. Nous y reviendrons.

Ce couple (huile-1, huile-3) constitue le premier réseau de la configuration. Une seconde inscription vient ajouter un noeud au premier réseau (huile-1, huile-2 pour un gain de 13) :

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 12)
1 huile-1, huile-316
RéseauPoids du réseau
huile-1, huile-38
812
2 huile-1, huile-213
RéseauPoids du réseau
huile-1, huile-3, huile-29.67
9.6713


À la seconde inscription, il n'y a toujours qu'un seul réseau à la configuration. Il a pris du poids. Le poids du réseau est = 9.67 = ((16 + 13) / 3) ; la somme des valeurs des gains divisée par le nombre de noeuds (3). Le poids de la configuration est égal à celui de son unique réseau. Il variera lorsqu'un second réseau s'installera.

La troisième inscription viendra fermer le premier réseau: (huile-2, huile-3) avec un gain de similitude de 11. Le poids de la configuration augmente à 13.33 :

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 12)
3 huile-2, huile-311
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
13.3313


La quatrième inscription voit naître un second réseau (dollar-1, dollar-3) :

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 12)
4 dollar-1, dollar-310
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-35
36.6725


Le poids de la configuration est maintenant de 36.67. L'ajout d'un réseau est toujours bénéfique pour l'augmentation du poids de la configuration. En effet, le poids de la configuration est la somme des poids des réseaux multipliée par le nombre de réseaux. À l'inverse, lorsque 2 réseaux qui étaient disjoints se retrouvent liés lors d'une nouvelle inscription, le poids de la configuration chute. Voici les inscriptions #5, #6 et #7 :

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 12)
5 bouchard-1, bouchard-39
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-35
bouchard-1, bouchard-34.5
68.537
6 ritalin-2, ritalin-36
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-35
bouchard-1, bouchard-34.5
ritalin-2, ritalin-33
103.3349
7 dollar-1, dollar-26
RéseauPoids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-3, dollar-25.33
bouchard-1, bouchard-34.5
ritalin-2, ritalin-33
104.67410


Nous avons maintenant 4 réseaux distincts et le poids de la configuration augmentera maintenant jusqu'à l'inscription #9 grâce au resserrement interne de ces 4 réseaux. Et voici l'inscription #9 qui se verra allouer le poids le plus élevé de la construction des réseaux : 109.33. Elle sera déclarée configuration focus :

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 12)
9 ritalin-1, ritalin-25
Réseau Configuration focus Poids du réseau
huile-1, huile-3, huile-213.33
dollar-1, dollar-3, dollar-25.33
bouchard-1, bouchard-3, bouchard-25
ritalin-2, ritalin-3, ritalin-13.67
109.33412


À l'inscription suivante (#10), deux réseaux vont se fondre (par la liaison entre dollar-3 et huile-1) et, par la suite, le poids de la configuration ne sera jamais aussi élevé :

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 12)
10 dollar-3, huile-15
RéseauPoids du réseau
dollar-1, dollar-2, dollar-3, huile-1, huile-2, huile-310.17
bouchard-1, bouchard-3, bouchard-25
ritalin-2, ritalin-3, ritalin-13.67
56.5312


Suivez ce lien pour examiner une représentation graphique des 10 premières inscriptions, suivies de la dernière inscription : #55.

Et suivez celui-ci pour examiner la courbe d'évolution du poids de la configuration au fil des inscriptions.

Nous appelons configuration focus la configuration ayant le poids le plus élevé et regroupant au minimum deux réseaux.

La configuration focus correspond au plus haut pouvoir séparateur de l'algorithme des réseaux de similitude. La configuration focus représente la partition la plus significative du réseau global des relations de ressemblance. Dans notre exemple, les réseaux ont bien classé les 12 textes du corpus dans leur catégorie d'origine. On remarque toutefois une différence au niveau des poids des 4 réseaux. Le réseau sur l'huile est de loin le plus lourd (13.33) près de 4 fois plus lourd que celui du ritalin (3.67).






6. Les fichiers tableurs et graphiques reliés aux résultats des réseaux de similitude

À la fin de la page de résultats des réseaux de similitude, des liens sont donnés sur des fichiers que les réseaux de similitude ont déposés dans le dossier SORTIES de votre dossier projet. Les trois premiers fichiers peuvent être ouverts par un chiffrier (tel Excel) en mode texte avec tabulateurs. Dans les fichiers tableurs, Sémato représente les décimales avec un point, exemple 5.67 ; il se peut que votre tableur (Excel par exemple) préfère les virgules. Vous devrez alors remplacer tous les points de ces fichiers par des virgules ou encore, changer l'option liée à la représentation des décimales dans les préférences d'Excel.



Fichier texte #1 - Les données pour la construction de la courbe liée à la configuration des réseaux

Un fichier tableur contient toutes les données requises pour construire la courbe de la progression des poids de configurations. Nous avons examiné cette courbe et les données requises ci-dessus.

Fichier construction de la courbe des poids de configurations : rsdemo/sorties/G0196576521-courbe.txt.



Fichier texte #2 - Les gains en similitude des différentes unités

À la fin des inscriptions, lorsque tous les noeuds ont reçu toutes les relations qui les unissent, il peut être intéressant de calculer pour un noeud donné le total de ses gains c'est-à-dire le total des valeurs trouvées sur tous les liens qui le touchent. Ce résultat est remis sur 100 et présenté sous forme de table :

UnitéGain absoluGain relatif
huile-14413.02
huile-33811.24
dollar-3308.88
bouchard-3298.58
huile-2298.58
dollar-2298.58
ritalin-3277.98
bouchard-2267.69
bouchard-1257.40
ritalin-2247.10
dollar-1247.10
ritalin-1133.85
Total : 338100


On voit que c'est le document huile-1 qui reçoit le plus de points de similitude.

Fichier cumul des gains : rsdemo/sorties/G0196576521-cumul-gains.txt.



Fichier texte #3 - Les gains en similitude des couples

Unité-1Unité-2Gain-absoluGain-relatif
huile-1huile-3169.47
huile-1huile-2137.69
huile-2huile-3116.51
dollar-1dollar-3105.92
bouchard-1bouchard-395.33
ritalin-2ritalin-363.55
dollar-1dollar-263.55
bouchard-1bouchard-263.55
ritalin-1ritalin-252.96
dollar-3huile-152.96
dollar-2dollar-352.96
bouchard-2bouchard-352.96
bouchard-2dollar-242.37
dollar-2ritalin-342.37
ritalin-1ritalin-342.37
bouchard-1dollar-231.78
bouchard-3ritalin-231.78
bouchard-3dollar-331.78
bouchard-2huile-131.781
huile-3ritalin-331.78
dollar-3ritalin-331.781
dollar-2ritalin-221.18
huile-3ritalin-221.18
bouchard-1huile-121.18
bouchard-2ritalin-221.18
dollar-2ritalin-121.18
bouchard-2huile-321.18
bouchard-3dollar-121.18
bouchard-3ritalin-321.18
dollar-1ritalin-210.59
dollar-3ritalin-210.59
dollar-2huile-110.59
bouchard-2dollar-310.59
huile-1ritalin-210.59
bouchard-1ritalin-210.59
bouchard-3dollar-210.59
bouchard-1dollar-310.59
bouchard-3huile-110.59
dollar-1ritalin-310.59
dollar-1huile-310.59
bouchard-2huile-210.59
huile-2ritalin-310.59
huile-2ritalin-110.59
bouchard-1dollar-110.59
huile-1ritalin-310.59
dollar-3huile-310.59
bouchard-3ritalin-110.59
dollar-2huile-310.59
dollar-1huile-110.59
bouchard-1huile-210.59
bouchard-3huile-210.59
bouchard-1ritalin-310.59
bouchard-2dollar-110.59
bouchard-2ritalin-310.59
bouchard-3huile-310.59


Fichier des gains : rsdemo/sorties/G0196576521-gains.txt.



Deux fichiers graphiques sont construits par les réseaux de similitude. Ces fichiers en format GraphMl peuvent être ouverts avec le logiciel yEd (gratuit).

Fichier graphml #1 - configuration focus

Ce fichier permet de dessiner la configuration focus des réseaux. Nous l'avons présenté ci-dessus.

Fichier graphml-focus : rsdemo/sorties/G0196576521-graphml-focus.graphml



Fichier graphml #2 - réseau total

Ce fichier permet de dessiner le réseau total, c'est-à-dire toutes les relations entre les noeuds. Nous l'avons présenté ci-dessus.

Fichier graphml-total : rsdemo/sorties/G0196576521-graphml-total.graphml






7. L'analyse discriminante des comparateurs

L'analyse discriminante des comparateurs permet de forcer l'émergence d'une configuration focus. Les cas de réseaux de similitude sans configuration focus sont habituellement causés par des comparateurs très fréquents répartis dans plusieurs des unités comparées. Nous avons développé deux algorithmes dont l'objectif est de contrer les effets de ces comparateurs faiblement discriminants, qui nuisent à la création de réseaux distincts.

Le premier algorithme agit en relativisant la fréquence des comparateurs alors que le second agit en éliminant les comparateurs les moins discriminants.

Une fonction matricielle, rs-action-comparateurs, permet d'activer l'un ou l'autre de ces deux algorithmes, on aura les scripts :
  • ((rangée lemme) (colonne document) (analyse rs) (rs-action-comparateurs 1)) 1 = relativisation de la fréquence des comparateurs
  • ((rangée lemme) (colonne document) (analyse rs) (rs-action-comparateurs 2)) 2 = retrait progressif des comparateurs





8. La relativisation des fréquences des comparateurs

La relativisation consiste à donner à chaque comparateur la même importance; chaque comparateur a 100 points à donner. Sans relativisation, le comparateur méditerranéen a 12 points à donner (5, 4 et 3 pour les 3 textes sur l'huile), alors que le comparateur ministre, par exemple, n'a que 6 points à donner. Avec la relativisation ils ont tous les deux 100 points à distribuer, ils acquièrent ainsi la même importance :

lemme/document Fréquenceritalin-1ritalin-2 ritalin-3 bouchard-1 bouchard-2 bouchard-3 huile-1 huile-2 huile-3 dollar-1 dollar-2 dollar-3
méditerranéen 12 0 0 0 0 0 0 41.67 33.33 25 0 0 0
régime 9 0 0 0 0 0 0 44.44 22.22 33.33 0 0 0
premier 8 0 12.5 0 50 12.5 25 0 0 0 0 0 0
Québec 7 0 0 0 28.57 28.57 42.86 0 0 0 0 0 0
ministre 6 0 0 0 66.67 16.67 16.67 0 0 0 0 0 0
taux 5 0 0 0 0 0 0 20 0 0 0 0 80

La relativisation des fréquences permet d'augmenter la ressemblance entre deux unités qui partagent des comparateurs rares et de réduire l'importance des comparateurs très fréquents. C'est donc une forme de discrimination favorable aux comparateurs moins fréquents. Cela peut permettre l'émergence d'une configuration focus. Si une expérience sans relativisation et une autre avec relativisation donnent toutes les deux une configuration focus, la configuration focus qui a le plus haut poids est à privilégier.






9. Le retrait progressif des comparateurs les moins discriminants

Le second algorithme est appelé lorsqu'aucune configuration focus n'a été trouvée.

Notre petit projet rsdemo ne permet pas de démontrer l'algorithme de discrimination par retrait progressif des comparateurs. Nous utiliserons plutôt le projet des photographes. Il s'agit d'un corpus de 12 entrevues. Vous trouverez ici la description de ce projet de démonstration.

Nous appliquons les réseaux de similitude sur un ensemble de 20 thèmes qui agiront à titre de comparateurs. Voici ces 20 thèmes :

Attention : les liens ne sont pas fonctionnels sur cette représentation de la table des thèmes.

th-photos818photo, photogénie, photogénique, photographe, photographiable, photographie, photographié, photographier, photographique
th-période242époque, ère, moment, période, temps
th-personne203gens, personnalité, personne, personnel, personnellement
th-travail165boulot, emploi, fonction, métier, occupation, profession, travail, travailler, travailleur
th-sentiment161émotion, impression, senti, sentiment, sentimental, sentir, tendresse
th-vie157existence, vécu, vie, vif, vitalité, vivable, vivant, vivre
th-beauté155beauté, beau, esthétique, harmonie, charme, joliesse, joli, esthétisme, harmonieux, attirance, charmant, séduction, admirable, séduire, admirer, divin, ***punition divine / divin, ***erreur divine / divin, extraordinaire, formidable, magnifique, merveilleux, parfait, superbe, admiration, splendide, fasciner, exalter, fabuleux, magique, perfection, émerveillement, fascinant, ravir, magie, émerveiller, enchanter
th-regard125regard, regarder
th-vérité117authenticité, réalité, véritablement, vérité, vrai
th-idée78conception, idéal, idée, notion, pensée
th-essentiel77capital, central, essence, essentiel, essentiellement, fondamental, important, indispensable, nécessaire, primordial, principal
th-liberté75liberté, indépendance, libre, possibilité, choix, indépendant, libérer, choisir
th-passion67amour, chaleur, intéressant, passion, passionnant, passionné, passionnel, passionner, penchant, rage
th-souffrance64souffrance, douleur, souffrir, douloureux, douloureusement
th-angoisse49angoissant, angoisse, crainte, détresse, horreur, inquiétude, peur, torture, trac
th-peinture48peindre, peintre, peinture, pittoresque, tableau
th-instant43instant, instantané, instantanéité, instantanément, immédiat, bref
th-aide37aide, aider, appoint, apport, assistant, collaboration, coopération, participation, second, support
th-affrontement29affrontement, bataille, combat, guerre
th-valeur26coût, importance, mérite, prix, valeur, valoir




Chacune des 12 entrevues a reçu une catégorie document dont la valeur est le nom du photographe interviewé.

Nous commandons une matrice : ((rangée thème) (colonne document) (projet photographes))

On désire donc comparer entre eux les colonnes, c'est-à-dire les documents (12 documents, 1 par photographe) selon les thèmes qu'on y trouve.

Nous désirons savoir si des réseaux de similitude peuvent se former entre les photographes selon les thèmes retenus. Dans un premier temps, nous demandons des réseaux de similitude sans action sur les comparateurs. Aucune configuration focus ne sera trouvée. Page des résultats :

Script de la matrice

((rangée thème) (colonne document) (analyse rs) (projet photographes))


Construction de la matrice

  • Matrice : rangées = 20, colonnes = 12, total des fréquences = 2736
Voici le lien pour récupérer la matrice en version WEB : G08190619191-matrice-réseaux.asp
Voici le lien pour récupérer la matrice en format texte (.txt) : G08190619191-matrice-réseaux.txt  (919 octets)



Construction des réseaux de similitude sur cette matrice

L'option relativisation (sur 100) des fréquences des comparateurs est désactivée.
L'option retrait progressif des comparateurs les moins discriminants est désactivée.


Nombre de comparateurs retenus pour les réseaux = 20

Aucune configuration focus

Les fichiers associés aux réseaux sont accessibles au bas de cette page.

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 12)
1 koudelka, riboud219
RéseauPoids du réseau
koudelka, riboud109.5
109.512
2 riboud, rubinstein214
RéseauPoids du réseau
koudelka, riboud, rubinstein144.33
144.3313
3 boubat, riboud209
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat160.5
160.514
4 newton, riboud207
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton169.8
169.815
5 koudelka, witkin201
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin175
17516
6 boubat, koudelka199
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin208.17
208.1716
7 doisneau, riboud193
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau206
20617
8 giacomelli, koudelka192
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli204.25
204.2518
9 giacomelli, riboud192
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli228.25
228.2518
10 koudelka, rubinstein190
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli252
25218
11 boubat, newton190
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli275.75
275.7518
12 riboud, witkin188
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli299.25
299.2518
13 mccullin, witkin188
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin286.89
286.8919
14 doisneau, koudelka187
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin307.67
307.6719
15 koudelka, newton186
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin328.33
328.3319
16 boubat, witkin183
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin348.67
348.6719
17 koudelka, sieff182
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff332
332110
18 doisneau, newton179
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff349.9
349.9110
19 boubat, doisneau178
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff367.7
367.7110
20 riboud, sieff178
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff385.5
385.5110
21 boubat, rubinstein177
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff403.2
403.2110
22 newton, rubinstein177
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff420.9
420.9110
23 doisneau, witkin176
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff438.5
438.5110
24 doisneau, giacomelli174
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff455.9
455.9110
25 giacomelli, witkin174
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff473.3
473.3110
26 boubat, giacomelli174
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff490.7
490.7110
27 newton, witkin173
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff508
508110
28 giacomelli, sieff172
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff525.2
525.2110
29 doisneau, sieff172
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff542.4
542.4110
30 sieff, witkin172
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff559.6
559.6110
31 mccullin, riboud169
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff576.5
576.5110
32 rubinstein, sieff167
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff593.2
593.2110
33 newton, sieff165
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff609.7
609.7110
34 boubat, sieff165
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff626.2
626.2110
35 rubinstein, witkin164
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff642.6
642.6110
36 boubat, mccullin162
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff658.8
658.8110
37 doisneau, mccullin162
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff675
675110
38 doisneau, rubinstein160
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff691
691110
39 giacomelli, newton160
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff707
707110
40 moon, riboud156
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon656.90
656.90111
41 giacomelli, mccullin155
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon671
671111
42 giacomelli, rubinstein154
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon685
685111
43 mccullin, newton154
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon699
699111
44 mccullin, rubinstein153
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon712.90
712.90111
45 koudelka, mccullin153
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon726.82
726.82111
46 mccullin, sieff153
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon740.73
740.73111
47 doisneau, moon150
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon754.36
754.36111
48 giacomelli, moon144
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon767.45
767.45111
49 koudelka, moon143
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon780.45
780.45111
50 moon, sieff143
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon793.45
793.45111
51 moon, rubinstein143
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon806.45
806.45111
52 moon, newton141
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon819.28
819.28111
53 moon, witkin140
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon832
832111
54 mccullin, moon137
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon844.45
844.45111
55 boubat, moon134
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon856.64
856.64111
56 hamaya, riboud114
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya794.75
794.75112
57 doisneau, hamaya114
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya804.25
804.25112
58 hamaya, koudelka112
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya813.58
813.58112
59 hamaya, sieff112
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya822.92
822.92112
60 giacomelli, hamaya110
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya832.08
832.08112
61 boubat, hamaya110
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya841.25
841.25112
62 hamaya, mccullin107
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya850.17
850.17112
63 hamaya, newton106
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya859
859112
64 hamaya, witkin104
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya867.67
867.67112
65 hamaya, rubinstein103
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya876.25
876.25112
66 hamaya, moon94
RéseauPoids du réseau
koudelka, riboud, rubinstein, boubat, newton, witkin, doisneau, giacomelli, mccullin, sieff, moon, hamaya884.08
884.08112


Fichier construction de la courbe des poids de configurations : photographesx/sorties/G08190619191-courbe.txt
Fichier cumul des gains : photographesx/sorties/G08190619191-cumul-gains.txt
Fichier des gains : photographesx/sorties/G08190619191-gains.txt

Fichiers graphml (logiciel yEd pour lire les graphml) :
Fichier graphml - réseau total : photographesx/sorties/G08190619191-graphml-total.graphml


Nous reprenons l'exercice, mais en demandant le retrait progressif des comparateurs les moins discriminants.

Nouvelle page de résultats :

Script de la matrice

((rangée thème) (colonne document) (analyse rs) (rs-action-comparateurs 2) (projet photographes))


Construction de la matrice

  • Matrice : rangées = 20, colonnes = 12, total des fréquences = 2736
Voici le lien pour récupérer la matrice en version WEB : G08190029176-matrice-réseaux.asp
Voici le lien pour récupérer la matrice en format texte (.txt) : G08190029176-matrice-réseaux.txt  (919 octets)



Construction des réseaux de similitude sur cette matrice

L'option relativisation (sur 100) des fréquences des comparateurs est désactivée.
L'option retrait progressif des comparateurs les moins discriminants est activée.

Nombre de comparateurs avant réduction par l'algorithme sur les comparateurs les moins discriminants = 20
Nombre de comparateurs après réduction par l'algorithme sur les comparateurs les moins discriminants = 9
Plus haut gain de similitude admis = ≤ 246

Configuration focus trouvée au poids = 71

Les fichiers associés aux réseaux sont accessibles au bas de cette page.

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 12)
1 mccullin, witkin39
RéseauPoids du réseau
mccullin, witkin19.5
19.512
2 riboud, rubinstein32
Réseau Poids du réseau
mccullin, witkin19.5
riboud, rubinstein16
7124
3 riboud, witkin30
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin25.25
25.2514
4 rubinstein, witkin29
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin32.5
32.514
5 giacomelli, riboud28
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli31.6
31.615
6 giacomelli, witkin28
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli37.2
37.215
7 boubat, witkin27
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat35.5
35.516
8 koudelka, riboud26
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka34.1429
34.142917
9 giacomelli, sieff24
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff32.88
32.8818
10 moon, riboud24
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon31.89
31.8919
11 boubat, giacomelli24
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon34.5556
34.555619
12 newton, riboud23
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton33.4
33.4110
13 boubat, riboud23
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton35.7
35.7110
14 newton, rubinstein23
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton38
38110
15 giacomelli, koudelka22
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton40.2
40.2110
16 giacomelli, rubinstein22
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton42.4
42.4110
17 giacomelli, moon22
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton44.6
44.6110
18 riboud, sieff22
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton46.8
46.8110
19 sieff, witkin22
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton49
49110
20 rubinstein, sieff21
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton51.1
51.1110
21 moon, rubinstein21
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton53.2
53.2110
22 moon, witkin20
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton55.2
55.2110
23 moon, sieff20
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton57.2
57.2110
24 newton, witkin20
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton59.2
59.2110
25 koudelka, moon19
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton61.1
61.1110
26 mccullin, rubinstein18
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton62.9
62.9110
27 boubat, rubinstein18
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton64.7
64.7110
28 koudelka, rubinstein18
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton66.5
66.5110
29 koudelka, witkin17
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton68.2
68.2110
30 doisneau, riboud17
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau63.5455
63.5455111
31 koudelka, sieff17
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau65.0909
65.0909111
32 doisneau, giacomelli17
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau66.64
66.64111
33 moon, newton16
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau68.0909
68.0909111
34 boubat, koudelka16
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau69.5455
69.5455111
35 giacomelli, newton16
Réseau Poids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau71
71111
36 boubat, mccullin16
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau72.45
72.45111
37 newton, sieff16
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau73.90
73.90111
38 boubat, moon15
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau75.28
75.28111
39 doisneau, moon15
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau76.64
76.64111
40 doisneau, koudelka15
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau78
78111
41 giacomelli, mccullin15
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau79.36
79.36111
42 mccullin, riboud14
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau80.64
80.64111
43 boubat, sieff14
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau81.90
81.90111
44 koudelka, newton13
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau83.0909
83.0909111
45 boubat, doisneau13
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau84.28
84.28111
46 doisneau, witkin13
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau85.45
85.45111
47 doisneau, sieff13
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau86.64
86.64111
48 doisneau, rubinstein12
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau87.73
87.73111
49 mccullin, sieff12
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau88.82
88.82111
50 mccullin, moon12
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau89.90
89.90111
51 doisneau, newton11
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau90.90
90.90111
52 hamaya, riboud11
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya84.25
84.25112
53 giacomelli, hamaya11
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya85.17
85.17112
54 doisneau, hamaya10
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya86
86112
55 mccullin, newton10
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya86.83
86.83112
56 boubat, newton10
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya87.67
87.67112
57 koudelka, mccullin9
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya88.42
88.42112
58 hamaya, witkin9
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya89.17
89.17112
59 hamaya, koudelka9
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya89.92
89.92112
60 hamaya, moon9
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya90.67
90.67112
61 boubat, hamaya9
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya91.42
91.42112
62 hamaya, rubinstein8
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya92.08
92.08112
63 hamaya, sieff8
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya92.75
92.75112
64 doisneau, mccullin7
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya93.33
93.33112
65 hamaya, newton5
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya93.75
93.75112
66 hamaya, mccullin5
RéseauPoids du réseau
mccullin, riboud, rubinstein, witkin, giacomelli, boubat, koudelka, sieff, moon, newton, doisneau, hamaya94.17
94.17112


Fichier construction de la courbe des poids de configurations : photographesx/sorties/G08190029176-courbe.txt
Fichier cumul des gains : photographesx/sorties/G08190029176-cumul-gains.txt
Fichier des gains : photographesx/sorties/G08190029176-gains.txt

Fichiers graphml (logiciel yEd pour lire les graphml) :
Fichier graphml - configuration focus: photographesx/sorties/G08190029176-graphml-focus.graphml
Fichier graphml - réseau total : photographesx/sorties/G08190029176-graphml-total.graphml


L'algorithme de retrait progressif des comparateurs les moins discriminants s'applique sur la matrice de base construite dans un premier temps par le générateur de matrices. Ouvrons cette matrice que nous avons au préalable triée par les valeurs descendantes de la dernière colonne (Gain de similitude) :

thème/documentFréquenceboubatdoisneaugiacomellihamayakoudelkamccullinmoonnewtonriboudrubinsteinsieffwitkinGain de similitude
th-photos81877674941776061801028256663864
th-période24229222711351110243017188977
th-personne2031715712281731416292520815
th-travail1659181182891512971326658
th-sentiment161613168716167303084566
th-vie1579142510251628931224556
th-beauté1551814133516818152934534
th-regard125138182217777131012489
th-vérité11761113377982271212471
th-idée78645312427145511289
th-essentiel7765931515514671260
th-liberté7515631529612871246
th-passion673241302101215510185
th-peinture48747460307226162
th-instant43336022833166146
th-angoisse497130264245015127
th-valeur2621313410124489
th-aide37101106342521286
th-souffrance643030019002323268
th-affrontement29111102300100121


La dernière colonne appelée Gain de similitude est ajoutée à la matrice de base par l'algorithme des réseaux de similitude. Nous avons vu qu'un couple d'unités comparées obtient des points de la part des comparateurs en fonction du minimum de leurs deux fréquences. Ainsi, th-photos donne 67 points au couple boubat-doisneau, le minimum de leurs deux fréquences, respectivement 77 et 67. Si on additionne tous les points ainsi donnés par th-photos, on obtient 3864 points. Th-photos donne plusieurs points à tous les couples. Il occurre partout dans les 12 documents. Il aura un pouvoir d'attraction élevé entre les noeuds des réseaux et empêchera l'émergence d'une configuration focus. La configuration focus cherche des réseaux distincts constitués de relations discriminantes (spécifiques à ces réseaux). Th-photos est le thème le moins discriminant des 20 thèmes. Un comparateur est discriminant dans la mesure qu'il a de s'associer significativement à peu d'unités comparées. Nous faisons l'hypothèse ici que le gain en similitude d'un comparateur est en relation inverse avec sa portée discriminante (sa "discriminance" pour utiliser un terme anglophone).

L'algorithme tente un premier essai, sans réduction aucune, pour voir s'il n'y a pas de configuration focus. Si oui, le travail est terminé; tout se passe comme si l'option de retrait progressif n'avait pas été programmée. Si non, on retire le premier comparateur de la matrice triée par Gain de similitude, th-photos (dans notre exemple) et on retente la construction des réseaux sans ce dernier. Et on recommence ainsi jusqu'à l'émergence d'une configuration focus. Si, à la fin du processus, aucune configuration focus n'a émergé, les réseaux de similitude sont construits comme si aucune réduction n'avait été programmée. Dans notre exemple, une configuration focus surviendra au gain de similitude 246 (au niveau du comparateur th-liberté), après le retrait des 11 premiers comparateurs.

Le gain en similitude est une meilleure mesure que la fréquence lorsque l'on veut juger du caractère discriminant d'un comparateur. Comparons dans la matrice ci-dessus les comparateurs th-passion et th-souffrance. Les deux thèmes ont des fréquences proches (67 et 64) mais des gains très différents (185 et 68). Th-passion est moins discriminant, car il saupoudre sa fréquence dans plusieurs documents alors que deux documents seulement absorbent 75% de la fréquence de th-souffrance.






10. Les réseaux de similitude sur les matrices de cooccurrences

Au moment de construire la matrice, si vous choisissez une même VM (variable matricielle) sémantique (thème, lemme ou lemsem) en rangée et en colonne, vous pouvez opter pour l'obtention d'une matrice de cooccurrences et ceci, soit dans les phrases, soit dans les textes (voir : Générateur de matrices - Les cooccurrences)). Une fonction matricielle, rs-gain-cooccurrence, permet d'indiquer de quelle manière les cooccurrents gagneront-ils leurs points. On aura les scripts :
  • ((rangée thème) (colonne thème) (cooccurrence nopha) (analyse rs) (rs-gain-cooccurrence 1))
    1 = par la stricte fréquence des cooccurrences

  • ((rangée thème) (colonne thème) (cooccurrence nopha) (analyse rs) (rs-gain-cooccurrence 2))
    2 = seulement par les points obtenus des comparateurs

  • ((rangée thème) (colonne thème) (cooccurrence nopha) (analyse rs) (rs-gain-cooccurrence 3))
    3 = par l'addition de la fréquence des cooccurrences et des points des comparateurs

Et nous obtenons la page de résultats avec (rs-gain-cooccurrence 3) :

Script de la requête

((rangée thème) (colonne thème) (cooccurrence nopha) (analyse rs) (rs-gain-cooccurrence 3) (projet photographes))


Construction de la matrice

  • Matrice : rangées = 20, colonnes = 20, total des fréquences = 1010
Voici le lien pour récupérer la matrice en version WEB : G08197056215-matrice-réseaux.asp
Voici le lien pour récupérer la matrice en format texte (.txt) : G08197056215-matrice-réseaux.txt  (1325 octets)



Construction des réseaux de similitude sur cette matrice

Le gain correspond à l'addition de la fréquence de cooccurrence des unités comparées et de la contribution des comparateurs des unités comparées.
L'option relativisation (sur 100) des fréquences des comparateurs est désactivée.
L'option retrait progressif des comparateurs les moins discriminants est désactivée.


Nombre de comparateurs retenus pour les réseaux = 20

Aucune configuration focus

Les fichiers associés aux réseaux sont accessibles au bas de cette page.


100 premières inscriptions affichées.

Numéro de l'inscription et lien sur les comparateursInscriptionGain Configuration des réseauxPoids de la configurationNombre de réseauxNombre d'inscrits (sur 20)
1 th-période, th-photos197
RéseauPoids du réseau
th-période, th-photos98.5
98.512
2 th-personne, th-photos174
RéseauPoids du réseau
th-période, th-photos, th-personne123.67
123.6713
3 th-période, th-personne152
RéseauPoids du réseau
th-période, th-photos, th-personne174.33
174.3313
4 th-photos, th-vie135
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie164.5
164.514
5 th-photos, th-sentiment127
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment157
15715
6 th-période, th-vie125
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment182
18215
7 th-période, th-sentiment122
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment206.4
206.415
8 th-photos, th-travail121
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail192.17
192.1716
9 th-personne, th-sentiment115
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail211.33
211.3316
10 th-personne, th-vie115
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail230.5
230.516
11 th-sentiment, th-vie112
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail249.17
249.1716
12 th-période, th-travail112
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail267.83
267.8316
13 th-beauté, th-photos107
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté244.86
244.8617
14 th-photos, th-regard107
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard227.63
227.6318
15 th-sentiment, th-travail106
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard240.88
240.8818
16 th-beauté, th-période105
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard254
25418
17 th-personne, th-travail102
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard266.75
266.7518
18 th-beauté, th-vie102
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard279.5
279.518
19 th-période, th-regard100
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard292
29218
20 th-personne, th-regard99
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard304.38
304.3818
21 th-regard, th-vie99
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard316.75
316.7518
22 th-travail, th-vie99
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard329.13
329.1318
23 th-beauté, th-sentiment98
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard341.38
341.3818
24 th-regard, th-sentiment96
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard353.38
353.3818
25 th-beauté, th-personne95
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard365.25
365.2518
26 th-regard, th-travail95
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard377.13
377.1318
27 th-beauté, th-travail93
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard388.75
388.7518
28 th-beauté, th-regard87
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard399.63
399.6318
29 th-vérité, th-vie80
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité364.11
364.1119
30 th-photos, th-vérité80
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité373
37319
31 th-personne, th-vérité78
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité381.67
381.6719
32 th-période, th-vérité77
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité390.22
390.2219
33 th-sentiment, th-vérité76
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité398.67
398.6719
34 th-beauté, th-vérité76
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité407.11
407.1119
35 th-travail, th-vérité73
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité415.22
415.2219
36 th-regard, th-vérité71
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité423.11
423.1119
37 th-essentiel, th-vie69
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel387.7
387.7110
38 th-essentiel, th-photos69
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel394.6
394.6110
39 th-essentiel, th-période69
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel401.5
401.5110
40 th-essentiel, th-sentiment69
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel408.4
408.4110
41 th-essentiel, th-personne68
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel415.2
415.2110
42 th-beauté, th-essentiel67
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel421.9
421.9110
43 th-essentiel, th-travail66
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel428.5
428.5110
44 th-essentiel, th-regard64
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel434.9
434.9110
45 th-photos, th-souffrance58
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance400.64
400.64111
46 th-liberté, th-vie57
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté372
372112
47 th-liberté, th-photos57
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté376.75
376.75112
48 th-liberté, th-période57
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté381.5
381.5112
49 th-période, th-souffrance57
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté386.25
386.25112
50 th-liberté, th-travail56
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté390.92
390.92112
51 th-passion, th-sentiment55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion365.08
365.08113
52 th-beauté, th-passion55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion369.31
369.31113
53 th-idée, th-vie55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée346.86
346.86114
54 th-liberté, th-personne55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée350.79
350.79114
55 th-passion, th-vie55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée354.71
354.71114
56 th-passion, th-travail55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée358.64
358.64114
57 th-liberté, th-sentiment55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée362.57
362.57114
58 th-idée, th-photos55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée366.5
366.5114
59 th-sentiment, th-souffrance55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée370.43
370.43114
60 th-passion, th-photos55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée374.36
374.36114
61 th-passion, th-personne55
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée378.29
378.29114
62 th-liberté, th-regard54
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée382.14
382.14114
63 th-passion, th-regard54
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée386
386114
64 th-idée, th-sentiment54
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée389.86
389.86114
65 th-idée, th-personne54
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée393.71
393.71114
66 th-idée, th-travail54
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée397.57
397.57114
67 th-passion, th-période54
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée401.43
401.43114
68 th-idée, th-période54
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée405.29
405.29114
69 th-personne, th-souffrance54
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée409.14
409.14114
70 th-beauté, th-idée53
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée412.93
412.93114
71 th-souffrance, th-vie53
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée416.71
416.71114
72 th-beauté, th-liberté53
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée420.5
420.5114
73 th-souffrance, th-travail51
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée424.14
424.14114
74 th-beauté, th-souffrance51
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée427.79
427.79114
75 th-regard, th-souffrance51
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée431.43
431.43114
76 th-essentiel, th-passion50
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée435
435114
77 th-idée, th-vérité49
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée438.5
438.5114
78 th-instant, th-photos48
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant412.47
412.47115
79 th-instant, th-personne48
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant415.67
415.67115
80 th-instant, th-période48
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant418.87
418.87115
81 th-instant, th-vie48
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant422.07
422.07115
82 th-instant, th-sentiment48
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant425.27
425.27115
83 th-instant, th-travail46
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant428.33
428.33115
84 th-liberté, th-vérité46
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant431.4
431.4115
85 th-beauté, th-instant46
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant434.47
434.47115
86 th-instant, th-regard45
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant437.47
437.47115
87 th-essentiel, th-idée44
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant440.4
440.4115
88 th-essentiel, th-instant44
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant443.33
443.33115
89 th-souffrance, th-vérité43
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant446.2
446.2115
90 th-instant, th-vérité40
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant448.87
448.87115
91 th-essentiel, th-souffrance40
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant451.53
451.53115
92 th-idée, th-passion39
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant454.13
454.13115
93 th-instant, th-liberté39
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant456.73
456.73115
94 th-idée, th-souffrance38
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant459.27
459.27115
95 th-idée, th-liberté38
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant461.8
461.8115
96 th-passion, th-souffrance37
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant464.27
464.27115
97 th-aide, th-beauté37
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant, th-aide437.56
437.56116
98 th-aide, th-travail37
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant, th-aide439.88
439.88116
99 th-aide, th-photos37
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant, th-aide442.19
442.19116
100 th-aide, th-période36
RéseauPoids du réseau
th-période, th-photos, th-personne, th-vie, th-sentiment, th-travail, th-beauté, th-regard, th-vérité, th-essentiel, th-souffrance, th-liberté, th-passion, th-idée, th-instant, th-aide444.44
444.44116


Fichier construction de la courbe des poids de configurations : photographesx/sorties/G08197056215-courbe.txt
Fichier cumul des gains : photographesx/sorties/G08197056215-cumul-gains.txt
Fichier des gains : photographesx/sorties/G08197056215-gains.txt

Fichiers graphml (logiciel yEd pour lire les graphml) :
Fichier graphml - réseau total : photographesx/sorties/G08197056215-graphml-total.graphml


La question peut être reformulée ainsi : qu'est-ce qui fait que deux unités cooccurrentes se ressemblent ? Une première réponse est la fréquence de cooccurrence. Plus les deux unités se retrouvent dans les mêmes phrases (ou textes, dépendant de la matrice programmée), plus elles gagnent de points de similitude. Une seconde option est de considérer que les deux membres d'un couple de cooccurrents cooccurrent aussi avec un autre comparateur, celui-ci procure aussi des points de similitude, à la hauteur minimale de cette cooccurrence.

Examinons la matrice de cooccurrences pour comprendre cette contribution.

thème/thèmeFréquenceth-affrontementth-aideth-angoisseth-beautéth-essentielth-idéeth-instantth-libertéth-passionth-peintureth-périodeth-personneth-photosminimum entre th-personne et th-photosth-regardth-sentimentth-souffranceth-travailth-valeurth-véritéth-vieGain de similitude
th-affrontement28000001010031121123002263
th-aide370011001102321123334101135
th-angoisse36010210111033933242102152
th-beauté10701202222431582885834189439
th-essentiel690012024020872673512006189
th-idée551002201111291890213047168
th-instant480112410110831131402116181
th-liberté5711120110101021724107125183
th-passion550014211100452352431003159
th-peinture27020301000030100100411162
th-période1973331582810430860812172131718821
th-personne1741238793250806601410891612661
th-photos479121192826181117231060660033401140727302726
th-regard1071335301421121433140636028383
th-sentiment1272328524140171040106055157506
th-souffrance583343110030281183504133280
th-travail12104242327141394096540447514
th-valeur2301110011011171011401194
th-vérité802008041201762762534107267
th-vie1352129676531181230128737170636
108

Nous avons mis en gras les colonnes th-personne et th-photos (déplacez le curseur latéral vers la droite). Nous avons ajouté à la matrice, pour la démonstration, une colonne minimum entre th-personne et th-photos. Cette colonne sert à expliquer les points donnés à th-personne et th-photos par les autres comparateurs. Th-affrontement, par exemple, cooccurre 1 fois avec th-personne et 12 fois avec th-photos. Il donnera donc 1 point (minimum entre 1 et 12) au couple th-personne th-photos. Au total, les comparateurs donneront 108 points de similitude au couple th-personne th-photos. C'est ce qu'on a appelé la contribution des comparateurs. Les deux thèmes th-personne et th-photos cooccurrent 66 fois (cellules au croisement des 2 thèmes). Puisque nous avons choisi d'additionner les deux contributions, le total du gain obtenu par les deux thèmes est de 174 (66 + 108). Ils construisent le premier réseau de similitude enregistré. Si on clique sur le numéro de l'inscription (#2) de ces deux thèmes, Sémato ouvrira la page qui montre la table de la collaboration des comparateurs :

Points des comparateurs aux 2 unités : th-personne et th-photos

Total des points gagnés par les 2 unités comparées (somme de minimum) = 108

Comparateurth-personneth-photosminimum
th-regard143314
th-vie123012
th-sentiment104010
th-travail9409
th-idée9189
th-souffrance8118
th-période8518
th-beauté8288
th-essentiel7267
th-vérité6276
th-passion5235
th-instant3113
th-angoisse393
th-liberté2172
th-aide2112
th-valeur171
th-affrontement1121