Sémato v3.0 | Projet | Thèmes | Analyses | Sondages | Entretiens | Projet : aucun |
Pages d'arrimageLe concept primitif de stockage des données dans Sémato est le texte ou unité textuelle. Quelle que soit la méthode utilisée pour téléverser vos données vers Sémato, vous avez eu à définir les unités textuelles de votre corpus. Il peut s'agir de chacune des questions et des réponses dans un corpus d'entrevues, de chacune des prises de parole dans un focus groupe, de chacun des paragraphes dans un article de journal... ou encore de chacune des réponses aux questions ouvertes dans le cas d'un projet Sémato Sondage.Au moment de l'indexation des données, chaque texte devient une unité de la base de connaissances que Sémato construit pour votre projet. Chaque texte hérite des valeurs des catégories de projet qui lui sont associées. Voici, par exemple, pour le projet de démonstration photographes les premières 8 rangées ou premiers 8 textes de la base de connaissances (le premier texte a le numéro 0):
On repère que chaque texte a reçu les valeurs des catégories de projet associées à son auteur (document, origine, sexe...) ainsi que le typeqr qui indique si ce texte était une question ou une réponse. Voici un second exemple extrait d'un Sémato Sondage, le projet de démonstration abasco:
Ici, chaque texte est une réponse à une question ouverte. Chaque texte a hérité de toutes les valeurs associées au questionnaire spécifique dont il est extrait. Ainsi, dans la base de connaissances de votre projet, construite au moment de l'indexation, chaque texte a reçu un numéro. De plus, Sémato a découpé chacun des textes en phrases, donnant aussi un numéro à chacune de celles-ci, numéro qui indique son emplacement dans le texte. Dans cette ordonnancement en phrases, le numéro 0 a la fonction de représenter le texte en entier. Comme on le verra, cet artifice permet de décider si on désire catégoriser une phrase particulière du texte ou ce dernier dans son entièreté. Le tableau suivant représente le texte #6 texte de la base des photographes. Ce texte a 4 phrases :
Les phrases sont les unités minimales de catégorisation par les thèmes. On peut associer (nous dirons arrimer) un thème à une phase ou encore à l'ensemble du texte (la phrase 0). En Sémato nous appelons thèmes les unités de catégorisation sémantique de vos données textuelles. Les thèmes sont automatiques, manuels ou mixtes. Un thème automatique est un script qui cherche des phrases à partir d'une liste de vocables (mots ou expressions). Cette liste de vocables, vous la construisez à l'aide de différents outils trouvés sur la page des thèmes dont principalement l'AST (Assistant Scripteur de Thèmes). Un thème automatique est toujours associé à une phrase précise et non au texte entier (ou phrase 0). La vérification et la correction des thèmes automatiques s'effectue dans les pages d'arrimage. Un thème manuel est associé, selon votre décision, soit à une phrase particulière (phrase 1, 2, 3...) soit au texte entier (phrase 0). L'arrimage des thèmes manuels s'effectue dans les pages d'arrimage. Un thème mixte est un thème qui trouve automatiquement certaines phrases à l'aide de son script de recherche et qui, par ailleurs a été arrimé manuellement à d'autres phrases, par vos soins. Le nom d'un thème commence toujours par les caractères th- . Il est intéressant de faire suivre ces 3 caractères de quelques lettres qui marqueront l'appartenance de ce thème à un regroupement quelconque. Par exemple th-gr4-beauté. Les pages WEB qui vous permmettent de vérifier (voire corriger) les thèmes automatiques et qui vous permettent d'ajouter des thèmes manuellement sont appelées des pages d'arrimage. Les pages d'arrimage sont construites dynamiquement par Sémato à la suite de requêtes variées. Pour poursuivre la description des pages d'arrimage, imaginons un thème portant sur l'inattendu (dans le projet photographes), Table des thèmes colligés (sous Thèmes) :
On accède aux pages d'arrimage depuis différentes fonctions du logiciel; la majorité des accès se fait toutefois depuis la page de résultats des requêtes. En cliquant sur le bouton cible associé au thème th-inattendu, nous obtenons la page de résultats suivante où nous avons commenté les différents liens permettant d'ouvrir des pages d'arrimage :
Et voici la page d'arrimage ouverte par le lien central sur th-inattendu (extrait, l'image ne montre que les 3 premières phrases sur les 25 phrases rapportées par ce thème) :
Dans cette page, les liens permettent d'ouvrir d'autres pages d'arrimage associées à chacun des textes. Une telle page présente alors toutes les phrases de ce texte. Voici un autre exemple de page d'arrimage : la page d'arrimage ouverte en cliquant sur le lien du texte 703-sieff-réponse, lien trouvé sur la page de résultats du thème th-inattendu :
Dans cette page d'arrimage, la première rangée nous présente le texte en entier. Les 3 rangées suivantes correspondent au découpage en phrases. Le thème a été associé automatiquement à la phrase #3 à cause du vocable accident qui est l'un des éléments du script de notre thème th-inattendu. Voici les actions qui peuvent être entreprises sur une page d'arrimage :
Poursuite au #3 :
|