Règles d'écriture des noms et des valeurs de catégories
La constitution des noms de catégories et des valeurs des catégories suivent des règles bien précises, les voici :
-
Les noms des catégories
-
Les caractères qui forment le nom d'une catégorie ne peuvent être que l'un ou l'autre des 26 caractères alphabétiques, minuscules et/ou majuscules, plus les caractères accentués français, plus les 10 chiffres (0 1 2 3 4 5 6 7 8 9) et plus le caractère _ (le souligné) .
-
Le nom d'une catégorie ne peut pas être un nombre. Il peut contenir des chiffres, mais il doit contenir au moins un caractère alphabétique.
-
Le nom d'une catégorie ne peut pas commencer par un nombre. Le premier caractère du nom d'une catégorie ne peut pas être un nombre.
-
Le nom d'une catégorie ne peut contenir d'espace. Utilisez le souligné pour écrire une expression (ex. : premier_ministre). Les tirets sont interdits dans les noms de catégorie.
-
Les mots suivants sont utilisés par le système et ne peuvent être employés comme noms de catégories :
datesqlp, annéesqlp, sourcesqlp, domainesqlp, taille, statutsqlp, clip, note, alnClip, alnNote, alndump, alnconcepts, condense, lexique, fichierfichierguidex, titre, alntitre, concepts, conceptsne, alnconceptsne, resume, unit, dateori, tstamp, alter, notxt, nophr, nopha, catgram, lexème, lemme, lemsem, synap1, synap2, thème et concordance .
-
Une catégorie appelée dateformat sera automatiquement interprétée comme une catégorie de type date. On pourra y appliquer des opérateurs numériques (plus grand, plus petit...). Les valeurs de la catégorie dateformat ont une syntaxe particulière. Voir ci-dessous.
-
Les valeurs des catégories
-
Les caractères qui forment les valeurs des catégories ne peuvent être que l'un ou l'autre des 26 caractères alphabétiques, minuscules et/ou majuscules, plus les caractères accentués français, plus les 10 chiffres (0 1 2 3 4 5 6 7 8 9), plus le caractère _ (le souligné) et plus le caractère - (le tiret).
-
La valeur d'une catégorie ne peut contenir d'espace. Utilisez le souligné ou le tiret pour écrire une expression contenant plus d'un mot.
-
La valeur d'une catégorie peut être un nombre. Si la valeur d'une catégorie est un nombre :
-
Elle ne peut contenir que des chiffres et/ou les caractères tiret et point. Exemples :     4     6.72     -3     -2.4
- Le point est utilisé pour marquer les décimales; la virgule est interdite pour marquer les décimales.
-
Le tiret marque un nombre négatif.
-
Les valeurs d'une même catégorie (valeurs d'une même colonne) ne peuvent tantôt être numériques et tantôt être symboliques; par exemple, la liste suivante est interdite comme liste de valeurs d'une catégorie : la catégorie âge = ( 23 45 27 ne-sais-pas 34 plus-grand-que-25 )
-
Les valeurs de la catégorie dont le nom est dateformat doivent obligatoirement suivre le format année-mois-jour, le 3 février 2004, par exemple, doit s'écrire 2004-02-03; l'année prend 4 chiffres, le mois et le jour prennent 2 chiffres.
- Le nombre maximum de caractères qu'une valeur de catégorie peut avoir est de 920.
Les catégories à multiples valeurs
Il est possible dans tous les formats de formuler des catégories dont les valeurs sont multiples.
Dans le format linéaire, le nom de la catégorie n'est pas affecté, les multiples valeurs sont simplement séparées par des virgules (aucun espace) : Exemple :
&atmosphère=tendue,étrange
*style=classique,moderne,avant-garde
Dans le format tableur, le nom de la catégorie (dans la première rangée) sera suivie du caractère + , dans les cellules, les valeurs seront séparées par un espace. Exemple :
| | A | B | C
| | 1 | texte | auteur | atmosphère+
| | 2 | Je crois que cette réunion ne mènera nulle part. Je ne sais pas encore pourquoi j'ai accepté cette rencontre avec vous. | Jean | tendue
| | 3 | Moi, c'est un peu comme pour Jean. Toutefois, je n'irai pas contre le groupe. Ça ne peut pas me faire de mal. Il faut se réunir semble-t-il. | Claire | tendue angoisse
| | 4 | Je ne vous comprends pas tous les deux. Moi, j'ai confiance dans le groupe, on va passer au travers. | Pierre | tendue
| | 5 | Je vais raconter mon histoire si vous voulez bien. Pour moi, tout a commencé l'été dernier. | Pauline | relax humour camaraderie
|
On pourra aussi exprimer, d'une façon semblable à la précédente, des catégories à valeurs multiples dans un fichier de méga-catégories :
| | A | B | C | D
| | 1 | auteur | genre | âge | fonction+
| | 5 | Claire | féminin | 29 | parent cadre
| | 2 | Jean | masculin | 32 | professeur cadre
| | 4 | Pauline | féminin | 27 | cadre
| | 3 | Pierre | masculin | 23 | parent cadre
|
Le nombre maximum de caractères qu'une valeur de catégorie peut avoir est de 920, ce total inclut toutes les valeurs d'une catégorie à multiples valeurs. Par exemple, la valeur de la catégorie atmosphère pour Pauline dans le premier tableau ci-dessus : relax humour camaraderie, est de 24 caractères (il faut aussi compter les espaces).
Les valeurs d'une catégorie à multiples valeurs ne peuvent pas être numériques. Elles seront automatiquement traitées par Sémato comme des valeurs symboliques; conséquemment, en requête, elles ne permettront pas d'opérations arithmétiques telles égal, plus petit ou plus grand.
Catégorie symbolique ou numérique
En Sémato, le comportement des catégories numériques est différent, au moment des requêtes, du comportement des catégories symboliques. Il ne faut pas donner de valeur numérique à une catégorie si cela n'est pas significatif de pouvoir effectuer des opérations arithmétiques sur celle-ci. L'âge par exemple est une vraie catégorie numérique : cela fait sens de demander les "plus vieux que 20 ans". À l'opposé, le genre n'est pas une catégorie numérique et on s'abstiendra de donner à une telle catégorie des valeurs numériques telles 0 et 1.
|