Comment créer un Dictionnaire

pour OpenOffice.org



Diffusé Par
Le Projet Documentation OpenOffice.org



Avertissement

Le chapitre 2 du présent tutoriel a été établi à partir du chapitre 7 du Manuel de Référence Français-GUTenberg v1.0 publié par Christophe Pythoud le 7 juin 1999.

Toutefois le plan du chapitre ayant été remanié et certains paragraphes récrits, il n'est pas possible de citer par le détail tous les passages recopiés de l'original.

Avant toute réutilisation de fragment de texte issu du chapitre 2 du présent tutoriel, il convient donc de vérifier s'il a été recopié sans modification du document de Christophe Pythoud.

La réutilisation de paragraphes issus du chapitre 2 du présent tutoriel qui auraient été recopiés du document de Christophe Pythoud est soumise au droit de licence du document original.

Le Manuel de Référence Français-GUTenberg v1.0 est disponible sous le nom reference.pdf à l'adresse suivante :

http://www.unil.ch/ling/cp/frgut.html#documentation



Table des matières

1 - Description des outils 4

1.1 - Le dictionnaire de mots (fichier fr_FR.dic) 4

1.2 - Le fichier des AFFIX 4

1.2.1 - Présentation d'une ligne d'en-tête 4

1.2.2 - Présentation d'une ligne descriptive 5

1.2.3 - Codification des conditions en champ 5 5

1.2.4 - Exemples de codification des conditions, tirés du fichier des affix FR 6

1.3 - Le programme MySpell 7

2 - Modification du dictionnaire général 8

2.1 - Ajouter des adverbes ou autres mots invariables 8

2.2 - Ajouter des noms et des adjectifs 8

2.2.1 - Le cas simple 8

2.2.2 - Féminin et masculin 8

2.2.3 - Accord de l'adjectif verbal formé sur le participe présent 9

2.2.4 - Le problème de l'élision devant les noms et adjectifs 10

2.2.5 - L'élision devant les noms et adjectifs verbaux formés sur le participe passé 11

2.2.6 - L'élision devant les adjectifs verbaux formés sur le participe présent 12

2.3 - Ajouter des verbes 12

2.3.1 - Conjugaison des temps de l'indicatif, du conditionnel, du subjonctif 12

2.3.2 - Infinitif, participe passé 14

2.3.3 - L'élision devant les verbes 14

2.3.4 - Première personne du singulier du conditionnel et des subjonctifs présent et imparfait avec élision de je 16

2.3.5 - Élision et emplois réflexifs 16

2.3.6 - Élision et verbes essentiellement pronominaux 17

2.3.7 - Les verbes du troisième groupe 18

2.4 - Entrer des abréviations 18

2.5 - Utilisation des préfixes 18

3 - Création d'un dictionnaire spécialisé 19

4 - Tableaux récapitulatifs 20

4.1 - Accord des noms et adjectifs 20

4.2 - Elision devant les noms et adjectifs 21

4.3 - Conjugaison des verbes du 1er et du 2ème groupe 22

4.4 - Elision devant les verbes du 1er et du 2ème groupe 23

4.5 - Elision devant les verbes du 1er et du 2ème groupe (page 2) 24

4.6 - Listes des Affix 25

5 - Crédits 27

6 - Licence 27


1 - Description des outils

Le dictionnaire français fonctionne à partir des 3 outils suivants :

1.1 - Le dictionnaire de mots (fichier fr_FR.dic)

Cette liste de mots a été reprise dans le dictionnaire Français Gutenberg et enrichie par le groupe francophone Open Office.org.

Définition :Un lemme est un mot racine en lexicographie

La liste de mots comporte deux types d'entrée

lemme1

lemme2/drapeau(x)

Dans le premier cas, il s'agit tout simplement d'un mot qui fait partie du dictionnaire. (lemme=mot)

Dans le second cas, le lemme est affecté de 1 ou plusieurs drapeaux qui font référence aux règles de composition des mots par application des affix contenus dans le fichier des affix. Ainsi, pour un seul lemme en entrée du dictionnaire de mots correspondra en réalité plusieurs mots.

1.2 - Le fichier des AFFIX

Un affix est, soit un préfixe, soit un suffixe, attaché à des mots racines (lemme) pour composer d'autres mots.

La raison d'être du fichier des affix est donc de restreindre le nombre de mots à faire figurer dans le dictionnaire de mots.

Par exemple :

dernière (lemme= dernière, suffixe= ère) qui permet d'obtenir dernier, derniers, dernières

joindre (lemme = joindre, préfixe = ad, re) qui donnent adjoindre, rejoindre

Les affix (suffixe) servent donc à gérer en particulier les règles d'accord en genre et en nombre (masculin/féminin, singulier/pluriel), les conjugaisons des verbes, ...

Les affix (préfixe) sont utilisés pour les règles de composition des mots avec préfixe, les règles d'élision, ...

Pour être complet, le fichier des affix doit comprendre une première ligne indiquant le type de jeux de caractère utilisé à la fois pour le dictionnaire de mots et le fichier des affix.

La seconde ligne du fichier des affix indique la liste des caractères à utiliser pour construire les mots qui seront suggérés pour les mots mal orthographiés.

Le fichier des affix comprend la description des différents drapeaux qui gèrent les règles d'affixation. Il est délimité par des espaces et est sensible à la casse.

Pour chaque drapeau, le fichier des affix est constitué de 2 types de lignes, une ligne d'en tête, plusieurs lignes descriptives des règles

1.2.1 - Présentation d'une ligne d'en-tête

La ligne d'en-tête comporte quatre champs

Champ 1 : valeur SFX ou PFX selon qu'il s'agit d'une règle s'appliquant au suffixe ou au préfixe

Champ 2 : Lettre minuscule ou majuscule indiquant le nom du drapeau (attention à la casse)

Champ 3 : valeur 'Y' si le lemme peut être combiné avec un préfixe et un suffixe.
valeur 'N' si pas de combinaison possible

Champ 4 : nombre de lignes descriptives à suivre.

1.2.2 - Présentation d'une ligne descriptive

La ligne descriptive comporte 5 champs

Champ 1 : valeur SFX ou PFX selon qu'il s'agit d'une règle s'appliquant au suffixe ou au préfixe

Champ 2 : lettre minuscule ou majuscule indiquant le nom du drapeau

Champ 3 : la chaîne de caractères à enlever avant d'ajouter le suffixe (restriction du lemme).
(0 indique qu'il n'y a pas de chaîne)
Il n'y a pas de restriction possible pour les préfixes (donc toujours 0 sur une ligne PFX)

Champ 4 : la chaîne de caractères affix à ajouter
(0 indique qu'il n'y a pas de chaîne)

Champ 5 : les conditions que l'on doit respecter pour que l'affix soit appliqué.

1.2.3 - Codification des conditions en champ 5

Pour un même drapeau, les conditions d'application de la règle peuvent varier en fonction de la chaîne de caractères initiale ou terminale.

Il y a donc autant de lignes descriptives pour un même drapeau que de conditions propres à chaque chaîne de caractères initiale ou terminale.

La condition peut donc se lire : pour les mots se terminant par la chaîne en champ 5, restreindre le lemme comme en champ 3 puis ajouter le champ 4

Lorsque la condition est spécifique à une lettre ou à une chaîne de caractères, celle-ci est simplement portée en champ 5

Lorsque la condition s'applique de la même manière plusieurs lettres, les lettres concernées sont placée entre crochets; Un '^' après le crochet ouvrant indique toutes les autres lettres sauf celles de la liste qui suit.

On peut combiner deux crochets successifs.

On peut combiner suite de lettre entre crochets et chaîne de caractères

Cas des préfixes

Pour les préfixes, la condition est toujours sur la première lettre du mot. Il est fréquent que le même préfixe s'applique pour tout un groupe de lettres.

L'apposition d'un préfixe se traduira souvent donc par une ligne descriptive qui aura en champ 5 une liste de lettre entre crochets (présence ou non de'^').

Cas des suffixes

Pour les suffixes, il est fréquent que les conditions dépendent de plusieurs des lettres de fin du mots. C'est le cas en particulier pour les conjugaisons de verbes.

L'apposition d'un suffixe se traduira donc souvent par des combinaisons de chaîne de caractères et de suite de lettres entre crochets.

1.2.4 - Exemples de codification des conditions, tirés du fichier des affix FR

Voici deux exemples d'application de préfixe :

Règle d'application du préfixe 'dé'

PFX D Y 2

PFX D 0 dé [^aàâeèéiîoôuh]

PFX D 0 des [aàâeèéiîoôuh]

Commentaires :
ajouter 'dé' devant les mots NE commençant PAS par a, à, â, e, è,é,i,î,o,ô,u,h.
ajouter 'des' devant les mots commençant par a, à, â, e, è,é,i,î,o,ô,u,h.

Règle d'application sur les préfixes latins 'a(d)-'devant les verbes et non verbes

PFX A Y 10

PFX A 0 ad [^bcdfglmnpqrst]

PFX A 0 a [bdgm]

PFX A 0 ac [cq]

PFX A 0 af [f]

PFX A 0 al [l]

PFX A 0 an [n]

PFX A 0 ap [p]

PFX A 0 ar [r]

PFX A 0 as [s]

PFX A 0 at [t]

Commentaires :
ajouter 'ad' devant les mots NE commençant PAS par b, c, d, f, g, l, m, n, p, q, r, s, t
ajouter 'a' devant les mots commençant par b, d, g, m
ajouter 'ac' devant les mots commençant par c, q
etc.

Voici plusieurs exemples d'application de suffixe

Accord en genre et en nombre des noms et adjectifs

La gestion du masculin singulier et pluriel se fait à partir du féminin singulier

Drapeau F : toutes terminaisons sauf mots en -eur

SFX F Y 57

Règle générale du féminin pluriel

SFX F 0 s [^sxz]

Cas des voyelles + e/ë

Masculin singulier des mots en ée lemme : employée

SFX F ée é ée

masculin singulier et pluriel des mots en ue lemme : bienvenue

sauf si avant dernière lettre g ou q

SFX F ue u [^gq]ue

SFX F e s [^gq]ue

masculin singulier et pluriel des mots en lle lemme : éventuelle, nulle, pareille, gentille

avec e, i, u précédant lle

SFX F lle l [eiu]lle

SFX F le s [eiu]lle

Commentaires :
tous les mots prennent un s au pluriel sauf ceux qui se termine par s, z, x
Deuxième ligne pour le masculin singulier et pluriel des mots en ée.
etc
Il y a 57 lignes descriptives sous le même drapeau F pour gérer les règles d'accord en genre et en nombre des mots sauf mots en en eur.

Conjugaison des verbes

lemme = 1ère pers. sing. de l'indicatif présent

Combinaison possible avec préfixe (Y en 3ème colonne)

SFX u Y 52

verbes en 'e' lemme : arrive

SFX u 0 s e

SFX u 0 nt e

Commentaires
2ème pers du sing et 3ème personne du pluriel de l'indicatif présent
2ème pers du sing et 3ème personne du pluriel du subj présent
3ème pers du sing. identique à 1ère

verbes en 'ens' sauf 'iens' lemme : sens

SFX u s tent [^i]ens

SFX u s te [^i]ens

SFX u s tes [^i]ens

Commentaires
3ème pers pluriel de l'indicatif présent
1ère, 2ème, 3ème pers sing, 3ème pers du pluriel du subjonctif présent

verbes en 'faux', 'feux', 'vaux', 'veux', 'peux' lemme : vaux, faux, veux, peux,

SFX u x t [fvp][ae]ux

Commentaires
sauf prévaloir
3ème pers singulier de l'indicatif présent
Dans cet exemple une combinaison de suite de lettre entre crochets et groupe de caractères, pour les verbes en ux dont l'antépénultième lettre est a ou e et celle d'avant f, v ou p
Il y a 52 lignes dans l'affix u pour décrire la conjugaison des verbes de tous les groupes aux 1ère, 2ème, 3ème personne singulier du présent de l'indicatif et du subjonctif ainsi qu'à la 3ème personne du pluriel des mêmes temps.

1.3 - Le programme MySpell

Il s'agit de l'outil d'analyse orthographique inclus dans la suite Open Office.

Cet outil fonctionne de la manière suivante :

2 - Modification du dictionnaire général

Ce chapitre expose les conditions dans lesquelles il est possible de modifier le dictionnaire général d'OpenOffice.org.

L'analyseur orthographique Myspell ne peut être modifié que par le développeur qui en a la charge. Toute anomalie, dysfonctionnement ou souhait d'améliorations doit donc lui être soumis.

En ce qui concerne le fichier des affix, il est issu de la transformation du fichier des affix pour Ispell créé par Christophe Pythoud. Il est fortement déconseillé de tenter d'apporter des modifications à ce fichier. Il ne faut surtout pas essayer de modifier la structure de affix fixée par Christophe Pythoud. Celle-ci est issue des travaux menés dans le cadre de son travail de diplôme et a été validée par la communauté des utilisateurs du dictionnaire Français Gutenberg. Les seules modifications envisageables sont celles portant sur la création de nouveaux affix dans la mesure où ils n'interfèrent pas avec ceux qui existent déjà. 1

La principale amélioration à apporter consiste donc à inclure de nouveaux lemmes dans le dictionnaire de mots et éventuellement à corriger les lemmes existants en leur adjoignant le drapeau idoine.

Les cas de corrections sont traités comme des adjonctions de mots nouveaux et il suffit de se reporter à l'un paragraphes ci dessous pour en connaître les règles d'application.

2.1 - Ajouter des adverbes ou autres mots invariables

Pour les adverbes et autres mots invariables, aucune précaution particulière n'est requise, il suffit de les faire figurer dans le dictionnaire tels quels.

2.2 - Ajouter des noms et des adjectifs

La règle retenue par Christophe Pythoud est de considérer que le lemme d'un nom ou d'un adjectif est sa forme féminine. Il est, en effet, dans la grande majorité des cas plus simple de faire les restrictions de lemme à partir de la forme féminine.

2.2.1 - Le cas simple

Le cas le plus simple est celui d'un nom ou d'un adjectif épicène2. Il suffit de l'entrer dans le dictionnaire et de lui adjoindre le drapeau S3, s'il prend un simple « s » au pluriel, ou le drapeau X dans tous les autres cas.

Par exemple :

célébration/S pour célébration et célébrations

enfant/S pour enfant et enfants

éclaircissement/S pour éclaircissement et éclaircissements

bateau/X pour bateau et bateaux

drapeau/X pour drapeau et drapeaux

Si le pluriel est identique au singulier, il ne faut pas mettre de drapeau (cf. 2.1)

2.2.2 - Féminin et masculin

Certains noms et adjectifs possèdent des formes féminines et masculines. Dans ce cas, la règle est de faire figurer le mot dans sa forme du féminin singulier

Les règles d'accord en genre et en nombre de ces noms et adjectifs sont traitées par les drapeaux F et G.

Les drapeaux F et G couvrent la quasi-totalité des correspondances entre masculin et féminin du français : Dans le doute, vérifier ce qui est produit par le drapeau.

Seuls les cas les plus irréguliers ne sont pas traités : andalou/andalouse, beau/belle, favori/favorite, fou/folle, tiers/tierce.

En présence de ces noms très irréguliers et non codifiés dans le fichier des affix, il faut faire figurer toutes les formes dans le dictionnaire.

Cas général. Drapeau F

On utilisera le drapeau F pour tous les mots, sauf si s'agit d'un mot qui finit en -eur au masculin singulier ou d'un mot en al qui fait son pluriel en aux

Quelques exemples :

nominative/F pour nominative, nominatives, nominatif, nominatifs

malheureuse/F pour malheureuse, malheureuses, malheureux

dentale/F pour dentale, dentales, dental, dentaux

Cas particuliers Drapeau G

Il faut utiliser le drapeau G pour les mots qui finissent en -eur au masculin singulier et pour les mots en -al qui font le pluriel en -als.

Rappel : on utilisera le drapeau F pour ceux qui font leur pluriel en aux.

Exemples

fatale/G pour fatale, fatales, fatal, fatals

boudeuse/G pour boudeuse, boudeuses, boudeur et boudeurs

2.2.3 - Accord de l'adjectif verbal formé sur le participe présent

Le participe présent est engendré par le drapeau v. Pour notre exemple charmant est créé à partir de du dernier affix du 2ème lemme repris au paragraphe 2.2.1.

En effet, bien souvent, au participe présent correspond un adjectif verbal (et parfois un substantif) susceptible de s'accorder en genre et en nombre (charmants, charmante, charmantes). Quand c'est le cas, on peut ajouter le drapeau c au lemme à l'imparfait.

Dans notre exemple, on obtient :

charmais/vc

Les règles du drapeau c sont :

SFX c Y 3

SFX c is nts ais charmant

SFX c is nte ais charmante

SFX c is ntes ais charmantes

Ce dernier mécanisme est très pratique, mais il faut savoir que l'orthographe française recèle quelques pièges dans ce domaine. Il faut dans certains cas s'abstenir d'utiliser le drapeau c. En effet, les graphies du participe présent et de l'adjectif verbal peuvent parfois être différentes. Quelques exemples :

Exemple 1

Pierre, négligeant toute prudence, appuya sur le champignon.

Pierre se montre toujours très négligent au volant.

Exemple 2

Paul asséna son dernier argument à Jean, le convainquant ainsi du bien-fondé de son point de vue.

Paul a été très convaincant face à Jean.

Exemple 3

Le journaliste continua de poser ses questions, fatiguant les coureurs.

Les questions du journaliste étaient fatigantes.

Au vu de ce qui précède, il faut tenir compte des points suivants :

Grevisse (1988) donne au §1882 une liste d'adjectifs « verbaux » qui ne se forment pas sur le participe présent.

2.2.4 - Le problème de l'élision devant les noms et adjectifs

Comment gérer l'élision de l'article le ou de dans le cas d'un nom ou d'un adjectif commençant par une voyelle ou un « h » muet ?

Les cas d'élision de le devant les noms et adjectifs sont réglés par le drapeau L

Les cas d'élision de de devant les noms et adjectifs sont réglés par le drapeau M

Attention : les cas d'élision devant les verbes sont réglés par d'autres drapeaux

Il faut distinguer deux cas :

Dans le premier cas, on entre le nom ou l'adjectif au singulier dans le dictionnaire, accompagné des drapeaux L et M en plus de S ou de X selon le pluriel du mot (cf. 2.2.1).

Exemples :

éclaircissement/LMS pour éclaircissement, éclaircissements, l'éclaircissement, d'éclaircissement et d'éclaircissements.

agneau/LMX pour agneau, agneaux, l'agneau, d'agneau, d'agneaux.



Dans le second cas, l'opération est une peu plus délicate : il faut entrer la forme du féminin singulier du mot, accompagnée des drapeaux LMF ou LMG (cf. 2.2.2), et le masculin singulier précédé de « l' ».

Exemple :

ancienne/LMF pour ancienne, anciennes, ancien, anciens, l'ancienne, d'ancienne, d'anciennes, d'ancien et d'anciens

l'ancien

Pourquoi est-il nécessaire de spécifier l'ancien. Examinons le « code » des drapeaux L et M :

Élision de l'article 'le'

PFX L N 1

PFX L 0 l' [aàâeèéêiîoôuh]

Élision de l'article 'de'

PFX M Y 1

PFX M 0 d' [aàâeèéêiîoôuh]

Ces deux règles indiquent que tout mot commençant par une voyelle (accentuée ou non) ou par un « h » muet peut être précédé de l' ou de d'.

La différence entre elles se situe au niveau du champ 3 de la ligne d'en tête : N pour l'affix L, Y pour l'affix M.

Ceci signifie que le préfixe M est libre de se combiner avec n'importe quel suffixe également doté de Y (et réciproquement). En revanche, le préfixe L ne le peut pas.

Ceci a pour conséquence que d' + ancienne + s est autorisé mais pas l' + ancienne + s:

Cette restriction interdit au système d'accepter ou de produire les formes erronées tel l'anciens et l'anciennes, mais nécessite alors que la forme correcte l'ancien soit spécifiée séparément.

Le problème ne se pose pas pour le drapeau M.

Quelques remarques sur les adjectifs

Jusqu'à présent aucune distinction n'a été faite entre noms et adjectifs pour l'attribution des drapeaux.

On pourrait cependant se demander si les drapeaux L et M, représentant respectivement l'élision des déterminants le et de, doivent vraiment être attribués aux adjectifs. En règle normale l'adjectif qualificatif se place après le nom et en conséquence les adjectifs ne peuvent être précédés de le ou de.

Exemple : l'individu ignoble

Mais, il ne faut pas oublier qu'en français, la plupart des adjectifs peuvent se trouver antéposés au nom qu'ils qualifient.

Exemple : l'ignoble individu.

Certains adjectifs, appartenant à des catégories bien précises, ne sont toutefois jamais antéposés. Pour ceux-ci, et seulement pour eux, on peut se passer des drapeaux L et M. Les catégories d'adjectifs concernées sont les suivantes :

Cette règle est largement tempérée par le fait que beaucoup de ces adjectifs sont aussi des noms et comme tels s'accordent et qu'en conséquence le dictionnaire comporte un affix pour le nom correspondant.

Exemple

ovale/LMS pour ovale, ovales, l'ovale, d'ovale, d'ovales

anglaise/LMF pour anglais, d'anglais

l'anglais

2.2.5 - L'élision devant les noms et adjectifs verbaux formés sur le participe passé

Si ce participe passé est à l'origine d'un substantif, on utilise la forme féminine accompagné des drapeaux LMF, suivie de la forme masculine précédée de « l' » (cf. 2.2.4, élision de le et de devant les noms).

Mais on ne fera pas de même pour un adjectif : contrairement aux adjectifs formés sur le participe présent, les adjectifs formés sur le participe passé ne peuvent jamais être antéposés en français, i.e., utilisés comme épithètes4. Ils ne seront donc jamais précédés d'un déterminant. On peut s'en rendre compte empiriquement, en comparant les quatre exemples ci-dessous :

L'homme assailli.

*L'assailli homme.

La question assaillante.

L'assaillante question.

2.2.6 - L'élision devant les adjectifs verbaux formés sur le participe présent

Que faire si le participe présent peut être mis en rapport avec un adjectif verbal ? Au vu de ce qui précède, il convient d'utiliser la forme féminine accompagnée des drapeaux LMF.

Il n'est pas nécessaire d'ajouter la forme masculine précédée de « l' », sauf si le verbe est intransitif (le drapeau l n'accompagne pas le lemme de l'imparfait) ou si l'adjectif verbal ne se forme pas sur le participe présent (voir les explications concernant le drapeau c en fin de section 2.2.3).

2.3 - Ajouter des verbes

Dans les paragraphes qui suivent, sont examinées les modalités d'ajout de verbes au dictionnaire de mots.

Pour simplifier les explications, les développements qui suivent partent du principe que les verbes à ajouter appartiennent aux premier et deuxième groupes de conjugaison5. Comme le dictionnaire Francais-GUTenberg dont est issu le dictionnaire OpenOffice contenait en principe tous les verbes du troisième groupe, il est peu probable qu'il soit nécessaire d'ajouter au dictionnaire de tels verbes (sinon, se reporter à la section 2.2.7).

La conjugaison des verbes reposent sur un système à 5 lemmes, c'est à dire 5 formes de conjugaison du verbe permettent d'obtenir par restriction et ajout toutes les autres formes du verbe.

Les quatre premiers lemmes sont étudiés au § 2.3.1 et le cinquième au § 2.3.2

Il existe une version du fichier des affix suffisamment documentée pour être comprise à partir des explications qui suivent.

2.3.1 - Conjugaison des temps de l'indicatif, du conditionnel, du subjonctif

Pour les verbes des 1er et 2ème groupe, la conjugaison des temps simples de l'indicatif, du conditionnel et de subjonctif (présent, imparfait, passé simple, futur) est formé au moyen de 4 lemmes qui sont les premières personnes des temps de l'indicatif présent, imparfait, passé simple et futur.

Pour les temps composés, la conjugaison est formée avec le verbe être ou avoir et le participe passé du verbe.

A ces quatre lemmes sont joints 4 drapeaux : u, v, w et x. (faire attention à la casse)

Prenons l'exemple du verbe charmer :

charme/u

charmais/v

charmai/w

charmerai/x

Ces quatre lemmes permettent d'engendrer toutes les formes du verbe charmer à l'exception de l'infinitif et du participe passé.

Voici les règles, extraites du fichier des affix, qui leur sont appliquées (ne figurent que les lignes pertinentes pour le verbe charmer) :

lemme = 1ère pers. sing. de l'indicatif présent qui permet d'obtenir les

1ère, 2ème, 3ème personne singulier de l'indicatif présent,

3ème personne pluriel de l'indicatif présent

1ère, 2ème, 3ème personne singulier du subjonctif présent,

3ème personne pluriel du subjonctif présent

SFX u Y 52

SFX u 0 s e je charme, tu charmes, il charme,
que je charme, que tu charmes, qu'il charme

SFX u 0 nt e ils charment, qu'ils charment



lemme = 1ère pers. sing. de l'indicatif imparfait qui permet d'obtenir

toutes les personnes de l'indicatif imparfait

les 1ère, 2ème personne pluriel de l'indicatif présent,

les 1ère, 2ème personne pluriel du subjonctif présent,

le participe présent

la plupart des adjectifs verbaux en 'ant'

SFX v Y 13

SFX v s t ais il charmait

SFX v ais ions [^çe]ais nous charmions

SFX v ais iez [^çe]ais vous charmiez

SFX v s ent ais ils charmaient

SFX v ais ons ais nous charmons

SFX v ais ez [^çe]ais vous charmez

SFX v is nt ais charmant



lemme = 1ère pers. sing. du passé simple qui permet d'obtenir

toutes les personnes du passé simple

les personnes du subjonctif imparfait

SFX w Y 38

SFX w i s ai tu charmas

SFX w ai a ai il charma

SFX w ai âmes ai nous charmâmes

SFX w ai âtes ai vous charmâtes

SFX w ai èrent [^çe]ai ils charmèrent

SFX w i sse ai que je charmasse

SFX w i sses ai que tu charmasses

SFX w ai ât ai qu'il charmât

SFX w i ssions ai que nous charmassions

SFX w i ssiez ai que vous charmassiez

SFX w i ssent ai qu'ils charmassent


lemme = 1ère pers. sing. du futur indicatif permet d'obtenir

toutes les personnes du futur indicatif

les personnes du conditionnel présent

SFX x Y 10

SFX x i s ai tu charmeras

SFX x ai a ai il charmera

SFX x ai ons ai nous charmerons

SFX x ai ez ai vous charmerez

SFX x ai ont ai ils charmeront

SFX x 0 s ai je charmerais, tu charmerais

SFX x 0 t ai il charmerait

SFX x ai ions ai nous charmerions

SFX x ai iez ai vous charmeriez

SFX x 0 ent ai ils charmeraient

2.3.2 - Infinitif, participe passé

En ce qui concerne le participe passé, il faut distinguer deux cas :

Dans le premier cas, on entre simplement l'infinitif et le participe passé dans le dictionnaire. Par exemple :

bifurquer

bifurqué

Dans le second cas, on entre l'infinitif suivi du drapeau y. Par exemple :

charmer/y

Le drapeau y se compose, entre autres, des règles suivantes :

lemme = infinitif qui permet d'obtenir toutes les formes du participe passé

SFX y Y 67

SFX y er é er charmé

SFX y er és er charmés

SFX y er ée er charmée

SFX y er ées er charmées

2.3.3 - L'élision devant les verbes

Lorsqu'on est confronté à un verbe commençant par une voyelle ou un « h » muet, la situation est un peu compliquée et il faut être extrêmement prudent par rapport à deux choses :

Les pronoms susceptibles de s'élider relèvent de différentes catégories :

La table ci-après récapitule les conditions d'élisions des pronoms devant les verbes;

Le pronom est

Sujet

Complément d'objet direct

Complément d'objet indirect

Réflexif

je j'

tu Ø

il/elle/on Ø

nous Ø

vous Ø

ils/elles Ø

me m'

te t'

le l'

nous Ø

vous Ø

les Ø

me m'

te t'

lui Ø

nous Ø

vous Ø

leur Ø

me m'

te t'

se s'

nous Ø

vous Ø

se s'

Négation : ne n'



On observe un grand syncrétisme entre les différentes formes, ce qui n'est pas de nature à faciliter la tâche. Aux différentes formes d'élision correspondent les drapeaux j, n, m, t, l s :

PFX j N 1 élision de de JE (j'aime)

PFX j 0 j' [aàâeèéêiîoôuh]

PFX n Y 2 élision de la négation (tu n'aimes pas)

PFX n 0 n' [aàâeèéêiîoôuh]

PFX n 0 qu' [aàâeèéêiîoôuh]

PFX m Y 1 élision du pronom ME (tu m'aides)

PFX m 0 m' [aàâeèéêiîoôuh]

PFX t Y 1 élision du pronom TE (je t'énerve)

PFX t 0 t' [aàâeèéêiîoôuh]

PFX l Y 1 élision de LE (je l'attends)

PFX l 0 l' [aàâeèéêiîoôuh]

PFX s N 1 élision de SE uniquement pour l'infinitif (s'attendre)

PFX s 0 s' [aàâeèéêiîoôuh]


Il ne faut jamais combiner ces drapeaux avec c et y (voir plus bas pour les détails).

L'élision de se n'est pas prise en charge par le système (sauf pour l'infinitif, par le biais du drapeau s) : voir les sections 2.2.5 et 2.2.6 pour ce qui concerne les emplois réflexifs et les verbes essentiellement pronominaux.

Quels drapeaux employer et dans quels cas ?

Drapeau j

Le drapeau j doit, dans tous les cas, précéder les quatre premiers lemmes du verbe, mais pas l'infinitif. Tout comme le drapeau L (cf. 2.2.4, accord des noms et adjectifs), il comporte N en champ 3, ce qui l'empêche de se combiner avec un suffixe pour donner des résultats aberrants (cependant, comme pour le drapeau L, cela présente quelques inconvénients – cf. 2.2.4).

Drapeau n

La négation est possible avec toutes les formes du verbe donc, le drapeau n concerne tous les lemmes du verbe.

Drapeaux m, t, l

Si le verbe accepte un objet direct, chaque lemme devrait être en principe accompagné des drapeaux m, t et l. En fait il faut bien réfléchir au sens du verbe :

Si l'objet direct ne peut pas être une personne les drapeaux m et t ne devraient en principe pas être spécifiés. On peut prendre comme exemples les verbes accélérer ou ébruiter.

Si le verbe n'accepte pas d'objet direct, mais seulement un objet indirect, seuls les drapeaux m et t entrent en ligne de compte (cf. table 2.1).

Le critère sémantique invoqué pour les compléments d'objets directs s'applique également aux compléments indirects. Mais il ne faut cependant pas surestimer son importance : le français dispose d'une construction appelée datif éthique, dont les grammaires parlent peu mais qui est très usitée. Rentrent dans cette catégorie toutes les constructions du type :

Je peux t' aménager de la place dans mon laboratoire.

Il faudra m'améliorer la conclusion de cet article.

qui indiquent, la plupart du temps, le bénéficiaire de l'action accomplie. On ne peux pas sérieusement considérer toutes ces formes comme incorrectes et il faut donc en tenir compte dans l'attribution des drapeaux.

Si le verbe est intransitif, les choses deviennent fort simple, on ignore les trois drapeaux m, t et l.

Avant d'aller plus loin, une remarque complémentaire sur les drapeaux m et t s'impose : ils autorisent des formes erronées comme *m'absolvons et *t'énerviez. Malheureusement, la seule solution pour éviter cela consisterait à supprimer ces drapeaux et à entrer « à la main » toutes les élisions des pronoms me et te dans le dictionnaire : vu leur nombre, ce n'est pas envisageable.

Concernant le cinquième lemme, l'infinitif, on le fera figurer accompagné des drapeaux nM6, dans tous les cas, et des drapeaux m, t et l, quand il y a lieu (cf. ci-dessus), ainsi que le drapeau s dans certains cas (cf. 2.3.5).

2.3.4 - Première personne du singulier du conditionnel et des subjonctifs présent et imparfait avec élision de je

Lorsqu'un verbe commence par une voyelle, il faut généralement ajouter « à la main » les premières personnes des subjonctifs présent et imparfait et du conditionnel précédées du pronom je élidé (« j' »).

Pour les verbes du premier groupe, la première personne du subjonctif présent est identique à celle du présent de l'indicatif, il n'est donc pas nécessaire de l'ajouter.

Pour les verbes du second groupe, la première personne du présent du subjonctif est identique à celle de l'imparfait du subjonctif ; il n'est donc pas nécessaire de l'ajouter.

2.3.5 - Élision et emplois réflexifs

Les drapeaux présentés jusqu'ici ne permettent pas de régler le problème de l'élision du pronom se (dans il s'aime ou ils s'aiment). En effet le drapeau s ne doit être utilisé » que pour le forme infinitive (cf. 2.3.3).

Ce problème présente deux caractéristiques :

On procédera de la manière suivante :

  1. « s' » + la troisième personne du singulier de l'indicatif présent, accompagnée du drapeau p (par exemple : s'abonne/p) ;

  2. « s' » + la troisième personne du singulier de l'indicatif imparfait, accompagnée du même drapeau p (par exemple : s'abonnait/p) ;

2.3.6 - Élision et verbes essentiellement pronominaux

Un problème de même nature, mais de plus grande ampleur, se pose avec les verbes dits « essentiellement pronominaux » comme s'absenter. La meilleure solution avec de tels verbes est d'en entrer manuellement toutes les formes dans le dictionnaire, à l'exception de celles qui peuvent être engendrées par les drapeaux p ou q (cf. 2.3.5). Ils sont heureusement peu nombreux (et seuls les verbes commençant par une voyelle ou un « h » muet posent problème). Le dictionnaire Open Office français en contient un certain nombre.

L'infinitif et le participe présent de ces verbes doivent être entrés tels quels, accompagnés des drapeaux s, m et t.

Voici un exemple (le verbe s'absenter) :

m'absente

t'absentes

s'absente/p

absentons

absentez

m'absentais

t'absentais

s'absentait/p

absentions

absentiez

m'absentai

t'absentas

absentâmes

absentâtes

m'absenterai

t'absenteras

absenterions

absenterez

m'absentasse

t'absentasses

absentassions

absentassiez

m'absenterais

t'absenterais

absenterions

absenteriez

absentant/smt

absentée/F

absenter/smt

2.3.7 - Les verbes du troisième groupe

Les verbes du troisième groupe doivent être traités comme les autres, selon les points qui précèdent. La seule difficulté supplémentaire est que les drapeaux gérant la conjugaison proprement dite ne sont pas toujours les mêmes que pour les deux autres groupes. D'autre part, il n'existe rien d'équivalent aux drapeaux p et q (cf. 2.3.5) pour les verbes à emplois réflexifs. En principe, le dictionnaire d'Open Office contient tous les verbes du troisième groupe, vous ne devriez donc pas avoir à vous en soucier.

2.4 - Entrer des abréviations

Le dictionnaire peut également contenir des abréviations. Si une abréviation contient un point final, celui-ci ne doit pas être tapé. En revanche on peut utiliser des points dans le corps de l'abréviation, de même que des tirets et des apostrophes. Par exemple, pour l'abréviation « c.-à-d.» de « c'est-à-dire », vous entrerez c. -à-d (sans point final).

2.5 - Utilisation des préfixes

Le fichier des affixf de OpenOffice permet de gérer les préfixes latin suivants : a(d)-, con-, dé-, dis-, ex-, in-, pré-, re- et sub-. Leur utilisation peut faciliter et accélérer la composition d'un dictionnaire.

Il peut être envisagé de rajouter d'autres préfixes pour composer automatiquement des mots. (anti, anté, multi, ...).

Il permet aussi de gérer les élisions de préposition telles que jusque, que, quoique, puisque.

Il est tout à fait possible d'ajouter d'autres préfixes que ceux figurant au fichier des affix.

Il conviendra seulement de respecter les règles suivantes :



3 - Création d'un dictionnaire spécialisé

Le correcteur orthographique est un ensemble complet et homogène des trois composantes décrites ci dessus. En particulier, il y a une articulation très étroite entre le fonctionnement de MySpell, les règles de codification du fichier des affix et la déclinaison de ces règles sur les lemmes du dictionnaire de mots.

Le fichier des affix est constitué d'un ensemble de règles codifiées selon un formalisme à respecter pour être correctement interprétées par le programme Myspell.

De plus, il est très important de respecter les règles syntaxiques suivies pour la définition des lemmes. Une déviation dans ces règles entraîne immédiatement une mauvaise application des règles dans le dictionnaire de mots.

Avant toute constitution d'un nouveau dictionnaire plus spécialisé que le dictionnaire général, il convient donc de lire attentivement les principes retenus dans la formation du fichier des affix et dans les choix retenus pour la constitution du dictionnaire de mots.(chapitre 1 de ce document)

En particulier, il convient de retenir que les règles pour le choix des lemmes sont les suivantes :

L'utilisateur intéressé pourra se reporter utilement au mémoire de Christophe Pythoud (chapitres 5, 6, 7) détaillant les règles de construction du dictionnaire GUTenberg, dont s'inspire le dictionnaire d'OpenOffice.org.

Ce mémoire est disponible sous le nom reference.pdf à l'adresse suivante :

http://www.unil.ch/ling/cp/frgut.html#documentation



4 - Tableaux récapitulatifs

4.1 - Accord des noms et adjectifs

Cas rencontré

Conditions d'utilisation

Mot entré dans le dictionnaire

Drapeau(x)

Exemple

Réf.

Adverbes et autres mots invariables

Aucune

Le mot

Aucun

évidemment

§ 2.1

Noms et adjectifs

Noms et adjectifs épicènes

Le mot

Drapeau S

Pour les mots avec pluriel en s

célébration/S

§ 2.2.1

Drapeau X

Dans tous les autres cas

drapeau/X

§ 2.2.1

Noms et adjectifs à formes masculines et féminines

La forme féminine du mot

Drapeau F

Tous les noms et adjectifs sauf ceux en -eur et qui font le pluriel en als

nominative/F

malheureuse/F

§ 2.2.2.1

Drapeau G

Pour les noms et adjectifs en -eur et ceux qui font leur pluriel en als

boudeuse/G

fatal/G

§ 2.2.2.2

Exception des mots très irréguliers

Aucune

Toutes les formes du mot

Aucun

beau/belle

favori/favorite

§ 2.2.1



4.2 - Elision devant les noms et adjectifs

Cas rencontré

Conditions d'utilisation

Mot entré dans le dictionnaire

Drapeau(x)

Exemple

Réf.

Élision de le

Élision de de

Noms et adjectifs épicènes

La forme féminine du mot

Drapeaux L et M

abcès/LM

§ 2.2.4

Noms et adjectifs à formes masculines et féminines

La forme féminine du mot

La forme masculine précédée de l'

Drapeaux L et M

ancien/LMS

l'ancien

§ 2.2.4

Noms formés sur le participe passé

La forme féminine du mot

La forme masculine précédée de l'

Drapeau L et M


abonnée/LM

l'abonné

§ 2.2.5

Adjectifs verbaux formés sur le participe passé

La forme féminine du mot

Drapeaux L et M

assaillie/F

§ 2.2.5

Adjectifs verbaux formés sur le participe présent

La forme féminine du mot

La forme masculine précédée de l'
(seulement si le verbe est intransitif)

Drapeaux L et M




abattante/LMF



l'aboutissant

§ 2.2.6



4.3 - Conjugaison des verbes du 1er et du 2ème groupe

Cas rencontré

Mot entré dans le dictionnaire

Drapeau(x)

Exemple

Référence

Conjugaison des temps de l'indicatif,du conditionnel, du subjonctif, participe présent

1ère pers. sing de l'indicatif présent

1ère pers. sing de l'indicatif imparfait

1ère pers. sing de l'indicatif passé simple

1ère pers. sing de l'indicatif futur

Drapeau u

Drapeau v

Drapeau w

Drapeau x

charme/u

charmais/v

charmai/v

charmerai/x

§2.3.1

Infinitif, participe passé

Forme infinitif

Drapeau y

charmer/y

§ 2.3.2



Les verbes du 3ème groupe sont en principe tous repris dans le dictionnaire

4.4 - Elision devant les verbes du 1er et du 2ème groupe

Cas rencontré

Conditions d'utilisation


Drapeau(x)

Exemple

Référence

Elision de je

Pour tous les verbes à tous les temps sauf pour l'infinitif

1ère pers. sing de l'indicatif présent

1ère pers. sing de l'indicatif imparfait

1ère pers. sing de l'indicatif passé simple

1ère pers. sing de l'indicatif futur



Drapeau j

aide/j

aidais/j

aidai/j

aiderai/j

§ 2.3.3

Elision de ne

Pour tous les verbes, à tous les temps

Les cinq lemmes de conjugaison

Drapeau n

aide/n

aidais/n

aidai/n

aiderai/n

aider/n

§ 2.3.3

Elision de me

Elision de te

Elision de le

Verbe intransitif

Les cinq lemmes de conjugaison

Aucun



Verbe transitif accepte C.O.D. qui peut être une personne

Les cinq lemmes de conjugaison

Drapeau m, t, l

abîme/mtl

abîmais/mtl

abîmai/mtl

abîmerai/mtl

abîmer/mtl

§ 2.3.3

Verbe transitif accepte C.O.D. qui ne peut pas être une personne

Les cinq lemmes de conjugaison

Drapeau l

emmétrer/l

§ 2.3.3

Verbe transitif qui n'accepte pas de C.O.D mais seulement un C.O. indirect.

Il y a des exceptions

Les cinq lemmes de conjugaison

Drapeau m,t

accouder/mt

§ 2.3.3







4.5 - Elision devant les verbes du 1er et du 2ème groupe (page 2)

Cas rencontré

Conditions d'utilisation


Drapeau(x)

Exemple

Référence

Elision de se

Pour les troisièmes personnes du singulier et du pluriel de tous les temps des verbes réflexifs

Verbes du 1er groupe

« s' »+3ème pers sing de l'indicatif présent

« s' »+3ème pers sing de l'indicatif imparfait

« s' »+infinitif

Drapeau p

s'abonne/p

s'abonnait/p

§ 2.3.5

Verbes du 2ème groupe

« s' »+3ème pers sing de l'indicatif imparfait

« s' »+infinitif

Drapeau q

s'abêtissait/q

§ 2.3.5

Elision de de

Infinitif de tous les verbes

Infinitif

Drapeau M

abdiquer/M

§ 2.3.5



4.6 - Listes des Affix



Cette liste est établie pour récapituler les préfixes et suffixes utilisés avec un résumé de la règle applicable.

Certaines règles ont des conditions complémentaires de mise en oeuvre qui ne sont pas indiquées ci-après. Pour plus de détails, consulter le corps du document ou le fichier des affix.

A

PFX

Préfixes latins 'a(d)-'devant les verbes et non verbes

B

PFX

Préfixes latins 'a(d)-' avec élision de 'de' devant les non verbes uniquement

C

PFX

Préfixes latins 'con-'devant les non verbes uniquement

D

PFX

Préfixe 'dé-'

E

PFX

Préfixe latin 'ex-' devant les verbes et non verbes

F

SFX

Accord en genre et en nombre des noms et adjectifs sauf terminaison en eur et ceux qui font le pluriel en als

G

SFX

Accord en genre et en nombre des noms et adjectifs se terminant en eur eou qui font le pluriel en als

H

PFX

Préfixes latins 'a(d)-' avec élision de 'le' devant les non verbes uniquement

I

PFX

Préfixe latin 'in-' (privatif, et locatif/inchoatif) devant les verbes et non verbes

J

PFX

Préfixe latin 'in-' avec élision de 'de' devant les non verbes uniquement

K

PFX

Préfixe latin 'in-' avec élision de 'le' devant les non verbes uniquement

L

PFX

Élision de l'article 'le' devant les noms verbes exclusivement

M

PFX

Élision de l'article 'de'

N

PFX

Préfixe 'dis-'

O

PFX

Préfixe 'ré-' et 're-' ('é' devant C et élision devant V)

P

PFX

Préfixe 'pré-' attention aux exceptions

Q

PFX

Élision des conjonctions que, quoique, puisque, lorsque

R

PFX

Préfixe 'ré-' et 're-' ('é' devant V et 'e' devant C)

S

SFX

Pluriel en s des mots sans forme féminine

T



U

PFX

Élision de jusque

V



W

PFX

Préfixe latin 'sub-'

X

SFX

Pluriel des mots en x

Y

PFX

Préfixe latin 'ex-' avec élision de 'de' devant les non verbes uniquement

Z

PFX

Préfixe latin 'ex-' avec élision de 'le' devant les non verbes uniquement



a

PFX

Élision des pronoms 'le', 'me', 'te' devant les préfixes latins a(d) verbes transitifs uniquement

b

PFX

Élision du pronom 'je' devant les préfixes latins a(d) verbes uniquement

c

SFX

Accord des adjectifs verbaux en ant

d

SFX

Cas particulier de conjugaison des verbes du 3ème groupe

e

PFX

Élision des pronoms 'le', 'me', 'te' devant les préfixes latins 'ex' verbes transitifs uniquement

f

PFX

Élision du pronom 'je' devant les préfixes latins 'ex' verbes uniquement

g

SFX

Cas particulier de conjugaison des verbes du 3ème groupe

h



i

PFX

Élision des pronoms 'le', 'me', 'te' devant les préfixes latins

j

PFX

Élision de 'je'

k

PFX

Élision du pronom 'je' devant les préfixes latins 'in' verbes uniquemenT

l

PFX

Élision de 'le' en pronom complément d'objet direct uniquement

n

PFX

Élision de la négation et de 'que'

m

PFX

Élision du pronom 'me'

o



p

SFX

Élision du pronom réfléchi 'se' devant certains verbes du 1er et 2ème groupe

q

SFX

Élision du pronom réfléchi 'se' devant certains verbes du 1er et 2ème groupe

r



s

PFX

Élision du pronom réfléchi 'se' à employer uniquement devant l'infinitif

t

PFX

Élision du pronom 'te'

u

SFX

Conjugaison des verbes des 1er et 2ème groupe

v

SFX

Conjugaison des verbes des 1er et 2ème groupe

w

SFX

Conjugaison des verbes des 1er et 2ème groupe

x

SFX

Conjugaison des verbes des 1er et 2ème groupe

y

SFX

Conjugaison des verbes des 1er et 2ème groupe

z

SFX

Cas particulier de conjugaison des verbes du 3ème groupe



5 - Crédits

Auteur : Christian Hardy

Remerciements : A Sophie Gautier et Blaise Drayer pour leur soutien et leurs encouragements permanents

Intégré par : N/A

Dernière modification : 20 novembre 2002

Contacts : OpenOffice.org Documentation http://www.openoffice-fr.org

Traduction : N/A

6 - Licence

Pour les parties de ce tutoriel reprises du Manuel de Référence Français GUTenberg V1.0 (chapitre 7) établies par Christophe Pythoud, les droits de licences sont ceux de l'auteur. (cf l'avertissement en tête de document). Le document original est disponible ici :

http://www.unil.ch/ling/cp/frgut.html#documentation

Appendix


Public Documentation License Notice


The contents of this Documentation are subject to the Public Documentation License Version 1.0 (the "License"); you may only use this Documentation if you comply with the terms of this License. A copy of the License is available at http://www.openoffice.org/licenses/PDL.html.


The Original Documentation is Comment créer un dictionnaire pour OpenOffice.org. The Initial Writer of the Original Documentation is Christian Hardy Copyright (C) 2002. All Rights Reserved. (Initial Writer contact(s): christian.hardy@dp.finances.gouv.fr).


Contributor(s): ______________________________________.

Portions created by ______ are Copyright (C)_________[Insert year(s)]. All Rights Reserved. (Contributor contact(s):________________[Insert hyperlink/alias]).



NOTE: The text of this Appendix may differ slightly from the text of the notices in the files of the Original Documentation. You should use the text of this Appendix rather than the text found in the Original Documentation for Your Modifications.

1Il existe une version très documentée du fichier des affix qui complète largement cette note

2Épicène : se dit d'un mot dont la forme ne varie pas selon le genre (exemple : habile, enfant)

3La casse du drapeau est importante et donc S n'est pas équivalent à s.

4Ils partagent d'ailleurs cette intéressante propriété, comme déjà signalé à la fin de la section 2.1.3 avec les adjectifs de couleur, d'appartenance et de forme.

5Les verbes du 1er groupes ont les verbes en -er à l'exception de alle. Les verbes du 2ème groupe sont les verbes en -ir qui font leur première personne en -is et leur participe présent en -issant. Dans tous les autres cas les verbes sont du troisième groupe

6Le drapeau M gère le préfixe d',