Logo BPI
Accueil TCAO  |  Remerciements  |  Un aperçu  |  Licence BPI  |  Distribution  |  Installation  | 
Claviers  |  Pointeurs  |  Alibi  |  Concorde  |  Recode  |  Ventile  |  Vocable  |  Accueil BPI

Progiciels de TCAO - Concorde - Exemples

Table des matières - Concorde - Exemples

Résumé

Concorde est un progiciel de production de concordances de mots en contexte. Cet outil permet de dépouiller des fichiers textuels et de produire une liste alphabétique des items-vedettes de ces textes. L'item-vedette d'une concordance peut être basé soit sur les mots dans leurs contextes phrastiques ou soit sur les caractères dans leurs contextes de mots. Comme usage mois fréquent, l'item-vedette peut aussi être basé sur la phrase ou sur la ligne d'un texte. Dans une concordance en contexte, les items-vedettes sont affichés au centre de la ligne et ils sont alignés verticalement. À la gauche et à la droite de chaque item-vedette, est affiché le contexte immédiat de cet item selon le contenu textuel des fichiers d'entrée. Les items-vedettes peuvent être triés en ordre alphabétique habituel (i.e. de gauche à droite) ou en ordre alphabétique inverse (i.e. de droite à gauche).

Comme données d'entrée, Concorde accepte un ou plusieurs fichiers d'entrée en même temps. Ces fichiers peuvent être soit en format plein texte, soit en format HTML ou soit en tout format SGML. Tout comme les progiciels Ventile, Vocable et Alibi, le progiciel Concorde supporte la notion de régions textuelles à l'aide de raffineurs internes et de raffineurs externes. Enfin, une option permet d'imprimer une référence de type nom de fichier:numéro de ligne facilitant la mise en regard les résultats d'une concordance avec le ou les fichiers sources d'entrée. Pour mieux comprendre les commandes d'appel de Ventile formulées dans les prochains exemples, consultez le Menu d'aide de Concorde.


Exemple 1 - Concordance en français avec tri alphabétique

La commande suivante demande de lire le fichier français xlinfr.l1, de produire une concordance des mots de ce texte (raffineur interne W) se trouvant dans une région textuelle phrase (raffineur interne S), et d'afficher les résultats sur une largeur de 70 colonnes (selon l'option -w70).

concorde -w70  S,W  xlinfr.l1

Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.

...
vés en chemin, l'Homme se mit  à   parler: amis ouvrons nos paquets et
éjouit; il l'a pour toujours,  à   lui tout seul sans contestation.
  La femme sortit et s'enfuit  à   toutes jambes.
                      L'homme  accepta.
             Après quoi, tous  acceptèrent.
 chercher une épouse; il s'en  alla.
ls remercièrent Maman et s'en  allèrent.
                     Ils s'en  allèrent.
Coq leur demanda: mes amis où  allez-vous?
    Ils répondirent que: nous  allons   épouser des femmes.
e Coq dit: attendez-moi, nous  allons   partir ensemble.
ement si tu arrives chez toi,  alors   tu peux l'ouvrir.
         Le Bouc lui demanda:  ami,   où vas-tu?
     Le Coq leur demanda: mes  amis   où allez-vous?
min, l'Homme se mit à parler:  amis   ouvrons nos paquets et mangeons.
                          Les  animaux   ne payent pas de dot.
               Au matin, elle  appela   l'Homme, lui donnant un paquet
                        Maman  appela   le Bouc, lui donna son paquet
                        Maman  appela   encore le Coq, lui donna aussi
...

Avec ces premiers résultats, on peut constater que les mots-vedettes sont affichés au centre de la ligne, proportionnellement à la valeur de la largeur de 70 colonnes demandées. Les mots-vedettes sont triés alphabétiquement et ils sont alignés verticalement. Des espaces blancs sont ajoutés de chaque côté du mot-vedette afin de le mettre plus en évidence. De plus, Concorde tente remplir au maximum le contexte gauche et le contexte droit, quitte à tronquer les mots soit au début du contexte droit ou soit à la fin du contexte gauche.

La valeur par défaut de l'option de sortie -w est de 79 colonnes, ce qui correspond à la largeur d'un écran standard. La valeur maximale de l'option -w dépend plutôt de la capacité de votre écran ou, encore, de la largeur maximale des pages de votre imprimante.


Exemple 2 - Concordance en français avec tri alphabétique inverse

La commande suivante demande presque la même chose que la commande précédente. Cette commande avec l'option -i demande de trier les mots-vedettes en ordre alphabétique inverse plutôt qu'en ordre alphabétique habituel. Un tri inverse permet de regarder les mots selon l'ordre morphologique des terminaisons.

concorde -w70 -i  S,W   xlinfr.l1

Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.

...
  Arrivés en chemin, l'Homme se mit   à  parler: amis ouvrons nos paqu
l se réjouit; il l'a pour toujours,   à  lui tout seul sans contestati
        La femme sortit et s'enfuit   à  toutes jambes.
s jours, le quatrième l'homme   demanda  encore.
                 Le Bouc lui   demanda:  ami, où vas-tu?
                 Le Coq leur   demanda:  mes amis où allez-vous?
                   Maman lui   demanda:  quoi / comment?
                   Maman lui   demanda:  comment?
                            Il   marcha  longuement et il arriva dans
ment; ils arrivèrent au village de   la  cheftaine des femmes.
                               Ils   la  saluèrent comme il faut.
 interdits, elle dit: en route, si   la  faim t'attrape, gratte seulem
a faim t'attrape, gratte seulement   la  poussière, mais tu n'ouvriras
; il ouvrit son paquet pour manger   la  nourriture; il y trouva égale
                           L'Homme   la  poursuivit très vite, mais hé
ursuivit très vite, mais hélas, ne   la  rattrapa pas!
              La femme arriva chez   la  cheftaine des femmes.
             L'Homme répondit: oh!   la  femme s'est enfuie en cours d
ouveau, donne de l'argent, apporte   la  dot.
ouva une femme; il se réjouit; il   l'a  pour toujours, à lui tout seu
                Il se réjouit, il   l'a  pour toujours, sans payer.
                                     La  nuit vint, maman prépara troi
                                     La  femme sortit et s'enfuit à to
                                     La  femme arriva chez la cheftain
                                     La  femme dit: voilà, l'Homme m'a
                                     La  cheftaine dit: reste ici.
 village; ils y trouvèrent un Coq   là.
...

Cet extrait permet d'illustrer un tri alphabétique inverse dans lequel les caractères d'un mot sont triés de la droite vers la gauche. On peut noter qu'il n'y a pas de contexte gauche pour les mots-vedettes La. Cela est tout à fait normal car cet article La est le premier mot d'une phrase et la commande d'appel a effectivement utilisé le raffineur S pour indiquer que la région textuelle devait se limiter au contexte des mots dans le contexte d'une phrase. Par conséquent, tout contexte précédent le début de cette phrase n'est pas retenu et il ne figure donc pas dans le contexte gauche de ce mot-vedette.


Exemple 3 - Concordance en lingala avec tri alphabétique et références

Dans l'exemple précédent, la commande demandait de traiter un texte écrit en français. Avant de lancer la prochaine commande qui demande de traiter cette fois-ci un texte écrit en lingala, il faut modifier la valeur des deux variables d'environnment avec les commandes suivantes:

export DEFAULT_CHARSET=lin
export COLLATE_LANGUAGE=lin

La commande suivante demande de lire le fichier lingala xlin.lin, de produire une concordance des mots de ce texte (raffineur interne W) se trouvant dans une région textuelle phrase (raffineur interne S), et d'afficher les résultats sur une largeur de 70 colonnes (selon l'option -w70). Cette commande demande aussi de produire une référence aux lignes du texte d'entrée sur une largeur moyenne de 10 colonnes (selon l'option -r10).

concorde -w70 -r10  S,W  xlin.lin

Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.

Concordance en Lingala

Ces derniers résultats permettent d'illustrer les références qui sont affichées sur la gauche. Ces références calculées par Concorde contiennent le nom du fichier d'entrée et le numéro de lignes contenant le mot-vedette correspondant. Pour afficher une référence, Concorde doit réduire d'autant le texte du contexte gauche. Enfin, les mots-vedettes sont triés conformément à l'ordre alphabétique du lingala.

Cette dernière commande démontre que Concorde peut traiter et trier un fichier lingala en version encodée. La prochaine commande avec les résultats qui suivent démontre que Concorde peut traiter et trier directement un fichier lingala en version translittérée. En comparant les résultats de ces deux commandes, on peut observer que les mots-vedettes lingala sont triés selon le même ordre lexicographique.

export DEFAULT_CHARSET=tlin
export COLLATE_LANGUAGE=lin

concorde -w70 -r10  S,W  xlin.tlin

...
xlin.tlin:52: mi\' nanzela\', Moto  abandi\'   koloba: bani\'nga\', to
xlin.tlin:66:             Moba\'li  abenga\'ni\'   ye\v ki\'li ki\'li
xlin.tlin:36:         Nanto['ngo['  abe\'ngi\'   Moto, ape['si\' ye\v
xlin.tlin:41:               Mama\'  abe\'ngi\'   Ntaba, ape['si\' ye\v
xlin.tlin:46:               Mama\'  abe\'ngi\'   lisu\'su Nso\'so\', a
xlin.tlin:65:            Mwa\vsi\'  abimi\'   mpe\' aki\'mi\' bobe['le
xlin.tlin:33: ' mokonzi yaba\vsi\'  abo[ngi\'si\'   mabo\'ke\' mi\'sa\
xlin.tlin:64:                       Afungo\'li\'   libo\'ke\' epeki\'s
xlin.tlin:66:                       Akangi\'   ye\v te[^.
xlin.tlin:71: obi\': o\v, moba\'li  akango\'li\'   nga\'i\' nanzela\'.
xlin.tlin:56:                       Akango\'li\'   libo\'ke\' boye, am
xlin.tlin:60:                       Akango\'li\'   libo\'ke\' te a\'li
xlin.tlin:15:                       Ake[i\'.
xlin.tlin:65: \vsi\' abimi\' mpe\'  aki\'mi\'   bobe['le[' mba\'ngo.
xlin.tlin:75: bi\': o\v, mwa\vsi\'  aki\'mi\'   nanzela\'.
xlin.tlin:76:                       aki\'mi\'   bo\'ni\'?
xlin.tlin:76:      Mama\' alobi\':  aki\'mi\'?
xlin.tlin:16: li\' ka\' ka\' ka\',  ako\'mi\'   nambo\'ka mo['ko[', ak
xlin.tlin:56:            Nso\'so\'  ako\'mi\'   nambo\'ka naye\'.
xlin.tlin:60: ata\'mbo\'li\' mpe\'  ako\'mi\'   nanda\'ko naye\'.
xlin.tlin:69:            Mwa\vsi\'  ako\'mi\'   naesi\'ka\' yaMama\' m
xlin.tlin:81: ^na\', moto moba\'li  ako\'mi\'   koba\'la mwa\vsi\' nam
xlin.tlin:74: e[' boye, Moto mpe\'  ako\'mi\'.
xlin.tlin:16:  nambo\'ka mo['ko[',  aku\'ti\'   wa^na\' Ntaba.
xlin.tlin:61: \'li\' libo\'ke\' te  a\'li\'ya   bilo['ko[.
xlin.tlin:42:  aye\'bi\'si\' ye\v,  alobi\'   naye\' te: nanzela\', so
xlin.tlin:15:    Moko[lo[ mo['ko['  alobi\':   ti\'ka\' na\'ke[nde[ ko
xlin.tlin:18:                 Moto  alobi\':   na\vkoke[nde[ koluka mw
xlin.tlin:18:                Ntaba  alobi\':   zila\' nga\'i\' to\'ke[
xlin.tlin:24:            Nso\'so\'  alobi\':   bo\'zila nga\'i\' to\'k
xlin.tlin:28:     Mwa^ moke[' Moto  alobi\':   Mama\', toye\'i\' mpo\'
xlin.tlin:47: 'si\' ye\v mibe\'ko,  alobi\':   nanzela\' so['ki\' nzal
xlin.tlin:64:     Eko\'mi\' naMoto  alobi\':   nga\'i\' nale[mbi\'.
xlin.tlin:70:            Mwa\vsi\'  alobi\':   o\v, moba\'li akango\'l
xlin.tlin:71: ' mokonzi yaba\vsi\'  alobi\':   zala\' a\'wa.
xlin.tlin:75:                 Moto  alobi\':   o\v, mwa\vsi\' aki\'mi\
xlin.tlin:76:               Mama\'  alobi\':   aki\'mi\'?
...

Le recodage d'un texte africain du charset de la version translittérée vers le charset de la version encodée (ou l'inverse) se fait à l'aide de Free recode. Pour préserver la disposition des résultats de Concorde, il est préférable de soumettre directement un fichier en version translittérée plutôt que de soumettre un fichier en version encodée et de recoder ensuite les résultats obtenus en version translittérée.


Exemple 4 - Concordance en lingala avec tri alphabétique inverse

La commande concorde suivante demande une concordance en contexte des mots du fichier lingala xlin.lin et, avec l'option -i, de produire une liste des mots-vedettes par ordre alphabétique inverse.

export DEFAULT_CHARSET=lin
export COLLATE_LANGUAGE=lin

concorde -w70 -i  S,W  xlin.lin

Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.

Concordance en Lingala

Ces derniers résultats démontre que Concorde est en mesure de produire une concordance tout en effectuant un tri alphabétique inverse du lingala.


Exemple 5 - Concordance de régions textuelles

Dans les exemples précédents, l'item-vedette des concordances n'est basé que sur le mot en tant que région textuelle (via le raffineur W). Les prochains exemples de cette section permettent d'illustrer que l'item-vedette d'une concordance peut être basé sur d'autres régions textuelles, par exemple: la phrase (via le raffineur S), le vers ou la ligne (via le raffineur V), le caractère (via le raffineur C).

Dans le prochain exemple, l'item-vedette est basé sur la phrase. Avant d'exécuter la commande concorde suivante sur un texte en fulfulde, il faut avoir exécuté au préalable les commandes d'initialisation suivantes des variables d'environnement qui indiquent que le texte d'entrée fulfulfe est écrit avec le charset bra et que le tri alphabétique doit se faire conformément aux conventions de tri de la langue fulfulde pulaar (valeur fuc).

export DEFAULT_CHARSET=bra
export COLLATE_LANGUAGE=fuc

Comme régions textuelles, la commande suivante demande de produire une concordance des phrases (raffineur S) dans le contexte de paragraphes (raffineur P), de calculer une référence pour l'item-vedette (option -r10) et d'afficher les résultats dans 70 colonnes (option -w70).

concorde -w70 -r10  P,S  xful.bra

Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.

Concordance en Fulfulde

Ces derniers résultats ne contiennent que des débuts de phrases car cette fois-ci l'item-vedette n'est pas un mot-vedette mais une phrase-vedette. Cette dernière commande permet ainsi de trier par ordre alphabétique toutes les phrases du texte d'entrée. Lorsque le contexte gauche est vide, par exemple l'occurrence de la référence xful.bra:72: cela signifie que cette phrase est la toute première phrase d'un paragraphe. Le contexte gauche contient la fin de la phrase qui précède la phase-vedette courante. Dans ces résultats, notons également que la clé de tri de ces phrases-vedettes ne se limite pas au premier mot de la phase-vedette mais elle s'étend à tout le texte qui a été retenu comme contexte droit.

Dans le prochain exemple, l'item-vedette est basé sur le vers d'une strophe (c'est-à-dire la ligne d'un fichier). Pour cet exemple, prenons le fichier suivant fable.bra qui contient une chantefable en bambara ayant deux strophes et où chaque strophe contient sept vers.

N ye n ka nsiirin nin da Amadu Tara la.
jamanatigi dò tun bè yen
muso kònòntò de tun bè a fè
muso kònòntò bèè ye denkè kelen kelen wolo a ye.
a denkè kelen kelen bèè fana tògò ye ko Amadu
Amadu ninw, u ba tògò de tun bè da u kan
ka u bò nyògòn na.

Amadu bèè ncinin tun ye
denkè ninw bèè la dògònin
o de tun ye Amadu Tara ye
o tun ye jamanatigi nin ka taramuso den ye.
jamanatigi nana bana
a banana kosèbè fo ka a da so kònò yen
a ye san caman kè, a tè taga yòrò si.

Avant d'exécuter une commande concorde sur un texte en bambara, il faut avoir exécuté au préalable les commandes d'initialisation suivantes des variables d'environnement qui indiquent que le texte d'entrée bambara est écrit avec le charset bra et que le tri alphabétique doit se faire conformément aux conventions de tri de la langue bambara (valeur bra). La commande concorde suivante demande de lire le fichier d'entrée fable.bra, de produire une concordance des vers (raffineur V) et d'afficher les résultats sur une largeur de 79 colonnes (option par défaut).

export DEFAULT_CHARSET=bra
export COLLATE_LANGUAGE=bra

concorde  V  fable.bra

Voici intégralement les résultats de cette dernière commande :

muso den ye. jamanatigi nana bana  a banana kosèbè fo ka a da so kònò yen
  a y
è ye denkè kelen kelen wolo a ye.  a denkè kelen kelen bèè fana tògò ye ko Amad
un bè da u kan ka u bò nyògòn na.  Amadu bèè ncinin tun ye
  denkè ninw bèè la
n kelen bèè fana tògò ye ko Amadu  Amadu ninw, u ba tògò de tun bè da u kan
  k
ana kosèbè fo ka a da so kònò yen  a ye san caman kè, a tè taga yòrò si.

yògòn na. Amadu bèè ncinin tun ye  denkè ninw bèè la dògònin
  o de tun ye Amad
 ka nsiirin nin da Amadu Tara la.  jamanatigi dò tun bè yen
  muso kònòntò de t
amanatigi nin ka taramuso den ye.  jamanatigi nana bana
  a banana kosèbè fo ka
inw, u ba tògò de tun bè da u kan  ka u bò nyògòn na.
   Amadu bèè ncinin tun y
è yen muso kònòntò de tun bè a fè  muso kònòntò bèè ye denkè kelen kelen wolo a
Tara la. jamanatigi dò tun bè yen  muso kònòntò de tun bè a fè
  muso kònòntò b
                                   N ye n ka nsiirin nin da Amadu Tara la.
  ja
 tun ye denkè ninw bèè la dògònin  o de tun ye Amadu Tara ye
  o tun ye jamanat
dògònin o de tun ye Amadu Tara ye  o tun ye jamanatigi nin ka taramuso den ye.

Dans ces résultats d'une concordance où l'item-vedette est un vers, on peut constater que les vers-vedettes sont triés en ordre alphabétique. Notons que le contexte gauche d'un vers-vedette est le vers précédent et que le contexte droit est le vers suivant le vers-vedette.

Comme autre variante d'une concordance où l'item-vedette est basé sur la ligne d'un fichier, nous pouvons penser entre autres à un fichier contenant une liste de syntagmes nominaux ou une liste d'unités terminologiques. Par exemple, utilisons le fichier lexique.eng qui contient en vrac la liste des syntagmes nominaux anglais suivants:

electrohydraulic flow control servo valve

hydraulic shutoff valve system

booster control valve

manual shutoff valve

autopilot engagement valve

flow control transfer valve

bypass shutoff orifice valve

shutoff valve

rudder booster shutoff valve

engagement valve

flap asymetry solenoid valve

valve lock input spring assemblies

booster control valve arm latch

dual system electrohydraulic servo valve assemblies

dual system spool valve

booster control valve lever

selector valve shaft

hydraulic control valve

movable valve slug

wing flap hydraulic control valve

La commande concorde suivante demande de lire le fichier d'entrée lexique.eng, de produire une concordance des lignes (raffineur V) dans le contexte d'un paragraphe (raffineur P), de trier les lignes-vedettes en ordre alphabétique (option de tri par défaut), et d'afficher les résultats sur une largeur de 79 colonnes (option par défaut).

concorde  P,V  lexique.eng

Voici intégralement les résultats de cette dernière commande:

                                   autopilot engagement valve

                                   booster control valve

                                   booster control valve arm latch

                                   booster control valve lever

                                   bypass shutoff orifice valve

                                   dual system electrohydraulic servo valve ass
                                   dual system spool valve

                                   electrohydraulic flow control servo valve

                                   engagement valve

                                   flap asymetry solenoid valve

                                   flow control transfer valve

                                   hydraulic control valve

                                   hydraulic shutoff valve system

                                   manual shutoff valve

                                   movable valve slug

                                   rudder booster shutoff valve

                                   selector valve shaft

                                   shutoff valve

                                   valve lock input spring assemblies

                                   wing flap hydraulic control valve

Dans les résultats de cette dernière concordance, on peut noter que le contexte droit et le contexte gauche de chaque ligne-vedette est vide. Cela s'explique par le fait que chaque syntagme du fichier d'entrée lexique.eng est séparé par une ligne blanche et que cette ligne blanche a été interprétée comme une frontière de paragraphe par le module reconnaisseur de paragraphes activé par le raffineur P spécifié dans la commande d'appel de concorde.

La commande concorde suivante demande de lire le fichier d'entrée lexique.eng, de produire une concordance des lignes (raffineur V) dans le contexte d'un paragraphe (raffineur P), de trier les lignes-vedettes en ordre alphabétique inverse (option -i), et d'afficher les résultats sur une largeur de 100 colonnes (option -w100).

concorde -i -w100 P,V ex-conco.eng

Voici intégralement les résultats de cette dernière commande:

                         flap asymetry solenoid valve

                         bypass shutoff orifice valve

                                        shutoff valve

                                 manual shutoff valve

                         rudder booster shutoff valve

                              dual system spool valve

                              hydraulic control valve

                    wing flap hydraulic control valve

                                booster control valve

            electrohydraulic flow control servo valve

                          flow control transfer valve

                                     engagement valve

                           autopilot engagement valve

                                   movable valve slug

                      booster control valve arm latch

                       hydraulic shutoff valve system

                          booster control valve lever

  dual system electrohydraulic servo valve assemblies

                   valve lock input spring assemblies

                                 selector valve shaft

Dans ce dernier exemple, l'item-vedette est basé sur le caractère. Avant d'exécuter la commande suivante, il faut avoir exécuté au préalable les commandes d'initialisation des variables d'environnement qui indiquent que le texte d'entrée en wolof est écrit avec le charset lin et que le tri alphabétique doit se faire conformément aux conventions de tri de la langue wolof (valeur wol). La commande concorde suivante demande de produire une concordance des caractères (raffineur C) dans le contexte de mots (raffineur W), de calculer une référence pour l'item-vedette (option -r5) et d'afficher les résultats dans 79 colonnes (option par défaut).

export DEFAULT_CHARSET=lin
export COLLATE_LANGUAGE=wol

concorde -r5  W,C  xwol.lin

Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.

...
xwol.lin:74:                      ba ñ  a
xwol.lin:75:                         ñ  aay».
xwol.lin:91:                    jari ñ
xwol.lin:92:                    jari ñ
xwol.lin:93:                         ñ  ep
xwol.lin:95:                         ñ  u
xwol.lin:97:                         ñ  u
xwol.lin:119:                        ñ  uy
xwol.lin:120:                        ñ  uy
xwol.lin:120:                    fee ñ  feeñ
xwol.lin:120:                feeñfee ñ
xwol.lin:121:             lijjantiwu ñ  u
xwol.lin:121:                        ñ  u
xwol.lin:124:                        ñ  u
xwol.lin:124:                        ñ  u
xwol.lin:125:                     Da ñ  uy
xwol.lin:125:                        ñ  u
xwol.lin:126:                     li ñ
xwol.lin:127:                    amu ñ  u
xwol.lin:127:                   manu ñ  oo
xwol.lin:129:                        ñ  ooñu
xwol.lin:129:                    ñoo ñ  u
xwol.lin:129:                   xama ñ  u
xwol.lin:129:                        ñ  u
xwol.lin:130:                        ñ  u
xwol.lin:130:                        ñ  uy
xwol.lin:131:                        ñ  aar
xwol.lin:131:                        ñ  ii
xwol.lin:132:                        ñ  oo
xwol.lin:135:                    Ñoo ñ  u,
xwol.lin:135:                        ñ  u
xwol.lin:135:                        ñ  uy
xwol.lin:136:                   jógu ñ  u
xwol.lin:137:                        ñ  u
xwol.lin:138:                        ñ  u
xwol.lin:142:                   waxu ñ  u
xwol.lin:145:                   jari ñ  oo
xwol.lin:147:                     da ñ  u
xwol.lin:149:                  njari ñ  .
xwol.lin:149:                        ñ  u
xwol.lin:150:                        ñ  u
xwol.lin:150:                   jari ñ  oo
xwol.lin:150:                   jari ñ  oo.
xwol.lin:151:                   jari ñ  oo
xwol.lin:153:                        ñ  oo
xwol.lin:153:                   jari ñ  oo
xwol.lin:172:                 waxagu ñ  u
xwol.lin:172:                     su ñ  u
xwol.lin:173:                        ñ  i
xwol.lin:173:                     su ñ  u
xwol.lin:173:                     Su ñ  u
xwol.lin:174:                     da ñ  oo
xwol.lin:174:                     da ñ  oo
xwol.lin:176:                     Sa ñ  u
xwol.lin:176:                        ñ  i
xwol.lin:176:                     na ñ  u
xwol.lin:177:                     su ñ  u
xwol.lin:177:                        ñ  an
xwol.lin:177:                        ñ  ooy
xwol.lin:177:                        ñ  udul
xwol.lin:177:                        ñ  i?
xwol.lin:178:                        ñ  oo
xwol.lin:178:                        ñ  udul
xwol.lin:178:                        ñ  i?
xwol.lin:180:                        ñ  an
xwol.lin:180:                        ñ  oo
xwol.lin:180:                        ñ  u
xwol.lin:180:                        ñ  an
xwol.lin:180:                     la ñ  u
xwol.lin:181:                        ñ  udul
xwol.lin:181:                        ñ  oom,
xwol.lin:181:                        ñ  oo
xwol.lin:182:                        ñ  u
xwol.lin:183:                        ñ  i
xwol.lin:183:                        ñ  ooy,
xwol.lin:183:                        ñ  oom
xwol.lin:183:                        ñ  u
xwol.lin:187:                        ñ  i
xwol.lin:187:                   masu ñ  oo
xwol.lin:188:                        ñ  u
xwol.lin:188:                        ñ  eneen
xwol.lin:189:                        ñ  uy
xwol.lin:189:                     na ñ  u
xwol.lin:192:                     na ñ  u
xwol.lin:194:                   dina ñ  u
xwol.lin:135:                        Ñ  ooñu,
xwol.lin:160:                        Ñ  I
xwol.lin:160:                     SU Ñ  U
xwol.lin:170:                        Ñ  I
xwol.lin:170:                     SU Ñ  U
xwol.lin:178:                        Ñ  an
xwol.lin:192:                        Ñ  ungi
...

Les résultats plus haut contiennent un extrait de tous les mots wolof du texte d'entrée. Dans ce genre de concordance, l'item-vedette n'est pas un mot-vedette mais un caractère-vedette. Le contexte droit d'un caractère-vedette correspond au début du mot tandis que le contexte gauche correspond à la fin du mot. Ce genre de commande permet ainsi de trier par ordre alphabétique tous les caractères de toute région textuelle reconnue comme mot. Pour un traducteur, une telle concordance sur les caractères n'est pas vraiment utile mais pour un linguiste cela est beaucoup plus pertinent. Par exemple, ce genre de concordance peut servir dans des applications spécifiques sur le traitement du mot comme les suivantes: étude morphologique et morphographique, étude de segmentation automatique, étude phonétique sur la coupe syllabique, étude typographique pour la normalisation de l'orthographe.


Exemple 6 - Concordance en fulfulde avec contrainte sélective

Si un fichier textuel est volumineux, une concordance de mots sur un tel texte génèrera une très grosse liste puisqu'il y aura une ligne de résultats pour chaque mot du texte d'entrée. Ainsi, un texte de 10,000 mots produira une concordance de 10,000 lignes. Pour réduire la taille d'une concordance, il est possible d'imposer des contraintes sélectives dans une commande d'appel de Concorde.

Comme contrainte sélective, l'option -a MOT permet de limiter la sortie des items-vedettes qu'aux items qui auront la chaîne MOT soit dans le contexte droit ou dans le contexte gauche de l'item-vedette. Par exemple, la commande suivante demande de lire le texte fulfulde du fichier xful.bra, de produire une concordance de mots (raffineur W) dans le contexte de phrases (raffineur S), de calculer une référence pour l'item-vedette (option -r5), de réduire la sortie qu'aux mots-vedettes ayant le chaîne wowlu soit dans le contexte gauche ou soit dans le contexte droit.

concorde -a wowlu  -r5  -w70  S,W  xful.bra

Voici l'ensemble des résultats de cette dernière commande:

Concordance en Fulfulde

Dans les résultats de cette commande, on ne retrouve que les mots-vedettes qui ont wowlu soit dans leur contexte gauche ou dans leur contexte droit. Lorsque wowlu ne figure pas explicitement dans les contextes affichés, cela signifie que ce mot est bel et bien dans la région textuelle phrase mais que la ligne d'affichage n'est pas assez longue pour afficher le texte de toute la phrase correspondante.


Exemple 7 - Concordance en espagnol d'un fichier HTML

Dans les exemples précédents, Concorde avait à traiter des fichiers d'entrée en format plein texte. Dans cette section, nous donnons un exemple de traitement d'un fichier d'entrée en format HTML. Le texte du fichier resums.html est écrit en espagnol et ce fichier est formellement conforme à la grammaire DTD de la norme HTML 3.2.

La commande suivante demande de lire le fichier espagnol resums.html, de produire une concordance des mots (raffineur interne W) en contexte de phrase (raffineur interne S) et dans les régions textuelles des raffineurs externes th et td. Ces raffineurs externes sont mis en correspondance avec les balises HTML <th></th> et <td></td> qui se trouvent dans le texte HTML d'entrée.

concorde  -w70  th+td,S,W  resums.html

Les résultats qui suivent ne sont qu'un extrait de la concordance originale obtenue. Cet extrait démontre bien que Concorde peut traiter directement un fichier en format HTML.

...
 ingenieros y de gestion.<br>  A   la luz de complementos recogidos du
                       Retour  à:
centro de recursos multimedia  abierto   al exterior e integrado a una
 presente artículo se propone  abordar   las etapas y los retos ligado
de trabajo de la AUCC y de la  ABRC/CARL   sobre las bibilotecas unive
ciones del Canadá», el Senado  académico   de la Universidad de Moncto
l informe entregado al Senado  académico   a principios de 1997 reflej
le-acceso no sólo facilita la  accesibilidad   a los fondos documental
que ofrece nuevos servicios y  acceso   a fuentes informativas cada ve
bliotecas así como una vía de  acceso   al mundo de la información.</f
rme con el objeto de proponer  acciones   apropiadas que pudieran ser
/images/acelfa.jpg" alt="Logo  ACELF"   height="50" width="95" border=
éducation de langue française  (ACELF)</b><br>   <b>268, rue Marie-de-
olor="0000ff">Accueil du site  ACELF</font></a>]     </font>
                               Acompañar   a los educandos en el manej
a descripción del conjunto de  actividades   de la biblioteca virtual
o en maestros y promotores de  actividades   pedagógicas.
tículo evalua las principales  actividades   de reflexión y de investi
r su desarrollo. La situación  actual,   revelada por una reciente enc
del conjunto de realizaciones  actuales   en las univerdidades y grand
ias a las nuevas tecnologías,  actualmente   asistimos al renacimiento
tos de vigilancia tecnológica  actualmente   en curso en la biblioteca
                               Actualmente,   el desarrollo de las tec
centros de aprendizaje: no se  acude   solamente a leer o pedir presta
presentan, son testigos de la  adaptación   de la cadena documental tr
...

ANNEXE 1 - Menu d'aide Concorde

«Concorde» produit des concordances de mots en contexte.

Usage: concorde [OPTION]... SCAN-SPEC[,SCAN-SPEC]  FICHIER...

Options:
  {-}{-}copyright  afficher les conditions de copie, puis terminer
  {-}{-}help       fournir ce message d'aide, puis terminer
  {-}{-}version    identifier le programme, puis terminer

Options de sortie:
  -v         expliquer en mode bavard ce qui se passe
  -d         sortir de l'information interne pour fin de débogage
  -a MOT     limiter la sortie ayant MOT dans le contexte gauche ou droit
  -w WIDTH   utiliser la valeur WIDTH comme largeur pour lister les contextes
  -r WIDTH   fournir les références aux lignes sur WIDTH colonnes en moyenne
  -i         produire les mots-vedettes en ordre alphabétique inverse

Chaque SCAN-SPEC est DEMARREUR[/TERMINATEUR].
Tant DEMARREUR que TERMINATEUR sont CHERCHER[+CHERCHER]... et
chaque CHERCHER est soit une balise SGML ou soit un des raffineurs
internes suivants:

   P   paragraphe délimité par une ou plusieurs lignes vides
   S   phrase terminée par .?! et possiblement ])}"» et suivie de 2 blancs
   V   vers terminé par une ou plusieurs fins de ligne
   W   mot délimité par un blanc (caractère espace)
   C   caractère unique (énergivore en CPU)
   T   fournir une balise démarreur/terminateur avant et après le textuel
   F   reconnaître l'espace français après une ponctuation forte
Accueil TCAO  |  Remerciements  |  Un aperçu  |  Licence BPI  |  Distribution  |  Installation  | 
Claviers  |  Pointeurs  |  Alibi  |  Concorde  |  Recode  |  Ventile  |  Vocable  |  Accueil BPI

http://progiciels-bpi.ca  |  bourbeau@progiciels-bpi.ca
Copyright ©  Progiciels Bourbeau Pinard inc., Montréal, 1999. Tous droits réservés / All rights reserved.