| |
|
Accueil TCAO |
Remerciements |
Un aperçu |
Licence BPI |
Distribution |
Installation |
Claviers | Pointeurs | Alibi | Concorde | Recode | Ventile | Vocable | Accueil BPI |
Concorde est un progiciel de production de concordances de mots en contexte. Cet outil permet de dépouiller des fichiers textuels et de produire une liste alphabétique des items-vedettes de ces textes. L'item-vedette d'une concordance peut être basé soit sur les mots dans leurs contextes phrastiques ou soit sur les caractères dans leurs contextes de mots. Comme usage mois fréquent, l'item-vedette peut aussi être basé sur la phrase ou sur la ligne d'un texte. Dans une concordance en contexte, les items-vedettes sont affichés au centre de la ligne et ils sont alignés verticalement. À la gauche et à la droite de chaque item-vedette, est affiché le contexte immédiat de cet item selon le contenu textuel des fichiers d'entrée. Les items-vedettes peuvent être triés en ordre alphabétique habituel (i.e. de gauche à droite) ou en ordre alphabétique inverse (i.e. de droite à gauche).
Comme données d'entrée, Concorde accepte un ou plusieurs fichiers d'entrée en même temps. Ces fichiers peuvent être soit en format plein texte, soit en format HTML ou soit en tout format SGML. Tout comme les progiciels Ventile, Vocable et Alibi, le progiciel Concorde supporte la notion de régions textuelles à l'aide de raffineurs internes et de raffineurs externes. Enfin, une option permet d'imprimer une référence de type nom de fichier:numéro de ligne facilitant la mise en regard les résultats d'une concordance avec le ou les fichiers sources d'entrée. Pour mieux comprendre les commandes d'appel de Ventile formulées dans les prochains exemples, consultez le Menu d'aide de Concorde.
La commande suivante demande de lire le fichier français
xlinfr.l1, de produire une concordance des mots de ce texte
(raffineur interne W) se trouvant dans une région
textuelle phrase (raffineur interne S), et d'afficher
les résultats sur une largeur de 70 colonnes (selon l'option
-w70).
concorde -w70 S,W xlinfr.l1
Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.
...
vés en chemin, l'Homme se mit à parler: amis ouvrons nos paquets et
éjouit; il l'a pour toujours, à lui tout seul sans contestation.
La femme sortit et s'enfuit à toutes jambes.
L'homme accepta.
Après quoi, tous acceptèrent.
chercher une épouse; il s'en alla.
ls remercièrent Maman et s'en allèrent.
Ils s'en allèrent.
Coq leur demanda: mes amis où allez-vous?
Ils répondirent que: nous allons épouser des femmes.
e Coq dit: attendez-moi, nous allons partir ensemble.
ement si tu arrives chez toi, alors tu peux l'ouvrir.
Le Bouc lui demanda: ami, où vas-tu?
Le Coq leur demanda: mes amis où allez-vous?
min, l'Homme se mit à parler: amis ouvrons nos paquets et mangeons.
Les animaux ne payent pas de dot.
Au matin, elle appela l'Homme, lui donnant un paquet
Maman appela le Bouc, lui donna son paquet
Maman appela encore le Coq, lui donna aussi
...
Avec ces premiers résultats, on peut constater que les mots-vedettes sont affichés au centre de la ligne, proportionnellement à la valeur de la largeur de 70 colonnes demandées. Les mots-vedettes sont triés alphabétiquement et ils sont alignés verticalement. Des espaces blancs sont ajoutés de chaque côté du mot-vedette afin de le mettre plus en évidence. De plus, Concorde tente remplir au maximum le contexte gauche et le contexte droit, quitte à tronquer les mots soit au début du contexte droit ou soit à la fin du contexte gauche.
La valeur par défaut de l'option de sortie -w est de 79 colonnes, ce qui correspond à la largeur d'un écran standard. La valeur maximale de l'option -w dépend plutôt de la capacité de votre écran ou, encore, de la largeur maximale des pages de votre imprimante.
La commande suivante demande presque la même chose que la commande précédente. Cette commande avec l'option -i demande de trier les mots-vedettes en ordre alphabétique inverse plutôt qu'en ordre alphabétique habituel. Un tri inverse permet de regarder les mots selon l'ordre morphologique des terminaisons.
concorde -w70 -i S,W xlinfr.l1
Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.
...
Arrivés en chemin, l'Homme se mit à parler: amis ouvrons nos paqu
l se réjouit; il l'a pour toujours, à lui tout seul sans contestati
La femme sortit et s'enfuit à toutes jambes.
s jours, le quatrième l'homme demanda encore.
Le Bouc lui demanda: ami, où vas-tu?
Le Coq leur demanda: mes amis où allez-vous?
Maman lui demanda: quoi / comment?
Maman lui demanda: comment?
Il marcha longuement et il arriva dans
ment; ils arrivèrent au village de la cheftaine des femmes.
Ils la saluèrent comme il faut.
interdits, elle dit: en route, si la faim t'attrape, gratte seulem
a faim t'attrape, gratte seulement la poussière, mais tu n'ouvriras
; il ouvrit son paquet pour manger la nourriture; il y trouva égale
L'Homme la poursuivit très vite, mais hé
ursuivit très vite, mais hélas, ne la rattrapa pas!
La femme arriva chez la cheftaine des femmes.
L'Homme répondit: oh! la femme s'est enfuie en cours d
ouveau, donne de l'argent, apporte la dot.
ouva une femme; il se réjouit; il l'a pour toujours, à lui tout seu
Il se réjouit, il l'a pour toujours, sans payer.
La nuit vint, maman prépara troi
La femme sortit et s'enfuit à to
La femme arriva chez la cheftain
La femme dit: voilà, l'Homme m'a
La cheftaine dit: reste ici.
village; ils y trouvèrent un Coq là.
...
Cet extrait permet d'illustrer un tri alphabétique inverse dans lequel les caractères d'un mot sont triés de la droite vers la gauche. On peut noter qu'il n'y a pas de contexte gauche pour les mots-vedettes La. Cela est tout à fait normal car cet article La est le premier mot d'une phrase et la commande d'appel a effectivement utilisé le raffineur S pour indiquer que la région textuelle devait se limiter au contexte des mots dans le contexte d'une phrase. Par conséquent, tout contexte précédent le début de cette phrase n'est pas retenu et il ne figure donc pas dans le contexte gauche de ce mot-vedette.
Dans l'exemple précédent, la commande demandait de traiter un texte écrit en français. Avant de lancer la prochaine commande qui demande de traiter cette fois-ci un texte écrit en lingala, il faut modifier la valeur des deux variables d'environnment avec les commandes suivantes:
export DEFAULT_CHARSET=lin export COLLATE_LANGUAGE=lin
La commande suivante demande de lire le fichier lingala
xlin.lin, de produire une concordance des mots de ce texte
(raffineur interne W) se trouvant dans une région
textuelle phrase (raffineur interne S), et d'afficher
les résultats sur une largeur de 70 colonnes (selon l'option
-w70). Cette commande demande aussi de produire une
référence aux lignes du texte d'entrée sur une largeur moyenne de 10
colonnes (selon l'option -r10).
concorde -w70 -r10 S,W xlin.lin
Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.
Ces derniers résultats permettent d'illustrer les références qui sont affichées sur la gauche. Ces références calculées par Concorde contiennent le nom du fichier d'entrée et le numéro de lignes contenant le mot-vedette correspondant. Pour afficher une référence, Concorde doit réduire d'autant le texte du contexte gauche. Enfin, les mots-vedettes sont triés conformément à l'ordre alphabétique du lingala.
Cette dernière commande démontre que Concorde peut traiter et trier un fichier lingala en version encodée. La prochaine commande avec les résultats qui suivent démontre que Concorde peut traiter et trier directement un fichier lingala en version translittérée. En comparant les résultats de ces deux commandes, on peut observer que les mots-vedettes lingala sont triés selon le même ordre lexicographique.
export DEFAULT_CHARSET=tlin export COLLATE_LANGUAGE=lin concorde -w70 -r10 S,W xlin.tlin
... xlin.tlin:52: mi\' nanzela\', Moto abandi\' koloba: bani\'nga\', to xlin.tlin:66: Moba\'li abenga\'ni\' ye\v ki\'li ki\'li xlin.tlin:36: Nanto['ngo[' abe\'ngi\' Moto, ape['si\' ye\v xlin.tlin:41: Mama\' abe\'ngi\' Ntaba, ape['si\' ye\v xlin.tlin:46: Mama\' abe\'ngi\' lisu\'su Nso\'so\', a xlin.tlin:65: Mwa\vsi\' abimi\' mpe\' aki\'mi\' bobe['le xlin.tlin:33: ' mokonzi yaba\vsi\' abo[ngi\'si\' mabo\'ke\' mi\'sa\ xlin.tlin:64: Afungo\'li\' libo\'ke\' epeki\'s xlin.tlin:66: Akangi\' ye\v te[^. xlin.tlin:71: obi\': o\v, moba\'li akango\'li\' nga\'i\' nanzela\'. xlin.tlin:56: Akango\'li\' libo\'ke\' boye, am xlin.tlin:60: Akango\'li\' libo\'ke\' te a\'li xlin.tlin:15: Ake[i\'. xlin.tlin:65: \vsi\' abimi\' mpe\' aki\'mi\' bobe['le[' mba\'ngo. xlin.tlin:75: bi\': o\v, mwa\vsi\' aki\'mi\' nanzela\'. xlin.tlin:76: aki\'mi\' bo\'ni\'? xlin.tlin:76: Mama\' alobi\': aki\'mi\'? xlin.tlin:16: li\' ka\' ka\' ka\', ako\'mi\' nambo\'ka mo['ko[', ak xlin.tlin:56: Nso\'so\' ako\'mi\' nambo\'ka naye\'. xlin.tlin:60: ata\'mbo\'li\' mpe\' ako\'mi\' nanda\'ko naye\'. xlin.tlin:69: Mwa\vsi\' ako\'mi\' naesi\'ka\' yaMama\' m xlin.tlin:81: ^na\', moto moba\'li ako\'mi\' koba\'la mwa\vsi\' nam xlin.tlin:74: e[' boye, Moto mpe\' ako\'mi\'. xlin.tlin:16: nambo\'ka mo['ko[', aku\'ti\' wa^na\' Ntaba. xlin.tlin:61: \'li\' libo\'ke\' te a\'li\'ya bilo['ko[. xlin.tlin:42: aye\'bi\'si\' ye\v, alobi\' naye\' te: nanzela\', so xlin.tlin:15: Moko[lo[ mo['ko[' alobi\': ti\'ka\' na\'ke[nde[ ko xlin.tlin:18: Moto alobi\': na\vkoke[nde[ koluka mw xlin.tlin:18: Ntaba alobi\': zila\' nga\'i\' to\'ke[ xlin.tlin:24: Nso\'so\' alobi\': bo\'zila nga\'i\' to\'k xlin.tlin:28: Mwa^ moke[' Moto alobi\': Mama\', toye\'i\' mpo\' xlin.tlin:47: 'si\' ye\v mibe\'ko, alobi\': nanzela\' so['ki\' nzal xlin.tlin:64: Eko\'mi\' naMoto alobi\': nga\'i\' nale[mbi\'. xlin.tlin:70: Mwa\vsi\' alobi\': o\v, moba\'li akango\'l xlin.tlin:71: ' mokonzi yaba\vsi\' alobi\': zala\' a\'wa. xlin.tlin:75: Moto alobi\': o\v, mwa\vsi\' aki\'mi\ xlin.tlin:76: Mama\' alobi\': aki\'mi\'? ...
Le recodage d'un texte africain du charset de la version translittérée vers le charset de la version encodée (ou l'inverse) se fait à l'aide de Free recode. Pour préserver la disposition des résultats de Concorde, il est préférable de soumettre directement un fichier en version translittérée plutôt que de soumettre un fichier en version encodée et de recoder ensuite les résultats obtenus en version translittérée.
La commande concorde suivante demande
une concordance en contexte des mots du fichier lingala
xlin.lin et, avec l'option -i, de produire
une liste des mots-vedettes par ordre alphabétique inverse.
export DEFAULT_CHARSET=lin export COLLATE_LANGUAGE=lin concorde -w70 -i S,W xlin.lin
Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.
Ces derniers résultats démontre que Concorde est en mesure de produire une concordance tout en effectuant un tri alphabétique inverse du lingala.
Dans les exemples précédents, l'item-vedette des concordances n'est basé que sur le mot en tant que région textuelle (via le raffineur W). Les prochains exemples de cette section permettent d'illustrer que l'item-vedette d'une concordance peut être basé sur d'autres régions textuelles, par exemple: la phrase (via le raffineur S), le vers ou la ligne (via le raffineur V), le caractère (via le raffineur C).
Dans le prochain exemple, l'item-vedette est basé sur la phrase. Avant d'exécuter la commande concorde suivante sur un texte en fulfulde, il faut avoir exécuté au préalable les commandes d'initialisation suivantes des variables d'environnement qui indiquent que le texte d'entrée fulfulfe est écrit avec le charset bra et que le tri alphabétique doit se faire conformément aux conventions de tri de la langue fulfulde pulaar (valeur fuc).
export DEFAULT_CHARSET=bra export COLLATE_LANGUAGE=fuc
Comme régions textuelles, la commande suivante demande de produire une concordance des phrases (raffineur S) dans le contexte de paragraphes (raffineur P), de calculer une référence pour l'item-vedette (option -r10) et d'afficher les résultats dans 70 colonnes (option -w70).
concorde -w70 -r10 P,S xful.bra
Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.
Ces derniers résultats ne contiennent que des débuts de
phrases car cette fois-ci l'item-vedette n'est pas un mot-vedette mais
une phrase-vedette. Cette dernière commande permet ainsi de trier par
ordre alphabétique toutes les phrases du texte d'entrée. Lorsque le
contexte gauche est vide, par exemple l'occurrence de la référence
xful.bra:72: cela signifie que cette phrase est la toute
première phrase d'un paragraphe. Le contexte gauche contient la fin de
la phrase qui précède la phase-vedette courante. Dans ces résultats,
notons également que la clé de tri de ces phrases-vedettes ne se limite
pas au premier mot de la phase-vedette mais elle s'étend à tout le texte
qui a été retenu comme contexte droit.
Dans le prochain exemple, l'item-vedette est basé sur le
vers d'une strophe (c'est-à-dire la ligne d'un fichier).
Pour cet exemple, prenons le fichier suivant fable.bra qui
contient une chantefable en bambara ayant deux strophes et où chaque
strophe contient sept vers.
N ye n ka nsiirin nin da Amadu Tara la. jamanatigi dò tun bè yen muso kònòntò de tun bè a fè muso kònòntò bèè ye denkè kelen kelen wolo a ye. a denkè kelen kelen bèè fana tògò ye ko Amadu Amadu ninw, u ba tògò de tun bè da u kan ka u bò nyògòn na. Amadu bèè ncinin tun ye denkè ninw bèè la dògònin o de tun ye Amadu Tara ye o tun ye jamanatigi nin ka taramuso den ye. jamanatigi nana bana a banana kosèbè fo ka a da so kònò yen a ye san caman kè, a tè taga yòrò si.
Avant d'exécuter une commande concorde
sur un texte en bambara, il faut avoir exécuté au préalable les commandes
d'initialisation suivantes des variables d'environnement qui indiquent
que le texte d'entrée bambara est écrit avec le charset
bra et que le tri alphabétique doit se faire
conformément aux conventions de tri de la langue bambara
(valeur bra). La commande concorde
suivante demande de lire le fichier d'entrée fable.bra, de
produire une concordance des vers (raffineur V) et
d'afficher les résultats sur une largeur de 79 colonnes (option par
défaut).
export DEFAULT_CHARSET=bra export COLLATE_LANGUAGE=bra concorde V fable.bra
Voici intégralement les résultats de cette dernière commande :
muso den ye. jamanatigi nana bana a banana kosèbè fo ka a da so kònò yen
a y
è ye denkè kelen kelen wolo a ye. a denkè kelen kelen bèè fana tògò ye ko Amad
un bè da u kan ka u bò nyògòn na. Amadu bèè ncinin tun ye
denkè ninw bèè la
n kelen bèè fana tògò ye ko Amadu Amadu ninw, u ba tògò de tun bè da u kan
k
ana kosèbè fo ka a da so kònò yen a ye san caman kè, a tè taga yòrò si.
yògòn na. Amadu bèè ncinin tun ye denkè ninw bèè la dògònin
o de tun ye Amad
ka nsiirin nin da Amadu Tara la. jamanatigi dò tun bè yen
muso kònòntò de t
amanatigi nin ka taramuso den ye. jamanatigi nana bana
a banana kosèbè fo ka
inw, u ba tògò de tun bè da u kan ka u bò nyògòn na.
Amadu bèè ncinin tun y
è yen muso kònòntò de tun bè a fè muso kònòntò bèè ye denkè kelen kelen wolo a
Tara la. jamanatigi dò tun bè yen muso kònòntò de tun bè a fè
muso kònòntò b
N ye n ka nsiirin nin da Amadu Tara la.
ja
tun ye denkè ninw bèè la dògònin o de tun ye Amadu Tara ye
o tun ye jamanat
dògònin o de tun ye Amadu Tara ye o tun ye jamanatigi nin ka taramuso den ye.
Dans ces résultats d'une concordance où l'item-vedette est un vers, on peut constater que les vers-vedettes sont triés en ordre alphabétique. Notons que le contexte gauche d'un vers-vedette est le vers précédent et que le contexte droit est le vers suivant le vers-vedette.
Comme autre variante d'une concordance où l'item-vedette
est basé sur la ligne d'un fichier, nous pouvons penser
entre autres à un fichier contenant une liste de syntagmes nominaux ou
une liste d'unités terminologiques. Par exemple, utilisons le fichier
lexique.eng qui contient en vrac la liste des syntagmes
nominaux anglais suivants:
electrohydraulic flow control servo valve hydraulic shutoff valve system booster control valve manual shutoff valve autopilot engagement valve flow control transfer valve bypass shutoff orifice valve shutoff valve rudder booster shutoff valve engagement valve flap asymetry solenoid valve valve lock input spring assemblies booster control valve arm latch dual system electrohydraulic servo valve assemblies dual system spool valve booster control valve lever selector valve shaft hydraulic control valve movable valve slug wing flap hydraulic control valve
La commande concorde suivante demande de
lire le fichier d'entrée lexique.eng, de produire une
concordance des lignes (raffineur V) dans le contexte
d'un paragraphe (raffineur P), de trier les
lignes-vedettes en ordre alphabétique (option de tri par défaut), et
d'afficher les résultats sur une largeur de 79 colonnes (option par
défaut).
concorde P,V lexique.eng
Voici intégralement les résultats de cette dernière commande:
autopilot engagement valve
booster control valve
booster control valve arm latch
booster control valve lever
bypass shutoff orifice valve
dual system electrohydraulic servo valve ass
dual system spool valve
electrohydraulic flow control servo valve
engagement valve
flap asymetry solenoid valve
flow control transfer valve
hydraulic control valve
hydraulic shutoff valve system
manual shutoff valve
movable valve slug
rudder booster shutoff valve
selector valve shaft
shutoff valve
valve lock input spring assemblies
wing flap hydraulic control valve
Dans les résultats de cette dernière concordance, on peut
noter que le contexte droit et le contexte gauche de chaque ligne-vedette
est vide. Cela s'explique par le fait que chaque syntagme du fichier
d'entrée lexique.eng est séparé par une ligne blanche et que
cette ligne blanche a été interprétée comme une frontière de paragraphe
par le module reconnaisseur de paragraphes activé par le raffineur
P spécifié dans la commande d'appel de
concorde.
La commande concorde suivante demande de
lire le fichier d'entrée lexique.eng, de produire une
concordance des lignes (raffineur V) dans le contexte
d'un paragraphe (raffineur P), de trier les
lignes-vedettes en ordre alphabétique inverse (option
-i), et d'afficher les résultats sur une largeur de 100
colonnes (option -w100).
concorde -i -w100 P,V ex-conco.eng
Voici intégralement les résultats de cette dernière commande:
flap asymetry solenoid valve
bypass shutoff orifice valve
shutoff valve
manual shutoff valve
rudder booster shutoff valve
dual system spool valve
hydraulic control valve
wing flap hydraulic control valve
booster control valve
electrohydraulic flow control servo valve
flow control transfer valve
engagement valve
autopilot engagement valve
movable valve slug
booster control valve arm latch
hydraulic shutoff valve system
booster control valve lever
dual system electrohydraulic servo valve assemblies
valve lock input spring assemblies
selector valve shaft
Dans ce dernier exemple, l'item-vedette est basé sur le
caractère. Avant d'exécuter la commande suivante, il
faut avoir exécuté au préalable les commandes d'initialisation des
variables d'environnement qui indiquent que le texte d'entrée en wolof
est écrit avec le charset lin et que le tri alphabétique
doit se faire conformément aux conventions de tri de la langue wolof
(valeur wol). La commande concorde
suivante demande de produire une concordance des caractères (raffineur
C) dans le contexte de mots (raffineur
W), de calculer une référence pour l'item-vedette
(option -r5) et d'afficher les résultats dans 79
colonnes (option par défaut).
export DEFAULT_CHARSET=lin export COLLATE_LANGUAGE=wol concorde -r5 W,C xwol.lin
Les résultats de cette commande qui suivent ne sont qu'un extrait de la concordance originale obtenue.
... xwol.lin:74: ba ñ a xwol.lin:75: ñ aay». xwol.lin:91: jari ñ xwol.lin:92: jari ñ xwol.lin:93: ñ ep xwol.lin:95: ñ u xwol.lin:97: ñ u xwol.lin:119: ñ uy xwol.lin:120: ñ uy xwol.lin:120: fee ñ feeñ xwol.lin:120: feeñfee ñ xwol.lin:121: lijjantiwu ñ u xwol.lin:121: ñ u xwol.lin:124: ñ u xwol.lin:124: ñ u xwol.lin:125: Da ñ uy xwol.lin:125: ñ u xwol.lin:126: li ñ xwol.lin:127: amu ñ u xwol.lin:127: manu ñ oo xwol.lin:129: ñ ooñu xwol.lin:129: ñoo ñ u xwol.lin:129: xama ñ u xwol.lin:129: ñ u xwol.lin:130: ñ u xwol.lin:130: ñ uy xwol.lin:131: ñ aar xwol.lin:131: ñ ii xwol.lin:132: ñ oo xwol.lin:135: Ñoo ñ u, xwol.lin:135: ñ u xwol.lin:135: ñ uy xwol.lin:136: jógu ñ u xwol.lin:137: ñ u xwol.lin:138: ñ u xwol.lin:142: waxu ñ u xwol.lin:145: jari ñ oo xwol.lin:147: da ñ u xwol.lin:149: njari ñ . xwol.lin:149: ñ u xwol.lin:150: ñ u xwol.lin:150: jari ñ oo xwol.lin:150: jari ñ oo. xwol.lin:151: jari ñ oo xwol.lin:153: ñ oo xwol.lin:153: jari ñ oo xwol.lin:172: waxagu ñ u xwol.lin:172: su ñ u xwol.lin:173: ñ i xwol.lin:173: su ñ u xwol.lin:173: Su ñ u xwol.lin:174: da ñ oo xwol.lin:174: da ñ oo xwol.lin:176: Sa ñ u xwol.lin:176: ñ i xwol.lin:176: na ñ u xwol.lin:177: su ñ u xwol.lin:177: ñ an xwol.lin:177: ñ ooy xwol.lin:177: ñ udul xwol.lin:177: ñ i? xwol.lin:178: ñ oo xwol.lin:178: ñ udul xwol.lin:178: ñ i? xwol.lin:180: ñ an xwol.lin:180: ñ oo xwol.lin:180: ñ u xwol.lin:180: ñ an xwol.lin:180: la ñ u xwol.lin:181: ñ udul xwol.lin:181: ñ oom, xwol.lin:181: ñ oo xwol.lin:182: ñ u xwol.lin:183: ñ i xwol.lin:183: ñ ooy, xwol.lin:183: ñ oom xwol.lin:183: ñ u xwol.lin:187: ñ i xwol.lin:187: masu ñ oo xwol.lin:188: ñ u xwol.lin:188: ñ eneen xwol.lin:189: ñ uy xwol.lin:189: na ñ u xwol.lin:192: na ñ u xwol.lin:194: dina ñ u xwol.lin:135: Ñ ooñu, xwol.lin:160: Ñ I xwol.lin:160: SU Ñ U xwol.lin:170: Ñ I xwol.lin:170: SU Ñ U xwol.lin:178: Ñ an xwol.lin:192: Ñ ungi ...
Les résultats plus haut contiennent un extrait de tous les mots wolof du texte d'entrée. Dans ce genre de concordance, l'item-vedette n'est pas un mot-vedette mais un caractère-vedette. Le contexte droit d'un caractère-vedette correspond au début du mot tandis que le contexte gauche correspond à la fin du mot. Ce genre de commande permet ainsi de trier par ordre alphabétique tous les caractères de toute région textuelle reconnue comme mot. Pour un traducteur, une telle concordance sur les caractères n'est pas vraiment utile mais pour un linguiste cela est beaucoup plus pertinent. Par exemple, ce genre de concordance peut servir dans des applications spécifiques sur le traitement du mot comme les suivantes: étude morphologique et morphographique, étude de segmentation automatique, étude phonétique sur la coupe syllabique, étude typographique pour la normalisation de l'orthographe.
Si un fichier textuel est volumineux, une concordance de mots sur un tel texte génèrera une très grosse liste puisqu'il y aura une ligne de résultats pour chaque mot du texte d'entrée. Ainsi, un texte de 10,000 mots produira une concordance de 10,000 lignes. Pour réduire la taille d'une concordance, il est possible d'imposer des contraintes sélectives dans une commande d'appel de Concorde.
Comme contrainte sélective, l'option
-a MOT permet de limiter la sortie des items-vedettes
qu'aux items qui auront la chaîne MOT soit dans le
contexte droit ou dans le contexte gauche de l'item-vedette. Par
exemple, la commande suivante demande de lire le texte fulfulde du
fichier xful.bra, de produire une concordance de mots
(raffineur W) dans le contexte de phrases (raffineur
S), de calculer une référence pour l'item-vedette
(option -r5), de réduire la sortie qu'aux mots-vedettes
ayant le chaîne wowlu soit dans le contexte gauche ou
soit dans le contexte droit.
concorde -a wowlu -r5 -w70 S,W xful.bra
Voici l'ensemble des résultats de cette dernière commande:
Dans les résultats de cette commande, on ne retrouve que les mots-vedettes qui ont wowlu soit dans leur contexte gauche ou dans leur contexte droit. Lorsque wowlu ne figure pas explicitement dans les contextes affichés, cela signifie que ce mot est bel et bien dans la région textuelle phrase mais que la ligne d'affichage n'est pas assez longue pour afficher le texte de toute la phrase correspondante.
Dans les exemples précédents, Concorde
avait à traiter des fichiers d'entrée en format plein texte. Dans cette
section, nous donnons un exemple de traitement d'un fichier d'entrée en
format HTML. Le texte du fichier
resums.html est écrit en espagnol et ce fichier est
formellement conforme à la grammaire DTD de la norme
HTML 3.2.
La commande suivante demande de lire le fichier espagnol
resums.html, de produire une concordance des mots (raffineur
interne W) en contexte de phrase (raffineur interne
S) et dans les régions textuelles des raffineurs
externes th et td. Ces raffineurs
externes sont mis en correspondance avec les balises HTML
<th></th> et <td></td>
qui se trouvent dans le texte HTML d'entrée.
concorde -w70 th+td,S,W resums.html
Les résultats qui suivent ne sont qu'un extrait de la concordance originale obtenue. Cet extrait démontre bien que Concorde peut traiter directement un fichier en format HTML.
...
ingenieros y de gestion.<br> A la luz de complementos recogidos du
Retour à:
centro de recursos multimedia abierto al exterior e integrado a una
presente artículo se propone abordar las etapas y los retos ligado
de trabajo de la AUCC y de la ABRC/CARL sobre las bibilotecas unive
ciones del Canadá», el Senado académico de la Universidad de Moncto
l informe entregado al Senado académico a principios de 1997 reflej
le-acceso no sólo facilita la accesibilidad a los fondos documental
que ofrece nuevos servicios y acceso a fuentes informativas cada ve
bliotecas así como una vía de acceso al mundo de la información.</f
rme con el objeto de proponer acciones apropiadas que pudieran ser
/images/acelfa.jpg" alt="Logo ACELF" height="50" width="95" border=
éducation de langue française (ACELF)</b><br> <b>268, rue Marie-de-
olor="0000ff">Accueil du site ACELF</font></a>] </font>
Acompañar a los educandos en el manej
a descripción del conjunto de actividades de la biblioteca virtual
o en maestros y promotores de actividades pedagógicas.
tículo evalua las principales actividades de reflexión y de investi
r su desarrollo. La situación actual, revelada por una reciente enc
del conjunto de realizaciones actuales en las univerdidades y grand
ias a las nuevas tecnologías, actualmente asistimos al renacimiento
tos de vigilancia tecnológica actualmente en curso en la biblioteca
Actualmente, el desarrollo de las tec
centros de aprendizaje: no se acude solamente a leer o pedir presta
presentan, son testigos de la adaptación de la cadena documental tr
...
«Concorde» produit des concordances de mots en contexte.
Usage: concorde [OPTION]... SCAN-SPEC[,SCAN-SPEC] FICHIER...
Options:
{-}{-}copyright afficher les conditions de copie, puis terminer
{-}{-}help fournir ce message d'aide, puis terminer
{-}{-}version identifier le programme, puis terminer
Options de sortie:
-v expliquer en mode bavard ce qui se passe
-d sortir de l'information interne pour fin de débogage
-a MOT limiter la sortie ayant MOT dans le contexte gauche ou droit
-w WIDTH utiliser la valeur WIDTH comme largeur pour lister les contextes
-r WIDTH fournir les références aux lignes sur WIDTH colonnes en moyenne
-i produire les mots-vedettes en ordre alphabétique inverse
Chaque SCAN-SPEC est DEMARREUR[/TERMINATEUR].
Tant DEMARREUR que TERMINATEUR sont CHERCHER[+CHERCHER]... et
chaque CHERCHER est soit une balise SGML ou soit un des raffineurs
internes suivants:
P paragraphe délimité par une ou plusieurs lignes vides
S phrase terminée par .?! et possiblement ])}"» et suivie de 2 blancs
V vers terminé par une ou plusieurs fins de ligne
W mot délimité par un blanc (caractère espace)
C caractère unique (énergivore en CPU)
T fournir une balise démarreur/terminateur avant et après le textuel
F reconnaître l'espace français après une ponctuation forte
|
Accueil TCAO |
Remerciements |
Un aperçu |
Licence BPI |
Distribution |
Installation |
Claviers | Pointeurs | Alibi | Concorde | Recode | Ventile | Vocable | Accueil BPI |
http://progiciels-bpi.ca |
bourbeau@progiciels-bpi.ca
Copyright © Progiciels Bourbeau Pinard inc., Montréal, 1999.
Tous droits réservés / All rights reserved.