Logo BPI
Accueil TCAO  |  Remerciements  |  Un aperçu  |  Licence BPI  |  Distribution  |  Installation  | 
Claviers  |  Pointeurs  |  Alibi  |  Concorde  |  Recode  |  Ventile  |  Vocable  |  Accueil BPI

Progiciels de TCAO - Alibi - Exemples

Table des matières - Alibi - Exemples

Résumé

Alibi est un progiciel d'alignement bi-textuel (ou bilingue). Cet outil permet de dépouiller en parallèle deux fichiers et d'aligner automatiquement les constituants textuels provenant de cette paire de fichiers.

Dans un contexte traductionnel et de TCAO, Alibi permet d'explorer en parallèle deux fichiers textuels ayant le même contenu informationnel mais où chacun est dans une langue distincte. Habituellement, le contenu du deuxième fichier est une traduction humaine du contenu du premier fichier, par exemple: les phrases d'un texte source en bambara à aligner avec les phrases traduites en français de ce texte bambara. Toutefois, cette traduction pourrait aussi bien être le résultat brut ou le résultat post-édité d'un système de traduction automatique (TAO). Dans un contexte de correction d'épreuves et de TCAO, Alibi permet également d'explorer en parallèle deux fichiers textuels écrits dans une même langue et ayant presque la même structure textuelle. Par exemple, ce deuxième fichier pourrait être une version modifiée, révisée ou post-éditée du premier fichier.

Le progiciel Alibi est constitué d'un moteur d'alignement et de modules raffineurs permettant de guider l'alignement par niveaux textuels. Comme constituants textuels, Alibi peut aligner par exemple les paragraphes, les phrases ou les mots. Comme paire de fichiers d'entrée, Alibi accepte soit deux fichiers en format plein texte ou soit deux fichiers «sgmlisés». Pour les fichiers d'entrée contenant des balises SGML ou HTML, l'utilisateur peut indiquer à Alibi de se servir de ces balises comme raffineurs additionnels ou complémentaires. Comme fichier de sortie, Alibi peut produire soit des fichiers alignés en format plein texte ou soit des fichiers alignés sgmlisés. Pour mieux comprendre les commandes d'appel de Alibi formulées dans les prochains exemples, consultez le Menu d'aide Alibi.


Exemple 1 - Alignement de phrases wolof/français

La commande suivante demande d'aligner les phrases (raffineur S) et les paragraphes (raffineur P) du texte wolof du fichier-A (premier fichier d'entrée xwol.lin) avec sa traduction française du fichier-B (deuxième fichier d'entrée xwolfr.l1). L'option -k demande de produire une sortie sur deux colonnes tandis que l'option -w70 indique d'utiliser 70 colonnes comme largueur d'affichage.

alibi -k -w70  P,S  xwol.lin  xwolfr.l1

Les résultats de cette commande qui suivent ne sont qu'un extrait de l'alignement original obtenu.

Alibi wolof/français

La valeur par défaut de l'option -w est de 79 colonnes, ce qui correspond à la largeur d'un écran standard. La valeur maximale de l'option -w dépend plutôt de la capacité de votre écran ou, encore, de la largeur maximale des pages de votre imprimante. Par défaut, les textes alignés en deux colonnes sont justifiés à la gauche des boîtes. L'option -c permet de justifier les deux colonnes sur la ligne du centre des boîtes. Dans certain cas, cette option peut être utile.


Exemple 2 - Alignement de vers bambara/français

Dans l'exemple précédent, Alibi a aligné les paragraphes et les phrases des deux textes à l'aide des raffineurs internes P et S. Présentons maintenant le raffineur V qui sert à indiquer que le genre littéraire des textes à aligner n'est pas de la prose mais plutôt de la poésie sous forme de vers et de strophes. Dans un tel cas, ce sont plutôt des lignes qu'il faut préserver et aligner.

La commande suivante demande d'aligner les vers à l'aide du raffineur V de la chantefable fulfulde (fichier xbam-stro.bra) avec la traduction française (fichier xbamfr-stro.l1) et de sortir les résultats sur deux colonnes (option -k) avec une largeur de 70 colonnes (option -w70). Le texte original fulfulde est une chantefable (un chant en vers) où les marques de ponctuation sont peu utilisées comme c'est souvent le cas dans un discours poétique.

alibi -k -w70  V  xbam-stro.bra  xbamfr-stro.l1

Les résultats de cette commande qui suivent ne sont qu'un extrait de l'alignement original obtenu.

__________________________________+__________________________________
AMADU TARA                        | AMADOU TARA
__________________________________+__________________________________
N ye n ka nsiirin nin da Amadu    | Ce conte est l'histoire d'Amadou
Tara la.                          | Tara.
__________________________________+__________________________________
jamanatigi dò tun bè yen          | Il était une fois le chef d'un
                                  | pays,
__________________________________+__________________________________
muso kònòntò de tun bè a fè       | qui avait neuf femmes.
__________________________________+__________________________________
muso kònòntò bèè ye denkè kelen   | Chacune d'elles lui avait donné
kelen wolo a ye.                  | un garçon,
__________________________________+__________________________________
a denkè kelen kelen bèè fana tògò | chacun de ses fils s'appelait
ye ko Amadu                       | Amadou.
__________________________________+__________________________________
Amadu ninw, u ba tògò de tun bè   | Au nom d'Amadou, on ajoutait
da u kan                          | celui de la mère
__________________________________+__________________________________
ka u bò nyògòn na.                | afin de les distinguer.
__________________________________+__________________________________
Amadu bèè ncinin tun ye           | Le plus jeune des Amadou,
__________________________________+__________________________________
denkè ninw bèè la dògònin         | le cadet de tous ces garçons,
__________________________________+__________________________________
o de tun ye Amadu Tara ye         | s'appelait Amadou Tara.
__________________________________+__________________________________

Avec le raffineur interne V, le progiciel Alibi produit internement un démarreur et un terminateur de vers si une ligne de caractères orthographiques se termine par un ou plusieurs caractères fin de ligne.


Exemple 3 - Alignement bambara/français avec simple contrainte

Parmi les options de sortie (voir Menu d'aide Alibi), il y a l'option -a mot et l'option -b mot. Ces deux options permettent d'effectuer, par l'entremise d'un alignement, une concordance multilingue sur les deux textes d'entrée (i.e. le fichier-a et le fichier-b en ciblant la recherche textuelle sur un mot spécifique). Par exemple, l'option -a mot signifie d'effectuer un alignement des deux textes d'entrée et de ne sortir ensuite que les segments alignés du fichier-a qui contiennent le mot indiqué en paramètre de cette option.

Il n'est pas obligatoire d'utiliser en même temps les deux options -a mot et -b mot sur la commande d'appel. L'option -a mot est une contrainte s'appliquant uniquement sur le fichier-a tandis que l'option -b mot est une contrainte s'appliquant uniquement sur le fichier-b. L'usage des deux options sur la commande d'appel impose tout simplement une double contrainte. Cela signifie de ne sortir que les segments alignés qui contiennent à la fois le mot de l'option -a dans le premier fichier (fichier-a) et le mot de l'option -b dans le deuxième fichier (fichier-b).

La commande suivante demande d'aligner le fichier-a bambara xbam.bra et le fichier-b français xbamfr.l1 et de ne sortir ensuite que les segments alignés qui contiennent le mot kòròkè dans le premier fichier (fichier-a).

alibi -k -w70 -a kòròkè  P,S  xbam.bra  xbamfr.l1

Voici l'ensemble des segments alignés produit par cette commande:

__________________________________+__________________________________
Kòòrimugu nin tagara sira min fè  | Le chemin que le coton désigna et
o ni a kòròkèw tagara sira min fè | le chemin où ses frères s'étaient
o tè kelen ye.                    | engagés étaient différents.
__________________________________+__________________________________
O ye a sòrò Amadu Tara ye jiri    | Or, celui-ci avait coupé neuf
nin a bulu kònòntò kari a yèrè    | feuilles de cet arbre, une pour
kelen, a kòròkèw ninw fana bèe    | lui-même, et une pour chacun de
kelen kelen.                      | ses frères.
__________________________________+__________________________________
A tagara kòròkè ninw yòrò nyini   | Il alla donc les chercher, pour
yala a bè se ka kelen kelen di u  | leur remettre une feuille à
ma u ka segin nyògòn fè ka na u   | chacun, et qu'ils retournent
fa bara.                          | ensemble chez leur père.
__________________________________+__________________________________
Ko barisa ko ale tèna segin ka a  | En effet, il ne saurait repartir
kòròkèw to ko a fana bè taga      | sans ses frères: il allait donc
dennin nyini o fana ka fara u     | demander la fille en mariage,
kan.                              | afin qu'on le traite comme ses
                                  | frères.
__________________________________+__________________________________
Ko ko ni a kòròkèw sara yòrò min, | Là où ses frères mourront, lui
ko a bè sa yen.                   | aussi, il mourra.
__________________________________+__________________________________
Amadu Tara fana ko ko a ka furu   | Amadou Tara dit qu'on ne pouvait
tè se ka siri ko fo a kòròkè minw | célébrer le mariage sans que ses
bè yan ko fo olu ka na.           | frères puissent y participer.
__________________________________+__________________________________
Ko ale dun ye a mèn ko kòròkè     | Il avait en effet appris que ses
nimw kèra jòn ye yan.             | frères étaient devenus esclaves
                                  | ici.
__________________________________+__________________________________
O tuma a ye kòròkè nimw tògò fò.  | Alors, il donna le nom de ses
                                  | frères.
__________________________________+__________________________________
O ye a sòrò kòròkè nimw bèè kèra  | Il se trouvait que ceux-ci
sagagènnaw ni bagènnaw ye.        | étaient devenus bergers de
                                  | moutons et de chèvres.
__________________________________+__________________________________
O kama, u ye kòròkè seegin fana   | On libéra donc ses huit frères;
bèè bila ka u bèè bò jònya la.    | ils quittèrent tous l'esclavage.
__________________________________+__________________________________
O tuma a ni a kòròkè seegin bèè   | Alors, il prit le chemin avec ses
ye sira minè ko a bè taga u fa    | huit frères, disant qu'ils
bara.                             | allaient retourner chez leur
                                  | père.
__________________________________+__________________________________
Jinèmuso nin nana dòròn Amadu     | Dès qu'elle arriva, tous les
Tara kòròkè ninw bèè Amadu Tara   | frères d'Amadou Tara, les huits
kòròkè seegin ninw bèè wulila ka  | frères d'Amadou Tara, se
jò jinèmuso nin kama sisan kòni   | levèrent, et entourèrent cette
ko u bè na jinèmuso nin furu.     | femme-génie, disant qu'ils
                                  | désiraient l'épouser.
__________________________________+__________________________________

Dans ces résultats, il est important de noter que mot dans les options -a et -b signifie une chaîne de caractères. Par exemple dans les segments alignés plus bas, les segments bambara retenus contiennent soit le mot kòròkèw ou soit le mot kòròkè.

Pour plusieurs langues africaines, la composante morphologique est constituée d'affixes morphologiques qui se placent en position de préfixe, contrairement au français où les affixes morphologiques flexionnels se retrouvent en position de suffixe. Par exemple en lingala, le suffixe ko- est une marque flexionnelle d'un verbe à l'infinitif. L'utilisation de la notion de chaîne dans un mot est particulièrement utile pour ce genre de langue à morphologie préfixale. Par exemple dans un texte lingala, l'option -a fungola permet de retrouver du même coup toutes les occurrences textuelles alignées du mot kofungola, du mot fungola et de toute chaîne fungola qui serait précédée par un préfixe quelconque.

Dans la plupart des exemples où nous utilisons une image graphique en format GIF pour afficher des textes en langues africaines, on peut observer que certains signes diacritiques sont déformés. Par exemple, le e accent aigu ressemble plutôt à un e macron, le o accent grave ressemble à un o macron tout comme le o accent aigu. Dans l'affichage de tous les exemples de ce genre-ci, c'est la fonte télétype qui en est la cause et non pas la codification des caractères africains accentués. Dans les autres exemples n'utilisant pas une image GIF, on peut constater que les caractères africains sont affichés correctement.


Exemple 4 - Alignement bambara/français avec double contrainte

La commande suivante demande d'aligner le fichier bambara xbam.bra et le fichier français xbamfr.l1 et de ne sortir ensuite que les segments alignés qui contiennent d'une part la chaîne kòròkè dans le segment bambara et, d'autre part, la chaîne frère dans le segment français.

alibi -k -w70  -a kòròkè  -b frère  P,S  xbam.bra  xbamfr.l1

En comparant les résultats de la commande précédente avec les résultats suivants, on peut constater que les segments alignés ne contenant pas la chaîne frère dans la partie française n'ont pas été retenus lors de la production des résultats de sortie.

__________________________________+__________________________________
Kòòrimugu nin tagara sira min fè  | Le chemin que le coton désigna et
o ni a kòròkèw tagara sira min fè | le chemin où ses frères s'étaient
o tè kelen ye.                    | engagés étaient différents.
__________________________________+__________________________________
O ye a sòrò Amadu Tara ye jiri    | Or, celui-ci avait coupé neuf
nin a bulu kònòntò kari a yèrè    | feuilles de cet arbre, une pour
kelen, a kòròkèw ninw fana bèe    | lui-même, et une pour chacun de
kelen kelen.                      | ses frères.
__________________________________+__________________________________
Ko barisa ko ale tèna segin ka a  | En effet, il ne saurait repartir
kòròkèw to ko a fana bè taga      | sans ses frères: il allait donc
dennin nyini o fana ka fara u     | demander la fille en mariage,
kan.                              | afin qu'on le traite comme ses
                                  | frères.
__________________________________+__________________________________
Ko ko ni a kòròkèw sara yòrò min, | Là où ses frères mourront, lui
ko a bè sa yen.                   | aussi, il mourra.
__________________________________+__________________________________
Amadu Tara fana ko ko a ka furu   | Amadou Tara dit qu'on ne pouvait
tè se ka siri ko fo a kòròkè minw | célébrer le mariage sans que ses
bè yan ko fo olu ka na.           | frères puissent y participer.
__________________________________+__________________________________
Ko ale dun ye a mèn ko kòròkè     | Il avait en effet appris que ses
nimw kèra jòn ye yan.             | frères étaient devenus esclaves
                                  | ici.
__________________________________+__________________________________
O tuma a ye kòròkè nimw tògò fò.  | Alors, il donna le nom de ses
                                  | frères.
__________________________________+__________________________________
O kama, u ye kòròkè seegin fana   | On libéra donc ses huit frères;
bèè bila ka u bèè bò jònya la.    | ils quittèrent tous l'esclavage.
__________________________________+__________________________________
O tuma a ni a kòròkè seegin bèè   | Alors, il prit le chemin avec ses
ye sira minè ko a bè taga u fa    | huit frères, disant qu'ils
bara.                             | allaient retourner chez leur
                                  | père.
__________________________________+__________________________________
Jinèmuso nin nana dòròn Amadu     | Dès qu'elle arriva, tous les
Tara kòròkè ninw bèè Amadu Tara   | frères d'Amadou Tara, les huits
kòròkè seegin ninw bèè wulila ka  | frères d'Amadou Tara, se
jò jinèmuso nin kama sisan kòni   | levèrent, et entourèrent cette
ko u bè na jinèmuso nin furu.     | femme-génie, disant qu'ils
                                  | désiraient l'épouser.
__________________________________+__________________________________

Exemple 5 - Alignement lingala/français avec sortie en SGML

Parmi les options de sortie de Alibi, il y a l'option -s qui permet de produire les alignements résultants en format SGML . La commande suivante demande d'aligner les phrases et les paragraphes du fichier lingala xlin.lin avec sa traduction française contenue dans le fichier xlinfr.l1, de produire ensuite les segments alignés en format SGML (option -s), et d'écrire les résultats dans le fichier de sortie aligne.txt.

alibi -s  P,S  xlin.lin  xlinfr.l1  > aligne.txt

Les résultats suivants représentent le contenu du fichier aligne.txt résultant de cette commande d'alignement.

Alibi lingala/français SGML

Dans les résultats SGML ainsi obtenus, la balise d'ouverture <PAIRE> et la balise de fermeture </PAIRE> délimitent chaque paire de segments alignés. Et dans chaque paire de segments, la balise d'ouverture <GAUCHE> et la balise de fermeture </GAUCHE> délimitent le segment aligné du fichier-a tandis que la balise d'ouverture <DROITE> et la balise de fermeture </DROITE> délimitent le segment aligné du fichier-b. Enfin, les balises d'ouverture et de fermeture <ALIGNEMENT></ALIGNEMENT> délimitent l'ensemble des résultats dans un tout.

Dans la présente version de Alibi, la grammaire de déclaration de type de document (DTD) qui est utilisée pour produire le format SGML via l'option -s est assez élémentaire. Cette option démontre toutefois que la mécanique informatique est en place pour produire éventuellement un format SGML beaucoup plus riche ou plus complexe.


Exemple 6 - Alignement anglais/français avec interface Alibi-Emacs-Ediff

Les commandes et les exemples présentés plus haut sont une illustration de l'utilisation de Alibi en mode de traitement par lot. Ce mode de traitement consiste à produire des segments alignés qui peuvent être soit affichés l'écran ou soit enregistrés dans un nouveau fichier textuel. Pour enregistrer les résultats d'une commande Alibi dans un fichier de sortie, il suffit d'utiliser le symbole > (désignant la sortie standard stdout) suivi d'un nom de fichier, comme le nom de fichier ali-txt.bra dans la commande suivante:

alibi -k -w70 -a kòròkè  -b frère  P,S  xbam.bra xbamfr.l1  > ali-txt.bra

Alibi peut aussi être utilisé en mode interactif. Ce mode interactif consiste à examiner dynamiquement les segments alignés tout en ayant accès directement aux deux fichiers textuels sources et tout en pouvant modifier en même temps le contenu de ces deux fichiers sources. Ce mode interactif d'exploration de segments alignés est intégré directement à même l'environnement de travail d'édition dans l'éditeur de textes Emacs (Stallman [1996]) à travers l'utilitaire Ediff (Kifer [1998]). Ce mode interactif sera expliqué brièvement dans cette section.

L'image suivante permet d'illustrer l'écran de travail résultant de l'interface entre Alibi, Emacs et Ediff.

Interface Alibi-Emacs-Ediff

Dans cette illustration d'écran, on peut observer que l'éditeur Emacs a ouvert trois fenêtres. La première fenêtre A contient le texte source du fichier-a, la deuxième fenêtre B contient le texte source du fichier-b tandis que la troisième fenêtre Paneau de contrôle contient le menu d'aide Ediff. La navigation à travers les segments alignés s'effectue automatiquement à l'aide des diverses commandes de déplacement Ediff.

Dans ce mode interactif, les fenêtres A et B sont synchronisées! Lors du déplacement d'un segment aligné vers un autre segment aligné, cela signifie que les deux textes sources bougeront automatiquement et simultanément en même temps dans les deux fenêtres A et B. Enfin, comme autre avantage de ce mode interactif, il faut dire que toutes les commandes de l'éditeur Emacs sont aussi disponibles pour éditer ou modifier directement les fichiers sources fichier-a et fichier-b des textes qui se trouvent dans ces fenêtres A et B.

L'interface Alibi fonctionne autant dans Emacs sous une console que dans Emacs sous X-Windows. Sous une console, lors du déplacement via les commandes de navigation Ediff, les segments alignés sont identifiés et délimités dynamiquement par des bornes (i.e. <<- et ->>). Sous X-Windows, les segments alignés sont identifiés par des couleurs. Par exemple, un segment aligné dans la fenêtre A sera couvert d'une couleur vert lime tandis que le segment aligné correspondant dans la fenêtre B sera couvert d'une couleur jaune. Lorsqu'on passe d'une paire de segments alignés vers une autre paire, ces deux couleurs bougent en même temps sur ces nouveaux segments tandis que la couleur des segments de la paire précédente redevient en gris pâle.

Pour pouvoir utiliser Alibi en mode interactif, nous présupposons que l'éditeur Emacs et le logiciel Ediff sont déjà installés et configurés dans votre poste de travail. Pour appeler Alibi à partir de Emacs, il suffit de taper la méta commande M-x alibi et de répondre aux questions de l'invite dans la ligne de tampon Emacs.


Exemple 7 - Alignement français/espagnol de fichiers HTML

Dans le contexte de ces progiciels de TCAO, un raffineur externe est toute balise d'une grammaire de déclaration de type de document (grammaire DTD selon la terminologie SGML). Par exemple, toute balise de la grammaire DTD de la norme HTML 3.2 ou de la norme HTML 4.0 peut être considérée comme un raffineur externe (voir Raffineurs textuels). Comme autre exemple, toute balise dans un fichier SGML dont la syntaxe répond formellement à la grammaire DTD qui lui est sous-jacente peut être utilisée comme raffineur externe. Pour une meilleure performance des progiciels de TCAO, il est entendu que les fichiers d'entrée en langage SGML sont formellement conformes à leur grammaire DTD.

La commande suivante demande de lire le texte français (fichier resumf.html et le texte espagnol (fichier resums.html), et d'aligner les phrases (raffineur interne S), les paragraphes (raffineur interne P) ainsi que les autres régions textuelles désignées par la liste des raffineurs externes html,tr,th+T,td,p. De plus, cette commande demande d'afficher les résultats sur deux colonnes (option -k) avec une largeur de 70 colonnes (option -w70).

alibi -k -w70  html,tr,th+T,td,p+P,S  resumf.html  resums.html

Les résultats qui suivent de cette commande d'alignement de fichiers HTML ne sont qu'un extrait de l'alignement original obtenu.

__________________________________+__________________________________
Éric SUTTER<br> <i>Consultant,    | Éric SUTTER<br> <i>Consultante,
Bureau van Dijk, Paris.</i>       | Bureau van Dijk, Paris.</i>
__________________________________+__________________________________
<font size="-1">Du fait que le    | <font size="-1">Debido al hecho
document joue un rôle essentiel   | de que los documentos juegan un
dans l'acquisition des            | rol esencial en la adquisición de
connaissances, les bibliothèques  | conocimientos, las bibliotecas
scolaires ou universitaires font  | escolares o universitarias forman
partie intégrante du «système»    | parte integrante del «sistema»
pédagogique.                      | pedagogico.
__________________________________+__________________________________
Elles assurent de fait plusieurs  | Estas realizan funciones
fonctions essentielles dans le    | esenciales para dichos
cadre des établissements,         | establecimientos, funciones que
fonctions qui varient avec le     | varían según el nivel de
niveau d'enseignement mais qu'il  | enseñanza pero que conviene
convient désormais d'examiner à   | analizar a la luz de las
la lumière des possibilités       | posibilidades que nos ofrece la
offertes par les technologies de  | tecnología de la información y de
l'information et de la            | la comunicación.
communication.                    |
__________________________________+__________________________________
Non seulement le fonds            | El tele-acceso no sólo facilita
documentaire se trouve            | la accesibilidad a los fondos
considérablement élargi du fait   | documentales, sino que tambien
de l'accès à distance, mais de    | provoca el surgimiento de nuevas
nouvelles approches du document   | maneras de tratar los documentos.
vont être possibles.              |
__________________________________+__________________________________
Le développement des              | El desarrollo de bibliotecas
bibliothèques virtuelles sous ses | virtuales de diversos tipos puede
différentes formes risque de      | provocar la eliminación de los
faire disparaître le lieu         | lugares físicos y poner en juego
physique et de remettre en cause  | no la existencia de bibliotecas
non pas l'existence des           | sino su manera de funcionar.
bibliothécaires mais leur façon   |
d'accomplir leur métier.          |
__________________________________+__________________________________
La part consacrée à la médiation  | Los equipos pedagógicos deberán
va se développer. Une place plus  | otorgarle un lugar más importante
grande devrait leur être confiée  | a la mediación, ya que ésta
au sein de l'équipe pédagogique à | conocerá un buen desarrollo, a
condition toutefois qu'un certain | condición de que un cierto número
nombre d'obstacles soient levés.  | de obstáculos desaparezcan.
__________________________________+__________________________________
Accompagner les apprenantes et    | Acompañar a los educandos en el
les apprenants dans la maîtrise   | manejo y control de la
de l'information et les préparer  | información y perpararlos para la
à la «société de la connaissance» | «sociedad del conocimiento» se
va être un axe fort de leur       | convertirá en uno de los pilares
métier.                           | de dichos equipos.
__________________________________+__________________________________
Il est donc urgent que les        | Es pues urgente que los
bibliothécaires, responsables     | bibliotecarios, los responsables
d'établissement et les            | de las instituciones y los
enseignantes et les enseignants   | maestros y maestras se reunan
se rencontrent pour étudier la    | para estudiar la nueva
nouvelle configuration de l'école | configuración de la escuela del
de demain, déterminer les         | futuro, determinar las nuevas
nouvelles complémentarités et les | complementaridades y
nouvelles compétences à mettre en | compentencias que será necesario
oeuvre.</font><br><br>            | desarrollar.</font><br><br>
__________________________________+__________________________________
Michèle HUDON<br> <i>Professeure  | Michèle HUDON<br> <i>Profesora
adjointe,<br> École de            | adjunta,<br>Escuela de
bibliothéconomie et des sciences  | biblioteconomía y de ciencias de
de l'information,<br> Université  | la información,<br>Universidad de
de Montréal</i>                   | Montreal</i>
__________________________________+__________________________________
<font size="-1">Grâce aux         | <font size="-1">Gracias a las
nouvelles technologies, nous      | nuevas tecnologías, actualmente
assistons aujourd'hui à la        | asistimos al renacimiento del
renaissance du catalogue de       | catálogo de biblioteca en tanto
bibliothèque comme outil          | que útil versatil y eficaz para
versatile et efficace pour le     | localizar documentos e
repérage de documents et          | información.
d'information.                    |
__________________________________+__________________________________
Nous présentons ici quelques      | Presentamos aqui algunas de las
caractéristiques de la troisième  | características de la tercera
génération de catalogues          | generación de católogos
accessibles en ligne, celle qui   | tele-accesibles, que se
se développe et s'installe        | desarrolla y se instala
progressivement dans les          | progresivamente en las
institutions documentaires,       | instituciones que manipulan
offrant de nouveaux services et   | documentos, que ofrece nuevos
donnant accès à des sources       | servicios y acceso a fuentes
d'information de plus en plus     | informativas cada vez más
diversifiées.                     | diversificadas.
__________________________________+__________________________________
Le catalogue contemporain devient | El catálogo contemporáneo se
une vitrine promotionnelle        | convierte pues en un poderoso
puissante pour les bibliothèques  | útil de promoción para las
en même temps qu'une voie d'accès | bibliotecas así como una vía de
au monde de l'information en      | acceso al mundo de la
général.</font><br><br>           | información.</font><br><br>
__________________________________+__________________________________

Dans ce genre d'alignement de fichiers HTML, on peut constater dans les résultats plus haut que toute balise qui ne fait pas partie de la liste des raffineurs demeure une donnée textuelle au même titre que le texte proprement dit. Par exemple, cela explique pourquoi on retrouve des balises comme <font size="-1"> dans la donnée textuelle. Lorsqu'une balise fait partie de la liste des raffineurs externes, alors Alibi récupère cette balise en tant que démarreur et terminateur. Par exemple, cela explique pourquoi on ne retrouve pas des balises comme <tr></tr>, <th></th> ou <td></td> dans la donnée textuelle.


ANNEXE 1 - Menu d'aide Alibi

«Alibi» effectue un alignement bi-textuel de deux fichiers.

Usage: alibi [OPTION]...  SCAN-SPEC[,SCAN_SPEC]...  FILE-A  FILE-B

Options:
  {-}{-}copyright  afficher les conditions de copie, puis terminer
  {-}{-}help       fournir ce message d'aide, puis terminer
  {-}{-}version    identifier le programme, puis terminer

Options d'entrée:
  -r         lire les fichiers binaires mais ne pas les réécrire
  -x         lire les fichiers binaires et les réécrire

Options d'analyse:
  -z         utiliser des bornes floues, non pas les bornes fortes
  -v         expliquer en mode bavard ce qui se passe
  -d         sortir de l'information interne pour fin de débogage

Options de sortie:
  -a MOT     sortir du FICHIER-A tout segment aligné contenant MOT
  -b MOT     sortir du FICHIER-B tout segment aligné contenant MOT
  -e         produire une sortie pour l'interface `alibi' Emacs/Ediff
  -k         produire la sortie en forme de boîtes sur 2 colonnes
  -c         justifier les deux colonnes sur la ligne du centre
  -w WIDTH   utiliser la valeur WIDTH comme largeur avec l'option -k
  -s         produire une sortie en format SGML des alignements

Options de calibrage:
  -M VALEUR  100 * moyenne du rapport de longueur mot-B par longueur mot-A
  -V VALEUR  100 * variance du rapport de longueur mot-B par longueur mot-A
  -Z VALEUR  pénalité pseudo-infinie
  -A VALEUR  -100 * log ([prob. de 0-1 match] / [prob. de 1-1 match])
  -B VALEUR  -100 * log ([prob. de 2-1 match] / [prob. de 1-1 match])
  -C VALEUR  -100 * log ([prob. de 2-2 match] / [prob. de 1-1 match])

SPECS est PASSE[,PASSE]... alors que PASSE est DEMARREUR[/TERMINATEUR].
Tant DEMARREUR que TERMINATEUR sont CHERCHER[+CHERCHER]...
et chaque CHERCHER est soit une balise SGML ou soit un des raffineurs
internes suivants:

   P   paragraphe délimité par une ou plusieurs lignes vides
   S   phrase terminée par .?! et possiblement ])}"» et suivie de 2 blancs
   V   vers terminé par une ou plusieurs fins de ligne
   W   mot délimité par un blanc (caractère espace)
   C   caractère unique (énergivore en CPU et option peu utile)
   T   fournir une balise démarreur/terminateur avant et après le textuel
   F   reconnaître l'espace français après une ponctuation forte

Un format de sortie est impliqué par défaut si une des options -eks est omise.
Les valeurs de calibrage impliquées sont -M100 -V680 -Z2500 -A450 -B230 -C440.
Accueil TCAO  |  Remerciements  |  Un aperçu  |  Licence BPI  |  Distribution  |  Installation  | 
Claviers  |  Pointeurs  |  Alibi  |  Concorde  |  Recode  |  Ventile  |  Vocable  |  Accueil BPI

http://progiciels-bpi.ca  |  bourbeau@progiciels-bpi.ca
Copyright ©  Progiciels Bourbeau Pinard inc., Montréal, 1999. Tous droits réservés / All rights reserved.