LES ÉTAPES DU TRAITEMENT AUTOMATIQUE

Le projet global Anamètre consiste essentiellement à élaborer des outils capables de traiter automatiquement l'ensemble des formes rythmiques périodiques caractéristiques des textes versifiés : calcul du mètre, agencement des rimes, formes strophiques et formes fixes.

IDENTIFICATION DES VOYELLES MÉTRIQUES

animation.gif
Charles Baudelaire, L'Albatros, vers 13


Étape 1 : segmentation des vers en mots

Les vers sont découpés en mots. La segmentation en mots est nécessaire pour l'application des ressources lexicales telles que le dictionnaire des mots jonctifs et disjonctifs (module de traitement des "e" instables) et le dictionnaire des diérèses (module de traitement des semi-consonnes).
Après traitement au moyen d'expressions régulières, les mots sont délimités par la balise <w>.
Exemple :
<w>Le</w> <w>poète</w> <w>est</w> <w>semblable</w> <w>au</w> <w>prince</w> <w>des</w> <w>nuées</w>
(Charles Baudelaire, L'Albatros)

Étape 2 : identification des voyelles et des semi-consonnes

Chaque segment de lettres correspondant à une voyelle ou à une semi-consonne est associé à un ensemble de quatre propriétés : Dans le fichier XML du texte analysé, chacune de ces propriétés est encodée par un attribut de l'élément <seg> qui encadre la lettre ou le groupe de lettres. Exemple pour la voyelle stable "a" :
<seg type="vs" rule="425" phoneme="&#97;" value="1">a</seg>

Dans la page XHTML correspondante, la couleur du segment représente l'attribut "type". Les autres propriétés sont visibles au moyen d'une bulle Javascript qui apparaît au passage de la souris sur le segment de lettres. Les différentes valeurs de l'attribut "type" utilisées pour l'identification des voyelles et des semi-consonnes sont : Lors de ce premier traitement, la valeur assignée aux "e" instables et aux semi-consonnes est une valeur par défaut. Leur valeur définitive est obtenue après traitement des "e" instables et des diérèses.

Étape 3 : traitement des "e" instables

À chaque voyelle sont associées cette fois cinq informations (les semi-consonnes sont traitées par le module suivant) L'objet du traitement des "e" instables est de modifier les attributs de l'élément <seg> des "e" instables. Selon son contexte, un "e" identifié comme instable lors du premier traitement, prend l'une des valeurs suivantes en lieu et place de l'attribut type="vi" : Exemple : Dans le vers "Le poète est semblable au prince des nuées" de Charles Baudelaire, (L'Albatros), le "e" instable de fin de mot de poète est associé à l'élément suivant lors de la seconde étape du traitement :
<seg type="vi" rule="433" phoneme="&#601;" value="1">e</seg>
Après application du module de traitement des "e" instables, cet élément est remplacé par le suivant :
<seg type="ee" rule="e-20" phoneme="&#601;" value="0" >e</seg>


Étape 4 : traitement des semi-consonnes

Les semi-consonnes repérées lors de le seconde étape sont converties en consonne (synérèse) ou en voyelle (diérèse). Le statut métrique ou non des semi-consonnes est déterminé le recours à une ressource lexicale qui donne la liste des mots qui contiennent une diérèse.
S'il y a diérèse, les attributs de l'élément <seg> sont modifiés : type="vs" et non plus type="sc", l'attribut valeur passe à "1" et le symbole phonétique de la semi-consonne est remplacé par le symbole de la voyelle correspondante ([j]→[i], [w]→[u], [ɥ]→[y]).
Exemple : Dans le vers "Le poète est semblable au prince des nuées" de Charles Baudelaire, (L'Albatros), le segment "u" du mot nuées est associé à l'élément suivant lors de la seconde étape du traitement :
<seg type="sc" rule="542" phoneme="&#613;" value="0">u</seg>
Après application du module de traitement des semi-consonnes cet élément est remplacé par le suivant :
<seg type="vs" rule="d-3" phoneme="&#121;" value="1" >u</seg>
S'il n'y a pas de diérèse dans le mot qui contient la semi-consonne, l'élément <seg> est simplement supprimé ; ce qui revient à analyser la semi-consonne comme une consonne.

Étape 5 : calcul de la longueur métrique

La numérotation des voyelles métriques dans le vers (attribut "place") permet de calculer la longueur métrique du vers qui est obtenue par addition des voyelles métriques jusqu'à la dernière voyelle stable du vers (type="vs"). Cette information apparaît en fin de vers dans les pages XHTML et correspond à un attribut de l'élément <l> qui délimite le vers.

Étape 6 : calcul du mètre

Le mètre des vers simples correspond à sa longueur métrique pour peu qu'elle entre dans un réseau d'équivalences contextuelles. Le mètre des vers composés (longueur métrique supérieure à 8) nécessite en revanche un calcul fondé sur la distribution de propriétés prosodiques et morphosyntaxiques dans le vers (cf. l'analyse métrico-métrique de Benoît de Cornulier).

Exemple de distribution des propriétés PCMF sur un vers de Verlaine (vers 4 de Nevermore) :
S u r  l e   b oi s  j au n i ss an t     l a   b i s e   d é t o n n e   
P1 C2 M4 M5 C8 F10 M11
L'absence de l'une de ces propriétés en place 6 rend possible la mesure 6+6.
logo de l'université   logo de l'université  
CRISCO - Université de Caen Normandie