Stage d'option en Informatique
en ligne à
http://atoll.inria.fr rubrique «Rejoindre ATOLL»




Titre:
Compilation de Meta-Grammaires

Laboratoire:
Institut National de Recherche en Informatique et en Automatique (INRIA)
http://www.inria.fr

Lieu du stage:
Rocquencourt
http://www.inria.fr/Allera/Somm-aller-fra.html

Equipe:
ATOLL (Atelier d'outils logiciels pour le langage naturel)
http://atoll.inria.fr

Responsable administratif du stage:

Éric de la Clergerie (Email Eric.De_La_Clergerie@inria.fr)

Responsable du suivi du stage:

Éric de la Clergerie
Tel: 01 39 63 54 10
Email: Eric.De_La_Clergerie@inria.fr
Url: http://atoll.inria.fr/~clerger

Présentation générale du sujet:


La construction d'une grammaire couvrant largement une langue (comme, par exemple, le français) est un tâche difficile pour des raisons de taille, de cohérence et de maintenance. Des propositions récentes préconisent l'utilisation d'un niveau plus abstrait de description, à savoir une méta-grammaire. Une telle méta-grammaire capture la connaissance linguistique au sein de classes organisées en une hiérarchie d'héritage. Le croisement des classes de manière à satisfaire leurs besoins et ressources respectifs permet d'obtenir l'ensemble des composants d'une grammaire.

En dehors du contenu spécifiquement linguistique des classes, l'organisation d'une méta-grammaire s'apparente à une vue orientée objet (ou module) des grammaires. Si on cherche à explorer plus avant cette analogie, on constate que le modèle actuel des méta-grammaires reste assez pauvre.

L'objectif de ce stage est donc de mieux étudier cette analogie entre méta-grammaire et objets pour proposer des extensions du modèle actuel. Certaines de ces extensions pourront être implantées et testées dans le compilateur de Méta-Grammaires actuellement développé au sein d'Atoll. Ce compilateur est écrit en DyALog, un environnement de programmation en logique. Parmi les extensions envisagées, il est plus particulièrement prévu de s'intéresser aux problèmes de portée des identifiants pour permettre de croiser une classe avec plusieurs instances d'une autre classe.

Ce travail ne nécessite pas réellement de connaissance linguistique mais offre l'opportunité de découvrir à quoi peut ressembler une grammaire à large couverture de la langue.

Connaissances requises:
Connaissance de modèles orientés objets, Connaissance en programmation en logique (Prolog), Connaissance développement sous Linux, intérêt pour la linguistique.

Matériel utilisé:

PC sous Linux

Ce document a été traduit de LATEX par HEVEA.