Technolangue

RNIL / Normalangue

Liens

Liens vers les actions nationales ou internationales en relation avec les activitées de RNIL.

Morphosyntaxe

TEI
Text Encoding Initiative
STTS Stuttgart-Tübingen-TagSet
Liste d'étiquettes morpho-syntaxiques pour l'allemand
EAGLES
Multext
Corpus arboré de Paris 7

Actions

Normalangue
Cette action s'inscrit dans le programme national Technolangue et démarre début 2003.
ISO
(International Organization for Standardization)
ISLE
(International Standards for Language Engineering)
Projet européen, dans la lignée de EAGLES, visant à proposer des standards dans le domaine linguistique.
EAGLES
(Expert Advisory Group on Language Engineering Standards)
IEEE
Information Technology for Learning, Education, and Training
TEI
(Text Encoding Initiative)
OLAC
(Open Language Archives Community)
W3C
(World Wide Web consortium)
MATES
(Multilevel Annotation, Tools Engineering)
NITE
(Natural Interactivity Tools Engineering)
MPEG
(Moving Picture Experts Group)
Multext
(Multilingual Text Tools and Corpora)
Ensemble de formats et d'outils pour la gestion de corpus et lexiques dans différentes langues.
KORTERM
(Korea Terminology Research Center for Language and Knowledge Engineering)
EAFTerm
(East Asia Forum on terminology )
AFNLP
(Asia Federation of Natural Language Processing)
MATE
Ce projet avec plusieurs partenaires européens s'intéresse aux questions d'annotations linguistiques de corpus.
TIPSTER
Programme américain ayant proposé des formats d'annotation permettant la coopération de programme. Les idées sont exploitées dans GATE.
Penn Tree Bank
Developpement d'un corpus annoté en morpho-syntaxe à l'université de Pennsylvanie.
NEGRA Corpus Corpus de l'allemand annoté en morpho-syntaxe
LT XML
Ensemble d'outils linguistiques développés à l'unniversité d'Edinburgh s'appuyant sur des formats et une infrastructure XML.
LDC -- Linguistic Data Consortium
Repertoire de resources linguistiques géré par l'université de Pennsylvanie
OLAC -- Open Language Archives Community
Création d'une bibliothèque virtuelle en réseau de ressources linguistiques en promouvant l'utilisation de formats standardisés et de méta-données décrivant les types de ressources.
GATE -- General Architecture for Language Engineering
Infrastructure développée par l'université de Sheffield devant faciliter l'intégration de composants linguistiques dans une chaîne de traitement. Les composants peuvent accéder en lecture et écriture à une base d'annotations qui suivent les recommandations du projet TIPSTER.
CES -- Corpus Encoding Standard
Une recommandation EAGLES sur le codage de corpus en SGML, en s'appuyant sur la TEI
ATLAS -- Architecture and Tools for Linguistic Analysis Systems
Développement d'une infrastructure facilitant le développement d'applications linguistiques, en s'appuyant sur un format d'échange de données linguistiques.

XML

XML -- Extensible Markup Language
Est-il besoin de présenter XML?
XML Schema
Pour être plus fin que les simples DTD d'XML afin de décrire les documents valides
A voir également, l'alternative (non W3C) RELAX NG avec un tutoriel
RDF -- Resource Description Framework
Pour décrire finement des ressources et les relations entres elles, par exemple pour des meta-données
XSL -- Extensible Stylesheet Language
Le standard pour décrire des transformation de XML vers XML, ou de XML vers d'autres formats.
XML Query
Le standard pour poser des requêtes sur un document XML. L'ambition ultime est d'accéder au contenu d'un document XML comme on accéde au contenu d'une base de données, avec la notion de bases de données XML qui commence à apparaître.

Last modified: Fri Jun 20 16:19:50 CEST 2003