SEDiL

FAQ

Qu'est-ce que SEDiL ?

SEDiL est une plateforme logicielle créée dans le contexte du projet ANR Marmota et du projet PASCAL pump-priming : "Learning Stochastic Edit Distances from Structured Data". Cette plateforme a pour but de rassembler un ensemble d'algorithmes autour des distances d'édition sur données structurées (séquences et arbres).

L'initiative de la création de cette plateforme revient à Marc Sebban. Le développement a été à l'origine accompli par Yann Esposito et est désormais assuré par Laurent Boyer durant sa thèse.

Pourquoi apprendre des distances d'édition probabilistes ?

Les distances d'édition sont utilisées dans de nombreux domaines : bio-informatique, reconnaissance de sons, images, musique, WEB mining...

La Distance d'Édition représente le nombre minimal de transformations (opérations d'édition) permettant de transformer une donnée d'entrée structurée en une autre.

Cependant les paramètres des distances d'édition utilisées en pratique sont souvent fixés à la main. Dans les domaines dans lesquels le niveau de connaissance est insuffisant, il semble intéressant d'apprendre ces paramètres.

Pourquoi sur des structures arborescentes ?

Parce que le format XML s'impose de plus en plus comme le nouveau format standard de données. De plus, les arbres sont une généralisation des séquences (chaînes de caractères).

Qu'est-ce que SEDiL peut faire ?

SEDiL permet l'apprentissage de distances d'édition stochastiques.
SEDiL peut utiliser les distances apprises pour des tâches de reconnaissance de formes.

SEDiL

Software for Edit Distance Learning

FAQ

Qu'est-ce que SEDiL ?

Pourquoi apprendre des distances d'édition probabilistes ?

Pourquoi sur des structures arborescentes ?

Qu'est-ce que SEDiL peut faire ?