SEDiL est une plateforme logicielle créée dans le contexte du projet ANR Marmota et du projet PASCAL pump-priming : "Learning Stochastic Edit Distances from Structured Data". Cette plateforme a pour but de rassembler un ensemble d'algorithmes autour des distances d'édition sur données structurées (séquences et arbres).
L'initiative de la création de cette plateforme revient à Marc Sebban. Le développement a été à l'origine accompli par Yann Esposito et est désormais assuré par Laurent Boyer durant sa thèse.
Les distances d'édition sont utilisées dans de nombreux domaines : bio-informatique, reconnaissance de sons, images, musique, WEB mining...
La Distance d'Édition représente le nombre minimal de transformations (opérations d'édition) permettant de transformer une donnée d'entrée structurée en une autre.
Cependant les paramètres des distances d'édition utilisées en pratique sont souvent fixés à la main. Dans les domaines dans lesquels le niveau de connaissance est insuffisant, il semble intéressant d'apprendre ces paramètres.
Parce que le format XML s'impose de plus en plus comme le nouveau format standard de données. De plus, les arbres sont une généralisation des séquences (chaînes de caractères).