ADVESTIGO
Texte
Les textes peuvent être caractérisés suivant leur nature au moyen d'empreintes formelles ou naturelles. Les programmes informatiques, tels que les codes source sont traités par des mécanismes d'extraction de régularités, alors que les textes d'origine humaine sont traités pour s'affranchir des flexions naturelles du langage (déclinaisons, conjugaisons, etc…). Les propriétés retenues dans les documents textuels permettent la reconnaissance de plagiats de natures diverses, tout en tenant compte de caractéristiques propres aux origines de ces contenus : une information formelle telle qu'un numéro de carte de crédit doit être considérée de manière exacte et non approchée, alors qu'une expression " clichée " d'une langue doit pouvoir être comprise malgré l'emploi d'une expression équivalente. Des dictionnaires de synonymies viennent renforcer la capacité de détection de plagiats volontaires sur les textes.
  • Résistance aux changements de temps, de genre, de nombre au moyen d'une extraction des concepts par lexiques de flexion.
  • Résistance à la reformulation par l'emploi de dictionnaires de synonymie.
  • Robustesse aux opérations d'éditions (ajout, suppression, réordonnancement, …)