Arbre métrique

Un article de Wikipédia, l'encyclopédie libre.

Un arbre métrique est une structure de données arborescente spécialisée dans l'indexation des données dans un espace métrique. Les arbres métriques exploitent les propriétés des espaces métriques telles que l'inégalité triangulaire afin de rendre les accès aux données plus efficaces.

Recherche multidimensionnelle[modifier | modifier le code]

La plupart des algorithmes et des structures de données pour la recherche d'un ensemble de données sont basés sur la classique recherche dichotomique. Par exemple, un arbre kd ou un arbre de portée fonctionne en entrelacent la recherche dichotomique sur les coordonnées séparées et en traitant chaque coordonnée spatiale comme une indépendante contrainte de recherche. Ces structures de données sont bien adaptées aux problèmes de requête de portée qui demandent tous les points qui satisfont et .

Une limite de ces structures de recherche multidimensionnelles est qu'elles ne sont définies que pour la recherche d'objets pouvant être traités comme des vecteurs.Ils ne s'appliquent pas au cas plus général dans lequel l'algorithme ne reçoit qu'une collection d'objets et une fonction pour mesurer la distance ou la similitude entre deux objets. Elles ne sont pas applicables pour le cas général où l'algorithme a seulement en entrée une collection d'objets et une fonction pour mesurer la différence ou la similarité entre deux objets. Si, par exemple, on possédait une fonction qui renvoie une valeur indiquant à quel point une image est similaire à une autre, un problème algorithmique naturel serait de prendre une base de données d'image et trouver celles qui sont similaires à une image suivant les résultats de la fonction.

Base de données métriques[modifier | modifier le code]

S'il n'y a pas de structure pour la mesure de la similarité alors une recherche exhaustive qui requiert la comparaison de l'image de la requête à chaque image de l'ensemble de données est ce qui a de mieux à faire [citation nécessaire]. Si, cependant, la fonction de similarité satisfait l'inégalité triangulaire alors il est possible d'utiliser le résultat de chaque comparaison pour diminuer l'ensemble de candidats à examiner.

Le premier article sur les arbres métriques, aussi le premier à utiliser le terme "arbre métrique", publié en libre consultation a été écrit par Jeffrey Uhlmann en 1991[1]. D'autres chercheurs ont travaillé indépendamment sur des structures de données similaires. EN particulier, Peter Yianilos a prétendu avoir découvert indépendamment la même technique, qu'il a appelé "arbre à point de vue"[2]. La recherche sur les structures de données d'arbres métriques s'est développée à la fin des années 1990, et a amené le cofondateur de Google Sergey Brin à examiner leur utilisation des très larges bases de données[3]. Le premier manuel sur les structures de données métriques a été publié en 2006.

Références[modifier | modifier le code]

  1. (en) Jeffrey Uhlmann, « Satisfying General Proximity/Similarity Queries with Metric Trees », Information Processing Letters, vol. 40, no 4,‎ (DOI 10.1016/0020-0190(91)90074-r)
  2. (en) Peter N. Yianilos « Data structures and algorithms for nearest neighbor search in general metric spaces » () (lire en ligne, consulté le )
    « (ibid.) », dans Proceedings of the fourth annual ACM-SIAM Symposium on Discrete algorithms, Society for Industrial and Applied Mathematics Philadelphia, PA, USA, p. 311–321
  3. (en) Sergey Brin « Near Neighbor Search in Large Metric Spaces » () (lire en ligne)
    « (ibid.) », dans 21st International Conference on Very Large Data Bases (VLDB)