En informatique théorique, un test de propriété (ou property testing en anglais) est un test probabiliste qui a pour objectif de déterminer si un objet donné, par exemple un graphe ou une fonction, possède une propriété fixée ou bien s'il est « loin » de l'avoir. Ces algorithmes ont l'avantage d'être très rapides.
Les testeurs de propriété sont notamment utiles pour tester que des grands graphes ont certaines propriétés.
Exemple introductif
Considérons l'exemple simpliste suivant[1] : on cherche à savoir si un graphe est vide ou relativement loin de l'être. Plus précisément on cherche à savoir si le graphe donné en entrée (dont le nombre de nœud est noté n) n'a aucune arêtes ou bien a au moins arêtes. Le type de requêtes est le suivant : on choisit k sommets et on reçoit le sous-graphe induit par ces k sommets. L'algorithme est simple : choisir au hasard uniformément k sommets, si le sous-graphe induit est vide renvoyé vide sinon renvoyer non vide. Dans le cas de la sortie non vide, l'algorithme ne se trompe pas, alors que dans le cas de vide, il est possible que le graphe soit en fait loin d'être vide. Cependant la probabilité d'erreur est petite pour n allant vers l'infini.
Définition plus formelle
Soit un ensemble, et une distance sur cet ensemble. Soit un sous-ensemble de , qu'on appelle propriété. Un testeur de propriété[2] pour est un algorithme qui prend en entrée un élément et un paramètre de distance , effectue certains types de requêtes (queries) sur , et détermine certaines caractéristiques (par exemple, le -ème bit de , ou bien la valeur d'une certaine fonction fixée a priori).
Les testeurs de propriété sont intéressants lorsqu'ils satisfont des contraintes fortes, par exemple un nombre de requêtes constant (dans le cadre de la complexité en requêtes), ou un temps de calcul sous-linéaire. Dans cette optique on s'intéresse à des algorithmes probabilistes et non déterministes, afin d'obtenir des résultats non-triviaux.
Acceptation probabiliste
L'algorithme a les propriétés suivantes :
accepte avec une probabilité si ;
rejette avec une probabilité si ;
peut renvoyer n'importe quel résultat avec une probabilité quelconque si .
Comme pour un algorithme de Monte-Carlo classique, si ou vaut 1, l'algorithme est dit à erreur unilatérale. Sinon, il est dit à erreur bilatérale[3].
Les différents modèles
Il existe plusieurs modèles de test. En particulier, on peut définir plusieurs distances et type de requêtes selon la densité des graphes en entrées : des graphes denses, des graphes creux ou des graphes généraux.
Distances
La distance choisie sur l'ensemble E est particulièrement importante. Les résultats obtenus avec une distance donnée ne sont pas valables si on la change. Par exemple, dans le cas des graphes, on peut obtenir des résultats complètement différents selon que l'on se limite aux graphes denses, aux graphes peu denses, ou que l'on étudie les graphes en général[4].
La distance pour les graphes denses entre deux graphes est souvent le nombre d'arêtes à changer divisé par . La distance pour les graphes creux ou généraux entre deux graphes est souvent le nombre d'arêtes à changer divisé par .
Requêtes
Selon les versions, l'algorithme choisit les requêtes, ou bien elles lui sont présentées selon une certaine distribution.
Pour les graphes denses, les requêtes sont de la forme : "est-ce que (u,v) est une arête du graphe ?", alors que pour les graphes creux, elles sont du type "quel est le degré du nœud u ?" ou "quel est le i-ème voisin du nœud u ?".
Une autre différence importante entre les modèles est que certains modèles sont non-adaptatifs, c'est-à-dire que toutes les requêtes sont choisies à l'avance, alors que certains sont adaptatifs, c'est-à-dire que la réponse à une requête peut être utilisée pour les requêtes suivantes.
Exemples des propriétés
Un cadre classique est celui du test de propriété de graphe. Dans ce contexte l'entrée est par exemple la matrice d'adjacence ou la liste d'adjacence du graphe.
Graphe 3-coloriable
Nous choisissons comme ensemble l'ensemble des graphes colorables avec 3 couleurs. Le problème de la 3-coloration est connu NP-complet, donc aucun algorithme à complexité polynomiale n'est connu à ce jour pour le résoudre. Cependant, Alon et Krielevich ont proposé un testeur de propriété fonctionnant en temps constant pour le résoudre[5].
L'algorithme en lui-même est un exemple très générique de testeur de propriété. Il reçoit en entrée un graphe et un paramètre de distance . De plus, la distance choisie est telle que si le graphe possède sommets, il sera à une distance de s'il faut lui enlever arêtes pour qu'il soit dans .
L'algorithme sélectionne aléatoirement sommets du graphe , et reconstitue le sous-graphe induit par ces sommets. Il vérifie alors de manière exacte si ce sous-graphe est 3-colorable, et il retourne pour le graphe global la même réponse que pour le sous-graphe.
Alon et Krielevich ont montré qu'avec une probabilité de 2/3, cette réponse était juste.
Le test de propriété peut aussi être utilisé pour estimer les propriétés de fonctions (monotonie, linéarité...), ou d'ensembles divers : est-ce qu'un ensemble de points est recouvrable par un nombre donné de boules, en quelle langue est écrit un texte... On parle en particulier de tests de propriétés algébriques, lorsque les objets considérés sont des structures algébriques comme des groupes ou des espaces vectoriels[8].
Une variante a également émergé, dans laquelle l'objet étudié est une distribution de probabilité sur un ensemble , et le but est de déterminer, ayant accès à des observations indépendantes de , si cette dernière satisfait une certaine propriété (telle qu'être uniforme, avoir une faible entropie, ou bien avoir une densité de probabilité décroissante ...)[9].
Le concept de test de propriété a été défini dans les années 90. Bien qu'il soit relié à d'autres formes d'approximation, notamment les PCPs, on considère que le test de propriété pour des fonctions a été formulé explicitement pour la première fois par Rubinfeld et Sudan[11] dans le cadre du test de fonctions. Dans le cadre du test de propriété pour des graphes, le premier article à explicitement définir ces notions a été publié par Goldreich et Ron[12].
Depuis, de nombreux articles ont été publiés. Notamment, Alonet al.[13] ont complètement caractérisé l'ensemble des propriétés de graphes testables en temps constant.
Bibliographie
Oded Goldreich, « A brief introduction to property testing », dans Studies in Complexity and Cryptography. Miscellanea on the Interplay between Randomness and Computation, Springer, (lire en ligne), p. 465-469
Nicolas Dalsass, Test de propriété pour l'homomorphisme de graphes et d'hypergraphes, (lire en ligne)
↑Une source pour la traduction de property testing est (Dalsass 2011)
↑Bien qu'il n'y ait pas de termes officiels français. En anglais, on parle d'algorithme with a "one-sided" or "two-sided" error .
↑(en) Kaufman, Krielevich et Ron, « Tight bounds for testing bipartiteness in general graphs », SIAM journal on computing, vol. 33, no 6, , p. 1441-1483 (ISSN0097-5397)
↑(en) Noga Alon et Michael Krivelevich, « Testing k-colorability », SIAM Journal on Discrete Mathematics, vol. 15, no 2, (lire en ligne)
↑Noga Alon, Tali Kaufman, Michael Krivelevich et Dana Ron, « Testing Triangle-Freeness in General Graphs », SIAM J. Discrete Math., vol. 22, no 2, , p. 786-819 (DOI10.1137/07067917X)
↑Oded Goldreich et Dana Ron, « A Sublinear Bipartiteness Tester for Bounded Degree Graphs », Combinatorica, vol. 19, no 3, , p. 335-373 (DOI10.1007/s004930050060)
↑(en) Ronitt Rubinfeld et Madhu Sudan, « Robust characterization of polynomials with applications to program testing », SIAM Journal on Computing, vol. 25, no 2, , p. 252-271
↑(en) Goldreich et Ron, « Property testing and its connection to learning and approximation », JACM,
↑(en) Noga Alon, Fischer, Newman et Shapira, « A combinatorial characterization of the testable graph properties: it's all about regularity », SIAM Journal on Computing, vol. 39, no 1, , p. 251-260 (lire en ligne)