Résumé
thumb|Nuage de points du jeu de données Le jeu de données Iris connu aussi sous le nom de Iris de Fisher ou Iris d'Anderson est un jeu de données multivariées présenté en 1936 par Ronald Fisher dans son papier The use of multiple measurements in taxonomic problems comme un exemple d'application de l'analyse discriminante linéaire. Les données ont été collectées par Edgar Anderson afin de quantifier les variations de morphologie des fleurs d'iris de trois espèces. Deux des trois espèces ont été collectées en Gaspésie. Le jeu de données comprend 50 échantillons de chacune des trois espèces d'iris (Iris setosa, Iris virginica et Iris versicolor). Quatre caractéristiques ont été mesurées à partir de chaque échantillon : la longueur et la largeur des sépales et des pétales, en centimètres. Sur la base de la combinaison de ces quatre variables, Fisher a élaboré un modèle d'analyse discriminante linéaire permettant de distinguer les espèces les unes des autres. thumb|Les résultats de l'utilisation de k-means sont insatisfaisants (les classes obtenues ne coïncident pas avec les espèces connues). left|thumb| Un exemple de ce qu'on appelle la metro map pour le jeu de données Iris. Seule une petite proportion des Iris virginica est mélangée avec les Iris versicolor. Tous les autres échantillons de différentes espèces Iris appartiennent à des nœuds différents. Utilisé à l'origine comme exemple pour l'application de l'analyse linéaire discriminante de Fisher, ce jeu de données est devenu un cas typique pour de nombreuses techniques de classification automatique en apprentissage automatique (machine learning) tel que les machines à vecteurs de support (SVM). L'utilisation de cet ensemble de données dans l'analyse est cependant rare, puisqu'il ne contient que deux clusters avec une séparation plutôt évidente. L'un des groupes contient lIris setosa, tandis que l'autre groupe contient à la fois lIris virginica et lIris versicolor; ce dernier groupe n'étant pas séparable sans information sur l’espèce que Fisher a utilisée.
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.