Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
Détection d'anomaliesDans l'exploration de données, la détection d'anomalies (en anglais, anomaly detection ou outlier detection) est l'identification d'éléments, d'événements ou d'observations rares qui soulèvent des suspicions en différant de manière significative de la majorité des autres données. Généralement, les anomalies indiquent un problème tel qu'une fraude bancaire, un défaut structurel, un problème médical ou une erreur dans un texte. Les anomalies sont également appelées des valeurs aberrantes, du bruit, des écarts ou des exceptions.
Hanyu pinyinvignette|Symbole de traduction. Le 'hanyu pinyin' () est un système de romanisation du chinois mandarin, promu officiellement en 1958 en République populaire de Chine, puis en 2008 à Taïwan. L'étude et la diffusion du mandarin, traditionnellement écrit à l'aide de sinogrammes, ont nécessité des systèmes de transcription au fur et à mesure que les contacts de la langue avec d'autres cultures et d'autres systèmes d'écriture se sont développés. Le pinyin est la méthode de transcription du mandarin en alphabet latin la plus répandue de nos jours dans les ouvrages modernes.
UpstepIn linguistics, upstep is a phonemic or phonetic upward shift of tone between the syllables or words of a tonal language. It is best known in the tonal languages of Sub-Saharan Africa. Upstep is a much rarer phenomenon than its counterpart, downstep. The symbol for upstep in the International Phonetic Alphabet is a superscript upward arrow [ꜛ] ([↑]). However, it is common, especially in the early research, to find a superscript (or sometimes subscript) inverted exclamation mark [ꜞ] ([¡]) or [¡], because of typographical constraints.