Extraction de connaissancesL'extraction de connaissances est le processus de création de connaissances à partir d'informations structurées (bases de données relationnelles, XML) ou non structurées (textes, documents, images). Le résultat doit être dans un format lisible par les ordinateurs. Le groupe RDB2RDF W3C est en cours de standardisation d'un langage d'extraction de connaissances au format RDF à partir de bases de données. En français on parle d'« extraction de connaissances à partir des données » (ECD).
Semainevignette|redresse=2|Calendrier de l'année 2022 avec numérotation des semaines selon la norme internationale ISO (du lundi au dimanche). Une semaine (du latin septimana : « semaine ») est une période de sept jours consécutifs. L'adjectif français associé est « hebdomadaire ». Substantivé (utilisé comme nom), le mot désigne une publication paraissant chaque semaine. Trois problématiques sont distinctes : le nombre sept, les noms des jours et leur ordre. Ces trois thèmes sont étudiés dans des articles détaillés.
Information extractionInformation extraction (IE) is the task of automatically extracting structured information from unstructured and/or semi-structured machine-readable documents and other electronically represented sources. In most of the cases this activity concerns processing human language texts by means of natural language processing (NLP). Recent activities in multimedia document processing like automatic annotation and content extraction out of images/audio/video/documents could be seen as information extraction Due to the difficulty of the problem, current approaches to IE (as of 2010) focus on narrowly restricted domains.
Détermination du jour de la semaineLa détermination du jour de la semaine est un algorithme utilisé pour déterminer le jour de la semaine (lundi, mardi, mercredi, jeudi, vendredi, samedi, ou dimanche) connaissant la date, basé sur la notion mathématique de congruence. Il est aussi appelé congruence de Zeller, du mathématicien allemand Christian Zeller. L'année tropique moyenne (qui est désormais définie comme étant le temps nécessaire pour que la longitude écliptique du Soleil augmente de 360° – et non plus comme étant le temps séparant deux équinoxes de printemps successifs), donnée pour l'an 2000 par Pierre Bretagnon, astronome à l'Observatoire de Paris, compte , , et , soit .
Plongement lexicalLe plongement lexical (« word embedding » en anglais) est une méthode d'apprentissage d'une représentation de mots utilisée notamment en traitement automatique des langues. Le terme devrait plutôt être rendu par vectorisation de mots pour correspondre plus proprement à cette méthode. Cette technique permet de représenter chaque mot d'un dictionnaire par un vecteur de nombres réels. Cette nouvelle représentation a ceci de particulier que les mots apparaissant dans des contextes similaires possèdent des vecteurs correspondants qui sont relativement proches.