World Wide Webvignette|Logo historique du World Wide Web par Robert Cailliau. vignette|Où la toile est née, plaque commémorant la création du World Wide Web dans les locaux du CERN. Le World Wide Web ( ; littéralement la « toile (d’araignée) mondiale », abrégé www ou le Web), la toile mondiale ou la toile, est un système hypertexte public fonctionnant sur Internet. Le Web permet de consulter, avec un navigateur, des pages accessibles sur des sites. L’image de la toile d’araignée vient des hyperliens qui lient les pages web entre elles.
Page webalt=|vignette|Une page web de Wikipédia. La page web, ou page Web, est l'unité de consultation du World Wide Web. Ce terme a une signification pratique ; il n'a pas de définition technique formelle. Les pages web sont conçues pour être consultées avec un navigateur web. Elles sont identifiées par une adresse web. Techniquement, une page web est généralement constituée d'un document rédigé en Hypertext Markup Language (HTML) pour la structure de base, d', de feuilles de style en cascade (CSS) pour la mise en page, et de JavaScript pour la programmation informatique des fonctionnalités plus avancées.
Page web dynamiqueUne page web dynamique est une page web générée à la demande, par opposition à une page web statique. Le contenu d'une page web dynamique peut donc varier en fonction d'informations (heure, nom de l'utilisateur, formulaire rempli par l'utilisateur, etc.) qui ne sont connues qu'au moment de sa consultation. À l'inverse, le contenu d'une page web statique est a priori identique à chaque consultation. Lors de la consultation d'une page web statique, un serveur HTTP renvoie le contenu du fichier où la page est enregistrée.
Robot d'indexationalt=Architecture d'un robot d'indexation|vignette|270x270px|Architecture d'un robot d'indexation Un robot d'indexation (en anglais web crawler ou web spider, littéralement araignée du Web) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les ressources (pages Web, , vidéos, documents Word, PDF ou PostScript, etc.), afin de permettre à un moteur de recherche de les indexer.
Classification décimale de DeweyLa classification décimale de Dewey (CDD) est un système visant à classer l’ensemble du fonds documentaire d’une bibliothèque, développé en 1876 par Melvil Dewey, un bibliographe américain. Elle a été complétée et perfectionnée par la classification décimale universelle (CDU) développée par Henri La Fontaine et Paul Otlet. Les dix classes retenues par la classification de Dewey correspondent à neuf disciplines fondamentales : philosophie, religion, sciences sociales, langues, sciences pures, techniques, beaux-arts et loisirs, littératures, géographie et histoire, auxquelles s’ajoute une classe « généralités ».
Page web statiqueUne page web statique est une page web dont le contenu ne varie pas en fonction des caractéristiques de la demande, c'est-à-dire qu'à un moment donné tous les internautes qui demandent la page reçoivent le même contenu. À l'inverse, une page web dynamique est générée à la demande et son contenu varie en fonction des caractéristiques de la demande (heure, adresse IP de l'ordinateur du demandeur, formulaire rempli par le demandeur, etc.) qui ne sont connues qu'au moment de sa consultation.
Classification (science de l'information)thumb|250px|Le de la Bibliothèque de l'université de Graz (Autriche). Les classifications bibliographiques, telles que celles mises en œuvre dans les bibliothèques, ont été les premiers outils d'organisation thématique des ouvrages. Ces systèmes de classification « permettent de représenter de façon synthétique le sujet d'un document, et de regrouper les ouvrages sur les rayons par affinité de contenu ».
Classification et catégorisation de documentsLa classification et catégorisation de documents est l'activité du traitement automatique des langues naturelles qui consiste à classer de façon automatique des ressources documentaires, généralement en provenance d'un corpus. Cette classification peut prendre une infinité de formes. On citera ainsi la classification par genre, par thème, ou encore par opinion. La tâche de classification est réalisée avec des algorithmes spécifiques, mis en œuvre par des systèmes de traitement de l'information.
Portail webUn portail web est un site web qui offre une porte d'entrée commune à un large éventail de ressources et de services accessibles sur Internet et centrés sur un domaine d'intérêt ou une communauté particulière. Les ressources et services dont l'accès est ainsi rassemblé peuvent être des sites ou des pages web, des forums de discussion, des adresses de courrier électronique, espaces de publication, moteur de recherche, etc.
Simple random sampleIn statistics, a simple random sample (or SRS) is a subset of individuals (a sample) chosen from a larger set (a population) in which a subset of individuals are chosen randomly, all with the same probability. It is a process of selecting a sample in a random way. In SRS, each subset of k individuals has the same probability of being chosen for the sample as any other subset of k individuals. A simple random sample is an unbiased sampling technique. Simple random sampling is a basic type of sampling and can be a component of other more complex sampling methods.