Un lien retour (aussi appelé lien entrant ou lien arrivant ; en anglais, inbound link, inlink ou backlink) est un hyperlien pointant vers un site ou une page Web. La qualité du lien retour et le nombre de liens retour pointant vers un site ou une page fournissent une indication de la réputation de ce site ou de cette page.
Plus précisément, un lien retour correspond à n'importe quel lien reçu par un nœud du Web (page Web, annuaire, site Internet, ou Domaine de premier niveau) depuis un autre nœud du Web.
Les liens retour ont des valeurs différentes pour les moteurs de recherche, en fonction du Pagerank de la page web sur laquelle ils sont publiés. C'est-à-dire qu'un lien vers une page web, publié sur une page dont le Pagerank est élevé, transmet plus de valeur à la page liée qu'un lien publié sur une page dont le Pagerank est faible. À l'inverse, les liens retour publiés sur des sites ayant une mauvaise réputation, ou les techniques frauduleuses utilisées pour obtenir plus de liens retour, peuvent altérer la réputation du site vers lequel ils pointent. Google Penguin est un filtre algorithmique utilisé par la firme Google depuis le dont la mission est de détecter automatiquement les liens retour artificiels. Depuis le mois de , Google Penguin est désormais inclus dans l'algo de Google et il est en temps réel.
Dans un premier temps, un lien retour permet à un webmaster d'envoyer en un clic un internaute d'une page web à une autre. En langage HTML, le lien se traduit par la syntaxe . Ce lien peut s'ouvrir dans le même onglet du navigateur, dans un nouvel onglet, ou dans une nouvelle fenêtre. Généralement, le webmaster va pointer un lien retour vers une page en rapport avec la page qu'il édite.
Les moteurs de recherche Web exploitent cette information fournie par les webmasters pour déterminer l'importance d'une page Web : Une page qui compte beaucoup de liens retour (pertinents) va bénéficier d'un meilleur positionnement dans les moteurs de recherche.
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
This course introduces the foundations of information retrieval, data mining and knowledge bases, which constitute the foundations of today's Web-based distributed information systems.
A search engine is a software system that finds web pages that match a web search. They search the World Wide Web in a systematic way for particular information specified in a textual web search query. The search results are generally presented in a line of results, often referred to as search engine results pages (SERPs). The information may be a mix of hyperlinks to web pages, images, videos, infographics, articles, and other types of files. Some search engines also mine data available in databases or open directories.
thumb|Illustration du PageRank. Le PageRank ou PR est l'algorithme d'analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google. Il mesure quantitativement la popularité d'une page web. Le PageRank n'est qu'un indicateur parmi d'autres dans l'algorithme qui permet de classer les pages du Web dans les résultats de recherche de Google. Ce système a été inventé par Larry Page, cofondateur de Google. Ce mot est une marque déposée. Le théorème de point fixe est le concept mathématique .
Le spamdexing ou référencement abusif, est un ensemble de techniques consistant à tromper les moteurs de recherche sur la qualité d'une page ou d'un site afin d'obtenir, pour un mot-clef donné, un bon classement dans les résultats des moteurs (de préférence dans les tout premiers résultats, car les utilisateurs vont rarement au-delà de la première page qui, pour les principaux moteurs, ne comprend par défaut que dix adresses).
Explore l'extraction de graphes dans les réseaux sociaux, couvrant les algorithmes de modularité et la détection communautaire.
Discute de l'influence sociale, des paramètres en ligne, du classement des pages et de l'impact de l'argent.
Explore les méthodes de classification des documents, y compris k-Nearest-Neighbors, Naïve Bayes Classifier, les modèles de transformateurs, et l'attention multi-têtes.
As one of the most widely accepted theoretical perspectives in strategy, the resource-based view (RBV) suggests that a firm's resources underlie its ability to achieve competitive advantage. However, much of the extant work in this stream has examined the ...
The World Wide Web is one of the most widely used information resources. Understanding the web better will enable us to benefit more of it. In this thesis we develop techniques to learn the properties of the web pages like language and topic using only the ...
Students often have information needs while carrying out a multitude of learning activities at universities. When information is needed for investigating a problem, the student may interrupt the work and switch to an information seeking task. As Internet c ...