Dans le contexte de l'accessibilité de l'Internet, du big data (mégadonnées) des données de la recherche et des sciences ouvertes et plus largement du partage et l'ouverture des données, la notion de FAIR data ou données FAIR recouvre les manières de construire, stocker, présenter ou publier des données de manière à permettre que les données soient (findable, accessible, interoperable, reusable), d'où l'acronyme « FAIR ».
Le mot fair (« équitable », « juste ») fait aussi référence au fair use, commerce équitable (fair trade), fair play, etc., il évoque un comportement proactif et altruiste du producteur de données, qui cherche à les rendre plus facilement trouvables et utilisables par tous, tout en facilitant en aval le sourçage (éventuellement automatique) par l'utilisateur des données.
Ces principes voient leur origine en janvier 2014 dans des travaux collectifs autour de l'initiative Data FAIRport en 2014, par un groupe de travail au sein de FORCE 11, une communauté internationale fondée en 2011 composée de chercheurs, d’éditeurs, de sociétés savantes, d’universités, de bibliothécaires, d’archivistes.
Ces travaux ont abouti, en 2016, à une publication considérée comme fondatrice des principes FAIR, dans la revue Nature, par un groupe de chercheurs de différents laboratoires à travers le monde (dont Mark D. Wilkinson du Centro de Biotecnología y Genómica de Plantas à l'université polytechnique de Madrid).
Depuis cette publication, différentes initiatives se mettent en place pour déployer ces principes, dont GO FAIR ou en France, un projet de recherche ANR 2020-2022: FOOSIN.
Le FAIR data implique que les données publiées répondent aux principes détaillés ci-dessous .
Pour être FAIR selon les principes énoncés en 2016, les données doivent être faciles à trouver ou retrouver par tous, humains et machines. Pour ce faire, les (méta)données doivent avoir un identificateur unique et pérenne. Elles doivent être décrites avec des métadonnées riches (voir plus bas) incluant notamment et explicitement un identificateur des données qu'elles décrivent, unique et pérenne.