OpenAIOpenAI (« AI » pour artificial intelligence, ou intelligence artificielle) est une entreprise spécialisée dans le raisonnement artificiel, à « but lucratif plafonné », dont le siège social est à San Francisco. Avant , elle est reconnue association à but non lucratif. L'objectif de cette société est de promouvoir et de développer un raisonnement artificiel à visage humain qui profitera à toute l'humanité.
AlphaGoAlphaGo est un programme informatique capable de jouer au jeu de go, développé par l'entreprise britannique DeepMind et racheté en 2014 par Google. En , il devient le premier programme à battre un joueur professionnel (le français Fan Hui) sur un goban de taille normale (19×19) sans handicap. Il s'agit d'une étape symboliquement forte puisque le programme joueur de go est alors un défi complexe de l'intelligence artificielle. En , il bat Lee Sedol, un des meilleurs joueurs mondiaux ( professionnel).
Go en informatiquethumb|Les programmes sont plus performants sur un goban de petite taille (ici 9×9). Le développement de programme informatique capable de jouer au go est un problème de l'intelligence artificielle. Ce problème est considéré comme l'un des plus complexes à résoudre, les algorithmes classiques (minimax et alpha-bêta) offrant des résultats médiocres. Le premier programme a été écrit en 1968 par comme un élément de sa thèse sur la reconnaissance des formes.
AlphaZeroAlphaZero est une version généraliste d’AlphaGo Zero, un logiciel de go (jeu de stratégie abstrait chinois) qui a été adapté pour jouer aux échecs et au shogi (échecs japonais). AlphaZero a été créé par Demis Hassabis de DeepMind, une entreprise appartenant au groupe Google. Le , DeepMind poste sur la plateforme de prépublication arXiv un article concernant AlphaZero, un programme utilisant l’approche généralisée d'AlphaGo Zero. Le style de jeu d'AlphaZero s'écarte des programmes de jeu habituels tout en requérant moins de calculs par mouvement en regard de ses concurrents.
Éthique de l'intelligence artificielleL'éthique de l'intelligence artificielle est le domaine de l' propre aux robots et autres entités artificiellement intelligents. Il est généralement divisé en roboéthique, qui se préoccupe de l'éthique humaine pour guider la conception, la construction et l'utilisation des êtres artificiellement intelligents, et l', préoccupée par le comportement moral des agents moraux artificiels. Pour l'aspect philosophique de l'intelligence artificielle, voir Philosophie de l'intelligence artificielle.
Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Multi-agent reinforcement learningMulti-agent reinforcement learning (MARL) is a sub-field of reinforcement learning. It focuses on studying the behavior of multiple learning agents that coexist in a shared environment. Each agent is motivated by its own rewards, and does actions to advance its own interests; in some environments these interests are opposed to the interests of other agents, resulting in complex group dynamics. Multi-agent reinforcement learning is closely related to game theory and especially repeated games, as well as multi-agent systems.
Grand modèle de langageUn grand modèle de langage, grand modèle linguistique, grand modèle de langue, modèle massif de langage ou encore modèle de langage de grande taille (LLM, pour l'anglais large language model) est un modèle de langage possédant un grand nombre de paramètres (généralement de l'ordre du milliard de poids ou plus). Ce sont des réseaux de neurones profonds entraînés sur de grandes quantités de texte non étiqueté utilisant l'apprentissage auto-supervisé ou l'apprentissage semi-supervisé.
Elon MuskElon Musk (prononcé en anglais : ), né le à Pretoria (Afrique du Sud), est un entrepreneur, chef d'entreprises et milliardaire sud-africain, canadien et américain. Il est cofondateur et président-directeur général de la société astronautique SpaceX et directeur général de la société automobile Tesla. En , selon Bloomberg, Elon Musk devient, à , l'homme le plus riche du monde, avec une fortune estimée à plus de de dollars. En , il devient le propriétaire de Twitter, par un achat à de dollars.
Tensor Processing Unitvignette|Un Tensor Processing Unit 3.0 datant de mai 2016 Un Tensor Processing Unit (TPU, unité de traitement de tenseur) est un circuit intégré spécifique pour une application (ASIC), développé par Google spécifiquement pour accélérer les systèmes d'intelligence artificielle par réseaux de neurones. Les TPU ont été annoncés en 2016 au Google I/O, lorsque la société a déclaré les utiliser dans leurs centres de données depuis plus d'un an.