Énergie solaireLénergie solaire est la fraction de l'énergie électromagnétique provenant du Soleil, traversant l’atmosphère qui en absorbe une partie, et parvenant à la surface de la Terre. L'énergie solaire est à l'origine du cycle de l'eau, du vent et de la photosynthèse réalisée par le règne végétal, dont dépend le règne animal via les chaînes alimentaires. Le Soleil est à l'origine de la plupart des énergies sur Terre, à l'exception de l'énergie nucléaire et de la géothermie profonde.
Prévision numérique du tempsLa prévision numérique du temps (PNT) est une application de la météorologie et de l'informatique. Elle repose sur le choix d'équations mathématiques offrant une proche approximation du comportement de l'atmosphère réelle. Ces équations sont ensuite résolues, à l'aide d'un ordinateur, pour obtenir une simulation accélérée des états futurs de l'atmosphère. Le logiciel mettant en œuvre cette simulation est appelé un modèle de prévision numérique du temps.
Organisation apprenanteUne organisation apprenante est une organisation humaine (entreprise, administration, etc.) qui met en œuvre un ensemble de pratiques et de dispositions pour rester en phase avec son environnement. On rencontre aussi les appellations : équipe apprenante, entreprise apprenante, entreprise ou organisation intelligente, smart entreprise, lieu apprenant, territoire apprenant... Chaque entreprise peut être considérée comme un système vivant opérant au sein d'un écosystème.
Reinforcement learning from human feedbackIn machine learning, reinforcement learning from human feedback (RLHF) or reinforcement learning from human preferences is a technique that trains a "reward model" directly from human feedback and uses the model as a reward function to optimize an agent's policy using reinforcement learning (RL) through an optimization algorithm like Proximal Policy Optimization. The reward model is trained in advance to the policy being optimized to predict if a given output is good (high reward) or bad (low reward).
Multi-agent reinforcement learningMulti-agent reinforcement learning (MARL) is a sub-field of reinforcement learning. It focuses on studying the behavior of multiple learning agents that coexist in a shared environment. Each agent is motivated by its own rewards, and does actions to advance its own interests; in some environments these interests are opposed to the interests of other agents, resulting in complex group dynamics. Multi-agent reinforcement learning is closely related to game theory and especially repeated games, as well as multi-agent systems.
Contrôle d'accès fondé sur les treillisDans le domaine de la sécurité numérique, le contrôle d'accès fondé sur les treillis (en anglais lattice-based access control, ou LBAC) est un modèle complexe de contrôle d'accès logique aux ressources qui sont placées sous son contrôle qui s'appuie sur la représentation des interactions entre toutes les combinaisons d'objets (ressources numériques, applications et ordinateurs) et les acteurs (personnes, groupes ou organizations). L'objectif du contrôle d'accès fondé sur les treillis est de permettre la mise en place de polices de sécurité du type Contrôle d'accès obligatoire.
Variation quadratiqueEn mathématiques, la variation quadratique est utilisée dans l'analyse des processus stochastiques, comme le mouvement brownien et autres martingales. La variation quadratique est un type de variation d'un processus. Si est un processus stochastique à valeurs réelles défini sur un espace probabilisé et avec un indice de temps qui parcourt les nombres réels positifs, sa variation quadratique est le processus, noté , défini par : où parcourt les subdivisions de l'intervalle et la norme de la subdivision est son pas.
Contrôle d'accès à base de règlesRSBAC (Rule Set Based Access Control) est un ensemble de sécurité pour Linux dont la fonction est d'offrir un contrôle supplémentaire d'accès aux ressources. Il peut utiliser plusieurs modèles de sécurité différents, tels ACL, MAC, RC, etc. Il est utilisé par exemple dans le cas où il est utile de restreindre l'accès à certaines ressources au seul utilisateur root (qui a normalement accès à toutes les ressources). Informatique Linux Dépassement de tampon (Buffer overflow) Grsecurity Site officiel Modèles de
OccupancyWithin the context of building construction and building codes, occupancy is the use (actual or intended) of a building (or its portion) for the shelter or support of persons, animals or property. A closely related meaning is the number of units in such a building that are rented, leased, or otherwise in use. Lack of occupancy, in this sense, is known as vacancy. It is possible to have multiple occupancies (or building uses) within one building. For example, a high-rise building can have retail stores occupying the lower levels, while the upper levels are residential.
Self-playSelf-play is a technique for improving the performance of reinforcement learning agents. Intuitively, agents learn to improve their performance by playing "against themselves". In multi-agent reinforcement learning experiments, researchers try to optimize the performance of a learning agent on a given task, in cooperation or competition with one or more agents. These agents learn by trial-and-error, and researchers may choose to have the learning algorithm play the role of two or more of the different agents.