Lajustement de la loi de probabilité ou simplement lajustement de la loi est l'ajustement d'une loi de probabilité à une série de données concernant la mesure répétée d'un phénomène aléatoire. L'ajustement de la loi a pour but de prédire la probabilité ou de prévoir la fréquence d'occurrence de l'ampleur du phénomène dans un certain intervalle.
Il existe de nombreuses lois de probabilité, dont certaines peuvent être ajustées plus étroitement à la fréquence observée des données que d'autres, selon les caractéristiques du phénomène et de la loi. La loi donnant un ajustement serré est supposée conduire à de bonnes prédictions. Dans l'ajustement, il faut donc sélectionner une famille de lois qui convient bien aux données.
vignette| Différentes formes de la loi normale symétrique en fonction de la moyenne μ et de la variance σ 2
Le choix de la loi appropriée dépend de la présence ou de l'absence de symétrie de l'ensemble de données par rapport à la tendance centrale.
Lorsque les données sont réparties symétriquement autour de la moyenne alors que la fréquence d'occurrence des données plus éloignées de la moyenne diminue, on peut par exemple sélectionner la loi normale, la loi logistique ou la loi de Student. Les deux premières sont très similaires, tandis que la dernière, avec un degré de liberté, a des "queues plus lourdes", ce qui signifie que les valeurs les plus éloignées de la moyenne se produisent relativement plus souvent (c'est-à-dire que le kurtosis est plus élevé). La loi de Cauchy est également symétrique.
vignette|220x220px| Asymétrie à gauche et à droite
Lorsque les valeurs les plus grandes ont tendance à être plus éloignées de la moyenne que les valeurs les plus petites, on a une loi asymétrique vers la droite (c'est-à-dire qu'il y a une asymétrie positive), on peut par exemple sélectionner la loi log-normale (c'est-à-dire les logarithmes des données sont normalement distribuées), la loi log-logistique (c'est-à-dire que les logarithmes des données suivent une loi logistique), la loi de Gumbel, la loi exponentielle, la loi de Pareto, la loi de Weibull, la loi de Burr ou la loi de Fréchet.
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Computer environments such as educational games, interactive simulations, and web services provide large amounts of data, which can be analyzed and serve as a basis for adaptation. This course will co
This course teaches the basic techniques, methodologies, and practical skills required to draw meaningful insights from a variety of data, with the help of the most acclaimed software tools in the dat
vignette|Exemple de distribution bimodale de minerais d'or. X : teneur en g/t ; Y : production en tonnes. Le caractère bimodal définit deux groupes de populations statistiques résultant de deux phénomènes différents. En probabilités et statistique, une distribution multimodale est une distribution statistique présentant plusieurs modes. vignette| Histogramme bimodal vignette|Dans ce cas précis, une distribution bimodale un mélange de deux distributions normales avec la même variance mais des moyennes différentes.
Dans la théorie des probabilités et en statistiques, la loi log-logistique (connue aussi comme la distribution de Fisk en économie) est une loi de probabilité continue pour une variable aléatoire strictement positive. Elle est utilisée dans l'étude de la durée de vie d'événement dont l'intensité augmente d'abord pour ensuite décroître, comme pour la mortalité dû au cancer après diagnostic ou traitement. Elle est aussi utilisée en hydrologie pour modéliser le débit d'un cours d'eau ou le niveau des précipitations, et en économie pour modéliser l'inégalité des revenus.
In statistics, maximum spacing estimation (MSE or MSP), or maximum product of spacing estimation (MPS), is a method for estimating the parameters of a univariate statistical model. The method requires maximization of the geometric mean of spacings in the data, which are the differences between the values of the cumulative distribution function at neighbouring data points.
Couvre l'estimation du L-moment, les moments pondérés en fonction des probabilités et les bases de l'inférence de la probabilité maximale.
, , ,
This paper addresses intra-client and inter-client covariate shifts in federated learning (FL) with a focus on the overall generalization performance. To handle covariate shifts, we formulate a new global model training paradigm and propose Federated Impor ...
2023
,
Electrochemical Impedance Spectroscopy (EIS) and Equivalent Circuit Models (ECMs) are widely used to characterize the impedance and estimate parameters of electrochemical systems such as batteries. We use a generic ECM with ten parameters grouped to model ...
2024
, , , ,
There is a bias in the inference pipeline of most diffusion models. This bias arises from a signal leak whose distribution deviates from the noise distribution, creating a discrepancy between training and inference processes. We demonstrate that this signa ...