Posterior predictive distributionIn Bayesian statistics, the posterior predictive distribution is the distribution of possible unobserved values conditional on the observed values. Given a set of N i.i.d. observations , a new value will be drawn from a distribution that depends on a parameter , where is the parameter space. It may seem tempting to plug in a single best estimate for , but this ignores uncertainty about , and because a source of uncertainty is ignored, the predictive distribution will be too narrow.
Categorical distributionIn probability theory and statistics, a categorical distribution (also called a generalized Bernoulli distribution, multinoulli distribution) is a discrete probability distribution that describes the possible results of a random variable that can take on one of K possible categories, with the probability of each category separately specified. There is no innate underlying ordering of these outcomes, but numerical labels are often attached for convenience in describing the distribution, (e.g. 1 to K).
Probabilité a posterioriDans le théorème de Bayes, la probabilité a posteriori désigne la probabilité recalculée ou remesurée qu'un évènement ait lieu en prenant en considération une nouvelle information. Autrement dit, la probabilité a posteriori est la probabilité qu'un évènement A ait lieu étant donné que l'évènement B a eu lieu. Elle s'oppose à la probabilité a priori dans l'inférence bayésienne. La loi a priori qu'un évènement ait lieu avec vraisemblance est .
Loi gamma-normaleEn théorie des probabilités et en statistiques, la loi gamma-normale (ou Gamma- Gaussienne) est une distribution bivariée continue à quatre paramètres. Elle est la prieure conjuguée de la loi normale de moyenne et variance inconnues. Soit une paire de variable aléatoires (X,T). Si la distribution conditionnelle de X sachant T est normale de moyenne et variance et si la distribution marginale de T est une loi gamma alors (X,T) suit une loi gamma-normale, que l'on note La fonction de densité conjointe de (X,T) a la forme Par définition, la distribution marginale de est une loi gamma.
Conjugate priorIn Bayesian probability theory, if the posterior distribution is in the same probability distribution family as the prior probability distribution , the prior and posterior are then called conjugate distributions, and the prior is called a conjugate prior for the likelihood function . A conjugate prior is an algebraic convenience, giving a closed-form expression for the posterior; otherwise, numerical integration may be necessary. Further, conjugate priors may give intuition by more transparently showing how a likelihood function updates a prior distribution.
Expérience de AschL'expérience de Asch, publiée en 1951, est une expérience du psychologue Solomon Asch qui démontre le pouvoir du conformisme sur les décisions d'un individu au sein d'un groupe. Asch invita un groupe d'étudiants (entre 7 et 9) de à participer à un prétendu test de vision auquel avaient auparavant été soumis des sujets témoins qui n'eurent aucun mal à donner toujours la bonne réponse. Tous les participants étaient complices de l'expérimentateur, sauf un.
Expérience de Milgramthumb|Reconstitution de l'expérience de Milgram (extrait).thumb|200px|L’expérimentateur (E) amène le sujet (S) à infliger des chocs électriques à un autre participant, l’apprenant (A), qui est en fait un acteur. La majorité des participants continuent à infliger les prétendus chocs jusqu'au maximum prévu () en dépit des plaintes de l'acteur. L’expérience de Milgram est une expérience de psychologie publiée en 1963 par le psychologue américain Stanley Milgram.
Data wranglingData wrangling, sometimes referred to as data munging, is the process of transforming and mapping data from one "raw" data form into another format with the intent of making it more appropriate and valuable for a variety of downstream purposes such as analytics. The goal of data wrangling is to assure quality and useful data. Data analysts typically spend the majority of their time in the process of data wrangling compared to the actual analysis of the data.
Science des donnéesLa science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données.
Data PreprocessingData preprocessing can refer to manipulation or dropping of data before it is used in order to ensure or enhance performance, and is an important step in the data mining process. The phrase "garbage in, garbage out" is particularly applicable to data mining and machine learning projects. Data collection methods are often loosely controlled, resulting in out-of-range values, impossible data combinations, and missing values, amongst other issues. Analyzing data that has not been carefully screened for such problems can produce misleading results.