ProbitIn probability theory and statistics, the probit function is the quantile function associated with the standard normal distribution. It has applications in data analysis and machine learning, in particular exploratory statistical graphics and specialized regression modeling of binary response variables. Mathematically, the probit is the inverse of the cumulative distribution function of the standard normal distribution, which is denoted as , so the probit is defined as Largely because of the central limit theorem, the standard normal distribution plays a fundamental role in probability theory and statistics.
Kappa de CohenEn statistique, la méthode du κ (kappa) mesure l’accord entre observateurs lors d'un codage qualitatif en catégories. L'article introduisant le κ a pour auteur Jacob Cohen – d'où sa désignation de κ de Cohen – et est paru dans le journal Educational and Psychological Measurement en 1960. Le κ est une mesure d'accord entre deux codeurs seulement. Pour une mesure de l'accord entre plus de deux codeurs, on utilise le κ de Fleiss (1981). Le calcul du κ se fait de la manière suivante : où Pr(a) est la proportion de l'accord entre codeurs et Pr(e) la probabilité d'un accord aléatoire.
Théorème de Gauss-MarkovEn statistiques, le théorème de Gauss–Markov, nommé ainsi d'après Carl Friedrich Gauss et Andrei Markov, énonce que dans un modèle linéaire dans lequel les erreurs ont une espérance nulle, sont non corrélées et dont les variances sont égales, le meilleur estimateur linéaire non biaisé des coefficients est l'estimateur des moindres carrés. Plus généralement, le meilleur estimateur linéaire non biaisé d'une combinaison linéaire des coefficients est son estimateur par les moindres carrés.
LogitLa fonction logit est une fonction mathématique utilisée principalement en statistiques et pour la régression logistique, en intelligence artificielle (réseaux neuronaux), en inférence bayésienne pour transformer les probabilités sur [0,1] en évidence sur R afin d'une part d'éviter des renormalisations permanentes, et d'autre part de rendre additive la formule de Bayes pour faciliter les calculs. Son expression est où p est défini sur ]0, 1[ La base du logarithme utilisé est sans importance, tant que celle-ci est supérieure à 1.
Surapprentissagevignette|300x300px|La ligne verte représente un modèle surappris et la ligne noire représente un modèle régulier. La ligne verte classifie trop parfaitement les données d'entrainement, elle généralise mal et donnera de mauvaises prévisions futures avec de nouvelles données. Le modèle vert est donc finalement moins bon que le noir. En statistique, le surapprentissage, ou sur-ajustement, ou encore surinterprétation (en anglais « overfitting »), est une analyse statistique qui correspond trop précisément à une collection particulière d'un ensemble de données.
Domaine temporelLe domaine temporel se rapporte à l'analyse de fonctions mathématiques ou de signaux physiques modélisant une variation quelconque au cours du temps. En domaine temporel, la valeur de la fonction ou du signal est connue, soit en quelques points discrets de la durée d'analyse, ou éventuellement, pour tous les nombres réels. L'oscilloscope est parmi les outils usuels permettant de visualiser les signaux physiques du domaine temporel. Domaine fréquentiel Temps (physique) Catégorie:Analyse du signal Catégorie:
Quadratic classifierIn statistics, a quadratic classifier is a statistical classifier that uses a quadratic decision surface to separate measurements of two or more classes of objects or events. It is a more general version of the linear classifier. Statistical classification considers a set of vectors of observations x of an object or event, each of which has a known type y. This set is referred to as the training set. The problem is then to determine, for a given new observation vector, what the best class should be.
Prévision de la demandeLa prévision de la demande (à différencier de la prévision des ventes qui intègre les contraintes de production) est une démarche qui consiste à estimer la consommation des produits ou des services pour les périodes à venir. Elle permettra de planifier la production afin de réduire les délais de livraison et d'optimiser le niveau des stocks. La prévision de la demande est aussi une étape fondamentale de l'établissement d'un S&OP (plan industriel et commercial) ou d'un plan d'affaires ("business model") pour étudier la viabilité économique d'un projet ou d'une entreprise.
Modèle linéairevignette|Données aléatoires sous forme de points, et leur régression linéaire. Un modèle linéaire multivarié est un modèle statistique dans lequel on cherche à exprimer une variable aléatoire à expliquer en fonction de variables explicatives X sous forme d'un opérateur linéaire. Le modèle linéaire est donné selon la formule : où Y est une matrice d'observations multivariées, X est une matrice de variables explicatives, B est une matrice de paramètres inconnus à estimer et U est une matrice contenant des erreurs ou du bruit.
Modèle de cointégrationLa cointégration est une propriété statistique des séries temporelles introduite dans l'analyse économique, notamment par Engle et Newbold (1974). En des termes simples, la cointégration permet de détecter la relation de long terme entre deux ou plusieurs séries temporelles. Sa formalisation rigoureuse est due à Granger (1981), et Johansen (1991, 1995). Techniquement, la notion de cointégration implique implicitement celle d'intégration.