Computational statisticsComputational statistics, or statistical computing, is the bond between statistics and computer science. It means statistical methods that are enabled by using computational methods. It is the area of computational science (or scientific computing) specific to the mathematical science of statistics. This area is also developing rapidly, leading to calls that a broader concept of computing should be taught as part of general statistical education.
HomoiconicitéEn programmation informatique, l'homoiconicité (de homo- : semblable, et icône : image) est une propriété de certains langages dans lesquels la principale représentation des programmes est aussi une structure de données d'un type primitif du langage. Les langages homoiconiques rassemblent la plupart des membres de la famille Lisp mais aussi APL, Prolog, REBOL, SNOBOL, XSLT, TRAC, Tcl, Io, Julia et Red. Cette propriété s'apparente à la réflexion dans les langages informatiques.
Array programmingIn computer science, array programming refers to solutions that allow the application of operations to an entire set of values at once. Such solutions are commonly used in scientific and engineering settings. Modern programming languages that support array programming (also known as vector or multidimensional languages) have been engineered specifically to generalize operations on scalars to apply transparently to vectors, matrices, and higher-dimensional arrays.
Comparaison des logiciels de statistiquesLes tableaux suivants comparent l'information générale et technique pour un certain nombre de logiciels de statistiques. Information basique sur les logiciels : créateur, compagnie, licence, etc. Implémentation de l'analyse de la variance. Support pour divers méthodes de régression. Support pour diverses méthodes d'analyse de séries temporelles.
S (langage)S est un langage de programmation de très haut niveau et un environnement d'analyse des données et des graphiques conçu dans les années 1975-1976 par John Chambers. En 1998, l'ACM offre son prix d'excellence logicielle à John Chambers pour « le système S, lequel a changé à jamais la façon dont les gens analysent, visualisent et manipulent les données ». Les deux interpréteurs modernes de S sont R et S-PLUS. Une première version du langage est distribuée par les laboratoires Bell en 1980, et le code source disponible en 1981.
StataStata est un logiciel de statistiques et d'économétrie largement utilisé par les économistes et les épidémiologistes. Il est développé par StataCorp, entreprise basée à College Station, au Texas. Stata est un logiciel statistique créé par William W. Gould. La première version officielle de Stata - disponible à l'origine sur PC uniquement - remonte à , le projet ayant commencé un an plus tôt seulement.
Free statistical softwareFree statistical software is a practical alternative to commercial packages. Many of the free to use programs aim to be similar in function to commercial packages, in that they are general statistical packages that perform a variety of statistical analyses. Many other free to use programs were designed specifically for particular functions, like factor analysis, power analysis in sample size calculations, classification and regression trees, or analysis of missing data.
Ggplot2ggplot2 est une librairie R de visualisation de données développée initialement par Hadley Wickham en 2005. La librairie est développée selon les principes développés par Leland Wilkinson dans son ouvrage The Grammar of Graphics. La "grammaire des graphiques" de Wilkinson décompose les graphique en une somme de composants sous-jacents : ainsi, elle permet de relier les données à des objets géométriques (points, barres, lignes) qui possèdent des attributs esthétiques (couleur, taille, type de ligne).
RStudioRStudio est un environnement de développement gratuit, libre et multiplateforme pour R, un langage de programmation utilisé pour le traitement de données et l’analyse statistique. Il est disponible sous la licence libre AGPLv3, ou bien sous une licence commerciale, soumise à un abonnement annuel. RStudio est disponible en deux versions : RStudio Desktop, pour une exécution locale du logiciel comme tout autre application, et RStudio Server qui, lancé sur un serveur Linux, permet d'accéder à RStudio par un navigateur web.
Carte thermiqueUne carte thermique (carte de fréquentation, ou heat map en anglais signifiant littéralement carte de chaleur) est une représentation graphique de données statistiques qui fait correspondre à l'intensité d'une grandeur variable une gamme de tons ou un nuancier de couleurs sur une matrice à deux dimensions (qui peut elle-même représenter une zone géographique). Ce procédé permet de donner à des données un aspect visuel plus facile à saisir qu'un tableau de statistiques.