Séance de cours

Introduction générale à la science des données

Séances de cours associées (32)

Introduit Renku, une plateforme pour la science collaborative des données, mettant l'accent sur la reproductibilité, la shareability, la réutilisabilité et la sécurité.

Structures et mécanismes : ouvrir une boîte

Explore l'analyse des structures et des mécanismes à travers un problème d'échantillon d'ouverture d'une boîte avec un couvercle à cordes.

Dispositifs excitoniques : Modélisation et applications

Couvre la modélisation de l'appareil excitonique et le contrôle de l'exciton à l'aide de matériaux 2D.

Renku : Science collaborative des données

Renku est une plate-forme pour la science des données collaborative permettant la reproductibilité et la promotion de la réutilisation du code et des données.

Fonctions avancées des pandas

Se concentre sur les fonctions avancées de pandas pour la manipulation, l'exploration et la visualisation des données avec Python, en soulignant l'importance de la compréhension et de la préparation des données.

Régression : Hautes Dimensions

Explore la régression linéaire en dimensions élevées et la prévision pratique des prix des maisons à partir d'un ensemble de données.

Collaborative Data Science : outils et flux de travail Git

Explore des outils tels que Git et Docker pour des projets collaboratifs de science des données.

Programmation R : conditions, boucles, fonctions et graphiques

Couvre les conditions, les boucles, les fonctions et les graphiques en programmation R avec des exemples pratiques.

La collaboration dans le domaine de la science des données

Couvre les outils collaboratifs de science des données, les concepts de big data, Spark, et le traitement du flux de données, avec des conseils pour le projet final.

Techniques avancées d'optimisation des sparks : gestion du Big Data

Discute des techniques avancées d'optimisation Spark pour gérer efficacement les Big Data, en se concentrant sur la parallélisation, les opérations de mélange et la gestion de la mémoire.

Techniques de gestion des données : HBase et Hive Integration

Couvre les techniques de querelles de données utilisant HBase et Hive, en se concentrant sur l'intégration et les applications pratiques.

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.