Lecture

Data Wrangling with Hadoop: Advanced Techniques

In course

Sit sunt laborum ipsum ullamco consequat sint sit ea proident irure. Dolore nostrud labore incididunt nulla nulla consequat sit ex tempor exercitation est proident dolor incididunt. Cillum est ex incididunt exercitation irure esse reprehenderit sunt ex incididunt magna. Adipisicing ex exercitation dolor ad velit sit id veniam laborum commodo sit officia sint.

Description

This lecture focuses on advanced data wrangling techniques using Hadoop, specifically through the integration of scalable data storage and processing with tools like Hive and HBase. The instructor discusses the importance of data formats such as Parquet and ORC, and how they enhance data processing efficiency. The lecture also covers the use of HiveQL for querying data and the implementation of user-defined functions (UDFs) to handle geospatial and JSON data. Students are guided through practical exercises that involve creating and managing Hive tables, loading data, and performing complex queries. The session emphasizes the Extract, Transform, Load (ETL) process, showcasing how to connect to Hive, create databases, and optimize data storage. Additionally, the lecture highlights the significance of partitioning data in Hive to improve query performance. By the end of the session, students gain a comprehensive understanding of how to leverage Hadoop's capabilities for effective data wrangling in large-scale data environments.

Instructors (3)

quis commodo cupidatat

Ad reprehenderit amet aliqua sint reprehenderit. Lorem duis anim consequat sit amet anim duis do ullamco elit consectetur in sit. Eiusmod amet aliqua excepteur ullamco commodo nulla. Exercitation officia occaecat est duis anim nisi Lorem elit.

fugiat eiusmod sint

Tempor exercitation consequat aute aute esse consectetur quis. Aliquip aliquip id aliquip dolor. Reprehenderit dolor reprehenderit id ea ad sint deserunt ex amet ad amet laboris. Minim ea in ea deserunt eiusmod reprehenderit officia in aliqua ex dolor amet. Minim consequat qui eiusmod aliquip sit dolore cillum reprehenderit.

ad nostrud

Est non occaecat cillum ad consequat tempor dolore sit laborum cupidatat. Proident proident non mollit ut deserunt eu reprehenderit. Et non anim nisi cillum ipsum eu quis magna.

Official source

https://mediaspace.epfl.ch/media/0_bcw9cq9v

About this result

This page is automatically generated and may contain information that is not correct, complete, up-to-date, or relevant to your search query. The same applies to every other page on this website. Please make sure to verify the information with EPFL's official sources.

Related lectures (32)

Graph Chatbot

Chat with Graph Search

Ask any question about EPFL courses, lectures, exercises, research, news, etc. or try the example questions below.

DISCLAIMER: The Graph Chatbot is not programmed to provide explicit or categorical answers to your questions. Rather, it transforms your questions into API requests that are distributed across the various IT services officially administered by EPFL. Its purpose is solely to collect and recommend relevant references to content that you can explore to help you answer your questions.