BIG DATA y HADOOP, Nuevos tratamientos avanzados de la información

BI-BIGDHDP-301-ES

Aprenderás cómo utilizar Hadoop con Microsoft HDInsight para implementar soluciones para grandes volúmenes de datos

}

Duración: 40 horas

Nivel: 300

Objetivos

Tras la finalización de este curso, los asistentes serán capaces de:

  • Describir y entender que es Big Data.
  • Entender y dominar las capacidades de Hadoop.
  • Comprender los problemas de Big Data.
  • Instalar y configurar Hindsight
  • Entender y dominar HDFS y MAP/ Reduce.
  • Cargar y transformar datos usando Hive / Pig / Sqoop / Flume.
  • Escribir aplicaciones con Map/Reduce.
  • Entender Data Science y los algoritmos de datos
  • Administrar HDInsight.
  • Dominar Big Data Picture

“Muy bueno el docente. Superó mis expectativas. Su mayor fortaleza, considero, la habilidad para proveer ejemplos del mundo real.”

WHEN and WHERE is this course running?

En este curso se aprenderá…

En este curso, los asistentes aprenderán cómo utilizar Hadoop con Microsoft HDInsight para implementar soluciones para grandes volúmenes de datos.

Este curso inicia al asistente en el dominio de la gestión de grandes volúmenes de datos y la instalación y aprovisionamiento de inAzure HDInsight. Se cubre la mayoría de los componentes dentro HDInsight para proporcionar la comprensión en profundidad de BigData y Hadoop con Microsoft HDInsight y Microsoft SQL Server 2012.

Los asistentes aprenderán habilidades de trabajo para el desarrollo de soluciones de grandes volúmenes de datos.

Dirigido a

Este curso está dirigido a administradores de datos, Profesionales de Business Intelligence o bien a cualquier profesional de Gestión de datos que desee conocer las nuevas herramientas para la gestión avanzada de datos.

Pre-requisites: What do you need to know?

Antes de asistir a este curso, se recomienda que los asistentes tengan al menos experiencia básica en Bases de Datos, en Minería de Datos o bien en Business Intelligence. Los asistentes deberán conocer el lenguaje SQL.

All our courses can be offered as a private delivery and tailored for your team's specific needs

Temario

Módulo 01: Introducción a Big Data
  • Big Data y Ciencias de Datos
  • Motivación
  • Hadoop : Ecosistema
  • Seleccionando Hadoop : Casos de uso

Lab 01: Comprobación del Servicio HDInisght

Módulo 02: Hadoop Conceptos Básicos
  • HDFS
  • Map/Reduce
  • Hadoop Ecosistema
  • API HDInsight

Lab 02: API HDInsight

Módulo 03: Azure HDInsigh
  • Nube (CLOUD)
  • Funciones
  • Limitaciones
  • Azure Blob Storage

LAB 03: HDInsight en Azure

Módulo 04: Instalación de HDInsight Server
  • Requisitos
  • Clusters
  • Limitaciones

LAB 04: Instalación de HIndsight Server.

Módulo 05: Hadoop Distribuir sistema de archivos
  • Comprendiendo HDFS
  • Almacenar datos en HDFS
  • HDFS detalles.

LAB 05: HDFS

Módulo 06: Map/Reduce
  • Introducción a Map / Reduce
  • Entrada y salida de datos
  • Ejecutar programas Hadoop

LAB 06: Ejecución de Map/Reduce programs

Módulo 07: Desarrollo de HDFS y Map/Reduce
  • FrameWork para el desarrollo en Map/Reduce • Java, C #
  • Desarrollar aplicaciones con Map/Reduce.
  • Testing de aplicaciones con Map/Reduce.

LAB 07: Desarrollo de ampliaciones en Map / Reduce

Módulo 08: Hive
  • El movimiento de datos desde / hacia HIVE
  • Manipulación de datos con HIVE
  • Características de HIVE • HIVE ODBC e Integración con Excel. (breve introducción)

LAB 08: HIVE.

Módulo 09: PIG
  • Carga de Datos
  • Transformación de Datos
  • Dump Lab 09: Pig.Intro to In-Memory OLTP

Dump LAB 09: PIG.

Módulo 10: Sqoop
  • Introducción
  • Transferencia de datos

LAB 10: Sqoop

Módulo 11: FLUME, transferir logs de gran tamaño
  • Introducción a Flume
  • Arquitectura Flume
  • Aplicaciones de análisis de datos

LAB 11: Flume (2 laboratorios).

Módulo 12: Introducción a Data Science
  • Aprendizaje automático básico
  • Análisis de Datos y Métodos Estadísticos
  • Introducción a Mahout & Pegasus

Lab 12: Simple Introducción (2 laboratorios)

Módulo 13: Data Science Algoritmos I
  • Text Mining
  • Clasificación

Lab 13: Mahout Lab

Módulo 14: Data Science Algoritmos II
  • Clustering
  • Batch base

Lab 14: Mahout Lab

Módulo 15: Data Science Algoritmos III
  • Minería Gráfica
  • Networks

Lab 15: Pegasus

Módulo 16: La integración de Big Data y Business Intelligence
  • HIVE ODBC.
  • Exploración con Excel, PowerPivot, PowerView
  • Data Explorer.
  • Arquitecturas de BI

Lab 16: Hive & Data Explorer

Módulo 17: Administración de HDInsight
  • Administración del clúster
  • Monitoreo de HDInsight
  • Ejecutando Jobs
  • Servicios HDInsight

Lab 17: HDinsight Administración.

Módulo 17: Administración de HDInsight
  • Administración del clúster
  • Monitoreo de HDInsight
  • Ejecutando Jobs
  • Servicios HDInsight

Lab 17: HDinsight Administración.

Módulo 18: Big Data con Microsoft
  • SQL Server
  • PDW
  • Cuándo usar cada uno
Módulo 19: Tratando datos de Redes Sociales

WHEN and WHERE is this course running next?

This course may be scheduled in more than one region. Please check availability in your country.