Big Data

Conhecimentos de Base Recomendados

Bases de Dados

Estruturas de Dados

SQL

 

 

 

Métodos de Ensino

1. Exposição dos fundamentos teóricos subjacentes ao Big Data

2. Exposição e análise das características das bases de dados NoSQL

3. Exposição e análise das características das bases de dados NewSQL

4. Exposição teórica das tecnologias de processamento de Big Data

5. Resolução de exercícios e exemplos de aplicação

6. Elaboração de trabalhos práticos

Resultados de Aprendizagem

No fim de completarem a unidade curricular com sucesso, os alunos deverão ser capazes de:

1. Compreender e explicar os princípios e conceitos de armazenamento, processamento e análise de grandes volumes de dados (Big Data)

2. Utilizar bases de dados NoSQL e NewSQL

3. Avaliar as bases de dados usando benchmarks

4. Identificar e aplicar os conceitos e técnicas de armazenamento, processamento e análise de dados (Big Data) a problemas práticos

5. Selecionar e utilizar ferramentas apropriadas de armazenamento, processamento e análise de grandes volumes de dados (Big Data)

Programa

1. Introdução ao Big Data

– Um pouco de história

– O que é Análise de Dados?

– O que é Big Data?

– Características do Big Data

– Exemplos específicos de domínio de Big Data

– Fluxo de análise para Big Data

 

2. O que são bases de dados NoSQL.

– O que está errado com o modelo relacional?

– Big Data

– NoSQL

  

3. Características das bases de dados NoSQL

– Arquiteturas NoSQL

– Esquemas de Dados

– Distribuição de dados e Sharding

– Consistência

– Modelos ACID e BASE

 

4. Análise das bases de dados NoSQL

– Key-Value

– Document

– Column

– Graph

 

5. Bases de dados NewSQL

– Principais características

– Funcionalidades

– Diferenças entre SQL, NoSQL e NewSQL

 

6. Benchmarks para avaliação de bases de dados

– Propriedades relevantes de um benchmark NoSQL

– Benchmarks para bases de dados Key-value

– Benchmarks para bases de dados Document

– Benchmarks para bases de dados Column

– Benchmarks para bases de dados Graph

– Exemplos de trabalhos práticos

 

7. Big Data – Introdução ao Processamento Distribuído

– Limitações dos sistemas tradicionais

– Funcionalidades

– Frameworks de processamento Distribuído: MapReduce

– Plataformas de Big Data

 

8. Big Data – Armazenamento

– Arquitetura

– HDFS – Hadoop Distributed File System

 

9. Big Data – processamento

– Ferramentas e técnicas de processamento

– Processamento com Hadoop, Spark

– SQL em Hadoop , Hive

– Processamento de streams de dados

Docente(s) responsável(eis)

Estágio(s)

NAO

Bibliografia

Bibliografia recomendada:

– Diapositivos e apontamentos das aulas dos professores

 

Bibliografia opcional:

– Santos, M. Y., & Costa, C. (2019). Big Data: Concepts, Warehousing, and Analytics. FCA.

– Erl, T., Khattak, W., & Buhler, P. (2013). Big Data Fundamentals: Concepts, Drivers & Techniques. Prentice Hall.

– Bahga, A., & Madisetti, V. (2016). Big Data Science & Analytics: A Hands-On Approach. VPT.

– Provost, F., & Fawcett, T. (2013). Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. O’Reilly Media.

– Bengfort, B., & Kim, J. (2016). Data Analytics with Hadoop: An Introduction for Data Scientists. O’Reilly Media.

– White, T. (2015). Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale. O’Reilly Media.

– Kumar, V. N., & Shindgikar, P. (2018). Modern Big Data Processing with Hadoop: Expert techniques for architecting end-to-end Big Data solutions to get valuable insights. Packt Publishing.

– Chodorow, K. (2013). MongoDB: The Definitive Guide: Powerful and Scalable Data Storage. O’Reilly Media.