Big Data

Conhecimentos de Base Recomendados

Bases de Dados

Estruturas de Dados

SQL

 

 

 

Métodos de Ensino

1. Exposição dos fundamentos teóricos subjacentes ao Big Data

2. Exposição e análise das características das bases de dados NoSQL

3. Exposição e análise das características das bases de dados NewSQL

4. Exposição teórica das tecnologias de processamento de Big Data

5. Resolução de exercícios/exemplos de aplicação

6. Elaboração de trabalhos práticos

Resultados de Aprendizagem

No fim de completarem a unidade curricular com sucesso, os alunos deverão ser capazes de:

1. Compreender e explicar os princípios e conceitos de armazenamento, processamento e análise de grandes volumes de dados (Big Data)

2. Utilizar bases de dados NoSQL e NewSQL

3. Avaliar as bases de dados usando benchmarks

4. Identificar e aplicar os conceitos e técnicas de armazenamento, processamento e análise de dados (Big Data) a problemas práticos

5. Selecionar e utilizar ferramentas apropriadas de armazenamento, processamento e análise de grandes volumes de dados (Big Data)

Programa

1. Introdução ao Big Data

– Um pouco de história

– O que é Análise de Dados?

– O que é Big Data?

– Características do Big Data

– Exemplos específicos de domínio de Big Data

– Fluxo de análise para Big Data

 

2. O que são bases de dados NoSQL.

– O que está errado com o modelo relacional?

– Big Data

– NoSQL

 

 

3. Características das bases de dados NoSQL

– Arquiteturas NoSQL

– Esquemas de Dados

– Distribuição de dados e Sharding

– Consistência

– Modelos ACID e BASE

 

4. Análise das bases de dados NoSQL

– Key-Value

– Document

– Column

– Graph

 

5. Bases de dados NewSQL

– Principais características

– Funcionalidades

– Diferenças entre SQL, NoSQL e NewSQL

 

6. Benchmarks para avaliação de bases de dados

– Propriedades relevantes de um benchmark NoSQL

– Benchmarks para bases de dados Key-value

– Benchmarks para bases de dados Document

– Benchmarks para bases de dados Column

– Benchmarks para bases de dados Graph

– Exemplos de trabalhos práticos

 

7. Big Data – Introdução ao Processamento Distribuído

– Limitações dos sistemas tradicionais

– Funcionalidades

– Frameworks de processamento Distribuído: MapReduce

– Plataformas de Big Data

 

8. Big Data – Armazenamento

– Arquitetura

– HDFS – Hadoop Distributed File System

 

9. Big Data – processamento

– Ferramentas e técnicas de processamento

– Processamento com Hadoop, Spark

– SQL em Hadoop , Hive

– Processamento de streams de dados

Docente(s) responsável(eis)

Estágio(s)

NAO

Bibliografia

Bibliografia recomendada:

– Diapositivos e apontamentos das aulas dos professores

 

Bibliografia opcional:

– Big Data: Concepts, Warehousing, and Analytics. Maribel Yasmina Santos, Carlos Costa, FCA 2019, (ISBN: 978-972-722-908-6)

– Big Data Fundamentals: Concepts, Drivers & Techniques. Erl, T., Khattak, W., & Buhler, P. Prentice Hall, (ISBN 978-0-13-429107-9).

– Big Data Science & Analytics: A Hands-On Approach. Bahga, A., & Madisetti, V. VPT, (ISBN 978-0-9960255-3-9).

– Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. Provost, F., & Fawcett, T. O’Reilly Media, (ISBN 978-1-4493-6132-7).

– Data Analytics with Hadoop: An Introduction for Data Scientists. Bengfort, B., & Kim, J. O’Reilly Media, (ISBN 978-1-4919-1370-3).

– Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale. White, T. O’Reilly Media, (ISBN 978-1-4919-0163-2).

– Modern Big Data Processing with Hadoop: Expert techniques for architecting end-to-end Big Data solutions to get valuable insights. Kumar, V. N., & Shindgikar, P. Packt Publishing, (ISBN 978-1-78712-276-5).

– MongoDB: The Definitive Guide: Powerful and Scalable Data Storage. Chodorow, K. O’Reilly Media, (ISBN 978-1-4493-4468-9).