Big Data

Métodos de Ensino

A atividade letiva decorre em regime presencial ou por videoconferência, com exposição de conceitos, técnicas e métodos, com grande enfoque na resolução de problemas práticos. Será utilizado software de apoio à resolução de problemas. O aluno será avaliado por um trabalho realizado no âmbito da unidade curricular e por uma prova escrita de avaliação final, ambas com o mesmo peso na nota final. A nota do trabalho só será considerada se o aluno obtiver uma nota mínima de 8 valores na prova escrita (numa escala de 0 a 20).

Resultados de Aprendizagem

Na vida quotidiana, enormes quantidades de dados são geradas quer através de websites, telemóveis, dispositivos vestíveis ou sensores associados à Internet das Coisas, entre outros. O processamento desta enorme quantidade de dados requer a utilização de ferramentas específicas que excedem a capacidade dos nossos PCs e mesmo de alguns servidores, tornando necessária a utilização de sistemas distribuídos para o seu processamento de dados. O principal objetivo deste curso é familiarizar os alunos com as mais importantes tecnologias de informação utilizadas na manipulação, armazenamento, e análise de grandes quantidades de dados, sendo um dos exemplos maiores a framework Apache Spark, utilizada para computação distribuída.

Programa

1. Bases de dados relacionais (SQL)
2. Bases de dados NoSQL
3. Fundamentos de Big Data
4. Hadoop e Spark
5. Machine Learning em Big Data

Estágio(s)

NAO

Bibliografia

– Antonio Trigo. (2018, June 12). PyTrigo – Introdução à Data Science com Python (Version v0.12). Zenodo.http://doi.org/10.5281/zenodo.1288006
– Mining of Massive Datasets, A. Rajaraman, J. Ullman, 2011, Cambridge University Press.
– Big Data: Algorithms, Analytics, and Applications, Kuan-Ching Li et al., Chapman and Hall/CRC, 2015.
– Advanced Analytics with Spark: Patterns for Learning from Data at Scale, Sandy Ryza et al., O’Reilly Media, 2017.