Programação para Ciência de Dados

Conhecimentos de Base Recomendados

Embora não seja fator de eliminação, é fortemente aconselhado que o aluno tenha realizado a Unidade Curricular de Programação (1.º semestre do 1.º ano).

Métodos de Ensino

A atividade letiva decorre em regime presencial ou por videoconferência, com exposição de conceitos, técnicas e métodos, com grande
enfoque na resolução de problemas práticos. Será utilizado software de apoio à resolução de problemas.

Resultados de Aprendizagem

Nesta unidade curricular os estudantes aprenderão os fundamentos da programação em Python necessários ao desenvolvimento de
algoritmos de análise de dados. Nesta unidade curricular os estudantes ganharão contacto com as bibliotecas base do Python para análise
de dados como NumPy, Pandas, MatPlotLib, Scipy, Scikit-learn. Além destas bibliotecas aprenderão a manipular conjuntos de dados com
a linguagem SQL. Pretende-se com esta unidade curricular que o estudante ganhe um conjunto de competências que lhe permitam de
forma autónoma realizar projetos de análise de dados.

Programa

1. Rever os Fundamentos da Python
2. Pacote NumPy
3. Trabalhar com dados
3.1. Pacote Pandas
3.2. Leitura do conjunto de dados
3.3. Filtragem, Limpeza, Manipulação de dados
4. Visualização de dados
4.1. Pacote Matplotlib
4.2. Compreender as motivações entre diferentes gráficos
5. Aprendizagem automática
5.1. Introdução à aprendizagem automática
5.2. Pacote SciKit Learn

Docente(s) responsável(eis)

Estágio(s)

NAO

Bibliografia

Bibliografia Principal:

Jake VanderPlas (2016). Python Data Science Handbook: Essential Tools for Working with Data. O’Reilly Media.

Wes McKinney (2017). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O’Reilly Media.

Joel Grus (2019). Data Science from Scratch: First Principles with Python. O’Reilly Media.

Paul Deitel and Harvey Deitel (2019). Intro to Python for Computer Science and Data Science: Learning to Program with AI, Big Data and

The Cloud. Pearson.Stephen Klosterman (2019) Data Science Projects with Python: A case study approach to successful data science projects using Python, pandas, and scikit-learn. Packt Publishing.