Conhecimentos de Base Recomendados
É recomendável que os alunos possuam conhecimentos sólidos de matemática, estatística assim como de programação em Python.
Métodos de Ensino
As aulas teóricas são aulas expositivas.
As aulas práticas baseiam-se em aulas expositivas intercaladas com resolução de exercícios. Algumas aulas serão exclusivamente dedicadas à resolução de exercícios.
Todos os elementos de apoio às aulas teóricas/práticas são disponibilizados aos alunos.
Todas as aulas decorrem em contexto de sala de aula em regime presencial.
Resultados de Aprendizagem
Pretende-se que os alunos adquiram um conjunto de conhecimentos e competências na área de Machine Learning, nomeadamente:
- Conhecer as etapas de um projeto real baseado em Machine Learning
- Analisar e preparar um conjunto de dados
- Identificar de forma correta os aspetos relativos à classificação (métricas, estratégias de validação, …)
- Conhecer e aplicar alguns dos algoritmos mais relevantes na Aprendizagem Supervisionada
- Conhecer e aplicar os algoritmos mais relevantes na Aprendizagem Não Supervisionada
Programa
Componente Teórica
Cap.1 – Introdução
- Data Mining /Machine Learning
- Tipos de Aprendizagem
- Classificação/Regressão
- Principais Desafios
- Notação Matemática
Cap.2 – Dados: Conceitos Fundamentais
- Tipos de dados
- Estatística Descritiva
- Variável Aleatória
- Distribuições de Dados
- Limpeza dos Dados
Cap. 3 – Etapas Principais de um Projeto
- Identificação/Contextualização do problema
- Obtenção dos dados
- Visualização e preparação dos dados
- Seleção e treino do modelo
- Sintonização/ajuste do modelo
- Monitorização e Manutenção
Cap. 4 – Classificação
- Estratégias de Validação
- Métricas de Avaliação
Cap. 5 – Aprendizagem Supervisionada
- Regressão Linear
- Regressão Logistica
- Naïve Bayes
- Árvores de Decisão
- Support Vector Machine
- KNN-nearest Neighbour
- Random Forest
- XGBoost
- Redes Neuronais
Cap. 6 – Aprendizagem Não Supervisionada
- Clustering
- K-means
- Subtractive Clustering
- Principal Component Analysis
Componente Prática
- Python aplicado à Análise de Dados
- Numpy
- Scipy
- Pandas
- Matplotlib
- Seaborn
- Scikit-learn
- Análise e Preparação dos Dados
- Aprendizagem Supervisionada
- Aprendizagem Não Supervisionada
Docente(s) responsável(eis)
Estágio(s)
NAO
Bibliografia
Geron A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems 2nd Edition. ISBN-13: 978-1492032649, O’Reilly (ISEC: 1A-4-179)
Chen, D. (2018) Pandas for Everyone, Python Data Analysis, ISBN:13-978-0-13-454693-3, Addison-Wesley, (ISEC: 1A -19-26)
Kuhn M., Johnson K. (2016). Applied Predictive Modeling. ISBN: 978-1-4614-6848-6, Springer. (ISEC:3-3-244)
Rashka S, Mirjalili V. (2019). Python Machine Learning, 3rd Edition. ISBN: 978-1-78995-575-0, Packt. (ISEC: 1A – 4-187)
Watt J., Borhani R., Katsaggelos A. (2020). Machine Learning Refined, 2nd Ed. ISBN: 978-1-108-48072-7, Cambridge University Pack. (ISEC: 1A – 4- 200)