Data Mining & Machine Learning

Conhecimentos de Base Recomendados

Não existem conhecimentos significativos específicos base recomendados para esta unidade curricular.

Métodos de Ensino

As aulas serão lecionadas em regime teórico-prático. Será utilizada a metodologia expositiva, apoiada na experimentação prática através da realização de exercícios de aplicação, alguns em papel e outros em computador. A experimentação prática mais importante será conseguida através de um projeto de Data Mining onde os alunos escolherão uma organização ou fenómeno real, que analisarão e usarão para aplicar conceitos, tarefas e técnicas apreendidas na teoria. As aulas decorrerão num regime presencial ou, se necessário, à distância, por aulas síncronas através de videoconferência.

Resultados de Aprendizagem

Muitas organizações de vários setores de atividade implementam projetos de mineração de dados, que lhes permitem obter novo conhecimento, tais como, comportamentos padrão e tendências futuras, e assim, decidir mais proactivamente. Modelos mais robustos permitem analisar mais dados e mais complexos, com resultados mais rápidos e precisos e identificando mais facilmente oportunidades ou riscos. A unidade curricular apresenta estes dois conceitos, suas diferenças, complementaridades, motivações e domínios de aplicação. Pretende-se dotar os alunos de conhecimentos nestas duas áreas, designadamente a classificação, previsão, análise de tendências (séries temporais), agrupamento, sumarização (e visualização) ou associação. Pretende-se ainda exemplificar na prática um conjunto de técnicas, tais como árvores de decisão, regras de associação, regressões lineares, redes neuronais artificiais, conjuntos e lógica difusa ou redes de Bayes. Outro objetivo é desenvolver um projeto usando dados reais.

Programa

1. Introdução ao Data Mining e Machine Learning

2. Atividades preditivas (ou supervisionadas):

2.1 Classificação,
2.2 Previsão,
2.3 Análise de Tendências (Séries Temporais)

3. Atividades descritivas (ou não-supervisionadas):

3.1 Agrupamento,
3.2 Sumarização (e visualização),
3.3 Associação

4. Metodologia CRISP-DM

5. Principais Técnicas:

5.1 Árvores de Decisão,
5.2 Regras de Associação,
5.3 Regressão Linear,
5.4 Redes Neuronais Artificiais,
5.5 Conjuntos Difusos e Lógica Difusa,
5.6 Redes de Bayes

Docente(s) responsável(eis)

Estágio(s)

NAO

Bibliografia

Camilo, C., & Silva, J. (2009). Mineração de dados. Goiânia: Universidade Federal de Goiás.
Chakrabarti, S., Cox, E., Frank, E., Güting, R., Han, J., Jiang, X., Neapolitan, R. (2008). Data Mining: Know It All.Burlinghton: Morgan
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0: Step-By-Step Data Mining
Delen, D.. (2014). Real-World Data Mining: FT Press.
Larose, D. (2005). Discovering Knowledge in Data. Hoboken: John Wiley & Sons, Inc.
Mohri, M., Rostamizadeh, A., & Talwalkar, A. (2018). Foundations of machine learning. MIT press.
North, M. (2012). Data mining for the masses: A Global Text Project Book.
Santos, M., & Azevedo, C. (2005). Data Mining: Descoberta de Conhecimento em Bases de Dados. Lisboa: FCA.
Witten, I., & Frank, E. (2005). Data Mining: Practical machine learning tools and techniques. San Francisco: MorganKaufmann