Data Mining & Machine Learning

Conhecimentos de Base Recomendados

Não existem conhecimentos significativos específicos base recomendados para esta unidade curricular.

Métodos de Ensino

 

As aulas serão lecionadas em regime teórico-prático e a metodologia de ensino incluirá diversos métodos pedagógicos, respetivamente o método expositivo, demonstrativo e o da aprendizagem baseada em projetos.

O método expositivo será utilizado para a apresentação dos conceitos e principais conteúdos da unidade curricular. O docente organiza e expõe oralmente os conteúdos, estruturando o raciocínio e o resultado a obter. Esta exposição será feita com suporte a diapositivos, os quais serão posteriormente disponibilizados aos alunos. Esta exposição será complementada com algumas referências disponibilizadas.

O método demonstrativo será utilizado para exemplificar algumas aplicações de conceitos, nomeadamente a aplicação das diversas técnicas abordadas para cada tarefa da mineração dos dados e aprendizagem automática. Com base em diversas folhas práticas disponibilizadas, o professor partilha o seu saber-fazer e demonstra e auxilia os alunos na sua execução, para que estes efetuem com sucesso o que aí é solicitado, por vezes em papel, outras em computador, através de ferramenta específica para o efeito.

O método da aprendizagem baseada em projetos (ABP) será utilizado para a construção de conhecimento por intermédio de um trabalho longo e contínuo de estudo, cujo propósito é atender a um desafio/problema cujo objetivo é o desenvolvimento de um projeto de mineração dos dados e aprendizagem automática, usando dados de uma organização (privada ou pública), dados abertos ou criando dados através de inquérito.

Resultados de Aprendizagem

Muitas organizações de vários setores de atividade implementam projetos de mineração de dados, que lhes permitem obter novo conhecimento, tais como, comportamentos padrão e tendências futuras, e assim, decidir mais proactivamente. Esta unidade curricular de Data Mining (DM) & Machine Learning (ML) pretende pretende ensinar a criar modelos mais robustos, que permitam analisar mais dados e mais complexos, com resultados mais rápidos e precisos e identificando mais facilmente oportunidades ou riscos.

Os principais objetivos a alcançar são:

O1 – Apresentar os conceitos de mineração de dados e de aprendizagem automática, suas diferenças e complementaridades 

O2 – Apresentar as motivações e os domínios de aplicação da mineração de dados e aprendizagem automática 

O3 – Dotar os alunos dos principais conhecimentos a cada tipo de atividade

O4 – Conhecer e compreender os princípios de algumas das técnicas mais comuns

O5 – Conseguir aplicar na prática as técnicas abordadas

O6 – Entender as etapas de uma metodologia adequada para desenvolver um projeto de DM/ML 

As principais competências a desenvolver são:

C1 – Capacidade de elaborar questões possíveis de responder por um projeto de DM/ML

C2 – Capacidade de enquadrar um projeto de DM/ML e de analisar da sua viabilidade

C3 – Conseguir planear e implementar um projeto de DM/ML nas suas diversas etapas

C4 – Habilidade em propor, criar e interpretar modelos adequados a problemas e desafios reais

C5 – Capacidade em criticar atuais modelos e de propor modelos alternativos

Programa

1. Introdução ao Data Mining e Machine Learning

2. Categorias de aprendizagem de máquina

  • Aprendizagem supervisionada
  • Aprendizagem não supervisionada
  • Aprendizagem por reforço

3. Atividades preditivas

  • Classificação,
  • Previsão,
  • Análise de tendências (séries temporais)

4. Atividades descritivas

  • Agrupamento,
  • Sumarização (e visualização),
  • Associação

5. Metodologia CRISP-DM

  • Entendimento do negócio ou tema
  • Entendimento dos dados
  • Preparação dos dados
  • Modelação
  • Avaliação
  • Desenvolvimento

6. Principais Técnicas:

  • Árvores de decisão,
  • Regras de associação,
  • Regressão linear,
  • Redes neuronais artificiais,
  • Conjuntos difusos e lógica difusa,
  • Redes de Bayes

Docente(s) responsável(eis)

Estágio(s)

NAO

Bibliografia

Bibliografia principal:

Tan, P. N., Steinbach, M., Karpatne, V. & Kumar, V. (2019). Introduction to Data Mining. Global Edition. Ney York: Pearson Education.

Yang, X. S. (2019). Introduction to algorithms for data mining and machine learning. Academic press.

Bibliografia complementar:

Camilo, C., & Silva, J. (2009). Mineração de dados. Goiânia: Universidade Federal de Goiás.

Chakrabarti, S., Cox, E., Frank, E., Güting, R., Han, J., Jiang, X., Neapolitan, R. (2008). Data Mining: Know It All.Burlinghton: Morgan

Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0: Step-By-Step Data Mining

Delen, D.. (2014). Real-World Data Mining: FT Press.

Dogan, A., & Birant, D. (2021). Machine learning and data mining in manufacturing. Expert Systems with Applications, 166, 114060.

Han, J., Pei, J., & Tong, H. (2023). Data mining: concepts and techniques. Morgan Kaufmann.

Larose, D. (2005). Discovering Knowledge in Data. Hoboken: John Wiley & Sons, Inc.

Mohri, M., Rostamizadeh, A., & Talwalkar, A. (2018). Foundations of machine learning. MIT press.

North, M. (2012). Data mining for the masses: A Global Text Project Book.

Santos, M., & Azevedo, C. (2005). Data Mining: Descoberta de Conhecimento em Bases de Dados. Lisboa: FCA.

Witten, I., & Frank, E. (2005). Data Mining: Practical machine learning tools and techniques. San Francisco: MorganKaufmann

Wang, W., & Siau, K. (2019). Artificial intelligence, machine learning, automation, robotics, future of work and future of humanity A review and research agenda. Journal of Database Management (JDM), 30(1), 61-79.