Métodos de Ensino
As aulas serão lecionadas em regime teórico-prático. Será utilizada a metodologia expositiva, apoiada na experimentação prática através da realização de exercícios de aplicação, alguns em papel e outros em computador. A experimentação prática mais importante será conseguida através de um projeto de Data Mining onde os alunos escolherão uma organização ou fenómeno real, que analisarão e usarão para aplicar conceitos, tarefas e técnicas apreendidas na teoria. As aulas decorrerão num regime presencial ou, se necessário, à distância, por aulas síncronas através de videoconferência. O processo de avaliação compreenderá duas componentes, respetivamente a realização de um exame final escrito (EFE), sem consulta, que decorrerá em qualquer uma das épocas de exames regulamentar e se a realização de um projeto prático (PP), cujos resultados serão apresentados, que decorrerá em qualquer uma das épocas de exames regulamentares. A Nota Final será a média aritmética dessas duas componentes
Resultados de Aprendizagem
Muitas organizações de vários setores de atividade implementam projetos de mineração de dados, que lhes permitem obter novo conhecimento, tais como, comportamentos padrão e tendências futuras, e assim, decidir mais proactivamente. Modelos mais robustos permitem analisar mais dados e mais complexos, com resultados mais rápidos e precisos e identificando mais facilmente oportunidades ou riscos. A unidade curricular apresenta estes dois conceitos, suas diferenças, complementaridades, motivações e domínios de aplicação. Pretende-se dotar os alunos de conhecimentos nestas duas áreas, designadamente a classificação, previsão, análise de tendências (séries temporais), agrupamento, sumarização (e visualização) ou associação. Pretende-se ainda exemplificar na prática um conjunto de técnicas, tais como árvores de decisão, regras de associação, regressões lineares, redes neuronais artificiais, conjuntos e lógica difusa ou redes de Bayes. Outro objetivo é desenvolver um projeto usando dados reais.
Programa
1. Introdução ao Data Mining e Machine Learning
2. Atividades preditivas (ou supervisionadas): 2.1 Classificação, 2.2 Previsão, 2.3 Análise de Tendências (SériesTemporais)
3. Atividades descritivas (ou não-supervisionadas): 3.1 Agrupamento, 3.2 Sumarização (e visualização), 3.3 Associação
4. Metodologia CRISP-DM
5. Principais Técnicas: 5.1 Árvores de Decisão, 5.2 Regras de Associação, 5.3 Regressão Linear, 5.4 Redes NeuronaisArtificiais,
5.5 Conjuntos Difusos e Lógica Difusa, 5.6 Redes de Bayes
Docente(s) responsável(eis)
Estágio(s)
NAO
Bibliografia
Camilo, C., & Silva, J. (2009). Mineração de dados. Goiânia: Universidade Federal de Goiás.
Chakrabarti, S., Cox, E., Frank, E., Güting, R., Han, J., Jiang, X., Neapolitan, R. (2008). Data Mining: Know It All.Burlinghton: Morgan
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0: Step-By-Step Data Mining
Delen, D.. (2014). Real-World Data Mining: FT Press.
Larose, D. (2005). Discovering Knowledge in Data. Hoboken: John Wiley & Sons, Inc.
Mohri, M., Rostamizadeh, A., & Talwalkar, A. (2018). Foundations of machine learning. MIT press.
North, M. (2012). Data mining for the masses: A Global Text Project Book.
Santos, M., & Azevedo, C. (2005). Data Mining: Descoberta de Conhecimento em Bases de Dados. Lisboa: FCA.
Witten, I., & Frank, E. (2005). Data Mining: Practical machine learning tools and techniques. San Francisco: MorganKaufmann