Data Mining & Machine Learning

Teaching Methodologies

As aulas serão lecionadas em regime teórico-prático. Será utilizada a metodologia expositiva, apoiada na experimentação prática através da realização de exercícios de aplicação, alguns em papel e outros em computador. A experimentação prática mais importante será conseguida através de um projeto de Data Mining onde os alunos escolherão uma organização ou fenómeno real, que analisarão e usarão para aplicar conceitos, tarefas e técnicas apreendidas na teoria. As aulas decorrerão num regime presencial ou, se necessário, à distância, por aulas síncronas através de videoconferência. O processo de avaliação compreenderá duas componentes, respetivamente a realização de um exame final escrito (EFE), sem consulta, que decorrerá em qualquer uma das épocas de exames regulamentar e se a realização de um projeto prático (PP), cujos resultados serão apresentados, que decorrerá em qualquer uma das épocas de exames regulamentares. A Nota Final será a média aritmética dessas duas componentes

Learning Results

Many organizations from various industries implement data mining projects, which allow them to gain new knowledge,such as pattern behaviors and future trends, and thus decide more proactively. More robust models allow to analyzemore and more complex data, with faster and more accurate results and more easily identifying opportunities or risks.The Data Mining and Machine Learning curricular unit presents these two concepts, their differences,complementarities,motivations, and application domains. It is intended to provide students with knowledge in thesetwo areas, namely classification, forecasting, trend analysis (time series), grouping, summarization (and visualization)or association. It is also intended to exemplify in practice a set of techniques, such as decision trees, associationrules, linear regressions, artificial neural networks, sets and fuzzy logic or Bayes networks. Another objective is todevelop a data mining/machine learning project using real data.

Program

1. Introduction to Data Mining and Machine Learning
2. Predictive (or supervised) activities: 2.1 Classification, 2.2 Forecasting, 2.3 Trend Analysis (Time Series)
3. Descriptive (or unsupervised) activities: 3.1 Grouping, 3.2 Summary (and visualization), 3.3 Association
4. CRISP-DM Methodology
5. Main Techniques: 5.1 Decision Trees, 5.2 Association Rules, 5.3 Linear Regression, 5.4 Artificial Neural Networks,
5.5 Fuzzy Sets and Fuzzy Logic, 5.6 Bayes Networks

Internship(s)

NAO

Bibliography

Camilo, C., & Silva, J. (2009). Mineração de dados. Goiânia: Universidade Federal de Goiás.
Chakrabarti, S., Cox, E., Frank, E., Güting, R., Han, J., Jiang, X., Neapolitan, R. (2008). Data Mining: Know It All.Burlinghton: Morgan
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0: Step-By-Step Data Mining
Delen, D.. (2014). Real-World Data Mining: FT Press.
Larose, D. (2005). Discovering Knowledge in Data. Hoboken: John Wiley & Sons, Inc.
Mohri, M., Rostamizadeh, A., & Talwalkar, A. (2018). Foundations of machine learning. MIT press.
North, M. (2012). Data mining for the masses: A Global Text Project Book.
Santos, M., & Azevedo, C. (2005). Data Mining: Descoberta de Conhecimento em Bases de Dados. Lisboa: FCA.
Witten, I., & Frank, E. (2005). Data Mining: Practical machine learning tools and techniques. San Francisco: MorganKaufmann