Conhecimentos de Base Recomendados
A unidade curricular de Métodos de Previsão está suportada nos conteúdos fundamentais de Estatística. Os conhecimentos de programação proporcionados pela unidade curricular de Programação para Ciência de Dados são uma mais-valia.
Métodos de Ensino
As aulas são, de acordo com o que está determinado no plano curricular, teórico-práticas. Na parte teórica, de introdução de conceitos, resultados fundamentais e metodologias, será usado, predominantemente, o método expositivo. A parte prática será destinada à exemplificação de procedimentos e resolução de problemas sob orientação do docente, mas incentivando-se o trabalho autónomo ou em pequenos grupos com suporte de uma ferramenta informática (predominantemente, Google Colab com a linguagem Python ou R). Far-se-á prevalecer uma forte interação entre a teoria e a prática, dando, tanto quanto possível, um papel central à visualização e ao tratamento de situações concretas.
O bom acompanhamento das aulas por parte do estudante pressupõe que, regularmente, haja um trabalho prévio de preparação e um estudo posterior de consolidação das matérias e aquisição de destreza na componente prática. Todos os materiais de apoio são disponibilizados na plataforma InforEstudande|Nonio, usando-se, complementarmente e se necessário, a plataforma Teams do Microsoft Office 365, ambas com o acesso institucional disponibilizado pela Coimbra Business School | ISCAC.
Resultados de Aprendizagem
Nesta unidade curricular pretende-se que o estudante conheça as técnicas, com especial incidência nas estatísticas, vocacionadas para o entendimento e preparação de dados em tarefas de Ciência dos Dados, complementando e estruturando as já abordadas noutras unidades curriculares. O estudante deve ainda ser capaz de selecionar as mais adequadas e de as aplicar a um conjunto de dados de uma forma estruturada e com implementação, preferencialmente, em Python, seguindo a metodologia CRISP-DM (Cross-Industry Standard Process for Data Mining).
Adicionalmente, pretende-se que o estudante conheça e execute técnicas simples de reamostragem e de simulação e que identifique situações concretas em que estas sejam adequadas.
Programa
1. Entendimento dos dados
1.1. Etapas e tarefas
1.2. Ferramentas estatísticas
2. Preparação de dados
2.1. Etapas e tarefas
2.2. Ferramentas estatísticas: tratamento de valores em falta; tratamento de outliers; discretização, normalização e outras transformações; técnicas para eliminação de redundância; técnicas para redução de dimensionalidade.
3. Tópicos de Estatística Computacional
3.1. Reamostragem
3.2. Simulação
Docente(s) responsável(eis)
Estágio(s)
NAO
Bibliografia
- Bruce, P., Bruce, A., Gedeck, P. (2020). Practical Statistics for Data Scientists, 2nd Edition. O’Reilly Media.
- Ciaburro, G. (2020). Hands-On Simulation Modeling with Python. Packt Publishing.
- García, S., Luengo, J., Herrera, F. (2014). Data Preprocessing in Data Mining. Springer.
- Hair, J.F., Black, W.C., Babin, B.J., Anderson, R.E. (2019). Multivariate Data Analysis, 8th Edition. Cengage.
- Kuhn, M., Johnson, K. (2020). Feature Engineering and Selection – A Practical Approach for Predictive Models. CRCPress.
- Moreira, J., Carvalho, A., Horvath, T. (2018). A General Introduction to Data Analytics. Wiley.