Tópicos de Ciência de Dados

Conhecimentos de Base Recomendados

Não estão definidas quaisquer precedências relativamente a outras disciplinas e nem são especificados conhecimentos base recomendados.

Métodos de Ensino

Os métodos de ensino (ME) a utilizar estão balanceados entre tradicionais e ativos e são os seguintes:
ME1 – Exposição de conteúdos pelo professor (compatível com objetivos de aprendizagem 1, 2, 3, 4, 5, 6)
ME2 – Testar os conteúdos apreendidos pelos alunos (compatível com objetivos de aprendizagem 1, 2, 3, 4, 5, 6)
ME3 – Resolução de problemas pelos alunos (compatível com objetivos de aprendizagem 1, 2, 5, 6, 7)
ME4 – Interação e partilha de ideias pelos alunos (compatível com objetivos de aprendizagem 1, 2, 5, 6, 7)
ME5 – Desenvolvimento de pensamento crítico pelos alunos (compatível com objetivos de aprendizagem 1, 2, 5, 6, 7)
ME6 – Investigação feita pelos alunos (compatível com objetivos de aprendizagem 5, 7)
ME7 – Criação feita pelos alunos (compatível com objetivos de aprendizagem 7)

A unidade curricular baseia-se em aulas teóricas-práticas. Os métodos de ensino (ME) a utilizar estão balanceados entre tradicionais e ativos. As aulas incluem a apresentação de conceitos e metodologias e procedem com a sua discussão, assim como a demonstração da resolução de problemas aplicados. Nas aulas apresentam-se conceitos e metodologias, discutem-se conteúdos e demonstra-se a resolução de problemas. O conteúdo é ensinado e discutido em ambiente de sala.

Para além do tradicional método expositivo, a metodologia incluirá uma investigação feita pelos alunos, onde estes serão desafiados a investigar sobre um determinado tema e a preparar e apresentar um artigo sobre esse tema, o qual eventualmente pode vir a ser submetido a uma revista científica ou a uma conferência. O ensino incluirá ainda a aprendizagem baseada em projetos (ABP), do inglês “Project Based Learning”. Como o próprio nome diz, uma metodologia de aprendizagem ativa que tem como objetivo associar o aprender ao fazer. Esse método baseia-se na construção do conhecimento de maneira coletiva, fugindo do modelo de sala de aula convencional onde o professor ensina uma matéria e os alunos mostram o quanto aprenderam a partir de uma atividade avaliativa final. O projeto que se propõe desenvolver, desejavelmente realizado em grupo, tem por objetivo abranger algumas das fases de um projeto de ciência de dados. 

Resultados de Aprendizagem

Os principais objetivos de aprendizagem (AO) que se pretendem alcançar são os seguintes:

  • OA1 – Conhecer o papel central dos dados na estratégia de criação de valor de uma organização
  • OA2 – Compreender como se estrutura e dinamiza um pensamento orientado por dados
  • OA3 – Conhecer possíveis aplicações de projetos de ciência de dados em diversos setores de atividade
  • OA4 – Conhecer os principais conceitos e técnicas relacionadas à ciência de dados
  • OA5 – Conhecer algumas das principais fontes de dados a nível nacional e internacional
  • OA6 – Compreender os principais aspetos relacionados às fases de um projeto de ciência de dados
  • OA7 – Saber aplicar num projeto prático alguns dos principais conceitos e abordagens apreendidos

As principais competências (C) que se pretendem desenvolver são as seguintes:

  • C01 – Capacidade em reconhecer transpor objetivos de uma organização em objetivos de um projeto de ciência dos dados
  • C02 – Competência em identificar, entender e preparar os dados necessários a um projeto de ciência de dados
  • C03 – Habilidade em planear um projeto de ciência dos dados, contemplando as principais etapas desse projeto
  • C04 – Capacidade em procurar e identificar dados abertos que respondam às necessidades de um projeto de ciência dos dados sobre um tema 
  • C05 – Competência para propor a técnica de modelação mais adequada a um determinado problema  

Programa

1 Os dados, a sua transformação em valor e o pensamento orientado por dados
2 A ciência de dados e aplicações em vários domínios
3 Os envolvidos num projeto de ciência de dados
4 As principais técnicas da ciência de dados
5 Fontes de dados a nível nacional e internacional
6 O(s) ciclo(s) de vida da ciência de dados
7 Processamento de linguagem natural (PLN)
8 Análise de casos práticos
9 Ferramentas usadas na ciência de dados
10 Principais problemas e desafios da ciência de dados

Docente(s) responsável(eis)

Estágio(s)

NAO

Bibliografia

Bibliografia principal 

  • Adamson, J. (2021). Minding the Machines: Building and Leading Data Science and Analytics Teams. John Wiley & Sons.
  • Berry, Michael J, & Linoff, Gordon. (1997). Data Mining Techniques: For Marketing, Sales, and Customer Support. New York, USA: John Wiley & Sons, Inc.
  • Bigus, Joseph P. (1996). Data Mining with Neural Networks: Solving Business Problems from Application Development to Decision Support. Crawfordsville, Indiana, USA: McGraw-Hill, Inc.
  • Chakrabarti, Soumen, Cox, Earl, Frank, Eibe, Güting, Ralf Hartmut, Han, Jiawei, Jiang, Xia, Neapolitan, Richard E. (2008). Data Mining: Know It All. Burlinghton, Massachusetts: Morgan Kaufmann Publishers.
  • Fernandes, Anita Maria da Rocha. (2005). Inteligência Artificial: Noções Gerais. Brasil: Visual Books.
  • Hotz, N. (2022). What is a Data Science Life Cycle?. Data Science Process Alliance. https://www.datascience-pm.com/datascience-life-cycle
  • Kelleher, J. D., Mac Namee, B., & D’arcy, A. (2015). Fundamentals of Machine Learning for Predictive Data Analytics: Algorithms, Worked Examples, and Case Studies, MIT Press

Bibliografia complementar

  • Larose, Daniel T. (2005). Discovering Knowledge in Data: An Introduction to Data Mining. Hoboken, New Jersey: John Wiley & Sons, Inc.
  • Martinez, I., Viles, E., & Olaizola, I. G. (2021). Data science methodologies: current challenges and future approaches. Big Data Research, 24, 100183.
  • North, Matthew. (2012). Data mining for the masses: A Global Text Project Book.
  • Peng, R. D., & Matsui, E. (2016). The art of data science. A Guide for Anyone Who Works with Data. Skybrude Consulting, LLC.
  • Sahay, Amar. (2021), Essentials of Data Science and Analytics: Statistical Tools, Machine Learning, and R-Statistical Software Overview. New York, USA: Business Expert Press.
  • Santos, Manuel Filipe, & Azevedo, Carla Sousa. (2005). Data Mining: Descoberta de Conhecimento em Bases de Dados. Lisboa: FCA.
  • Santos, Maribel Yasmina, & Ramos, Isabel. (2009). Business Intelligence: Tecnologias da informação na gestão de conhecimento (2ª ed.). Lisboa: FCA.