Análise de Dados
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Informática |
Ocorrência: 2023/2024 - 1S
Ciclos de Estudo/Cursos
Sigla |
Nº de Estudantes |
Plano de Estudos |
Anos Curriculares |
Créditos UCN |
Créditos ECTS |
Horas de Contacto |
Horas Totais |
MES |
10 |
Plano de Estudos 2017-2018 |
1 |
- |
7,5 |
- |
202,5 |
Docência - Responsabilidades
Língua de trabalho
Português
Objetivos
Reconhecer os desafios e necessidades específicas da persistência e análise de grandes volumes de dados
Conhecer as etapas de desenvolvimento de um projeto BI/Analytics
Modelar e dimensionar um Data wharehouse, selecionando de entre abordagens alternativas
Compreender as necessidades e boas práticas de codificação do processo ETL, considerando fontes de dados heterogéneas
Realizar questões analíticas através das extensões OLAP ao SQL
Selecionar sistemas OLAP e configurar a estrutura subjacente de dados conhecendo as respetivas implicações para a análise dos mesmos
Selecionar e diferenciar classes de algoritmos de data mining, bem como os pressupostos da sua utilização
Construir suportes de visualização e interação com resultados de diferentes análises dos dados, sobre plataformas existentes
Resultados de aprendizagem e competências
- Saber conduzir um projeto de BI
- Realizar modelos de dados
- Selecionar e aplicar algoritmos adequados para o problema
Modo de trabalho
B-learning
Programa
Revisão de conceitos fundamentais de Bases de Dados Relacionais
Conceitos e Definições elementares
O Processo de desenho de uma BD
Níveis de abstração, Modelos e Notações
Conversão do modelo E-R para MR
Formas normais
Linguagem SQL
Projetos BI e Datawarehousing
Sistemas Operacionais vs Sistemas de Apoio à Decisão
História dos Sistemas de Apoio à Decisão
Motivação dos projectos Business Intelligence
Modelos de dados multidimensionais
Modelação Dimensional
Obtenção de dimensões
Metáfora do cubo de dados
Navegação no cubo de dados
Tabelas de factos e dimensões
Granularidade da tabela de factos
Chaves e dimensões degeneradas
Chaves substitutas
Esquemas estrela e snowflake
Análise de Dimensões (inteligibilidade vs desempenho)
Modelação de factos: medidas
Recomendações complementares à modelação
Projecto de Data warehouses
Características de gestão de um projecto de criação e manutenção de um Data Warehouse
Desenho físico de data warehouses
Carregamento e manutenção do Data warehouse – O Processo ETL
Data Mining
Objetivos e tarefas típicas
Principais classes de métodos
Métodos representativos: Agrupamento, Classificação, Associação
Avaliação e modelos de classificação
Bibliografia Obrigatória
Ralph Kimball e Margy Ross; The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, Wiley, 2002
Foster Provost, Tom Fawcett; Data Science for Business: What you need to know about data mining and data-analytic thinking (, O'Reilly Media, 2013. ISBN: 1449361323
Métodos de ensino e atividades de aprendizagem
Exposição teórica de conceitos. Análise de casos de estudo. Aplicação prática dos conceitos.
As aulas seguirão um calendário inicialmente apresentado aos alunos contendo aulas presenciais, remotas e tarefas/milestones entregaveis.
As aulas remotas exploram o uso das tecnologias envolvidas em ambiente digital, este e respetivos métodos, nas matérias selecionadas, de forma mais pedagógicamente produtiva. As aulas presencias mantêm exposição, exploração de exemplos/casos de estudo e exercicios de introfução e enquadramento das matérias. O numero de aulas na modalidade remota é inferior a 50% das aulas totais.
Tipo de avaliação
Avaliação distribuída sem exame final
Componentes de Avaliação
Designação |
Peso (%) |
Trabalho escrito |
50,00 |
Exame |
50,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Elaboração de projeto |
20,00 |
Trabalho escrito |
10,00 |
Trabalho laboratorial |
32,00 |
Estudo autónomo |
80,00 |
Frequência das aulas |
60,00 |
Total: |
202,00 |
Obtenção de frequência
Presença nas apresentações de avaliação de labs, seminário e projeto
Fórmula de cálculo da classificação final
Alaternativa por avaliação continua:
20% Lab (min9)+ 30% Seminario (min9) + 50% teste (min9)
Ãlternativa por exame:
Exame: 50% Projeto (min9) + 50% Exame (min9)