Big Data
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Informática |
Ocorrência: 2020/2021 - 1S
Ciclos de Estudo/Cursos
Sigla |
Nº de Estudantes |
Plano de Estudos |
Anos Curriculares |
Créditos UCN |
Créditos ECTS |
Horas de Contacto |
Horas Totais |
BINF |
14 |
Plano Estudos 2016 |
3 |
- |
5 |
52,5 |
135 |
Docência - Responsabilidades
Língua de trabalho
Português
Objetivos
Os estudantes que terminam com sucesso esta unidade curricular deverão ser capazes de:
- Conhecer um conjunto de tópicos não convencionais que permitam uma gestão escalável dos dados, bem como a utilização de algoritmos paralelos e de modelação estatística, com e sem recurso à cloud;
- Ser proficientes num ecossistema de ferramentas e plataformas, que lhes permitam, em face de um problema concreto, determinar a solução a aplicar e os instrumentos a utilizar no armazenamento, exploração e análise de um grande volume de dados.
Resultados de aprendizagem e competências
Não aplicável
Modo de trabalho
Presencial
Programa
1. Introdução
História e contexto. Panorama da tecnologia Big Data. Ciência dos dados. Pesquisa, indexação e memória
2. Manipulação de dados em larga escala
Sistema de Armazenamento em Larga Escala. MapReduce e Hadoop. Relação com bases de dados correntes, streams, algoritmos, extensões e linguagens. Processamento paralelo de consultas e análise computacional de estatísticas. Armazenamento chave-valor; comparativo entre bases de dados SQL e não- SQL
3. Comunicação dos resultados
Visualização dos resultados computacionais. Proveniência dos dados, privacidade, ética e governação
4. Tópicos Especiais
Análise de grafos: estrutura, travessias, análise computacional, PageRank, consultas recursivas, web semântica, sistemas de advertising e recomendação na internet.
Bibliografia Obrigatória
Sadalage et al.; No SQL distilled : a brief guide to the emerging world of polyglot persistence, Pearson Education, 2012
O'Neil, C. and Schutt, R.; Doing Data Science: Straight Talk from the Frontline, 2013
Leskovec, J., Rajaraman, A., Ullman, K.; Mining of Massive Datasets, Cambridge University Press, 2nd Ed., 2014
White, T.; Hadoop: The Definitive Guide, O'Reilly, 2015
Wilke, C. O; Data Visualisation, O’Reilly, 2019
Bibliografia Complementar
Knaflick, N. C; Storytelling with data, Wiley, 2015
Métodos de ensino e atividades de aprendizagem
Como metodologia de ensino serão adotadas as seguintes abordagens:
1. Exposição oral dos conceitos e ferramentas base
2. Elaboração de trabalhos de laboratório
A avaliação contínua é efetuada com base em dois projetos e um teste escrito
A avaliação final é efetuada com base em dois projetos e num exame escrito
Software
Python
MongoDb
Tipo de avaliação
Avaliação distribuída com exame final
Componentes de Avaliação
Designação |
Peso (%) |
Teste |
30,00 |
Trabalho escrito |
70,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Estudo autónomo |
82,50 |
Frequência das aulas |
52,50 |
Total: |
135,00 |
Obtenção de frequência
Não aplicável
Fórmula de cálculo da classificação final
Por avaliação contínua
- 30%*projeto1+40%*projeto2+30%*teste
Por avaliação final
- 30%*projeto1+40%*projeto2+30%*exame