Saltar para:
This page in english Ajuda Autenticar-se
ESTB
Você está em: Início > BINF025
Autenticação




Esqueceu-se da senha?

Big Data

Código: BINF025     Sigla: BD

Áreas Científicas
Classificação Área Científica
OFICIAL Informática

Ocorrência: 2021/2022 - 1S

Ativa? Sim
Unidade Responsável: Matemática e Informática
Curso/CE Responsável: Licenciatura em Bioinformática

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
BINF 24 Plano Estudos 2016 3 - 5 52,5 135

Docência - Responsabilidades

Docente Responsabilidade
Maria Raquel Feliciano Barreira Responsável

Docência - Horas

Ensino Teórico-Prático: 1,50
Ensino Prático e Laboratorial: 1,50
Tipo Docente Turmas Horas
Ensino Teórico-Prático Totais 1 1,50
Maria Raquel Feliciano Barreira 1,50
Ensino Prático e Laboratorial Totais 1 1,50
Maria Raquel Feliciano Barreira 1,50

Língua de trabalho

Português

Objetivos





Os estudantes que terminam com sucesso esta unidade curricular deverão ser capazes de:

- Conhecer um conjunto de tópicos não convencionais que permitam uma gestão escalável dos dados, bem como a utilização de algoritmos paralelos e de modelação estatística, com e sem recurso à cloud;

- Ser proficientes num ecossistema de ferramentas e plataformas, que lhes permitam, em face de um problema concreto, determinar a solução a aplicar e os instrumentos a utilizar no armazenamento, exploração e análise de um grande volume de dados.





Resultados de aprendizagem e competências

Não aplicável

Modo de trabalho

Presencial

Programa





1. Introdução
História e contexto. Panorama da tecnologia Big Data. Ciência dos dados. Pesquisa, indexação e memória

2. Manipulação de dados em larga escala
Sistema de Armazenamento em Larga Escala. MapReduce e Hadoop. Relação com bases de dados correntes, streams, algoritmos, extensões e linguagens. Processamento paralelo de consultas e análise computacional de estatísticas. Armazenamento chave-valor; comparativo entre bases de dados SQL e não- SQL

3. Comunicação dos resultados
Visualização dos resultados computacionais. Proveniência dos dados, privacidade, ética e governação

4. Tópicos Especiais
Análise de grafos: estrutura, travessias, análise computacional, PageRank, consultas recursivas, web semântica, sistemas de advertising e recomendação na internet.





Bibliografia Obrigatória

Sadalage et al.; No SQL distilled : a brief guide to the emerging world of polyglot persistence, Pearson Education, 2012
O'Neil, C. and Schutt, R.; Doing Data Science: Straight Talk from the Frontline, 2013
Leskovec, J., Rajaraman, A., Ullman, K.; Mining of Massive Datasets, Cambridge University Press, 2nd Ed., 2014
White, T.; Hadoop: The Definitive Guide, O'Reilly, 2015
Wilke, C. O; Data Visualisation, O’Reilly, 2019

Bibliografia Complementar

Knaflick, N. C; Storytelling with data, Wiley, 2015

Métodos de ensino e atividades de aprendizagem





Como metodologia de ensino serão adotadas as seguintes abordagens:

1. Exposição oral dos conceitos e ferramentas base

2. Elaboração de trabalhos de laboratório


A avaliação contínua é efetuada com base em dois projetos e um teste escrito

A avaliação final é efetuada com base em dois projetos e num exame escrito 





Software

Python
MongoDb

Tipo de avaliação

Avaliação distribuída com exame final

Componentes de Avaliação

Designação Peso (%)
Teste 30,00
Trabalho escrito 70,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Estudo autónomo 82,50
Frequência das aulas 52,50
Total: 135,00

Obtenção de frequência

Não aplicável

Fórmula de cálculo da classificação final

Por avaliação contínua



  • 30%*projeto1+40%*projeto2+30%*teste


 Por avaliação final



  • 30%*projeto1+40%*projeto2+30%*exame

Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Instituto Politécnico de Setúbal - Escola Superior de Tecnologia do Barreiro  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2024-11-23 às 15:27:54