Extração Automática de Informação
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Informática |
Ocorrência: 2022/2023 - 2S
Ciclos de Estudo/Cursos
Sigla |
Nº de Estudantes |
Plano de Estudos |
Anos Curriculares |
Créditos UCN |
Créditos ECTS |
Horas de Contacto |
Horas Totais |
MES |
17 |
Plano de Estudos 2017-2018 |
2 |
- |
7,5 |
- |
202,5 |
Docência - Responsabilidades
Língua de trabalho
Português
Objetivos
- Aquisição de conhecimento para a formulação de um problema prático usando técnicas de reconhecimento de padrões
- Assegurar que os alunos adquirem capacidade de implementação e utilização de vários algoritmos de classificação supervisionada e não-supervisionada
- Fornecer competências teóricas e práticas para efetuar análise inteligente de dados não estruturados, nomeadamente em textos, e em particular recorrendo a exemplos comuns na internet, tais como páginas web, mensagens assíncronas e de e-mail, usando as técnicas de reconhecimento de padrões adquiridas nesta UC.
Resultados de aprendizagem e competências
- Contacto com um conjunto de aplicações de análise inteligente de dados não estruturados incluindo a classificação documental, sistemas de recomendação web, análise de sentimentos em redes sociais, deteção de cibercrime, e outros.
- Desenvolvimento nos alunos da curiosidade científica e de capacidades para investigar aspetos inovadores na área de reconhecimento de padrões.
Modo de trabalho
Presencial
Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)
Probabilidades e Estatistica
Inteligência Artificial
Programa
Aspetos lecionados principalmente nas aulas teórico-práticas:
1. Introdução ao Reconhecimento de Padrões
1.1. Natureza do Problema
1.2. Áreas de Aplicação
1.3. Classificação Supervisionada e não-Supervisionada
2. Árvores de Decisão
2.1. Aprendizagem por Indução.
2.2. Algoritmo ID3
2.3. Regras Lógicas
3. Projeto de Classificador
3.1. Espaço vetorial de características
3.2. Funções Discriminantes
3.3. Matriz de confusão
3.4. Critério de avaliação
4. Redução de Dimensionalidade: Seleção vs. Extração de Características
5. Teoria da Decisão
5.1. Classificação Supervisionada Paramétrica: Modelo das Observações
5.1.1. Classificador de máximo a posteriori (MAP)
5.1.2. Classificador de Bayes
5.1.3. Estimação Paramétrica do Modelo das Observações
5.2. Classificação Supervisionada Não-Paramétrica
5.2.1. Classificador k-NN
6. Classificação não-Supervisionada
6.1. Algoritmo K-Médias
6.2. Clustering Hierárquico
Aspetos lecionados principalmente nas aulas prático-laboratoriais:
7. Mineração de Texto
7.1. Informação não Estruturada
7.2. Expressões Regulares
7.3. Operações Elementares
7.4. Técnicas de Pre-processamento
7.5. Seleção e Extração de Características
7.6. Categorização de Textos
7.7. Avaliação de Desempenho
8. Descoberta de Conhecimento
8.1. Medidas de Similaridade
8.1.1. Coocorrência de termos
8.1.2. Cosseno
8.1.3. Similaridade semântica
8.2. Pesquisa de documentos na web
8.3. Extração de Informação
8.3.1. Extração de Entidades
8.3.2. Extração de Relações
9. Aplicações
Bibliografia Obrigatória
Jorge Salvador Marques; Reconhecimento de Padrões, IST-Press, Lisboa
Bibliografia Complementar
Ronen Feldman and James Sanger, ; The Text Mining Handbook: Advanced Approaches In Analyzing Unstructured Data, Cambridge University Press. ISBN: ISBN-13 978-0-521-83657-9
Métodos de ensino e atividades de aprendizagem
Aulas teórico-práticas: exposição com auxílio de slides e exercícios de consolidação.
Aulas de laboratório: Exercícios de programação para resolver no computador, enquadrados por uma contextualização teórica prévia.
Será ainda estimulada a aprendizagem ativa por parte dos alunos, relativamente a aspetos do progama da UC ligados à aprendizagem automática, que os alunos desejem aprofundar de forma autónoma.
A utilização de meios de ensino à distância decorrentes da situação atual é documentada em anexo
Tipo de avaliação
Avaliação distribuída com exame final
Componentes de Avaliação
Designação |
Peso (%) |
Apresentação/discussão de um trabalho científico |
15,00 |
Exame |
30,00 |
Trabalho escrito |
55,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Elaboração de projeto |
35,00 |
Estudo autónomo |
10,00 |
Frequência das aulas |
25,00 |
Trabalho de investigação |
10,00 |
Trabalho escrito |
20,00 |
Total: |
100,00 |
Obtenção de frequência
Modo de avaliação contínua: Apresentação e artigo sobre um tema de investigação 15% + 2 Testes 15% + 15% + Projeto 55%.
A aprovação exige que em cada um dos elementos se obtenha nota igual ou superior a 7.
Fórmula de cálculo da classificação final
Modo de avaliação por exame:: Exame 45% + Projeto 55%.
A aprovação exige que em cada um dos elementos se obtenha nota igual ou superior a 7.
a referência aos mecanismos de mitigação da fraude e suas consequências é o Despacho n.º 40/Presidente/2021
Melhoria de classificação
Repetição de Exame e Projeto