Análise Inteligente de Dados
Engenharia de Sistemas e Informática

Departamento de Informática

Escola Superior de Tecnologia de Viseu

Pág. Inicial

Programa

Sumários

Avaliação

Calendário

Bibliografia

Trabalhos

 
 Disciplina:
Análise Inteligente de Dados
 Curso: Engenharia de Sistemas e Informática
(5º Ano; 1º Semestre)
 Docente: Jorge Loureiro  <jloureiro@di.estv.ipv.pt>

Acetatos

Capítulo 1 - Introdução à Análise de Dados
Universo de dados em expansão e a informação como um factor de produção. Referencial informacional e de conhecimento - Data Warehousing e extracção de informação e conhecimento de bases de dados: Query, OLAP e Data Mining - sua análise comparativa. Aplicação prática de cada tipo de ferramenta e seu domínio de acção.
Conceitos para extracção de conhecimento em bases de dados: padrões e modelos, utilização dos modelos, limitação dos modelos e falta de dados; estatística: alguns conceitos úteis para ECBD.

Capítulo 2 - Query e OLAP
Report Backlog; categorias de aplicações de emissão de relatórios e query; ferramentas de emissão de relatórios e suas características mais relevantes.
DSS e OLAP: Necessidade para o OLAP e sua evolução; Conceitos OLAP - Síntese Flexível de Informação, Múltiplas Dimensões de Dados / Caminhos de Consolidação; Características do OLAP -
Análise Multidimensional dos Dados (MDA), Valor dos Dados Multidimensionais, Termos mais Utilizados, Arquitecturas Multidimensionais, Modelos de Dados Multidimensionais Características dos Dados Multidimensionais, Tipos de Arquitecturas Multidimensionais,  Visão Multidimensional de Dados Relacionais Bases de Dados Multidimensionais;
Análise Comparativa das Aproximações (MOLAP x ROLAP) e Ferramentas para Exploração de Informação com as suas características mais salientes.

Capítulo 3 - Extracção de Conhecimento em Bases de Dados (ECBD) e Data Mining

Introdução ao Data Mining (DM):

Definição de ECBD / Data Mining e fonte do seu poder; data query/reporting e OLAP X Data Mining; breve história do Data Mining e suas raízes; passos na evolução até ao Data Mining; distinção entre estatística / IA e Data Mining; tecnologias de suporte ao DM; como funciona o DM.

Descoberta x predição; tipos de problemas do DM. 

Técnicas de Data Mining e Processos do Data Mining
Processos de ECBD: Preparação e selecção dos dados, depuração, enriquecimento, transformação dos dados (codificação), extracção de conhecimento e interpretação dos resultados.
Classificação (aprendizagem supervisionada), descoberta de associações e sequências (aprendizagem não supervisionada), visualização, associação, predição, estimação - conceitos e exemplos de utilização. 

Capítulo 4 - Métodos e Algoritmos de Data Mining 

Parte 1
-
Soluções Distância (K-NN e Clustering), Naïve-Bayes

Parte 2 - Arvores de Decisão e Regras de Associação.

Parte 3 - Redes Neuronais, Algoritmos genéticos.
Combinação de múltiplos métodos de predição.

Capítulo 5 - Considerações Finais
Tendências em DM; alguns prós e contras das tecnologias mais comuns; ferramentas mais relevantes e suas características.

 

Capítulo 1 - Introdução ao Clementine
Introdução ao DM com Clementine; Introdução ao Clementine Leitura, integridade e manipulação de ficheiros de dados.

Capítulo 2- Procurar relacionamentos nos dados
Introduzir o nó Web e Matrix; Introduzir o nó Plot e Statistics p/ avaliar a correlação; Usar um histograma para investigar o relacionamento entre campos simbólicos e numéricos.
Técnicas de Modelação com Clementine
Dar uma breve introdução acerca das técnicas de modelação disponíveis no Clementine Qual técnica utilizar? Quando e como?

Capítulo 3- Redes neuronais
Introdução ao Nó Train Net Criar uma Rede Neuronal Introduzir a paleta Modelos Gerados Investigar e interpretar os resultados Avaliar o modelo
Árvores de Decisão
Introdução aos dois nós de Árvores de Decisão Criar uma Árvore C5.0 Analisar e Interpretar os resultados Criar um conjunto de regras para visualizar as regras de indução de uma forma diferente
Combinar árvores de decisão com redes neuronais
Introdução ao Nó Análise Usar Árvores de Decisão antes das Redes Neuronais Usar Redes Neuronais ante das Árvores de Decisão
Redes Kohonen
Introdução ao Nó Train Kohonen Construir uma rede Kohonen Interpretar os resultados
Regras de Associação
Introdução aos dois métodos de gerar regras de associação Utilizar o nó APRIORI para construir um conjunto de regras de associação Interpretar os resultados
Estratégia p/ o Data Mining e Desenvolvimento de Modelos
Discutir estratégias para Data Mining Sugerir métodos para melhoria dos modelos Opções para aplicação de modelos em novos dados

Links de Interesse

Conceitos sobre Estatística, OLAP e Data Mining - http://www.statsoftinc.com/textbook/stathome.html

Conceitos e recursos sobre Text Mining - http://textmining.krdl.org.sg/resources.html
Papers neste site: Text Mining: The state of the art and the challenges
                           Intelligent Text Mining Creates Business Intelligence

Recursos sobre Data Warehouse, OLAP, BI, CRM, etc.- http://www.datawarehouse.com/home/
                                                                                         http://www.dw-institute.com/

Recursos disponíveis na Revista Electrónica DMREVIEW.COM
* Ask the Experts http://www.dmreview.com/experts/
* Associations http://www.dmreview.com/associations/
* Bookstore http://www.dmreview.com/bookstore/
* Current Issue http://www.dmreview.com/issue/
* Events http://www.dmreview.com/events/
* Industry News http://www.dmreview.com/industrynews/
* Online Columns http://www.dmreview.com/onlinecolumnists/
* Product Reviews http://www.dmreview.com/productreviews/
* Resource Portals http://www.dmreview.com/portal_ros.cfm?NavID=284
* Vendor Listings http://www.dmreview.com/vendorcategories/
* White Papers http://www.dmreview.com/whitepaper/
* Home Page http://www.dmreview.com/
* Search http://www.dmreview.com/search/

             

última actualização: Outubro, 2006
página editada por: Jorge Loureiro