Capítulo 1 -
Introdução à Análise
de Dados
Universo de dados em expansão e a informação como um
factor de produção. Referencial informacional e de conhecimento - Data Warehousing e extracção
de informação e
conhecimento de bases de dados: Query, OLAP e Data Mining - sua análise
comparativa. Aplicação prática de cada tipo de ferramenta e seu
domínio de acção.
Conceitos para extracção de conhecimento em bases de dados: padrões e
modelos, utilização dos modelos, limitação dos modelos e falta de
dados; estatística: alguns conceitos úteis para ECBD.
Capítulo 2 -
Query
e OLAP
Report Backlog;
categorias de aplicações de emissão de relatórios e query; ferramentas de
emissão de relatórios e suas características mais relevantes.
DSS
e OLAP: Necessidade para o OLAP e sua evolução; Conceitos OLAP
- Síntese
Flexível de Informação, Múltiplas Dimensões de Dados / Caminhos de
Consolidação; Características do OLAP - Análise
Multidimensional dos Dados (MDA), Valor
dos Dados Multidimensionais, Termos mais Utilizados, Arquitecturas
Multidimensionais, Modelos de Dados
Multidimensionais Características dos Dados Multidimensionais, Tipos
de Arquitecturas Multidimensionais, Visão
Multidimensional de Dados Relacionais Bases de Dados Multidimensionais;
Análise Comparativa das Aproximações
(MOLAP x ROLAP) e Ferramentas
para Exploração de Informação com as suas características mais
salientes.
Capítulo 3 -
Extracção
de Conhecimento em Bases de Dados (ECBD) e Data
Mining
Introdução ao
Data Mining (DM):
Definição de
ECBD / Data Mining e fonte do seu poder; data query/reporting e OLAP X
Data Mining; breve história do Data Mining e suas raízes; passos na
evolução até ao Data Mining; distinção entre estatística / IA e Data
Mining; tecnologias
de suporte ao DM; como funciona o DM.
Descoberta
x predição; tipos de problemas do DM.
Técnicas
de Data Mining e Processos
do Data Mining
Processos de ECBD: Preparação
e selecção
dos dados, depuração, enriquecimento, transformação dos dados
(codificação), extracção de conhecimento e interpretação dos resultados.
Classificação
(aprendizagem supervisionada), descoberta de associações e sequências
(aprendizagem não supervisionada), visualização, associação,
predição, estimação - conceitos e exemplos de utilização.
Capítulo 4 - Métodos
e Algoritmos de Data Mining
Parte 1 - Soluções Distância (K-NN e Clustering), Naïve-Bayes
Parte 2 - Arvores de Decisão e Regras de Associação.
Parte 3 - Redes Neuronais,
Algoritmos genéticos.
Combinação
de múltiplos métodos de predição.
Capítulo
5 -
Considerações
Finais
Tendências
em DM; alguns prós e contras das tecnologias mais comuns; ferramentas
mais relevantes e suas características.

Capítulo
1 - Introdução ao Clementine
Introdução ao DM com Clementine;
Introdução ao Clementine Leitura, integridade e manipulação de
ficheiros de dados.
Capítulo
2- Procurar relacionamentos nos dados
Introduzir o nó Web e Matrix; Introduzir o nó Plot e Statistics p/
avaliar a correlação; Usar um histograma para investigar o
relacionamento entre campos simbólicos e numéricos.
Técnicas de Modelação com Clementine
Dar uma breve introdução
acerca das técnicas de modelação disponíveis no Clementine Qual
técnica utilizar? Quando e como?
Capítulo
3- Redes neuronais
Introdução ao Nó Train Net Criar uma Rede Neuronal
Introduzir a paleta Modelos Gerados Investigar e interpretar os
resultados Avaliar o modelo
Árvores de Decisão
Introdução aos dois nós de Árvores de Decisão Criar uma
Árvore C5.0 Analisar e Interpretar os resultados Criar um conjunto de
regras para visualizar as regras de indução de uma forma diferente
Combinar árvores de decisão com redes neuronais
Introdução ao Nó Análise Usar Árvores de Decisão antes
das Redes Neuronais Usar Redes Neuronais ante das Árvores de Decisão
Redes Kohonen
Introdução ao Nó Train Kohonen Construir uma rede Kohonen
Interpretar os resultados
Regras de Associação
Introdução aos dois métodos de gerar regras de associação
Utilizar o nó APRIORI para construir um conjunto de regras de
associação Interpretar os resultados
Estratégia p/ o Data Mining e Desenvolvimento de Modelos
Discutir estratégias para Data Mining Sugerir métodos para
melhoria dos modelos Opções para aplicação de modelos em novos
dados
Links de Interesse
Conceitos sobre Estatística, OLAP e Data Mining - http://www.statsoftinc.com/textbook/stathome.html