DATA MINING
Mineração de dados, é o processo de descoberta de novas e significativas correlações, padrões e tendências em grandes volumes de dados, através do uso de técnicas e reconhecimento de padrões, estatística e outras ferramentas matemáticas. A mineração de dados permite analisar todo o ruído caótico e repetitivo dos dados; entender o que é relevante e fazer bom uso dessas informações para avaliar os resultados possíveis; e acelerar o ritmo de tomada de decisões informadas.
Algumas ferramentas de software para o desenvolvimento de modelos de Data Mining:
- KEEL
- KNIME
- Neural Designer
- OpenNN
- Orange
- SAS
- R
- SPSS
- Weka
Algumas atividades do Data Mining:
Previsão - parte de uma série de valores existentes para prever quais serão os outros valores.
Sequência - os eventos estão ligados ao longo do tempo.
Associação - são ocorrências ligadas a um único evento.
Classificação - reconhece modelos que descrevem o grupo ao qual o item pertence por meio do exame dos itens já classificados e pela inferência de um conjunto de regras.
Agrupamento - descobre diferentes agrupamentos dentro da massa de dados.
A mineração de dados é muitas vezes usada por empresas e organizações para a obtenção de conhecimento a respeito de utilizadores/funcionários/clientes. Empresas como cadeias de supermercados podem recorrer a esse cruzamento de dados para determinarem produtos que são comprados em conjunto.
Segundo a Hierarquia de Ackoff...
Pirâmide de Conhecimento
Os dados são os elementos através dos quais é possível obter informação.
Com informação é possível construir conhecimento.
Mineração de Dados
E através da investigação dos dados podemos chegar ao conhecimento.
Dados
Um símbolo ou evento sem relação com outras coisas.
Informação
Compreensão de uma relação ou contextualização de dados.
Conhecimento
Compreensão de um padrão que normalmente permite deduzir o que acontecerá ou identificar algo descrito por um conjunto de factos ou símbolos.
Compreensão
Exige diagnóstico e prescrição, que considera serem mais que "conhecimento", mas menos que sabedoria. Enquanto as informações agem rapidamente, o conhecimento tem uma vida mais longa e compreensão tem apenas uma aura de permanência.
Sabedoria
É considerada como "permanente" no verdadeiro sentido.
Modelos para utilização do Data Mining na extracção das informações:
Modelo de Verificação: escolhe uma hipótese do utilizador e testa a validez dela contra os dados. A ênfase está no utilizador que é responsável por formular a hipótese e verificar a questão nos dados e assim afirmar ou negar a hipótese.
Modelo de Descobrimento: os dados são filtrados à procura de padrões de frequente ocorrência, tendências e generalizações sobre os dados sem intervenção ou direção do utilizador.