Qualquer estudo é observar as propriedades dos objetos, a fim de determinar e avaliação de relações significativas e interações entre os indicadores destas propriedades.
Especialização inclui objetos que diferem em suas propriedades e de uma certa maneira são, em alguns aspectos interligados.Enfrentar os desafios no domínio da programação começa com um estudo da área de assunto.
Especialização - é parte do mundo real, que é infinito e contém dados importantes e sem importância.O pesquisador deve ser capaz de alocar uma parte substancial deles.Por exemplo, a resolução do problema do crédito, serão consideradas todas as informações relevantes sobre a vida privada do cliente (se existe um trabalho com um cônjuge, se um cliente traz filhos menores, educação, cliente, etc.).E, a fim de resolver outras tarefas relacionadas com as actividades bancárias, esses dados será bastante significativo.A importância dos dados depende do que nós escolhemos como uma área de assunto.
O estudo precisa criar um modelo de domínio.Conhecimento de diferentes fontes deve ser formalizada.A especialização é formalizada por meio de qualquer meio.Fundos podem ser muito diferentes.Esta pode ser uma descrição de texto da área de assunto ou notação gráfica especializada.Com o modelo de domínio descreve os processos que ocorrem no mesmo, bem como o estudo dos dados na área de pesquisa.Declaração
do problema é também a descrição do comportamento estático e dinâmico de objectos que investigam.Descrição comportamento estático sugere características dos objetos e suas propriedades.Na descrição do comportamento dinâmico de objetos nas causas do comportamento.Comportamento dinâmico
de objetos é frequentemente descrito em conjunto com o comportamento estático.
Às vezes, a análise de domínio e tarefa são combinadas em uma única etapa.
identificar e analisar os requisitos de dados feitas modelagem de dados necessários para a Mineração de Dados.Para fazer isso, nós estudamos as questões da distribuição dos usuários;características analíticas do sistema;questões de acesso aos dados necessários para a análise.
Especialização analisa mais fácil e mais eficaz quando a organização tem um data warehouse.No entanto, nem todas as empresas têm um tal data warehouse.Neste caso, a fonte de dados original é a bancos de dados operacionais, de referência e materiais de arquivo, ou seja, dados de IP existente (sistemas de informação).
Mais informações podem ser necessários com os líderes comunitários, fontes internas e externas de vários documentos em papel, bem como conhecimentos especializados e / ou resultados das urnas.
também deve estar ciente de que no processo de desenvolvedores de software de preparação de dados deve descrever tanto quanto possível, os fatores que afetam o processo.Pode haver alguns codificação de dados.Por exemplo, uma das características do cliente - o nível dos seus rendimentos, que podem ser definidas como: muito baixo, baixo, médio, alto, muito alto.Neste caso, é necessário determinar o nível de gradação de renda.
Ao determinar a quantidade certa de dados a ser considerado pedidos de dados.
No caso em que eles são ordenados, é necessário descobrir se incluídos neste conjunto componente sazonal / cíclica de dados.Quando eles não são ordenados, ou seja,conjunto de eventos a partir do banco de dados não está ligada a linha do tempo, em seguida, no decurso da coleção deve respeitar as seguintes regras:
1) um pequeno número de registros no banco de dados pode ser a causa da criação de um modelo inadequado;
2) a precisão do modelo pode ser melhorada através do aumento do número de dados;
3) informações desatualizadas está excluído do conjunto;
4) algoritmos que são usados para criar um modelo com grandes bases de dados, deve ter a capacidade de escala.