Qualsiasi studio è quello di osservare le proprietà degli oggetti al fine di determinare e valutazione di relazioni significative e delle interazioni tra gli indicatori di queste proprietà.
specializzazione include oggetti che si differenziano per le loro proprietà e in un certo modo sono per alcuni aspetti interconnessi.Alle sfide nel campo della programmazione comincia con uno studio della materia.
Specializzazione - è parte del mondo reale, che è infinito e contiene sia i dati importanti e non importanti.Il ricercatore deve essere in grado di destinare una parte sostanziale di essi.Ad esempio, la soluzione del problema del finanziamento, saranno prese in considerazione tutte le informazioni utili sulla vita privata del cliente (se vi è un lavoro con il coniuge, se un cliente porta i figli minori, l'istruzione, clienti, ecc.)E al fine di risolvere altri compiti connessi con l'attività bancaria, tali dati saranno abbastanza significativo.Il significato dei dati dipende da ciò che scegliamo come argomento.
Lo studio necessario creare un modello di dominio.La conoscenza da diverse fonti dovrebbe essere formalizzato.La specializzazione è formalizzato tramite qualsiasi mezzo.I fondi possono essere molto diverse.Questo può essere una descrizione della materia o notazione grafica specializzato.Con il modello di dominio descrive i processi che avvengono in esso, così come studiano i dati nell'area di ricerca.
Dichiarazione del problema è anche la descrizione del comportamento statico e dinamico di oggetti che noi indagare.Descrizione comportamento statico suggerisce caratteristiche degli oggetti e le loro proprietà.Nella descrizione del comportamento dinamico di oggetti in cause del comportamento.
comportamento dinamico di oggetti è spesso descritto con comportamento statico.
volte analisi del dominio e il compito sono combinati in un solo passo.
di identificare ed analizzare i requisiti di dati effettuate dati di modellazione necessari per il Data Mining.Per fare questo, studiamo i problemi della distribuzione degli utenti;caratteristiche analitiche del sistema;problemi di accesso ai dati necessari per l'analisi.
Specializzazione analisi più facile e più efficace quando l'organizzazione ha un data warehouse.Tuttavia, non tutte le aziende hanno un tale data warehouse.In questo caso, la fonte per i dati originali è il database operativi, di riferimento e materiali d'archivio, cioè, dati da IP esistente (sistemi informativi).
Ulteriori informazioni possono essere necessarie da parte dei leader comunitari, fonti interne ed esterne di vari documenti cartacei, nonché conoscenze specialistiche e / oi risultati delle urne.
dovrebbe anche essere consapevoli del fatto che nel processo di sviluppatori di software di preparazione dei dati dovrebbe descrivere il più possibile i fattori che influenzano il processo.Ci può essere qualche codifica dei dati.Ad esempio, una delle caratteristiche del cliente - il livello del suo reddito, che possono essere definite come: molto bassa, bassa, media, alta, molto alta.In questo caso, è necessario determinare il livello di gradazione reddito.
Nel determinare la giusta quantità di dati da considerare dati di ordinazione.
Nel caso in cui essi sono ordinati, è necessario scoprire se compresi in questo set componente stagionale / ciclico dei dati.Quando non sono ordinati, cioè,serie di eventi dal database non è legata alla timeline, poi nel corso della raccolta devono rispettare le seguenti regole:
1) un piccolo numero di record del database può essere la causa della creazione di un modello inadeguato;
2) la precisione del modello può essere migliorata aumentando il numero di dati;
3) informazioni obsolete è esclusa dal set;
4) algoritmi utilizzati per creare un modello con database molto grandi, dovrebbe avere la capacità di scalare.