akákoľvek štúdia je pozorovať vlastnosti objektov za účelom zistenia a vyhodnotenia zmysluplných vzťahov a interakcií medzi ukazovateľmi týchto vlastností.
Špecializácia zahŕňa objekty, ktoré sa líšia svojimi vlastnosťami, a určitým spôsobom sú v niektorých ohľadoch prepojených.Plnenie úloh v oblasti programovania začína štúdiu o predmetnej oblasti.
Špecializácia - je to súčasť skutočného sveta, ktorý je nekonečná a obsahuje ako dôležitá a nedôležitá dáta.Výskumník musí byť schopný alokovať podstatnú časť z nich.Napríklad, riešenie problému úveru, budú považované všetky relevantné informácie o súkromnom živote zákazníka (či už je práca s manželom, či zákazník prináša maloleté deti, vzdelanie, zákazník, atď.)A s cieľom riešiť ďalšie úlohy spojené s bankové činnosti, budú tieto údaje byť pomerne významné.Význam dát závisí na tom, čo si vyberieme ako oblasť.
Štúdia je potrebné vytvoriť model domény.Znalosti z rôznych zdrojov by malo byť formalizované.Špecializácia je formovaný pomocou akýchkoľvek prostriedkov.Fondy môžu byť veľmi odlišné.To môže byť textový popis oblasť alebo špecializované grafické notácie.Pri modeli domény opisuje procesy, ktoré sa odohrávajú v ňom, rovnako ako študovať dáta v oblasti výskumu.
Vyhlásenie problému je aj popis statické a dynamické správanie objektov, ktoré skúmame.Popis statické správanie naznačuje, charakteristiky objektov a ich vlastností.V popise dynamického správania objektov príčin správania.
dynamické chovanie objektov je často popisovaná spolu s statické pôsobenie.
Niekedy analýza domény a úlohou sú spojené v jednom kroku.
na identifikáciu a analýzu požiadaviek na modelovanie dát vykonanej dáta potrebné pre dolovanie dát.K tomu, študujeme problematiku distribúcie užívateľov;analytické vlastnosti systému;Otázky prístupu k údajom potrebným pre analýzu.
Špecializácia analýzy ľahšie a efektívnejšie, ak organizácia má dátový sklad.Avšak, nie všetky spoločnosti majú taký dátový sklad.V tomto prípade je zdrojom pôvodných dát je prevádzková databáza, referencie a archívne materiály, to znamená, že dáta zo súčasného IP (informačné systémy).
Viac informácií môže byť potrebné z vodcov ES, vnútorné a vonkajšie zdroje rôznych papierových dokumentov, ako aj odborné znalosti a / alebo výsledky ankety.
by tiež mala byť vedomí toho, že v procese vývojárov softvéru prípravy by údaje mali opisovať čo najviac faktory, ktoré ovplyvňujú proces.Tam môžu byť niektoré kódovanie dát.Napríklad, jedna z charakteristík klienta - úrovni jeho príjmu, ktorý môže byť definovaný ako: veľmi nízka, nízka, stredná, vysoká, veľmi vysoká.V tomto prípade je nutné určiť úroveň gradácie príjmov.
Pri stanovení správne množstvo dát, ktoré majú byť považované za dáta pre objednávanie.
V prípade, že sú usporiadané, je nutné zistiť, či zahrnutá v súbore dát sezónne / cyklická zložka.Keď oni nie sú nariadené, tjsúbor udalostí z databázy nie je spojená s časovej osi, potom sa v priebehu zberu musí byť v súlade s týmito pravidlami:
1) malý počet záznamov v databáze, môže byť príčinou vzniku nedostatočného modelu;
2) presnosť modelu môže byť zlepšená zvýšením počtu dát;
3) neaktuálne informácie je vylúčená zo súboru;
4) algoritmy, ktoré sa používajú na vytvorenie modelu sa veľmi rozsiahlych databáz, by mal mať možnosť škálovať.