Vsaka študija je opazovati lastnosti predmetov, da bi ugotovili in ocenjevanje pomembnih odnosov in interakcij med kazalniki teh lastnosti.
Specializacija vključuje predmete, ki se razlikujejo v njihovih lastnostih in na določen način, so v nekaterih pogledih med seboj povezani.Soočanje z izzivi na področju programiranja začne s študijo o predmetnem področju.
Specializacija - to je del realnega sveta, ki je neskončno in vsebuje tako pomembne in nepomembne podatke.Raziskovalec mora biti sposoben dodeliti precejšen del njih.Na primer, bo reševanje problema posojila, je treba upoštevati vse relevantne informacije o zasebnem življenju kupca (ali je delo z zakoncem, ali stranka prinaša mladoletnih otrok, izobraževanje, stranke, itd.)In da bi rešili druge naloge v zvezi z bančnimi dejavnostmi, bodo ti podatki zelo pomembni.Pomen podatkov je odvisna od tega, kaj bomo izbrali kot predmetnem področju.
Študija morali ustvariti model domene.Znanje iz različnih virov je treba formalizirati.Specializacija je formalizirano z vsemi sredstvi.Skladi so lahko zelo različni.To je lahko opis besedilo predmetnega področja ali specializirane grafično notacijo.Z vzorcem domene opisuje procese, ki potekajo v njem, kot tudi študij podatke na področju raziskav.
Izjava problem je tudi opis statičnega in dinamičnega obnašanja predmetov, ki jih raziskujejo.Opis statična obnašanje kažejo značilnosti predmetov in njihovih lastnosti.V opisu dinamičnega obnašanja objektov v vzrokov vedenja.
dinamično obnašanje objektov se pogosto opisuje skupaj s statično obnašanje.
Včasih analiza domene in naloga združene v enem koraku.
Pri prepoznavanju in analizi zahtev, podatki, ki so podatke za modeliranje, ki so potrebni za Data Mining.Da bi to naredili, bomo preučili vprašanja razdelitve uporabnikov;analitske lastnosti sistema;vprašanja dostopa do podatkov, potrebnih za analizo.
Specializacija analiz lažje in bolj učinkovito, če ima organizacija podatkovno skladišče.Vendar pa niso vsa podjetja imajo takšno podatkovno skladišče.V tem primeru je vir prvotne podatke je operativne baze podatkov, referenčna in arhivsko gradivo, ki je, podatki iz obstoječe IP (informacijski sistemi).
Več informacij bo morda potrebno od voditeljev ES, notranjih in zunanjih virov različnih papirnih dokumentov, kot tudi strokovnega znanja in / ali rezultati anket.
morajo zavedati tudi, da je treba v procesu razvijalcev programske opreme za pripravo podatkov opisati čim več dejavnikov, ki vplivajo na proces.Obstajajo lahko nekateri podatki kodiranje.Na primer, ena od značilnosti stranke - raven svojih dohodkov, kar se lahko opredeli kot: zelo nizka, je majhna, srednja, visoka, zelo visoka.V tem primeru je treba ugotoviti stopnjo stopnjevanje dohodkov.
Pri ugotavljanju pravo količino podatkov, ki se štejejo za naročanje podatkov.
V primeru, da se odredi, je treba ugotoviti, ali so vključeni v ta podatkih določenem sezonska / ciklična komponenta.Ko jih ne naloži, to je,niz dogodkov iz baze ni vezano na časovni premici, nato pa v času zbiranja morajo biti v skladu z naslednjimi pravili:
1) majhno število zapisov v zbirki podatkov je lahko vzrok za ustvarjanje neustreznega modela;
2) natančnost modela je mogoče izboljšati s povečanjem števila podatkov;
3) zastarele podatke je izključena iz niza;
4) algoritmi, ki se uporabljajo za ustvarjanje model z zelo velikimi bazami podatkov, bi morali imeti možnost, da lestvice.