Studii de specializare

Orice studiu este de a observa proprietățile obiectelor, în scopul de a determina și de evaluare a relațiilor semnificative și interacțiunile dintre indicatorii de aceste proprietăți.

Specializare include obiecte care diferă în proprietățile lor și într-un anumit fel sunt în unele privințe interconectate.A răspunde provocărilor în domeniul de programare începe cu un studiu al zonei subiect.

Specializarea - este parte din lumea reală, care este infinită și conține atât date importante și neimportante.Cercetătorul trebuie să fie în măsură să aloce o parte substanțială a ei.De exemplu, rezolvarea problemei a împrumutului, va fi considerată toate informațiile relevante despre viața privată a clientului (dacă există un lucru cu un soț, dacă un client aduce copii minori, educație, client, etc.).Și în scopul de a rezolva alte sarcini legate de activitățile bancare, aceste date vor fi destul de semnificative.Semnificația datelor depinde de ceea ce alegem ca un domeniu.

Studiul nevoie pentru a crea un model de domeniu.Cunoștințe din diferite surse trebuie să fie formalizată.Specializarea este formalizată prin orice mijloace.Fondurile pot fi foarte diferite.Acest lucru poate fi o descriere text a zonei subiect sau notație grafică de specialitate.Cu modelul de domeniu descrie procesele care au loc în ea, precum și studiază datele în domeniul cercetării.Declarația

a problemei este, de asemenea, descrierea comportamentului static și dinamic de obiecte pe care le investiga.Descrierea comportament static sugerează caracteristici ale obiectelor și proprietățile lor.În descrierea comportamentului dinamic de obiecte în cauzele de comportament.

comportamentul dinamic de obiecte este adesea descris împreună cu un comportament static.

Uneori analiza domeniu și sarcină sunt combinate într-un singur pas.

identificarea și analiza cerințelor privind datele făcute de date de modelare necesare pentru Data Mining.Pentru a face acest lucru, vom studia problemele legate de distribuția de utilizatori;Caracteristicile analitice ale sistemului;problemele de acces la datele necesare pentru analiza.

Specializare analize mai ușoară și mai eficientă atunci când organizația are un depozit de date.Cu toate acestea, nu toate companiile au un astfel de depozit de date.În acest caz, sursa de date originală este bazele de date operaționale, de referință și materialele de arhivă, care este, de date de la IP existente (sisteme informatice).

Mai multe informații pot fi necesare din partea liderilor CE, surse interne și externe ale diverselor documente de hârtie, precum și cunoștințe de specialitate și / sau rezultate ale sondajelor.

ar trebui să fie, de asemenea, conștienți de faptul că, în procesul de dezvoltatori de software de pregatire a datelor ar trebui să descrie cât mai mult posibil a factorilor care afectează procesul.Pot exista unele codificarea datelor.De exemplu, una dintre caracteristicile clientului - nivelul veniturilor sale, care pot fi definite ca: foarte scăzut, scăzut, mediu, ridicat, foarte ridicat.În acest caz, este necesar să se determine nivelul gradare a venit.

La determinarea dreptul de cantitatea de date care urmează să fie luate în considerare ordonarea datelor.

În cazul în care acestea sunt ordonate, este necesar pentru a afla dacă sunt incluse în set componentă sezonieră / ciclică aceste date.Atunci când acestea nu sunt ordonate, de exemplu,set de evenimente din baza de date nu este legată de cronologie, apoi în timpul colectării trebuie să respecte următoarele reguli:

1) un număr mic de inregistrari in baza de date poate fi cauza de crearea unui model inadecvat;

2) exactitatea modelului poate fi îmbunătățită prin creșterea numărului de date;

3) informații învechite este exclus din set;

4) algoritmi care sunt utilizate pentru a crea un model cu baze de date foarte mari, ar trebui să aibă capacitatea de a scala.