Studier Spesialisering

Enhver studien er å observere egenskapene til objekter for å bestemme og evaluering av meningsfulle relasjoner og interaksjoner mellom indikatorer på disse eiendommene.

Spesialisering omfatter gjenstander som varierer i sine egenskaper og på en bestemt måte er i noen henseender sammenkoblet.Møte utfordringene innen programmering begynner med en studie av fagområdet.

Spesialisering - det er en del av den virkelige verden, som er uendelig og inneholder både viktige og uviktige data.Forskeren må være i stand til å allokere en vesentlig del av dem.For eksempel å løse problemet med lånet, vil bli vurdert all relevant informasjon om privatlivet til kunden (om det er et arbeid med en ektefelle, om en kunde bringer mindreårige barn, utdanning, kunde, etc.).Og for å løse andre oppgaver knyttet til bankvirksomhet, vil slike data være ganske betydelig.Signifikansen av dataene er avhengig av hva vi velger som fagområde.

Studien må opprette et domene modell.Kunnskap fra ulike kilder bør formaliseres.Spesialisering er formalisert ved hjelp av noen som helst måte.Midler kan være svært forskjellige.Dette kan være en tekstbeskrivelse av fagområde eller spesialiserte grafisk notasjon.Med domenemodellen beskriver prosesser som foregår i det, så vel som studerer data på området forskning.

Uttalelse av problemet er også beskrivelsen av statiske og dynamiske egenskapene til objekter som vi undersøker.Beskrivelse statisk oppførsel tyder karakteristikker av objekter og deres egenskaper.I beskrivelsen av de dynamiske egenskapene til objekter i årsakene til atferd.

dynamisk oppførsel av objekter beskrives ofte sammen med statisk oppførsel.

Noen ganger domene analyse og oppgaven er kombinert i ett trinn.

Ved å identifisere og analysere kravene data laget modellerings data som trengs for Data Mining.For å gjøre dette, vi studere spørsmål om fordeling av brukere;analytiske egenskapene til systemet;spørsmål om tilgang til de dataene som trengs for analyse.

Spesialisering analyser enklere og mer effektiv når organisasjonen har et datavarehus.Men ikke alle selskaper har en slik datavarehus.I dette tilfellet er kilden for opprinnelige dataene den operative databaser, referanse og arkivmateriale, det vil si data fra eksisterende IP (informasjonssystemer).

Mer informasjon kan være nødvendig fra EF-ledere, interne og eksterne kilder til ulike papirdokumenter, samt spesialist kunnskap og / eller resultatene av meningsmålingene.

bør også være klar over at i prosessen med data forberedelse programvareutviklere skal beskrive så mye som mulig de faktorene som påvirker prosessen.Det kan være noen datakoding.For eksempel, en av karakteristikkene av klienten - nivået på inntekten hans, som kan defineres som: svært lav, lav, middels, høy, veldig høy.I dette tilfelle er det nødvendig å bestemme graderingen inntektsnivå.

Ved fastsettelse av riktig mengde data som skal vurderes bestiller data.

I det tilfelle at de er ordnet, er det nødvendig å finne ut hvorvidt som inngår i dette datasett sesong / syklisk komponent.Når de ikke er bestilt, dvs.sett av hendelser fra databasen ikke er knyttet til tidslinjen, så i løpet av samlingen må være i samsvar med følgende regler:

1) et lite antall poster i databasen kan være årsaken til opprettelsen av en utilstrekkelig modell;

2) nøyaktigheten av modellen kan forbedres ved å øke antallet av data;

3) utdatert informasjon er utelukket fra settet;

4) algoritmer som brukes til å lage en modell med meget store databaser, bør ha evnen til å skalere.