wszelkie badania jest obserwacja właściwości obiektów w celu określenia i oceny znaczącej relacji i interakcji pomiędzy wskaźnikami tych właściwości.
Specjalizacja obejmuje przedmioty, które różnią się właściwościami i w pewien sposób są w niektórych aspektach, połączonych.Sprostać wyzwaniom w dziedzinie programowania rozpoczyna się badaniu dziedzinie.
Specjalizacja - to część realnego świata, który jest nieskończony i zawiera zarówno ważnych i nieważnych danych.Badacz powinien być w stanie przydzielać znaczną część z nich.Na przykład, rozwiązująca problem kredytu, będą brane pod uwagę wszystkie istotne informacje na temat życia prywatnego klienta (czy jest to praca z małżonkiem, czy klient przynosi małoletnie dzieci, wykształcenie, klienta, etc.).Oraz w celu rozwiązania innych zadań związanych z działalnością bankową, dane te będą dość znaczące.Znaczenie danych zależy od tego, co wybrać jako obszaru tematycznego.
Badanie należy utworzyć model domeny.Wiedza z różnych źródeł powinny być sformalizowane.Specjalizacja jest sformalizowana poprzez dowolny sposób.Fundusze mogą być bardzo różne.To może być tekstowy opis tematyki lub specjalistycznej notacji graficznej.Z modelu domeny opisuje procesy, które odbywają się w nim, a także studia dane w obszarze badań.Oświadczenie
problemu jest także opis statyczne i dynamiczne zachowanie obiektów, które badamy.Opis sugeruje zachowanie właściwości statycznych obiektów i ich właściwości.W opisie dynamiczną obiektów przyczyn zachowania.
dynamiczne zachowanie obiektów jest często opisywany wraz z zachowania statycznego.
Czasami analiza domeny i zadania są połączone w jednym kroku.
w identyfikacji i analizy potrzeb modelowania danych dokonanych dane potrzebne do eksploracji danych.Aby to zrobić, badamy kwestie podziału użytkowników;analityczne cechy systemu;Problemy z dostępem do danych potrzebnych do analizy.
Specjalizacja analizuje łatwiejsze i bardziej skuteczne, gdy organizacja ma hurtownię danych.Jednak nie wszystkie firmy mają taki hurtowni danych.W tym przypadku źródłem oryginalnej bazy danych jest roboczą, odnośniki i materiały archiwalne, czyli danych z istniejącego adresu IP (systemy informatyczne).
Więcej informacji mogą być potrzebne z liderów WE, źródeł wewnętrznych i zewnętrznych z różnych dokumentów papierowych, jak również specjalistycznej wiedzy i / lub wyniki sondaży.
powinni mieć świadomość, że w procesie programistów przygotowujących dane powinny opisać jak najwięcej czynników, które wpływają na proces.Nie mogą być pewne kodowania danych.Na przykład, jedna z cech klienta - poziom jego dochodów, które mogą być określone jako: bardzo niska, niska, średnia, wysoka, bardzo wysoka.W tym przypadku, konieczne jest określenie poziomu gradacji dochodu.
Przy ustalaniu odpowiedniej ilości danych, aby uznać dane do zamówienia.
W przypadku, gdy są one uporządkowanego, konieczne jest, aby dowiedzieć się, czy zawarte w danych określonym składnikiem sezonowy / cykliczny.Gdy nie są one zamawiane, czylizbiór zdarzeń z bazy danych nie jest powiązana z osi czasu, a następnie w trakcie zbierania muszą być zgodne z następującymi zasadami:
1) mała liczba rekordów w bazie danych może być przyczyną powstania nieodpowiedniego modelu;
2) Dokładność modelu można poprawić przez zwiększenie ilości danych;
3) nieaktualne informacje są wyłączone z zestawu;
4) algorytmy, które są używane do tworzenia modelu z bardzo dużych baz danych, powinna mieć możliwość skalowania.