Jede Studie ist es, die Eigenschaften der Objekte um festzustellen, und die Bewertung von sinnvollen Beziehungen und Interaktionen zwischen den Indikatoren dieser Eigenschaften zu beobachten.
Spezialisierung enthält Objekte, die in ihren Eigenschaften und in einer bestimmten Weise zu unterscheiden, werden in einigen Punkten verbunden sind.Bewältigung der Herausforderungen im Bereich der Programmierung beginnt mit einer Studie des Fachgebiets.
Spezialisierung - es ist Teil der realen Welt, die unendlich ist, und enthält sowohl wichtige und unwichtige Daten.Der Forscher muss in der Lage, einen erheblichen Teil von ihnen zuzuordnen.Zum Beispiel, die Lösung des Problems des Darlehens, werden berücksichtigt alle relevanten Informationen über das Privatleben des Kunden (ob es sich um ein Werk mit einem Ehepartner, ob ein Kunde bringt minderjährigen Kinder, Bildung, Kunden, etc.).Und um andere Aufgaben zu Banking-Aktivitäten zu lösen, werden solche Daten ganz erheblich sein.Die Bedeutung der Daten hängt davon ab, was wir als Fachgebiet zu wählen.
Die Studie muss eine Domain-Modell zu erstellen.Wissen aus verschiedenen Quellen sollte formalisiert werden.Spezialisierung wird durch irgendwelche Mittel formalisiert.Fonds können sehr unterschiedlich sein.Dies kann eine Textbeschreibung des Fachgebiets oder spezielle grafische Notation sein.Mit dem Domain-Modell beschreibt die Prozesse, die in es auf dem Gebiet der Forschung zu nehmen, als auch studieren die Daten.
Problemstellung ist auch die Beschreibung des statischen und dynamischen Verhaltens der Objekte, die wir erforschen.Beschreibung statische Verhalten deutet Eigenschaften von Objekten und deren Eigenschaften.In der Beschreibung des dynamischen Verhaltens von Objekten in den Ursachen des Verhaltens.
dynamische Verhalten von Objekten wird oft zusammen mit statischem Verhalten beschrieben.
Manchmal Bereichsanalyse und Aufgaben werden in einem Schritt zusammengefasst.
identifiziert und analysiert die Datenanforderungen gestellt Modellierungsdaten für Data Mining benötigt.Dazu untersuchen wir Fragen der Verteilung von Benutzern;analytischen Eigenschaften des Systems;Fragen der Zugriff auf die für die Analyse benötigt werden.
Spezialisierung Analysen einfacher und effektiver, wenn die Organisation über ein Data Warehouse.Allerdings sind nicht alle Unternehmen haben wie ein Data Warehouse.In diesem Fall ist die Quelle für die ursprünglichen Daten der Betriebsdatenbanken, Referenz- und Archivalien, das heißt, Daten aus bestehenden IP (Informationssysteme).
Mehr Informationen können von den EG-Führern, internen und externen Quellen von verschiedenen Papierdokumente sowie Fachkenntnisse und / oder Ergebnisse der Abstimmungen notwendig sein.
sollte auch bewusst sein, dass in den Prozess der Datenaufbereitung Softwareentwickler sollten so weit wie möglich die Faktoren, die den Prozess beeinflussen zu beschreiben.Es kann einige Datencodierung ist.Zum Beispiel eines der Merkmale des Kunden - die Höhe seines Einkommens, die wie folgt definiert werden kann: sehr niedrig, niedrig, mittel, hoch, sehr hoch.In diesem Fall ist es notwendig, die Gradationspegel von Einkommen bestimmen.
Bei der Bestimmung der richtigen Menge an Daten, die als Bestelldaten werden.
den Fall, dass sie bestellt werden, ist es notwendig, um herauszufinden, ob in diesem Datensatz Saison / zyklische Komponente enthalten zu finden.Wenn sie nicht bestellt werden, das heißt,Reihe von Ereignissen aus der Datenbank ist nicht auf der Timeline dann im Zuge der Sammlung verbunden sind, müssen den folgenden Regeln entsprechen:
1) eine kleine Anzahl von Datensätzen in der Datenbank kann die Ursache für die Schaffung einer unzureichenden Modell sein;
2) die Genauigkeit des Modells kann durch Erhöhung der Anzahl der Daten verbessert werden;
3) mehr aktuelle Informationen aus dem Satz ausgeschlossen;
4) Algorithmen, die verwendet werden, um ein Modell mit sehr großen Datenbanken zu schaffen, sollten die Fähigkeit haben, zu skalieren.