כל מחקר הוא לבחון את המאפיינים של אובייקטים על מנת לקבוע והערכה של מערכות יחסים משמעותיות ואינטראקציות בין אינדיקטורים של נכסים אלה.
התמחות כוללת אובייקטים שונים בתכונותיהם ובדרך מסוימת הם במובנים מסוימים קשורים.עמידה באתגרים בתחום של תכנות מתחילה במחקר של אזור הנושא.
התמחות - זה חלק מהעולם האמיתי, שהוא אינסופי ומכיל שני נתונים חשובים ולא חשובים.החוקר חייב להיות מסוגל להקצות חלק ניכר מהם.לדוגמא, פתרון הבעיה של ההלוואה, ייחשב כל המידע הרלוונטי אודות חייו הפרטיים של הלקוח (אם יש עבודה עם בן זוג, אם לקוח מביא ילדי קטינים, חינוך, לקוחות, וכו ').ועל מנת לפתור את משימות אחרות הקשורות לפעילות בנקאית, נתונים כזה יהיו משמעותיים למדי.המשמעות של הנתונים תלויים במה שאנו בוחרים כאזור נושא.
המחקר צריך ליצור מודל מושלם.ידע ממקורות שונים צריך להיות באופן רשמי.התמחות מעוגנת באמצעות כל אמצעי.קרנות עשויות להיות שונות מאוד.זה יכול להיות תיאור טקסט של אזור הנושא או סימון גרפי מיוחד.עם המודל המושלם מתאר את התהליכים המתרחשים בו, כמו גם ללמוד את הנתונים בשטח של מחקר.הצהרת
של הבעיה היא גם התיאור של ההתנהגות סטטית ודינמית של אובייקטים שאנו חוקרים.התנהגות סטטית תיאור מרמזת מאפיינים של אובייקטים והמאפיינים שלהם.בתיאור של ההתנהגות הדינמית של אובייקטים בגורמים להתנהגות.התנהגות דינמית
של אובייקטים מתוארים לעתים קרובות יחד עם התנהגות סטטית.
לפעמים ניתוח ומשימת תחום משולבים בצעד אחד.
בזיהוי וניתוח דרישות נתונים שנעשו נתונים דוגמנות דרושים לData Mining.כדי לעשות זאת, אנחנו לומדים סוגיות של ההפצה של משתמשים;מאפייני אנליטיות של המערכת;סוגיות של גישה לנתונים הנדרשים לניתוח.
התמחות ניתוחים קלה יותר ויעילה יותר כאשר הארגון יש מחסן הנתונים.עם זאת, לא כל חברות כגון מחסן נתונים.במקרה זה, המקור לנתונים מקוריים הוא מסדי נתונים תפעוליים, ההתייחסות וחומרי ארכיון, כלומר, נתונים מIP הקיים (מערכות מידע).מידע נוסף עשוי להיות נחוץ
ממנהיגי EC, מקורות פנימיים וחיצוניים של מסמכי נייר שונים, כמו גם ידע מקצועי ו / או תוצאות של הסקרים.
צריך גם להיות מודע לכך בתהליך של מפתחי תוכנת הכנת נתונים צריכים לתאר עד כמה שניתן את הגורמים המשפיעים על התהליך.ייתכנו כמה קידוד הנתונים.לדוגמא, אחד ממאפייניו של הלקוח - רמת ההכנסה שלו, אשר יכול להיות מוגדרים כ: נמוך מאוד, נמוך, בינוני, גבוה, גבוה מאוד.במקרה זה, יש צורך לקבוע את רמת ההדרגתיות של הכנסה.
בקביעת הכמות הנכונה של נתונים כדי להיחשב הזמנת נתונים.
במקרה שהם הזמינו, יש צורך לברר אם נכלל בנתונים אלה נקבעו מרכיב עונתי / מחזורי.כשהם לא מסודרות, כלומר,סט של אירועים מבסיס הנתונים אינו צמוד לציר הזמן, ולאחר מכן בקורס של אוסף חייב לציית לכללים הבאים: מספר קטן של רשומות במסד הנתונים
1) יכול להיות הגורם ליצירת מודל מספק;ניתן לשפר
2) את הדיוק של המודל על ידי הגדלת מספר נתונים;
3 מידע) מיושן אינו נכלל בסט;
4) אלגוריתמים המשמשים ליצירת מודל עם מסדי נתונים גדולים מאוד, צריכים את היכולת לשנות את קנה מידה.