Studi Spesialisasi

Setiap studi adalah untuk mengamati sifat-sifat benda-benda untuk menentukan dan evaluasi hubungan yang bermakna dan interaksi antara indikator dari sifat ini.

Spesialisasi meliputi objek yang berbeda dalam sifat-sifat mereka dan dalam cara tertentu dalam beberapa hal saling berhubungan.Memenuhi tantangan di bidang pemrograman dimulai dengan studi tentang subyek.

Spesialisasi - itu bagian dari dunia nyata, yang tak terbatas dan berisi baik data penting dan tidak penting.Peneliti harus mampu mengalokasikan sebagian besar dari mereka.Misalnya, memecahkan masalah pinjaman, akan dipertimbangkan semua informasi yang relevan tentang kehidupan pribadi dari pelanggan (apakah ada pekerjaan dengan pasangan, apakah pelanggan membawa anak-anak kecil, pendidikan, pelanggan, dll).Dan untuk menyelesaikan tugas-tugas lain yang berkaitan dengan kegiatan perbankan, data tersebut akan cukup signifikan.Pentingnya data tergantung pada apa yang kita pilih sebagai subyek.

Penelitian perlu membuat model domain.Pengetahuan dari sumber yang berbeda harus diformalkan.Spesialisasi ini diformalkan melalui cara apapun.Dana mungkin sangat berbeda.Ini bisa menjadi deskripsi teks dari area subyek atau notasi grafis khusus.Dengan model domain menggambarkan proses yang terjadi di dalamnya, serta mempelajari data di daerah penelitian.

Pernyataan masalah juga deskripsi perilaku statis dan dinamis dari benda-benda yang kita menyelidiki.Deskripsi perilaku statis menunjukkan karakteristik objek dan sifat mereka.Dalam deskripsi perilaku dinamis dari benda-benda di penyebab perilaku.

perilaku dinamis dari benda-benda yang sering digambarkan bersama-sama dengan perilaku statis.

Terkadang analisis domain dan tugas digabungkan dalam satu langkah.

Pada mengidentifikasi dan menganalisis kebutuhan data dibuat pemodelan data yang diperlukan untuk Data Mining.Untuk melakukan hal ini, kita mempelajari masalah distribusi pengguna;Karakteristik analisis sistem;masalah akses ke data yang dibutuhkan untuk analisis.

Spesialisasi analisis lebih mudah dan lebih efektif bila organisasi memiliki data warehouse.Namun, tidak semua perusahaan memiliki sebuah gudang data.Dalam hal ini, sumber data aslinya adalah database operasional, referensi dan bahan arsip, yaitu, data dari IP yang ada (sistem informasi).

Informasi lebih lanjut mungkin diperlukan dari pemimpin EC, sumber internal dan eksternal dari berbagai dokumen kertas, serta pengetahuan spesialis dan / atau hasil jajak pendapat.

juga harus menyadari bahwa dalam proses pengembang perangkat lunak persiapan data harus menjelaskan sebanyak mungkin faktor-faktor yang mempengaruhi proses.Mungkin ada beberapa encoding data.Sebagai contoh, salah satu karakteristik dari klien - tingkat pendapatan, yang dapat didefinisikan sebagai: sangat rendah, rendah, sedang, tinggi, sangat tinggi.Dalam hal ini, perlu untuk mengetahui tingkat gradasi pendapatan.

Dalam menentukan jumlah yang tepat dari data yang dianggap data pemesanan.

Dalam hal bahwa mereka diperintahkan, perlu untuk mengetahui apakah termasuk dalam data ini diatur musiman / siklus komponen.Ketika mereka tidak memerintahkan, yaitu,rangkaian peristiwa dari database tidak terkait dengan timeline, kemudian dalam perjalanan koleksi harus sesuai dengan aturan berikut:

1) sejumlah kecil catatan dalam database dapat menjadi penyebab penciptaan model yang tidak memadai;

2) akurasi model dapat ditingkatkan dengan meningkatkan jumlah data;

3) informasi usang dikecualikan dari set;

4) algoritma yang digunakan untuk membuat model dengan database yang sangat besar, harus memiliki kemampuan untuk skala.