دپارتمان داده کاوی

معرفی داده کاوی

برای آشنایی بیشتر با فعالیت های این دپارتمان می توانید به وبسایت گروه داده کاوی صدرا از طریق همین لینک مراجعه نمائید.

داده‌کاوی به انگلیسیData Mining   به مفهوم استخراج اطلاعات نهان و یا الگوها و روابط مشخص در حجم زیادی از داده‌ها در یک یا چند بانک اطلاعاتی بزرگ است. بسیاری از شرکت‌ها و موسسات دارای حجم انبوهی از اطلاعات هستند. تکنیک‌های داده‌کاوی به طور تاریخی به گونه‌ای گسترش یافته‌اند که به سادگی می‌توان آنها را بر ابزارهای نرم‌افزاری و … امروزی تطبیق داده و از اطلاعات جمع‌آوری شده بهترین بهره را برد.

در صورتی که سیستم‌های داده‌کاوی بر روی سکوهای Client/Server قوی نصب شده باشد و دسترسی به بانک‌های اطلاعاتی بزرگ فراهم باشد، می‌توان به سوالاتی از قبیل :کدامیک از مشتریان ممکن است خریدار کدامیک از محصولات آینده شرکت باشند، چرا، در کدام مقطع زمانی و بسیاری از موارد مشابه پاسخ داد.

موفقیت داده کاوی در گرو بهره‌گیری از کارشناسان فنی و تحلیل گران کار آزموده‌ای است که از توانایی کافی برای طبقه‌بندی تحلیل‌ها و تغییر آنها برخوردار هستند.

بهره‌برداری از داده کاوی در دو بخش دولتی و بخش خصوصی رو به گسترش است. صنایعی چون بانکداری، بیمه، بهداشت و بازاریابی آنرا عموماً برای کاهش هزینه‌ها، ارتقاء کیفی پژوهش‌ها و بالاتر بردن میزان فروش به کار می‌برند.

کاوش در داده‌ها بخشی بزرگ از سامانه‌های هوشمند است. سامانه‌های هوشمند زیر شاخه‌ای بزرگ و پرکاربرد از زمینه علمی جدید و پهناور یادگیری ماشینی هستند که خود زمینه‌ای در هوش مصنوعی است.

داده کاوی منحصر به گردآوری و مدیریت داده‌ها نبوده و تجزیه و تحلیل اطلاعات و پیش بینی را نیز شامل می‌شود.

داده کاوی مرحله‌ای در روند کشف دانش در پایگاه داده‌ها براساس الگوی هرم داتش ذیل می‌باشد.

مراحل دیگر در روند سا خت سیستم های مدیریت اطلاعات  به صورت تصاعدی شامل، پاکسازی داده، انتخاب داده، انتقال داده، داده کاوی، الگوی ارزیابی، و عرضه دانش می‌باشد. بسیاری از پیشرفت‌ها در تکنولوژی و فرایندهای تجاری بر رشد علاقه‌مندی به داده کاوی در بخش‌های خصوصی و عمومی سهمی داشته‌اند.

کاربردهای داده کاوی

کاربردهایی که برای داده کاوی وجود دارند، بسیار بسیار گسترده اند و ما در این نوشتار، فقط امکان معرفی تعداد محدودی از آن ها را داریم. به عنوان مثال های بیشتر، می توان به کاربردهای داده کاوی در زمینه های زیر اشاره کرد:

    سیستم های مدیریتی، مثلا مدیریت ارتباط با مشتریان یا CRM

    نرم افزارهای امنیتی، مثلا نرم افزاری مانیتورینگ شبکه و ویروس کش ها

    سیستم های بانکی، مثلا تخصیص اعتبار به مشتریان و طبقه بندی آن ها

    مالی و اقتصادی، مثلا پیش بینی قیمت یک یا چند سهام یا شاخص

    برنامه ریزی و مکان یابی، مثلا چینش داخلی فروشگاه های بزرگ و یا تخصیص امکانات شهری

    علوم پزشکی، مثلا پیش بینی خطرات احتمالی ناشی از یک عمل جراحی خاص

    علوم اجتماعی و سیاسی، مثلا پیش بینی یا تحلیل نتایج انتخابات

خدمات ما در حوزه داده کاوی

انجام پروژه های داده کاوی (Data Mining) در زمینه های

طراحی و پیاده سازی سیستم های مدیریت و مستند سازی داده ها

رده بندی (Classification)

خوشه بندی (Clustering)

پیش بینی (Prediction)

متن کاوی(Text mining)

انتخاب ویژگی (Feature Selection)

قواعد انجمنی (Association Rules)

با استفاده از تکنیک های ذیل

شبکه عصبی مصنوعی(ANN)

شبکه های عصبی فازی (ANFIS)

سری های زمانی

رگرسیون خطی، غیر خطی، تک و چند متغیره و رگرسیون لجستیک

درخت تصمیم با شاخص جینی و آنتروپی

بگینگ و بوستینگ

ماشین بردار پشتیبان

سیستم استنباط بیزین

الگوریتم ژنتیک , ازدحام ذرات

الگوریتم های فراابتکاری

قواعد همسایگی با fp-growth, apriory

تحلیل نتایج با رسم نمودار Roc

انواع مختلف روش های انتخاب ویژگی:شاخص ریلیف، ازدحام ذرات،شاخص جینی و …

انواع روش های نمونه برداری و بیش نمونه گیری

روش های حل مشکل رده نامتوازن

تشخیص داده پرت

تشخیص داده پرت محلی

با استفاده از نرم افزارهای

IBM SPSS Modeler

رپیدماینر

 وکا

R

پایتون

SAS