داده کاوی را اگر بخواهیم به زبان ساده تعریف کنیم همان استفاده استخراج اطلاعات پنهان و یا روشها و روابط نهان در حجم زیادی از دادهها است . Data Mining یا همان داده کاوی که ترجمه تحت اللفظی آن کاویدن داده ها است .کلمه ” Mining ” اصطلاحی است که برای استخراج از معدن استفاده شده است، داده کاوی به ما نشان میدهند که اطلاعات همچون معادنی حاوی دادههای ارزشمند هستند که باید آن ها را استخراج کنیم.
داده کاوی بخش کلیدی تجزیه و تحلیل داده به طور کلی و یکی از رشته های اصلی در علم داده است که از تکنیک های تجزیه و تحلیل پیشرفته برای یافتن اطلاعات مفید در مجموعه داده ها استفاده می کند. در یک سطح جزئی تر، داده کاوی گامی در فرآیند کشف دانش در پایگاه های داده (KDD) است، یک روش علم داده برای جمع آوری، پردازش و تجزیه و تحلیل داده ها. داده کاوی و KDD گاهی اوقات به جای هم نامیده می شوند، اما معمولاً به عنوان چیزهای متمایز دیده می شوند.
امروزه داده کاوی به عنوان یک روش جدید برای نظم دادن به پایگاه های بزرگ و در حال افزایش داده ها ظهور پیدا کرده است. در دنیای امروزی حتی در کارهای ساده ای مانند تلفن زدن، استفاده از کارت های اعتباری یا خریدهای روزانه، جای پای تکنولوژی های مدرن دیده می شود. افزایش آزمایش ها در تمام زمینههای علمی و ثبت نتایج آن باعث ذخیره انبوه داده ها به حجم چندین پتابایت (هزار ترابایت) شده است.
دستگاه های جمع آوری اتوماتیک داده که در کسب و کار امروزی مورد استفاده قرار میگیرند توانایی تولید ترابایت (هزار گیگا بایت) داده در ساعت را دارند. داده کاوی به دنبال نیاز به دستکاری انبار داده بوجود آمد تا الگوهایی منطقی از داده ها بدست آورد که ممکن است برای مدیریت سازمان یا شرکت تولید کننده داده مفید باشد. این الگو میتواند یک خلاصه سازی ساده از داده، طبقه بندی داده و یا مدل مربوط به آن باشد.
امروزه اکثر سازمان ها از لحاظ داده ها بسیار غنی می باشند، چرا که آنها حجم عظیم و روز افزون داده ها را ذخیره نموده اند. عموما سازمان ها از این کوه داده ها برای ارایه آمار و گزارش استفاده می کنند. داده کاوی فرآیند استخراج دانش از داده ها می باشد. این امر از طریق کشف الگوهای موجود در داده ها انجام میگیرد. در واقع داده کاوی به عنوان روشی جهت پشتیبانی تصمیم گیری مبتنی بر کامپیوتر، فناوری جدیدی نیست. بلکه با گرفتن الکوریتم های زیادی از آمار، هوش مصنوعی و سایر زمینه ها، کاری جدید را انجام میدهد.
نقطه تحول الگوریتم های داده کاوی نیستند، بلکه ایده استخراج دانش به طور خودکار از پایگاه های بزرگ داده است. این مطلب در کنار این مساله بسیار حائز اهمیت میشود که امروزه حجم عظیمی از داده های خوب و پاکسازی شده در سازمان ها وجود دارد و راهکارهای موثری در بستر فناوری اطلاعات، هم در توانایی انبارش و هم در پردازش به وجود آمده است. اگر چه هنوز اجرای کشف دانش از پایگاه های داده به طور کاملا خودکار، راهی طولانی تا وضعیت ایده آل در پیش دارد، اما این مفهوم جدید و تلاشهای تحقیقاتی انجام شده در مورد آن، فرصتی را خلق میکند تا در حوزه تصمیمگیری کامپیوتر مبنا تحولی عظیم در آینده رخ دهد.







