داده کاوی همان تکنیکی است که از آن برای کار با کلان داده ها استفاده می شود و در جهت استخراج اطلاعات مفید از حجم عظیمی از دیتا مورد استفاده قرار می گیرد. در این مطلب قصد داریم به صورت مفصل به داده کاوی بپردازیم و کتابی فوق العاده را برای برنامه نویسان در زمینه داده کاوی معرفی کنیم.
در عصری که روزانه صدها ترابایت داده در انواع مختلف توسط کاربران در حال تولید است، باید راه حلی برای کار با این داده ها و استفاده از آن ها در نظر گرفت. راه حلی که بتوان به کمک آن به مطالب و اطلاعاتی مفید از حجم بسیار زیادی دیتای پراکنده دست پیدا کرد و در علوم مختلف از این اطلاعات بهره برد. چرا که اگر نتوان از این داده ها استفاده کرد پس تولید آن ها نیز هیچ کاربردی نخواهد داشت و فقط هدر دادن سرمایه آن هم به مقدار بسیار زیاد است. این راه حل امروزه داده کاوی نام دارد.
همان طور که در پاراگراف پیشین گفتیم، حجم عظیم داده ها سبب شد تا تکنیکی با نام داده کاوی به وجود بیاید. پس بدون شک اولین نیاز برای دیتا ماینینگ وجود حجم بالای داده های تولیدی در یک سازمان است. این حجم عظیم داده ها با نام بیگ دیتا یا کلان داده شناخته می شود. اگر با مفهوم کلان داده آشنا نیستید، پیشنهاد می کنیم حتما پیش از مطالعه کامل این مطلب، کتاب کلان داده یا بیگ دیتا چیست؟ را مطالعه کنید.
داده کاوی تکنیکی برای کشف دانش در دنیای مدرن
حال که با کلان داده ها آشنا شدید، وقت آن است که به سراغ مفهوم داده کاوی برویم. واژه داده کاوی (به انگلیسی: Data Mining) به ترکیب روش هایی از علوم مختلف نظیر آمار، ریاضیات، کامپیوتر و… اشاره دارد که به منظور کشف اطلاعات کاربردی و مفید از حجم عظیمی از داده های خام و بدون دسته بندی می پردازد. در این تکنیک، متخصصان به دنبال یافتن الگوهای پنهان درون داده ها و همچنین یافتن روابط بین آن ها هستند. در واقع به طور کلی می توان گفت هدف این است که از داده های پراکنده و نامفهوم، به مجموعه ای منظم از اطلاعات قابل فهم و کاربردی دست پیدا کرد.
داده کاوی از دهه ۶۰ میلادی مطرح شد اما در آن زمان از طرف دانشمندان علم آمار تحت عناوین Data Fishing یا Data Dredging به معنای صید داده از حجم عظیمی از دیتا ها بدون در نظر گرفتن هر گونه روش مشخصی اشاره داشت. بعد ها که به علت رشد روز افزون آی تی و سیستم های کامپیوتری، سرعت رشد داده ها هم بسیار فراتر رفت و موجب شد تا حجم بسیار بیشتری از داده در پایگاه های داده انباشته شود، دانشمندان به فکر یافتن راهی بهتر و منطقی تر مطابق علوم قابل اثبات برای کار با داده ها افتادند که در دهه ۹۰ میلای این روش با عنوان داده کاوی معرفی شد. (داده کاوی – از صفر تا صد)
مطلب مرتبط: کتاب علم داده چیپست؟
داده کاوی برای پیش برد اهداف خود از علوم مختلف استفاده می کند، اغلب اوقات متخصصین از علوم مختلف گرد هم می آیند تا عمل داده کاوی را بر روی کلان داده ها انجام دهند. علومی نظیر ریاضیات و محاسبات عددی، آمار و احتمالات، کامپیوتر و… همین موضوع سبب شده تا برای انجام این کار نوع جدیدی از علم با نام علم داده به وجود آید. هدف از به وجود آمدن علم داده، پرورش متخصصینی است که به صورت اختصاصی بر روی روش های مربوط به کشف دانش و الگوهای معتبر از روی داده ها و عمل داده کاوی می پردازند.
به طور کلی سه دسته از افراد به دنبال استفاده از تکنیک های داده کاوی هستند. ریاضی دانان، آماردانان و دانشمندان علم آمار، متخصصین حوزه علوم کامپیوتر نظیر مهندسین هوش مصنوعی، متخصصین پایگاه داده و برنامه نویسان. در این مطلب قصد داریم به صورت اختصاصی به دسته متخصصین حوزه علوم کامپیوتر اشاره کنیم و به یادگیری دیتا ماینینگ برای این گروه بپردازیم.
از آنجایی که داده کاوی عملی زمان بر است، یکی از بهترین روش ها برای انجام این کار پیاده سازی سامانه های هوشمند می باشد که به سازمان ها کمک می کند تا بتوانند با هزینه های به مراتب پایین تر و به کمک تکنیک های هوش مصنوعی نظیر یادگیری ماشین و شبکه های عصبی، سیستم هایی را بسازند که بتوانند به صورت خودکار دیتا ماینینگ را در یک سازمان انجام دهند و به یادگیری دانش و اطلاعات جدید بپردازند. به همین دلیل افرادی که در حوزه علوم کامپیوتر فعالیت می کنند، یکی از مهمترین گروه های فعال علم داده هستند، از جمله مهندسین هوش مصنوعی و برنامه نویسان.
مطلب مرتبط: کتاب هوش مصنوعی سهراب جلوه گر
برنامه نویسان به عنوان فعالان اصلی توسعه سامانه های هوشمند شناخته می شوند و به صورت جدی در زمینه داده کاوی فعالیت می کنند. اگر شما هم برنامه نویس هستید و دوست دارید به یک متخصص علم داده تبدیل شوید، کتابی که در ادامه معرفی می کنیم، را به هیج عنوان از دست ندهید. این کتاب هر آنچه که یک برنامه نویس برای تبدیل شدن به یک متخصص حوزه داده کاوی نیاز دارد را در اختیارش قرار می دهد.
کتاب داده کاوی برای برنامه نویسان تالیف ران زاچارسکی و ترجمه مسعود کاویانی بهترین و کامل ترین منبع فارسی زبان برای یادگیری داده کاوی است. در این کتاب برنامه نویس با صفر تا صد علم داده و روش های Data Mining آشنا می شود. دانش ریاضیات مورد نیاز در این تکنیک را می آموزد، الگوهای مدل سازی داده ها را فرا می گیرد و در نهایت با نحوه به کار گیری این موارد به کشف دانش از داده های خام می پردازد. کتاب فوق توسط نویسنده و وبسایت چیستیو به رایگان در اختیار برنامه نویسان قرار گرفته است. پس اگر دوست دارید به کمک این کتاب به یک داده کاو تبدیل شوید، فقط کافیست دانش برنامه نویسی خود را تقویت کنید و سپس مطالعه این کتاب را شروع کنید.
فهرست مطالب کتاب داده کاوی برای برنامه نویسان:
- مقدمه
- سیستم های توصیه گر
- پایش براساس اقلام
- طبقه بندی
- کمی بیشتر در مورد طبقه بندی
- بیز ساده
- پردازش متون بدون ساختار
- خوشه بندی
برای دانلود رایگان این کتاب به انتهای پست مراجعه کنید. اگر پیشنهاد یا انتقادی در خصوص این کتاب دارید می توانید از طریق بخش دیدگاه ها در همین مطلب و صفحات اجتماعی وبسایت، با ما در میان بگذارید. کتاب داده کاوی برای برنامه نویسان را برای دوستان برنامه نویس خود ارسال کنید.
نظرات کاربران