داده کاوی یا دیتا ماینینگ چیست و چه کاربردهایی دارد؟

داده کاوی (Data Mining) اصطلاحی است که در سال ۱۹۹۶ مطرح شد و از آن زمان به بعد شرکتها شروع به وارد کردن اطلاعات در دیتابیسهای کردند، با پیشرفتهای گسترده در زمینه فناوری اطلاعات و گسترش استفاده از اینترنت و خرید اینترنتی، داده کاوی نیز جای خود را میان دیگر علوم باز کرد تا جایی که در حال حاضر بسیاری از شرکتهای بزرگ مانند گوگل، اپل، آمازون و … از روشهای دیتا ماینینگ استفاده میکنند. در سال ۲۰۰۱، از آنجایی که علوم کامپیوتر (Computer science) و داده کاوی (Data mining) یک روند را طی میکردند و بسیار به هم وابسته شده بودند، کلمه علوم داده (Data science) متولد شد.
داده کاوی چیست؟
داده کاوی یکی از روشهای تحلیل پیشرفته است که با استفاده مجموعهای از فناوریها، الگوریتمها و مدلهای ریاضی پیشرفته به منظور استخراج و استفاده از دادههای بزرگ بانکهای اطلاعاتی ایجاد شده است. از داده کاوی برای شناسایی و یادگیری الگوها و روندهای کسبوکار میتوان استفاده کرد؛ اما این استفاده چگونه است؟ یک شرکت بزرگ مانند دی جی کالا را در نظر بگیرید که دادههای زیادی در خصوص هر خریدار، علایق وی، میزان خرید هر سال، هر ماه، در زمان تخفیفهای آخر فصل و … را در یک دیتابیس گرد آورده است. حالا این شرکت قصد دارد برای توسعه کسب و کار یک انبار پخش جدید در یکی از شهرها راهاندازی کند، داده کاوی میتواند به در این راه به این شرکت کمک زیادی کند. اینکه کدام شهر بهترین گزینه است، بیشترین خریداران از کدام شهر است و … پرسشهایی هستند که میتوان آنها را از طریق داده کاوی استخراج کرد.
دیتا ماینینگ در چه حوزههایی کاربرد دارد؟
همانطور که گفته شد، داده کاوی یا دیتا ماینینگ در بسیار از حوزهها مانند تشخیص صدا در گوشیهای هوشمندها و انواع درهای امنیتی، خودروهای خودران، تشخیص چهره، تشخیص اشیاء و … کاربرد زیادی دارد. به طور کلی دیتا ماینینگ در جاهایی که نمیتوان از علم ریاضی خشک و سخت استفاده کرد، کاربرد دارد. علم داده گسترهی فراوانی از کارها را در برمیگیرد؛ مثلاً در بازار سرمایه و در بورس کاربرد زیادی دارد.
آیا از داده کاوی میتوان در زمینه سرمایه گذاری در بازار مسکن استفاده کرد؟
پاسخ این پرسش مثبت است. در کشورهای توسعه یافته، بازار مسکن در بورس به رقابت با سایر بازارها راه پیدا کرده است و مانند هر شرکت دیگری، شرکتهای بزرگ ساختمان سازی، دادههای خود را در اختیار شرکت بورس قرار میدهند و خریداران با ارزیابی آمارها به خرید اوراق میپردازند. حال که در ایران داده تجمیع شدهای از بازار مسکن وجود ندارد و از آنجایی که این بازار در بورس حضور ندارد، نمیتوان مانند کشورهای پیشرفته از اطلاعات و آمارها استفاده کرد ولی امری غیر ممکن به نظر نمیرسد.
یکی از راههای داده کاوی بازار مسکن را میتوان خرید اطلاعات از نرم افزارهای ارائه کننده مسکن و استخراج آمار از آنها دانست. با دانستن اینکه افراد تمایل دارند خانههایی با چه متراژهایی در چه مناطقی را خریداری کنند، سودآوری ساخت و اجاره مسکن در چه منطقهای بهتر است و ساخت و فروش مسکن در چه منطقه ای به سودآوری بیشتر میانجامد. همچنین با خرید اطلاعات از سازمانهای مربوط به مسکن مانند شهرداریها و صنف املاک میتوان به موضوعاتی مانند در چه بازههای زمانی خرید و فروش مسکن افزایش پیدا میکند و بازار مسکن با رونق مواجه میشود و یا در چه بازههای زمانی رونق بازار کم است و خرید و فروش با رکود مواجه میشود، با مقایسههای بازههای زمانی با اتفاقات مهمی که در جامعه رخ داده است میتوان به محرکهای رونق بازار مسکن پی برد و به خرید پیش از موعد و سود بیشتر رسید.
سخن آخر
با توجه به اینکه پیشرفت علم داده کاوی به میزان داده بستگی زیادی دارد و هر چه میزان داده ورودی بیشتر باشد بهتر میتوان به پیش بینی و عکس العمل پرداخت. علاوه بر این علم داده در ایران علم تازهای است و شرکتهای فناوری اطلاعات جز اولین شرکتهایی هستند که به این علم ورود پیدا میکنند. به نظر میرسد رسیدن به یک تجمیع و استفاده از دادههای موجود و استخراج آنها و در نهایت دستیابی به اهداف مورد نظر راه درازی در پیش است ولی این هدف دور از دسترس نیست.