موضوعی که جدیدا در حال تحقیق روی اون هستم بحث تعامل بین داده کاوی و رایانش ابری است . دو تکنولوژی جدید دنیای فن آوری اطلاعات که تعامل انها با یکدیگر می تواند بسیاری از مشکلات دنیای فن آوری را بهبود بخشد . اما هر تعاملی با تناقضات و تداخلاتی همراه است بحثی که نگرانی اصلی خروجی این تعامل است امنیت داده ها در این بین است .
داده کاوی ، استخراج اطلاعات مخفی از پایگاه داده های بزرگ ، تکنولوژی قدرتمندجدید با پتانسیل بزرگی است که به شرکت ها کمک می کند روی اکثرداده های مهم در انبار داده شان تمرکز داشته باشند . ابزارهای داده کاوی روند و رفتار آینده را پیش بینی می کند و به سازمان ها اجازه می دهند کسب و کار فعالی داشته باشند و براساس دانش تصمیم گیری کنند .آنالیزهای آینده نگر و خودکاری که توسط داده کاوی روی وقایع گذشته ارائه می شود اکثرا در سیستم های پشتیبان گیری مورد استفاده قرار می گیرد . داده کاوی داده ها رامرتب می کند تا الگوها را شناسایی کند و روابط را ایجاد کند .
ابزارهایی که برای داده کاوی استفاده می شود ممکن است مدلهای آماری، الگوریتمهای ریاضی و روشهای یاد گیرنده باشند . داده کاوی منحصر به گردآوری و مدیریت دادهها نیست ، نبوده و نخواهد بود و تجزیه و تحلیل اطلاعات و پیش بینی را ( البته تا اینجای کار ) نیز شامل میشود ؛ نرم افزارهایی که به کاوش دادهها میپردازند. پارامترهای گوناگونی را در نظر میگیرد که عبارت اند از:
- قواعد انجمنی (Association): الگوهایی که بر اساس آن یک رویداد به دیگری مربوط میشود مثلاً خرید قلم به خرید کاغذ.
- ترتیب (Sequence): الگویی که به تجزیه و تحلیل توالی رویدادها پرداخته و مشخص میکند کدام رویداد، رویدادهای دیگری را در پی دارد مثلاً تولد یک نوزاد و خرید پوشک.
- پیش بینی(Prediction) : در پیش بینی هدف پیش بینی یک متغیر پیوسته میباشد. مانند پیش بینی نرخ ارز یا هزینههای درمانی.
- ردهبندی یا طبقهبندی (Classification): فرآیندی برای پیدا کردن مدلی که ردههای موجود در دادهها را تعریف مینماید و متمایز میکند، با این هدف که بتوان از این مدل برای پیش بینی رده رکوردهایی که برچسب رده آنها (متغیر هدف) ناشناخته میباشد، استفاده نمود.
- خوشه بندی(Clustering): گروه بندی مجموعهای از اعضاء، رکوردها یا اشیاء به نحوی که اعضای موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را به اعضای خوشههای دیگر داشته باشند .
- مصورسازی (visualization): مصورسازی دادهها یکی از قدرتمندترین و جذابترین روشهای اکتشاف در دادهها میباشد .
در طول چند سال گذشته جمعآوری و نگه داری حجم اطلاعات سرعت یافته و متعاقبا افزایش نیز داشتهاست. در همین زمان هزینه ذخیرهسازی دادهها بطور قابل توجهی از دلار برای هر مگابایت به پنی برای مگابایت کاهش پیدا کردهاست. مطابقا قدرت محاسبهها در هر ۱۸ – ۲۴ ماه به دوبرابر ارتقاء پیدا کردهاست این در حالیه که هزینه قدرت محاسبه ، رو به کاهش است. داده کاو به طور معمول در دو حوزه خصوصی و عمومی افزایش پیدا کردهاست. سازمانها داده کاوی را به عنوان ابزاری برای بازدید اطلاعات مشتریان ، کاهش تقلب و اتلاف و کمک به تحقیقات پزشکی استفاده میکنند. با اینهمه ازدیاد داده کاوی به طبع بعضی از پیادهسازی ها پیامد اشتباهی درپی دارد. اینها شامل نگرانیهایی در مورد کیفیت دادهای که تحلیل میگردد، توانایی کار گروهی پایگاههای داده و نرمافزارها بین ارگانها و تخطیهای بالقوه به حریم شخصی میباشد( یه چیز بسیار روتینیه و نگفته پیداست ).
از طرف دیگه ما رایانش ابری رو داریم که منبع اصلی پردازش داده ها ، ذخیره سازی و توزیع آن می باشد . ذخیره سازی داده آسان و رایگان است و خیلی فواید دیگه
تکنیک ها و ابزارهای داده کاوی در الگوی رایانش ابری بسیار مورد نیاز هستند .اجرای تکنیک های داده کاوی از طریق رایانش ابری به کاربران اجازه خواهد داد تا اطلاعات ارزشمند را از انبارداده های یکپارچه بازیابی کنند .هدف داده کاوی بسیار بسیار پیچیده است بنابراین الگوریتم داده کاوی نیاز به کارآمدی بیشتر دارد . رایانش ابری می تواند زیرساخت لازم برای داده های پیچیده و عظیم داده کاوی را فراهم کند هم چنین مسائل چالش برانگیز داده کاوی از تحقیق های ابری پدید می آیند در داده کاوی این داده است که به عنوان امنیت داده ها در یک محاسبات موازی استفاده می شود .همانطور که ما از ذخیره سازی ابری به دلایل امنیتی در سرورهای مختلف استفاده نمی کنیم مفهوم داده کاوی نیز برای کارآمدیی هربخش از داده در حالت امن بکار می رود .
نتیجتا اگه بتونیم چالش امنیت رو در این بین از بین ببریم باید بگیم فناوری جدیدی که در راه خواهد بود داده کلاد یا همچین چیزی خواهد بود
با سلام و تشکر اگر ممکن در مورد داده کلاد مطالب بزارید. ممنون
میشه لطفا برام یک مقاله با منابع و مآخذ آن بفرستید با تشکر