23 شهریور هرآنچه درباره بیگ دیتا ( کلان داده) لازم است بدانید! نوشته شده: adminsite 0 در چند سال اخیر حوزه هایی مانند هوش مصنوعی، کلان داده ( بیگ دیتا ) ، یادگیری ماشین (Machine Learning) و داده کاوی (Data Mining) و ... به شدت مورد توجه قرار گرفته است. کلان داده (Big Data) به مجموعهای از دادهها بسیار حجیم و پیچیده گفته میشود که هرروزه حجم آن افزایش پیدا کرده به طوری که هیچ یک از ابزارهای سنتی مدیریت دادهها امکان ذخیره یا پردازش آنها را به طور کارآمد ندارند. به طور کلی، مفهوم کلان داده به دادههایی اشاره دارد که تنوع بسیاری دارند و حجم آنها با سرعت زیادی افزایش مییابد. دادهها در بیگ دیتا میتوانند ساختارمند یا بدون ساختار باشند، اما این نوع و حجم داده نیستند که در بیگ دیتا اهمیت دارند، بلکه مسئله مهم، نوع تحلیلی است که سازمانها میتوانند با بیگ دیتا انجام دهند. برای تحلیل این اطلاعات ما با داده کاوی و یادگیری ماشین و تحلیل پایگاه داده ها و ... روبه رو هستیم که در ادامه انواع این کلان داده ها ، کاربرد ها، معایب و مزایای آنها و هرآنچه پیرامون این علم لازم است بدانید مطرح خواهد شد. انواع کلان داده ها دادههای ساختاریافته (Structured Data) منظور از دادههای ساختاریافته در Big Data وجود یک ساختار مناسب برای کلان داده هاست به بیان ساده، دادههایی که طول و قالب مشخصی دارند. به عنوان مثال پایگاه داده ( دیتا بیس) ، فایل اکسل و csv همگی دادههای ساختاریافته به حساب میآیند. دادههای نیمه ساختاریافته (Semi-Structured Data) دادههای نیمه ساختاریافته در بیگ دیتا شکلی از دادههای ساختاریافته هستند که مطابقتی با ساختار رسمی داده های پایگاه داده یا اشکال جداول داده ها ندارند. اما برای این داده ها در عین اینکه ساختار و جداول اشکال موجود نیست اما دارای برچسب ها و نشانه هایی برای معنا دار کردن هستند که آنهارا برای ضبط و طبقه بندی آماده میکند. به عنوان مثال، دادههای موجود در ایمیلها، فایلهای گزارش (Log) و اسناد ورد (Word) همگی دادههای نیمه ساختاریافته هستند. دادههای بدون ساختار (Unstructured Data) در دنیای امروزه تقریباً ۸۰٪ از دادههای سراسر جهان ساختار ندارند. این دادهها، ماهیت پیچیدهای دارند، فضای بیشتری را اشغال میکنند و بینظمی و به هم ریختگیشان، مدیریت و درک آنها را دشوار میکند. سختترین قسمت تحلیل دادههای بدون ساختار این است که از برنامه بخواهیم اطلاعات را درک کند به عنوان مثال، فایلهای ارتباط صوتی و تصویری، همگی دادههای بدون ساختار محسوب میشوند. ویژگی های کلان داده ها برخی از ویژگی های کلان داده ها شامل موارد زیر میشود: سرعت رشد دادهها (Velocity): سرعت پردازش دادهها یکی از فاکتورهای مهم برای اجرای فرآیندهای کلان داده به حساب میآید حجم دادهها (Volume): : ویژگی حجم به مقدار دادههای سازمان مد نظر اشاره دارد تنوع دادهها (Variety) : تنوع داده ها به وجود انواع مختلف کلان داده اشاره دارد. تنوع یکی از بزرگترین دغدغههایی است که در صنعت بیگ دیتا وجود دارد ارزش دادهها (Value):: مزیتهایی که به واسطه دادههای سازمان به دست میآیند، همان ویژگی ارزش در کلان داده است صحت دادهها (Veracity) :در این ویژگی دقت داده ها مورد بررسی قرار گرفته میشود اعتبار دادهها :(Validity) این عبارت به بررسی میزان اعتبار داده های ما در حوزه هدف مد نظر میپردازد نوسان (Volatility) : داده های ما همواره در حال تغییر هستن به طوری که داده هایی که امروز از از منبعی جمع آوری شوند برای فردا احتمال تغییر دارند و این تغییرات ب همگن سازی داده های ما بسیار اثر میگذارد نمایش: (Visualization) نشان دادن بینشهای تولید شده توسط کلان داده از طریق نمودارها و گرافها ویژگی نمایش را مطرح میکند معایب و مزایای بیگ دیتا حوزه کلان داده که امروزه یکی از مطرح ترین حوزه های دنیای مدرن شده دارای معایب و مزایایی است که به اختصار اینجا براتون مطرح خواهیم کرد. بهبود تجربه مشتری مدیریت ریسک توسعه محصول و ایجاد نوآوری تصمیمگیری بهتر و سریعتر کمپینهای متمرکز و هدفمند شبکههای تامینکننده گسترده تشخیص کلاهبرداری (Fraud Detection) کاهش هزینههای سازمان افزایش بهرهوری و درآمد همچنین از جمله معایب آن میتوان موارد زیر را مطرح کرد: کمبود دادههای با کیفیت تغییرات بسیار سریع نیاز به سختافزار مخصوص مشکلات مربوط به ادغام با سیستمهای قدیمی خطرات امنیتی کاربرد های کلان داده ها داده ها در دنیای امروز اهمیت زیادی دارند به همن جهت هرکجا که بتوان تحلیل خوبی از آنها داشت میتوان از کلان داده ها بهره برد. صنعت آموزش حجم زیاد کاربران که به این حوزه مراجعه میکنند سبب بالا بردن حجم داده ها میشود که این مساله ما را به استفاده از کلان داده ها وادار میکند. تولید محتوای ویدیویی : محتوای ویدیویی بهویژه فیلمهای سینمایی، سریالها و برنامههای تلویزیونی جزو پرطرفدارترین نوع محتوا در دنیا هستند. کمپانیهای تولیدکننده تلاش میکنند به کمک بیگ دیتا ذائقه مخاطب را شناسایی کرده و محصولات جذابتری را روانه بازار کنند. حوزه سلامت این حوزه از مهم ترین کاربرد های کلان داده هاست که به کمک تحلیل اطلاهات و داده های موجود در این بخش میتوانیم به پیشگیری و درمان هرچه بهتر در جامعه بپردازیم. سیستم پیشنهاد : همه آنچه که در سایت ها و اپلیکیشن های مختلف به شما پیشنهاد میشود را میتوان به بخش کلان داده ها مرتبط دانست دیجیتال مارکتینگ یکی دیگر از کاربردهای بیگ دیتا در حوزه دیجیتال مارکتینگ یا بازاریابی دیجیتال است. در این حوزه چون حجم زیادی از دادههای قابل اندازهگیری وجود دارد، در صورت دادهکاوری درست و تحلیل و پردازش دقیق اطلاعات و دادهها میتوانید کمپینهای موفقی را اجرا کنید. و در نهایت تمامی سازمان های بزرگ از کلان داده ها استفاده میکنند زیرا استفاده ار آنها به شدت هزینه بالایی را برای سازمان در نظر میگیرد. انواع تحلیل کلان داده ها تحلیل بیگ دیتا، به هدفی که در راستای آن داده تحلیل میشود وابسته است. اما بههرحال خروجی هر تحلیل باید گزارش، الگو، روند، مدل یا پیشبینی باشد. انواع تحلیل مبتنی بر بیگ دیتا را به ۴ نوع تقسیم میشوند. ۱. تحلیل توصیفی (Descriptive) نتیجه تحلیل توصیفی یک نمودار، جدول یا هر نوع گزارش دیگر است که بر رخداد های گذشته تمرکز میکند ۲. تحلیل تشخیصی (Diagnostic) تحلیل تشخیصی چرایی یک مشکل را بررسی میکند این نوع تحلیل نسبت به توصیفی پیچیدهتر و عمیقتر است و به همین دلیل در بیشتر موارد نیازمند سیستمهای مبتنی بر هوش مصنوعی و یادگیری ماشین است. ۳. تحلیل پیشبینی (Predictive) این تحلیل کمک میکند که با آن مشکل را قبل از وقوع پیش بینی کرد. وقتی مشکلی قبل از وقوع پیشبینی شود میتوان تا حد زیادی در هزینهها صرفهجویی کرد. ۴. تجویزی (Prescriptive) در این تحلیل برای مشکلاتی که هنوز رخ نداده از پیش راهکار تعیین میشود که از پیچیدهترین و پرهزینهترین نوع تحلیل بیگ دیتا است. آموزش حوزه بیگ دیتا بیشتر مختص چه کسانی است با توجه به مطالبی که در بخش های پیش مطرح شد متوجه شدیم که بیگ دیتا مربوط به هرآنچه درباره داده های دریافتی است حال این داده ها نیازمند جمع آوری، تحلیل، بررسی و پیاده سازی هستند. دوره های آموزشی بیگ دیتا به همین منظور در اکثر مراکز آموزشی از جمله دپارتمان برق و کامپیوتر گروه آموزشی پارس پژوهان در حال تدریس میباشد که همه افراد امکان شرکت در آن را دارند اما به طور تخصصی مهندسین و متخصصان حوزه هوش مصنوعی، داده کاوی، علم داده و ... از این قبیل در این حوزه فعالیت دارند و به جمع آوری اطلاعات در پایگاه داده ها و تحلیل آنها در حوزه های مختلف میپردازند. جمع بندی در این مقاله با بیگ دیتا، شکل گیری و چالشهای آن آشنا شدیم. این دادهها هر روز بیشتر و سریعتر جمعآوری میشوند و حفظ و سازماندهی آنها اهمیت زیادی دارد. اگر بخواهیم ب طور خلاصه بگوییم که بیگ دیتا به چه صورتی پیش میرود: ترکیب اطلاعات در بیگ دیتا مدیریت داده ها آنالیز در این سه قدم متخصص کلان داده حجم زیاد اطلاعات سازماندهی و مدیریت و جهت استفاده در حوزه کاری مربوطه آنالیز میکند تا بتوان هر چه بهتر سازمان و سیستم های مختلف را رشد داد. نویسنده: نگین بشیری، کارشناس دپارتمان برق و کامپیوتر گروه آموزشی پارس پژوهان اشتراک گذاری Facebook Googleplus Linkedin RSS Skype Twitter نظرات (0) نظرات هیچ نظری ثبت نشده است.