بخشی از مقاله
چکیده :
در سال های اخیر، بسیاری از انواع دستگاه های تلفن همراه انسان، مانند تلفنهای هوشمند و تبلتها، که بسیاری از حسگرها و ارتباطات بیسیم با تکنولوژی بالا را ممکن می سازند به طور فزاینده و فراگیر در سراسر جهان قرار دارند. از آنجا که بسیاری از مردم در جهان معمولا در زندگی خود این دستگاهها را حمل می کنند، میتوانند به راحتی با استفاده از GPS ، تماس تلفن همراه، برچسب گذاری جغرافیایی ،شناسه برج همراه جهانی، نقاط دسترسی وای فای، فعالیت های خود را مانند مکان هایی که آنها دیدار میکنند و افرادی که با آنها مرتبط میشوند را ثبت کنند که این می تواند به طور موثر در بهبود تحرک افراد مورد استفاده قرار گیرد.
با توجه به حضور در عصر اطلاعات و استفاده روز افزون از GPS ها، دادهها یی دقیق و عظیم از شرایط تحرک افراد در دسترس هستند، اما این حجم عظیم از اطلاعات ما را با چالش های محدودیت وسایل ذخیره سازی و پردازش مواجه می کنند. استفاده از تکنولوژی کلان داده و ابر می تواند پاسخی مناسب بر این چالش ها باشد.
دراین تحقیق بامعرفی تکنولوژی کلان دادهها و بهرهگیری از آن درجهت تحلیل دادههای GPS موبایل با استفاده از محیط هدوپ و ابزار هایو به استخراج الگوهای حرکتی مستتر در دادهها خواهیم پرداخت تا در حوزه سلامت به تحرک افراد بهبود بخشیم.
.1 مقدمه
در عصری که ذخیره ارزان دادهها در دسترس همگان می باشد، اصل دادهای که جمع آوری میکنیم در حال تغییر است. در بسیاری از مشاغل، دادههای حساس در پایگاههای داده و انبارهای دادهشان محدود شده است. در این نوع سیستمها،دادهها در سطرها و ستونها مرتب شده اند، بطوریکه هر بایت از اطلاعات در اصل و ارزشش قابل فهم است. این پایگاههای داده هنوز بسیار مهم هستند ولی اکنون تجارت با یافتن مقادیر ارزشمند از حجم بالایی از داده که فقط در یک پایگاه داده کوچک نیستند، تغییر یافته است.
تنوع داده قابل دسترس انسانها باورنکردنی است. چالش موجود اینست که ابزار قدیمی برای کار با حجم و پیچیدگی این دادهها ضعیفند.
پیشرفت علم در قرن 21 تجزیه و تحلیل عمیق تر در جنبه هایی که باعث ایجاد جنبش میشود، فراهم میکند. برنامه های توسعه و تحقیقات اخیر منجربه بهبود در مطالعات جنبش، از جمله تجزیه و تحلیل حرکت با فن آوری های پیشرفته مورد استفاده در زمینه پزشکی ورزشی، پزشکی عمومی، تجاری، صنعتی و حوزه بالینی است. این پیشرفت های فن آوری های اخیر در پردازش و تجزیه تحلیل دادههای عظیم و پیچیده، فرصت ها و چالش های جدیدی را برای پزشکان و حوزه سلامت ارائه داده اند
برخی از مطالعات اخیر در تجزیه و تحلیل مبتنی بر کلان دادهها از الگوهای تحرک انسان نشان داده است که رفتار انسان به دلیل تحرک انسان در حالت کلی به راحتی قابل پیش بینی است2]،.[1 ما با یافتن موقعیت حرکتی و علکرد های حرکتی که در رفتار افراد وجود دارند به دنبال حفظ سلامت و نظارت بر نحوه درست حرکتی انها هستیم.
به منظور پیش بینی و نظارت خودکار میزان تحرک بیمار یا فرد و طبقه بندی فعالیت های روزانه - به عنوان مثال، نشسته، ایستاده، راه رفتن، و غیره - با در نظر داشتن کاهش هزینه نسبت به طبقه بندی دستی انها، این دادههای عظیم مورد استفاده قرار می گیرند
دادههای عظیم به راهکار ذخیره سازی حجم بسیار عظیم داده در حد ترابایت و پتابایت گفته می شود که بتوان با انجام پروسه های سنگین پردازشی به این حجم عظیم داده، مفهوم بخشید. مفهوم بخشیدن به دادهها یعنی از میان صدها، هزاران یا میلیون ها رکورد در ظاهر بی ارتباط بتوان روابط جدیدی را تعریف کرد.با توجه به این حجم عظیم ، تنوع و سرعت زیاد دادههایی که تولید می شوند ، نیاز به دسته بندی و موازی سازی دادهها با استفاده از ابزارهای دادههای عظیم مانند هدوپ ، مپ ردیوس و غیره داریم که با استفاده از سیستمهای کامپیوتری طراحی شده دادهها را ضبط و ذخیره میکنیم.
اولین قدم در این تحقیق یافتن داده نزدیک به موضوع مسئله می باشد با طراحی اپلیکشن اندروید از طریق استفاده از دادههای GPS روی موبایل موقعیت ها و میزان تحرک فرد را در طول ساعات مختلف روز جمع آوری کرده و از این داده به عنوان مجموعه داده استفاده نموده و تجزیه و تحلیل بر روی این مجموعه داده را برای حوزه سلامت با استفاده از ابزار هدوپ *در حوزه کلان دادهها انجام میدهیم تا با پیمایش این حجم عظیم داده در شناسایی رفتار افراد با استفاده از ابزارهای دادهها ی بزرگ و روش های هوشمندانه پیشنهادی موثر و مفید ارائه دهیم .
هدف ما از این تحقیق یافتن الگویی در جهت شناسایی رفتار حرکتی افراد با استفاده از تجزیه و تحلیل دیتاست های موجود است. در صورت فقدان دیتاستهای مورد نیاز به صورت فرضی آن را شبیه سازی می کنیم و تجزیه و تحلیل بر روی این مجموعه داده را با استفاده از ابزار هدوپ در حوزه کلان دادهها انجام میدهیم.
داده های جمع آوری شده از تحرک افراد توسط موبایل با برنامه های مختلف - مانند: Life log,Running,Google - Fitتولید میشوند و حتی وسایل جانبی مانند کفش و دستبند های همراه نیز در حال جمع آوری داده های کاربران هستند،اما استفاده از این داده در سطح کلان و بهره بردن از این داده کلان که تنها توسط چارچوب هدوپ قابل اجراست،در علم پزشکی در خصوص بیماران قلبی اکنون در این تحقیق انجام میگردد.
.2 داده بزرگ
داده بزرگ یک راه آسان برای توصیف مشکل دادههایی است که با ابزار قدیمی قابل حل نیستند .در فارسی به عبارات و اصطلاحات متعددی از جمله »بزرگ داده«، »دادههای بزرگ«، »کلان داده« و »دادههای کلان« ترجمه شده است.
بیگ دیتا را هرطور که ترجمه کنیم، در تعریف آن تفاوتی ایجاد نمی شود: » به مجموعه دادههایی اطلاق می شود که مدیریت، کنترل و پردازش آنها فراتر از توانایی ابزارهای نرم افزاری در یک زمان قابل تحمل و مورد انتظار است. « مقیاس بزرگ و کلان بودن این داده نیز همزمان با پیشرفت فناوری های ذخیره سازی و پردازش اطلاعات روز به روز در حال افزایش است. بیگ دیتا اصطلاح جدیدی است که برای رشد قابل توجه در تولید ،دسترس پذیری، ذخیره سازی و پردازش دادهها و اطلاعات به کار می رود و در ارتباط با گسترش روزافزون فناوری اطلاعات مورد توجه قرار گرفته است. حجمی از دادهها که این روزها می تواند ذخیره و پردازش شده و نتایج تحلیل آن مورد استفاده قرار گیرد، در گذشته نه چندان دور قابل تصور هم نبود.
شکل : انواع داده بزرگ
.3داده کاوی
پایگاهها و مجموعههای حجیم دادهها را در پی کشف واستخراج دانش، مورد تحلیل و کند و کاوهای ماشینی - و نیمهماشینی - قرار میدهد. این گونه مطالعات و کاوشها را به واقع میتوان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. داده کاوی به بهرهگیری از ابزارهای تجزیه و تحلیل دادهها به منظور کشف الگوها و روابط معتبری که تا کنون ناشناخته بودهاند اطلاق میشود.