بخشی از مقاله
چکیده
امروزه توسعه علم نرم افزار و رایانه به قدري سریع شده است که تغییرات نرم افزاري به صورت لحظه به لحظه در حال انجام است و همواره روش ها و متدهاي جدیدي جهت توسعه یک سیستم نرم افزاري ابداع می شود. بشر در تمامی زمینه هاي زندگی روزمره خود به استفاده از تکنولوژي روي آورده است و به تولید و توسعه نرم افزارها و سخت افزارهاي خدماتی پرداخته که به زندگی اش سهولت بخشد.
به جز موارد زندگی روزمره، نرم افزارهاي متعددي در زمینه هاي مختلف صنعتی و کسب و کار ایجاد شده است. با توسعه صنعت نرم افزار و پیروي از استانداردهاي روز دنیا، تمامی این نرم افزارها پویا بوده و و اکثریت آنها یک ویژگی واحد دارند و آن استفاده از یک زیرساخت مناسب جهت نگهداري داده هاي حاصل از استفاده ي گسترده از نرم افزارها می باشد. این محصولات می تواند اپلیکیشن هاي معمولی شبکه هاي اجتماعی و سرگرمی و پر استفاده باشند و یا نرم افزارهاي مدیریت خدمات، اطلاعات و کسب و کار یک سازمان باشند.
در هر صورت مسئله اي که قابل توجه می باشد این است که در ادامه روند نگهداري نرم افزار این اطلاعات چه ارزشی براي ما داشته و چه استفاده اي از آن می توان نمود. هر اطلاعاتی به خودي خود و به صورت پیش فرض ارزش چندانی نداشته مگر اینکه با ترکیبی از اظلاعات دیگر و با در نظر گرفتن احتمالاتی که از نگهداري سایر اطلاعات به دست آمده است بتوان پیش بینی درستی از آینده داشت.
چیزي که مهمترین مسئله در زمینه سیستم هاي اطلاعاتی و داده محور می باشد. از سوي دیگر پس از گذشت مدتی استفاده از سیستم هاي اطلاعاتی مبحث مهمی که مطرح می شود مسئله Big Data می باشد. مسئله اي که برنامه هاي کاربردي و سیستم هاي اطلاعاتی به تنهایی براي پردازش آنها کافی نمی باشند، از این رو جهت پردازش اطلاعات نیاز به یک نرم افزاري قدرتمند با الگوریتم هاي دقیق تر به منظور تحلیل داده ها می باشد.
اما با وجود حجم بالاي داده هاي تولید شده یک پیش پردازش جامع جهت تفکیک داده هاي ارزشمند از بی ارزش، قبل از استفاده از نرم افزارهاي تحلیلی نیاز می باشد. داده هاي بیشتر به تحلیل دقیق تر می انجامد و تحلیل هاي دقیق تر منجر به تصمیم گیري هاي مطمئن بیشتري شده و تصمیمات بهتر می تواند معناي کارایی بیشتر عملیات، کاهش هزینه ها و کاهش ریسک ها باشد. در این پژوهش سعی بر این است تا با استفاده از تئوري نظریه اطلاعات و آنتروپی شانون در زمینه ریاضیات بتوان روشی را براي یافتن ارزش اطلاعات ارائه نمود.
.1 مقدمه
اطلاعات هر آن چیزي است که در نتیجه پردازش بر روي داده اي خام بدست آمده باشد. اهمیت نگهداري این اطلاعات بر هیچ کس پوشیده نیست بنابراین مبحث ذخیره سازي اطلاعات یکی از اساسی ترین و بنیادي ترین جزء اصلی هر سیستمی بوده و طراحی معماري و زیرساخت آن از اهمیت بسزایی برخوردار می باشد. از این رو در طراحی سیستم هاي نرم افزاري، همواره مهمترین اصل، نحوه نگهداري اطلاعات بوده و کار پیاده سازي نرم افزار از مرحله طراحی معماري پایگاه داده آغاز شده است. با توسعه نرم افزارهاي تحلیل و هوش تجاري، وظیفه آنالیز داده و تصمیم گیري بر اساس نتایج حاصله بر عهده نرم افزارهاي خاص این حوزه قرار گرفته است. با افزایش حجم داده ها مسئله Big Data مطرح شده است.
Big data اصطلاحی است براي مجموعه داده هاي حجیم که بزرگ ، متنوع ، با ساختار پیچیده و با دشواریهایی براي ذخیره سازي ، تحلیل و تصویرسازي - نمایش - ، پردازشهاي بیشتر یا نتایج میباشد. پروسه تحقیق بر روي داده هاي حجیم جهت آشکارسازي الگوهاي مخفی و راز همبستگی ها ، تجزیه و تحلیل Big data نامیده میشود. این اطلاعات مفید براي سازمانها وشرکتها در جهت کسب بینش غنی تر و عمیق تر و موفقیت در رقابت کمک میکند. به همین دلیل اجراهاي Big data نیاز دارند تا در صورت امکان ، تحلیل شوند و به طور دقیق اجرا شوند.
اما با تغییر در فرآیندهاي جاري سیستم و پارامترهاي ارزیابی و تحلیل در هر دوره ممکن است نتایج متفاوتی از داده هاي مختلف اخذ شود. نتایجی که ممکن است وابسته به زمان نیز بوده و بر یکدیگر تاثیر بگذارند اما معیاري براي سنجش ارزشمندي آنها در نظر گرفته نمی شود. امروزه زمان مهمترین مسئله در تصمیم گیري هاي سریع و موردي بوده و ممکن است با تاخیر در اعلام یک ارزیابی، نتایج جبران ناپذیري به وقوع بپیوندد.
از این رو مفهوم Information Base به جاي Data Base مطرح می گردد. استخراج پارامترهاي مهم در ارزیابی و تحلیل و در ادامه، نگهداري اطلاعات ارزشمند بر اساس پارامترهاي مهم، یکی از راه حل هاي امکان پذیر جهت این امر می باشد. در پی یافتن راهی جهت تعیین این موارد می توان از مسائل تئوري ولی کاربردي قدیمی که در عین ارزشمندي کمتر به آن پرداخته شده است بهره برد.
.2 نظریه اطلاعات
این نظریه مدلی ریاضی از شرایط و عوامل موثر در انتقال و پردازش داده ها و اطلاعات فراهم می آورد. این نظریه در علوم گوناگونی مورد استفاده و بررسی قرار گرفته است. کاربرد ریاضی در تحلیل سیستم هاي پیچیده به نظارت و ارزیابی و سنجش مربوط خواهد بود. بشر در حال خلق روش هایی براي پیش بینی آینده از طریق اندازه گیري داده ها و اطلاعات گذشته و در حال تولید می باشد.
ریاضیات در سیستم هاي پیچیده مبتنی بر اندازه گیري داده ها و سنجش میزان اطلاعات می باشد و در صورت اندازه گیري دقیق می تواند منجر به تغییر در سیستم ها نیز شود. بدون داشتن اطلاعات کافی از سابقه ي فعالیت یک سیستم امکان تاثیر گذاري بر آن وجود نخواهد داشت. بنابراین به منظور کسب و جمع آوري اطلاعات کافی و ایجاد بستري جهت اندازه گیري دقیق، میاز به جمع آوري داده ها به بهترین نحو و بدون آنتروپی می باشد.
امروزه علم فیزیک از اندازه گیري عبور و در حال تاثیرگذاري روي سیستم ها بر اساس سنجش هاي گذشته می باشد. در ریاضیات نیز سعی بر این است که با بهینه نمودن روش هاي اندازه گیري، روش هاي بهتري جهت خلق محیط ایجاد نماییم. در این پژوهش از نظریه اطلاعات به عنوان یکی از ابزارهاي ریاضی که به درك سیستم هاي پیچیده کمک می نماید استفاده خواهد شد.
امروزه اطلاعات مفهوم داغ و مورد بحث در تمامی صنعت ها می باشد. توسعه نرم افزار هاي جمع آوري، مدیریت و نگهداري اطلاعات و سپس بهبود و ارتقاء نرم افزار هاي سنجش و آمارگیري از اطلاعات جمع آوري شده گویاي مطلب اهمیت نگهداري داده ها و سنجش اطلاعات می باشد. درست است که اطلاعات قابل اندازه گیري نمی باشد اما قابل سنجش و مقایسه می باشد. اطلاعات به عنوان مفهومی تجاري قلمداد شده و از ارزش بالایی برخوردار می باشد.
با نگاهی به اپلیکیشن هاي روز دنیا می توان دریافت که درصد بالایی از این اپلیکیشن ها در صدد جمع آوري داده ها به منظور شناخت رفتارها و سنجش اطلاعات افراد در جهان می باشند، چه از لحاظ سلایق و خصوصیات شخصی و چه از نظر سطح داتش و همچنین پالایش و بررسی فعالیت هاي روزمره افراد در جاي جاي جهان و آشنایی با شیوه زندگی، آداب رسوم و فرهنگ و در نهایت پیش بینی رفتار افراد و تاثیر هر یک بر وضعیت جهان. در نظر داشته باشید در صورت همه گیر شدن استفاده از شبکه هاي اجتماعی چه بانک اطلاعاتی عظیمی از افراد و سلایق هریک ایجاد خواهد شد.
همچنین در صورت استفاده جامع از اپلیکشن هاي حمل و نقل به راحتی می توان موقعیت افراد و رفتار سفر شهري هر فرد را به مرور، مشخص و هر لحظه موقعیت افراد را پیگیري نمود. این گونه، بازگشت سرمایه اپلیکیشن هاي رایگان به منظور جمع آوري اطلاعات ارزشمند محقق خواهد شد. اطلاعات مفهومی است قابل سنجش که یا ثابت می ماند و یا افزایش می ماند. به عنوان مثال نمی توان گفت "با خواندن مطلبی اطلاعاتم کاهش پیدا کرد." می توان گفت "چیزي به اطلاعاتم اضافه نشد."
در مباحث ترمو دینامیک، چیزي که زیاد می شود اما کم نمی شود، به عنوان آنتروپی مطرح می شود. باید بدانیم که اطلاعات بار ارزشی ندارند، برخلاف لغت هایی چون حقیقت و واقعیت، مفهومی است که سو گیري ندارد. نگاه مبتنی بر اطلاعات می تواند درك عمیقی از جهان به ما بدهد. استفاده دائمی از موبایل و وسایل ارتباطی و شبکه هاي اجتماعی، حجم گسترده اي از تحولات را در دنیا ایجاد می کنند. این نتایج قابل مشاهده است اما مکانیزم آن با مترهاي رایج به سادگی قابل اندازه گیري نیست.
آنتروپی بیانگر بی نظمی یک سیستم است و هر سیستمی به صورت خودبخود، یعنی بدون صرف انرژي، میل دارد به سمت بی نظمی بیشتر یا آنتروپی بیشتر میل کند. شاخصه دیگر آنتروپی، بیان عدم قطعیت در مورد یک سیستم می باشد. با دانستن موقعیت یک شی می توان موقعیت بعدي را تخمین زد. در سیستمی که آنتروپی زیادي دارد انرژي بیشتري براي انجام کار مورد نیاز است. آنتروپی معیاري از اشتباهات تصادفی است که در هنگام انتقال یک سیگنال به وجود می آیند. بنابراین می تواند معیاري از بازده سیستم ارسال پیام باشد.
.3معرفی سیستم هاي اطلاعاتی
سیستم اطلاعاتی یک پایگاه داده براي ذخیره، جمع آوري و پردازش داده ها و در نهایت تجزیه و تحلیل اطلاعات حاصل از داده هاي جمع آوري شده و نتایج گزارشهایی است که به طور منظم از سیستم قابل اجرا، دریافت و توسعه می باشد. از این رو سیستمهاي اطلاعاتی نه تنها به عنوان یک پایگاه داده، نرمافزار و یا سخت افزار جهت نگهداري داده ها و تهیه اطلاعات مطرح می شوند، بلکه به عنوان یک سیستم فراتر قلمداد شده است که به کمک و بهرهگیري از امکانات و مزایاي آن میتوان مدیریت تمام امور اتوماتیک و غیر اتوماتیک و تحلیل و تفسیر سیستمهاي ارتباطی و جمع آوري اطلاعات را به راحتی انجام داد.
با این حال، این اصطلاح در معناي وسیع تر به هر وسیله اي که باعث برقراري ارتباط علمی بین افراد میشود، اطلاق میشود. به طور مثال از طریق ارتباط کلامی، سیستمهاي پانچ کارت و سیستمهاي تصادفی نوري ساده. همچنین گاهی اوقات تنها براي اشاره به نرم افزار مورد استفاده براي اجراي یک پایگاه داده کامپیوتري و یا براي اشاره به یک سیستم کامپیوتري استفاده میگردد. مجموعه سیستمهاي اطلاعاتی، براي مطالعه علمی، دقیق و واقعی شبکههاي متشکل از سختافزار و نرم افزار، که مردم و سازمانها براي جمع آوري، فرایند ایجاد و توزیع اطلاعات از آنها استفاده میکنند مورد استفاده قرار میگیرند.