بخشی از مقاله
چکیده
یافتن ریز منابع وظیفه ی مردم شده است که برای اهداف مختلف استفاده می شود : ایجاد داده های آموزشی به صورت الگوریتم های یادگیری ماشین، ارتباط داوری هایی برای ارزشیابی از سیستم های اطلاعات، تجزیه و تحلیل احساسات، ترجمه زبان، و غیره. در این مقاله ابتدا ،در مورد استفاده از تأمین منابع به عنوان جمعیت حاضر از جزء اصلی از این سیستم های مبتنی بر داده، تمرکز می کنیم. ایجاد سیستم های پیوندی انسان و ماشین آلات به جهت امیدواری بسیار است که به آن اجازه می دهد تابا اعمال نفوذ در هر دو، با مقیاس پذیری از ماشین آلات و استفاده از مقادیر بزرگی از داده ها و همچنین با حفظ کیفیت هوش انسانی در حلقه ،در نهایت با بدست آوردن هر دو بهره وری و اثربخشی، در پردازش برنامه های کاربردی استفاده لازم را ببرد. چنین رویکرد ترکیبی یک فرصت عالی برای توسعه سیستم های قدرتمند تر از آنهایی صرفا که مبتنی بر دستگاه می باشند است. .
به عنوان مثال، ممکن است به برای ساخت سامانه هایی باشد که می تواند با طعنه در متن در یک مقیاس قابل درک باشند. با این حال، در هنگام طراحی این چنین سیستمی، به حساب برخی ابعاد مربوط به رفتار انسان، به عنوان انسان از تبدیل به یک جزء در کل فرایند بهره حیاتی است . در این مقاله، ما به بررسی اجمالی سیستم های ترکیبی حرارتی انسانی راهکارهای مشترک ارائه شده، توسط جوامع مختلف پژوهشی که موجود است می پردازیم . ما در چالش های کلیدی که شخص مجبور است به صورت توسعه ی چنین سیستمی و همچنین فرصت ها و جهت تحقیق باز به چنین روشی برای بهترین راه جهت پردازش داده های نیاز است به طور خلاصه در آینده می پردازیم.
کلمات کلیدی : سیستم های هیبریدی ، پردازش داده ، وب معنایی ، بازیابی
.1مقدمه
با رشد سریع داده های موجود در شرکت ها و نیز داده های موجود برروی وب، نیاز به سیستم های پردازش داده ای کارا و موثر بیشتر شده است. داده ها به عنوان کلیدی برای تجارت و پشتیبانی تصمیم گیری ها محسوب می شوند در حین اینکه راه حل های مبتنی بر ماشین برای پردازش داده های بزرگ مقیاس موجود می باشند این داده ها از لحاظ نوع وظایف پردازش داده ای که انجام می دهند محسوب می شوند. نمونه هایی از وظایفی که سیستم های مبتنی بر ماشین اعمال می کنند شامل درک تصویر،تشخیص گزینه ها و یا کنایه های موجود در متن می باشد به منظور کاهش این مشکلات سیستم های پیوندی انسان- ماشین با تاثیر بر هوش انسانی در مقیاسی بزرگ در ترکیب با الگوریتم های مبتنی بر ماشین مطرح شده اند. این سیستم ها از طریق درخواست داده های مرتبط با سوالاتی از جمعیتی از انسان های موجود جهت پاسخدهی به آنها استفاده از منابع جمعیتی را پیشنهاد می دهد. به لطف هوش انسانی این نوع از سیستم های اطلاعاتی می توانند وظایفی را انجام دهند که انسان به تنهایی قادر به انجام ان نبود. پیش پردازش یا پس پردازش مبتنی بر ماشین مقیاس پذیری مقادیر عظیمی از داده ها را برعهده دارد. داده ها با سوالات مرتبط توسط سیستم به جمعیت فرستاده می شوند که وظایف هوش انسان - - HTS نامیده می شود. معمولا انواع مختلفی از وظایف بر روی این سیستم های عامل جمعیتی انتشار می یابد که در گستره رو نویسی های - نسخه - صوتی تا بررسی های کلی جمعیتی می باشد.
منبع جمعیتی یک واژه بسیار عمومی است که موضوعاتی از علوم نوآوری تا علوم شهروندی را پوشش می دهد. نمونه های معروف منابع جمعیتی شامل ویکی پدیا، دانشنامه رایگان و آنلاین که هر شخص بر روی وب قادر به ویرایش آن است، گلاکسی زو، سیستم عاملی که هر کابر می تواند مقادیر زیادی از تصاویر علمی حاصل از تلسکوپ و یا آزمایشات را حاشیه نویسی - یاداشت نویسی - استفاده کند می باشند که عموما برای تصحیح خطاهای موجود در پروژه بزرگ کتاب دیجیتالی مورد استفاده قرار می گیرد. ما در این مقاله به صورت اختصاصی بر روی سیستم هایی تمرکز می کنیم که به منابع جمعیتی می پردازند. سیستم های عامل تجاری برای پشتیبانی از تبادل HITها بین درخواست کنندگان که نیاز دارند وظایف انجام شوند و کارگران،یعنی اعضای جمعیت ساخته شده که خواهان انجام وظایف درخواست شده به وسیله مشوق مالی می باشند.
در این مقاله ما مبحث سیستم های پیوندی ماشین- انسان پرداختیم که بسیاری از وظایف کوچک را برای پاسخدهی به جمعیتی از کارکنان انسانی ارائه می دهد می پردازیم.،افراد به دست می آورند که ما درسیستم های پیوندی ، به ویژگی های آن و چالش های اصلی ان می پردازیم. در هنگام ساختن سیستم با جزء جمعیتی درون آنها پیش رو می باشند جنبه هایی ک باید با آنها برخورد شود شامل کنترل تاخیر، کیفیت داده ها و محرک جمعیتی می باشند در نهایت ما مجموعه ای از جهت گیری های پژوهشی را در حوزه های سیستم های پیوند انسان- ماشین ارائه می دهیم که اینها شامل استفاده طولانی مدت از جمعیت ها، خطوط پیچیده داده های پیوندی و بهبود کارایی بدست آوردن داده ها می باشد.
.2 سیستم های پیوندی موجود انسان-ماشین:
سیستم های محاسبات انسانی نمونه های اولیه از سیستم هایی که بر هوش انسانی در ترکیب با پردازش داده ای مبتنی بر زماشین اثر می گذارند اغلب به جای انگیزه های پولی، انگیزه های سرگرم کننده را تحت تاثیر قرار می دهند. بنابراین به واسطه شناسایی بازی سیستم هایی مانند بازی ESP طراحی شوند. . 2.1 سیستم پردازش داده ها: این سیستم قدرتمند بر بدست آوردن اطلاعات برای پردازش اطلاعات در پرس و جوهای sql بسیار قدرتمند تاکید دارد که می تواند به عنوان مثال تصاویر را بر روی اسلایدهای محرک نمایش دهد.دراین محور جمعیت برای برچسب زدن وعلامت گذاری تصاویر بر روی ابعاد انگیزشی و یا محرک آنها استفاده می شود که عمل نسبتا ساده ای برای انسان ها می باشد اما برای الگوریتم های مبتنی برماشین بسیار پیچیده است.[2]
پس از این کار بنیادی تعدادی از اختصاصی ترین مسائل پایگاه های داده ای به وسیله روش های پیوندی انسان-ماشین نشان داده شده اند که یکی از این ها تفکیک ویا دقت در ورود است یعنی تعیین اینکه دو مورد در پایگاه داده ای به ورودی مشابه در دنیای واقعی برخورد می کنند. دراین زمینه سیستم های مطرح شده پیوند انسان -ماشین رویکردهای اتوماتیک - خودکار - را ترکیب می کنند شباهت بین تعداد زیادی از زوج برچسب ورودی را محاسبه می کنند و برخی از زوج ورودی هایی را برای تطبیق دستی بدست آورده وبنابراین تفکیک ورودی قابل مقیاس و دقیقی حاصل می گردد. برای بدست اوردن این نتیجه ضرورت دارد که تعداد Hit های حاصله بوسیله اعمال امتیازات اطمینان الگوریتم مبتنی برماشین به زوج های ورودی و انتخابی مورد مقایسه کاهش یابد.این فرایند نشان می دهند که چگونه یک پیوند انسان- ماشین بهتر از روش کاملا مبتنی برماشین عمل می کند و همچنین در مقایسه با تفکیک کاملا دستی مقدار کار انسانی را کاهش می دهد.[9]
این عمل برای انتخاب Hit هایی انجام می شود که دقت مورد انتظار را به حداکثر می رساند. مسئله دیگر مرتبط با پایگاه داده ای پرس و جوهای Skyline می باشد.این ها پرس و جوهای پیچیده ای جهت پردازش می باشند که هدف آن ها بازیابی نتایج بهینه در ابعاد متعدد می باشد . به عنوان مثال هتل هایی که از لحاظ قیمت و مسافت تا ساحل مناسب ترین گزینه می باشند. در این مثال برخی از نتایج نسبت به سایرین از لحاظ هردو بعد دارای بدترین حالت خواهد بود و می توان در مراحل اولیه پردازش پرس و جو آن ها را کنار گذاشت برای این نوع از پرس و جو ها روش پیوند انسان- ماشین مطرح شده است.به بیان دقیق تر ممکن است یافتن مقادیر از دست رفته در پایگاه داده ای به وسیله محاسبه بهینگی برای کلیه یا تعدادی از انها از لحاظ هزینه کارا نباشد و احتمال انتخاب داده ها به منابع جمعیتی که دارای بیشترین تاثیر برروی نتایج پرس و جوی هستند وجود دارد.[7] پردازش پیوندی انسان- ماشین می تواند برای داده های نموداری شکل نیز مفید و کارا باشد این روش به مسئله جستجوی نموداری پیوندی انسان- ماشین می پردازند.به عنوان مثال از افراد می پرسند که آیا روش موجود در نمودار از روش دیگر که گاهی اوقات می تواند نسبت به الگوریتم های مبتنی بر ماشین کارآمد تر باشد، قابل دسترس تر است یا نه.
2.2 بازیابی اطلاعات: حوزه دیگری که روش های پیوندی انسان- ماشین مورد استفاده قرار داده اند، حوزه بازیابی اطلاعات می باشد. استفاده عمده از منابع جمعیتی به عنوان ابزاری برای ایجاد قضاوت مطرح شده است.[1] داده هایی مرتبط برداده های ضروری برای ارزیابی کیفیت کارایی های سیستم بازیابی اطلاعات می باشد.برای ایجاد این داده ها ضرورت دارد که ارزیابی های انسانی به صورت دستی ارتباط مستندات بازیابی شده را با پرس و جو کاربر ارائه شده به سیستم بازیابی اطلاعات مورد قضاوت و داوری قرار دهد.چنین قضاوت هایی می توانند دوتایی و چنددرجه ای باشند.