بخشی از مقاله

چکیده

جمعسپاري به عنوان یک مدل کسب وکار است، که تمرکز آن بر مشارکت دادن جمعیت در فعالیتهایی چون حل مساله، نوآوري و تولید میباشد، که بر کیفیت محصول، وفاداري و خشنودي مشتري اثري مستقیم دارد. در طول چند سال گذشته، جمع سپاري به عنوان یک گروه زبده و کارآزموده، از گروه کارگران اصلی، پدید آمده است. این گروه براي انجام کارهاي کوچکی مانند برچسب گذاري تصویر، حاشیه نویسی زبان طبیعی،قضاوت ارت باطی و ... بوجود آمده است. برچسب زنی ، یکی از امور مهم در حوزه بازیابی اطلاعات به حساب می آید، که از طریق جمع سپاري بهدستاوردهاي خوبی از لحاظ صرفه جویی در هزینه و همچنین بالا بردن کیفیت برچسب گذاري رسیده است.

تصاویر و محتواي متعددي در اینترنت وجود دارند که فاقد برچسب می باشند. مشکلی که موتورهاي جستجو دارند، این است که نمی توانند بصورت هوشمند عمل جستجو را انجام داده و اطلاعات خواسته شده، توسط کاربر را در اختیارش قرار بدهند. بنابراین از خاصیت جمع سپاري استفاده میشود تا محتویات و تصاویر موجود در اینترنت، توسطجمعیت کارگري برچسب زده شود. روش راي گیري وزنی، یکی از بهترین روش ها براي تعیین دقت کارگرانی است که در امر برچسب زنی مشارکت داشته اند. در این پژوهش ، توسط روش پیشنهادي، ابتدا کارگران کم کیفیت و بی دقت در امر برچسب گذاري را شناسایی و برچسبآنها را بی اثر کرد ه و سپس از طریق وزن دهی به سایر کارگرانی که در امر برچسب گذاري حضور داشته اند و جزو کارگران بی کیفیت نبوده اند، نسبت به برچسب پایانی، تصمیم گیري می کنیم. روش ارایه شده می تواند، تا حد چشمگیري صحت و کیفیت امر برچسب گذاري را افزایش دهد.

کلمات کلیدي: برچسب گذاري، وزن دهی، جمع سپاري، الگوریتم

مقدمه

طیف پژوهشهایی که در یادگیري ماشینی میشود، گسترده است. از سویی پژوهشگران بر آنند، که روشهاي یادگیري تازهاي به وجود بیاورندو امکانپذیري و کیفیت یادگیري را براي روشهايشان مطالعه کنند و در سوي دیگر عدهاي از پژوهشگران سعی میکنند، روشهاي یادگیري ماشینی را روي مسایل تازهاي اعمال کنند. البته این طیف گسسته نیست و پژوهشهاي انجامشده داراي مولفههایی از هر دو رویکرد هستند. یکی از تقسیمبنديهاي متداول در یادگیري ماشینی، تقسیمبندي بر اساس نوع دادههاي در اختیار عامل هوشمند است. به سناریوي زیر توجه کنید:فرض کنید به تازگی رباتی سگنما خریدهاید، که میتواند توسط دوربینی دنیاي خارج را مشاهده کند، به کمک میکروفنهایش صداها را بشنود، بابلندگوهایی با شما سخن بگوید - فرضا بصورت محدود - و چهارپایش را حرکت دهد.

همچنین در جعبه این ربات، دستگاه کنترل از راه دوري وجوددارد، که میتوانید انواع مختلف دستورها را به ربات بدهید. اولین کاري که میخواهید بکنید، این است که اگر ربات شما را دید، خرناسه بکشد، اما اگرغریبهاي را مشاهده کرد، با صداي بلند عوعو کند. فعلا فرض میکنیم، که ربات توانایی تولید آن صداها را دارد، اما هنوز چهره شما را یاد نگرفته است. پس کاري که میکنید، این است که جلوي چشمهایش قرار میگیرید، و به کمک کنترل از راه دورتان به او دستور میدهید، که چهرهاي که جلویشمیبیند را با خرناسهکشیدن مربوط کند. اینکار را براي چند زاویه مختلف از صورتتان انجام میدهید، تا مطمئن شوید، که ربات در صورتی که شمارا از مثلا نیمرخ ببیند، بهتان عوعو نکند.

همچنین شما چند چهره غریبه نیز به او نشان میدهید و چهره غریبه را با دستور عوعوکردن، مشخص میکنید. در این حالت شما به کامپیوتر ربات گفتهاید، که چه ورودياي را به چه خروجیاي مربوط کند. دقت کنید که هم ورودي و هم خروجی مشخص است و در اصطلاح خروجی برچسبدار1 است. به این شیوه یادگیري، یادگیري بانظارت2 میگویند.اکنون حالت دیگري را فرض کنید. برخلاف دفعه پیشین که به رﺑﺎﺗﺘﺎن میگفتید، چه محرکی را به چه خروجی ربط دهد، اینبار میخواهید، ربات خودش چنین چیزي را یاد بگیرد. به این صورت که اگر شما را دید و خرناسه کشید، به نحوي به او پاداش دهید - مثلاً به کمک همان کنترل از راه دورتان - و اگر به اشتباه به شما عوعو کرد، او را تنبیه کنید - باز هم با همان کنترل از راه دورتان - . در این حالت به ربات نمیگویید به ازاي هر شرایطی چه کاري مناسب است،

بلکه اجازه میدهید ربات خود کاوش کند و تنها شما نتیجه نهایی را تشویق یا تنبیه میکنید. به این شیوه یادگیري، یادگیريتقویتی3 میگویند.در دو حالت پیش قرار بود، ربات ورودياي را به خروجیاي مرتبط کند. اما گاهی وقتها تنها میخواهیم ربات بتواند ﺗﺸﺨﯿﺺ دهد که آنچه میبیند - یا میشنود و... - را به نوعی به آنچه پیشتر دیدهاست، ربط دهد، بدون اینکه به طور مشخص بداند، آنچیزي که دیده شدهاست، چه چیزي است یااینکه چه کا ري در موقع دیدناش باید انجام دهد. ربات هوشمند شما باید بتواند بین صندلی و انسان تفاوت قایل شود، بیآنکه به او بگوییم این نمونهها صندلیاند و آن نمونههاي دیگر انسان. در اینجا برخلاف یادگیري بانظارت هدف ارتباط ورودي و خروجی نیست، بلکه تنها دستهبندييآنها است.

این نوع یادگیري که به آن یادگیري بی نظارت4 میگویند بسیار مهم است، چون دنیاي ربات پر از وروديهایی است که کسی برچسبی به آنها اختصاص نداده، اما به وضوح جزیی از یک دسته هستند.از آن جا که شما سرتان شلوغ است، در نتیجه در روز فقط میتوانید، مدت محدودي با ربات تان بازي کنید و به او چیزها را نشان دهید و نامشان رابگویید - برچسب گذاري کنید - . اما ربات در طول روز روشن است و دادههاي بسیاري را دریافت میکند. در اینجا ربات میتواند، هم به خودیه خودو بدون نظارت یاد بگیرد و هم اینکه هنگامی که شما او را راهنمایی میکنید، سعی کند از آن تجارب شخصیاش استفاده کند، و از آموزش شما بهره بیشتري ببرد. به ترکیبی که عامل هوشمند هم از دادههاي بدون برچسب و هم از دادههاي با برچسب استفاده میکند، یادگیري نیمه نظارتی5 گفته می شود.

کارهاي مرتبط

در طی سالهاي گذشته جمعسپاري بهصورت یک نیروي عظیم آموزشدیده از کاوش محاسبات انسانی براي انواع کارهاي کوچک ظاهر شده است. از جمله این کارها میتوان به برچسب گذاري ﺗﺼﻮﯾﺮ، حاشیهنویسی زبانهاي طبیعی6 ، قضاوت - تشخیص - ارتباطی7 و ... اشاره کرد.در واقع "حاشیهنویسی8 در زبانهاي برنامهنویسی" یکی از مفاهیمی است که در زبان برنامهنویسی جاوا معرفی شد. "ﺣﺎﺷﯿﻪﻧﻮﯾﺴﯽ" در حقیقت یک فراداده9 است و براي مستندسازي اجزاي برنامه از قبیل کلاسها، رابطها، متغیرهاي محلی و ... استفاده میشود. برخلاف دیگر روشهاي سنتی،مستندسازي یعنی استفاده از متنهاي توضیحی در میان کدهاي برنامه که فقط براي انسان قابل درك است و توسط کامپایلر صرفنظر میشود، مستندسازي با استفاده از حاشیه نویسی هم براي انسان هم براي کامپایلر جاوا و هم براي اجراکننده جاوا قابل درك است.قضاوت نسبی به معنی بیان میزان یک شی با استفاده از واحدهاي نسبی است.

به عنوان مثال بیان نمره امتحانی یک دانشجو با A، B،C، D یک قضاوت نسبی است که هر نمره توصیفی میزان عملکرد دانشجو را در یک محدوده مشخص نشان می دهد. امتُرك آمازون توجهات بسیاري را در حوزههاي تحقیقات صنعتی و علمی به خود جذب کرده است. در این تحقیقات ام ترك بهصورت یک سکوي مناسب، ارزان و کارآمد براي کارهایی از جمع سپاري در نظر گرفته میشود که انجام این کارها بهصورت خودکار مشکل بوده اما امکان انجام آنها توسط افراد از راه دور امکانپذیر است. در ام ترك آمازون، "درخواستکنندهها" بهطور معمول بسیاري ازکارهاي کوچکِ10 حاشیهنویسی را پیشنهاد میکنند و پیمانکاران میتوانند هر کدام از این وظایف را براي انجام دادن انتخاب کنند.درخواستکنندهها برچسبهایی با سرعت بیشتر و مقرون بهصرفهتر را به دست میآورند و افراد پیمانکار درآمدي را کسب میکنند.

مطالعات گذشته نشان میدهدکه متأسفانه افراد بنا به دلایلی از جمله ضعیف بودن طراحی یا انگیزهي - انجام - وظایف، وجود پیمانکاران بیاثر و یا غیر متعهد و یا پیچیدگی کار حاشیهنویسی، داراي واریانس - اختلاف - بالایی در دقت کار انجام شده هستند.دو روش معمول براي کنترل کیفیت عبارتاند از: - الف - فیلترینگ افراد - بهعنوان مثال شناسایی افراد با کیفیت پایین - انجام کار - و مستثنا کردن آنها - و - ب - جمعآوري برچسبها از افراد متعدد براي یک نمونه معین بهمنظور رسیدن به یک برچسب "اجماع" واحد.[9]برآورد دقیق برچسبهاي اجماع براساس برچسبهاي افراد چالش برانگیز است. برچسبهاي "اجماع" متشکل از برچسبهاي تکتک افراد است و براساس استنباط از مجموع برچسبهاي جداگانه، برچسب "اجماع" حاصل میشود. منظور از عبارت "وفاق عمومی" یا "اجماع " این است که تمامی یا بیشت ر افراد بر روي آن اتفاق نظر داشته باشند. یک روش متداول براي انجام این کار، روش "رأي اکثریت"11 است، که کاربردي آسان دارد و اغلب

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید