بخشی از مقاله

چکیده

با گسترش روز افزون تعداد کاربران شبکه های اجتماعی، تشخیص اجتماعات موضوع محور بر اساس موضوعات مشترک مورد علاقه کاربران به یکی از زمینه های پژوهشی جذاب در حوزه تحلیل شبکه های اجتماعی بدل گشته است. یک از چالش های این حوزه وابسته بودن الگوریتم ها و راهکارهای تشخیص اجتماعات بر اساس محوریت موضوع شبکه های اجتماعی است.

از این رو در این پژوهش، شبکه ای از مقالات و ارجاعات بین آنها به عنوان مطالعه موردی با استفاده از نرم افزار پایگاه داده گراف محور Neo4j پیاده سازی شده است. سپس به منظور استفاده از راهکار خوشه بندی گراف به کمک نرم افزار داده کاوی Rapidminer سه الگوریتم خوشه بندی متفاوت بر گراف موضوعی مقالات و ارجاعات اعمال شد. متریک های مورد استفاده در خوشه بندی های صورت گرفته، عنوان مقالات و کلمات کلیدی مقالات در نظر گرفته شد. نتایج حاکی از مناسب تر بودن متریک عنوان نسبت به کلمات کلیدی به علت تخصصی تر بودن دامنه لغات است.

-1 مقدمه

رشد روزافزون کاربران شبکه های اجتماعی در سالهای اخیر به علت همگانی شدن استفاده از اینترنت و سهولت کاربرد این شبکه ها، زمینه های پژوهشی جدیدی فراروی محققان گشوده است که از جمله آن می توان به موضوع تشخیص اجتماعات در شبکه های اجتماعی، موارد مربوط به حفظ حریم خصوصی و ... اشاره نمود. به این منظور نیاز به ابزارهایی جهت پیاده سازی شبکه های اجتماعی با حجم وسیعی از کاربران و اطلاعات پروفایل آنهاست.

امروزه تئوری گراف برای نمایش مجموعه های داده بزرگ ناشی از شبکه های اجتماعی و پایگاه های داده با مقیاس بزرگ مورد استفاده قرار می گیرند و نرم افزارهای معروفی چون Neo4j از جمله نرم افزارهای پایگاهی گراف محور در این حوزه است. همچنین نرم افزارهایی چون Cassandra و MongoDB نیز تحت مدل NoSQL با خروج از مدل رابطه ای پایگاه داده به نگهداری حجم وسیعی از اطلاعات و ایجاد مکانیزم هایی جدید برای سهولت دسترسی به اطلاعات می پردازند. پایداری اطلاعات، مقیاس پذیری، قابلیت همزمانی، قابلیتهای مرتبط با حافظه، امنیت اطلاعات و ... از جمله دلایل استفاده از تئوری گراف در نمایش داده های حجیم است.

اجتماع* در یک شبکه اجتماعی بیانگر زیرمجموعه متراکمی از گره های به هم متصل در تعریف توپولوژیک است اما در تعریفی بر اساس شاخص موضوع محور بودن شبکه به زیرمجموعه ای مفهومی و نه لزوما توپولوژیک از شبکه اجتماعی اطلاق می گردد. در ادامه پس از مروری بر ادبیات پژوهش های مرتبط با موضوع تشخیص اجتماعات در شبکه های اجتماعی، متودولوژی روش پیشنهادی این پژوهش و یافته های حاصل از آن در تشخیص اجتماعات در شبکه های موضوع محور مورد بحث قرار می گیرد

-2 مروری بر ادبیات پژوهش

لیو و همکاران - 2014 - ، گراف خوشه وزندار برای تشخیص اجتماع از شبکههای بزرگ اجتماعی را پیشنهاد کردند که در آن گراف ها با یال های بدون جهت رایج ترین نوع نمودارها در نمایش شبکه میباشند. در گراف های جهتدار، نمودار به چندین زیر بخش یا خوشه تفکیک می-شود و هر خوشه دارای یک مقدار وزنی است که این مقدار شاخصی از اهمیت خوشه در گراف است. در این مدل، هر گره وزن مربوط به خود را داراست و علاوه بر آن بین هر دو گره یک مقدار وزنی نیز وجود دارد و پیمایش در هر خوشه همیشه از بیشترین وزن مابین دو گره انجام میگیرد تا بتوان به تابع هدف بهینه دست یافت. شکل 1 نمونه ای از یک گراف وزن دار را نمایش می دهد 

شکل 1 یک گراف وزن دار در مدلسازی شبکه های اجتماعی

پیزوتی - 2008 - ، ایده کشف جوامع در شبکهها با استفاده از الگوریتم ژنتیک را مطرح نمود. در این روش، مفهوم امتیاز هر اجتماع، اندازه-گیری کیفیت یک پارتیشن در شبکه و تلاش برای بهینهسازی آن است. تمامی جوامع متراکم در ساختار شبکه در پایان از الگوریتم پیگیری انتخابی فضای جستجو، بدون نیاز به دانش قبلی در پیشبرد دقیق شناسایی تعدادی از گروه ها استفاده میکنند. این الگوریتم از اپراتورهای متنوعی برای کاهش فضای راهحلها جهت دستیابی به نتایج بهبود همگرایی استفاده میکند. برخلاف بسیاری از روش های موجود، الگوریتم ژنتیک تعدادی از جوامع را یافته و بر روی آنها آزمایش و مقایسات انجام میدهد. آزمایش بر روی شبکههای مصنوعی و واقعی نشاندهنده قابلیتهای الگوریتم ژنتیک در تشخیص جوامع است که با نتایج دیگر روشها قابل مقایسه هستند 

چن و همکاران - 2012 - ، الگوریتم بهینهسازی کلونی مورچگان را برای تشخیص ساختار اجتماع در شبکه های اجتماعی معرفی نمودند. منظق الگوریتم پیشنهادی آن ها بر این حقیقت استوار است که هر مورچه راه خود را با توجه به فرومون و اطلاعات اکتشافی در هر مسیر انتخاب میکند. کیفیت راهحل به دست آمده توسط هر مورچه توسط پیمانه در همان کلونی اندازهگیری میگردد. به این منظور، این الگوریتم میتواند نتایج با کیفیت بالاتر ودقیقتری را در جهت رسیدن به اطلاعات پیمایش گرهها نشان دهد 

ریحانیان و همکاران - 2016 - ، الگوریتم تشخیص جامعهگرا مبتنی بر دسته بندی اشیاء اجتماعی و تجزیه و تحلیل لینک را مطرح نمودند. این رویکرد میتواند جوامع موضوعی را که منعکس کنندهی موضوعات و قدرت پیوندها است به طور همزمان شناسایی کند

زائو و همکاران - 2012 - در پژوهش خود، تشخیص اجتماع را از امتیاز مبتنی بر شبکههای اجتماعی در پیدا کردن جوامع معنیدار با اطلاعات افزون تر در آن دسته از سایتهای شبکههای اجتماعی که در آنها کاربران احساسات خود را نسبت به اشیاء مختلف - مانند فیلم - با استفاده از روش دستهبندی بیان میکنند انجام دادند. بنابراین شبکه به خوشههای مختلف موضوعی که در آن گرهها همان موضوع مورد علاقهاند تقسیم شده است. سپس یک الگوریتم تشخیص اجتماع برای خوشه موضوعی برای پیدا کردن جوامع معنیدارتر مورد استفاده قرار گرفته است. این به شناخت جوامعی منجر خواهد شد که در آن گرهها اتصال محکم در موضوع مشترک دارند.

در گذشته نتایج حاصل از تشخیص جامعه با موضوع و با نتایج حاصل از تشخیص جامعه، بدون در نظر گرفتن موضوعات مورد علاقه انجام شده است. ارزیابی کمی نشان میدهد که نتایج حاصل از تشخیص جامعه زمانی که موضوع مورد علاقه در شبکه در نظر گرفته شود بهبود قابل توجهی خواهد داشت . همچنین در این پژوهش، تشخیص جامعه موضوع محور را از طریق اشیاء اجتماعی و تجزیه و تحلیل لینک در شبکههای اجتماعی با توجه به رویکرد ترکیبی از موضوع و لینک مطرح کردند. در این پژوهش، متریک ارزیابی شامل دو جنبه یکی برای موضوع و دیگری برای ساختار ارتباط درنظر گرفته شد. جوامع تشخیص داده شده در این روش در شکل 2 با رنگ های مختلف نشان داده شده است 

شکل 1 از هر موضوع با شروع از یک گره مرکزی به پیمایش گرهها و یافتن گرههای دیگر از طریق منابع آن مقاله اقدام شد. نمایی از یکی از اجتماعات ایجاد شده در شکل 4 نشان داده شده است. سپس در بخش بعد با برچسب C پیمایش تا رسیدن به گرههای مشترک ادامه یافت در بخش بعد با برچسب D بعد از یافتن منابع مشترک در بین مقالات به شناسایی یال های اتصال دهنده تمامی گره ها اقدام شد. سپس در بخش بعد در شکل 1 که با برچسب E نمایش داده شده است پایگاه داده گراف محور نهایی با دستورات زبان پرس و جوی Cypher در نرم افزار Neo4J اقدام شد. بعد از ایجاد هر گره، با فراخوانی آن فیلدهای اطلاعاتی مورد نیاز به گره افزوده شد که شامل عنوان مقاله، تاریخ چاپ و کلمات کلیدی است.

شکل 2 تشخیص اجتماع موضوع محور از طریق اشیاء اجتماعی و تجزیه و تحلیل لینک در شبکههای اجتماعی

فن و همکاران - 2015 - ، تشابه بین ساختارهای جوامع شبکههای اجتماعی آنلاین مختلف را مطرح نمودند که در آن در شبکههای اجتماعی اینترنتی، کاربر می تواند یک یا چند لیست از کاربران دیگر ایجاد و لیستها را در پروفایل خود برای نمایان ساختن روابط دوستانه خود با دیگران به اشتراک گذارد. در این کار به طور عمده بر روابط دوستی کاربران در شبکههای اجتماعی آنلاین تمرکز می شود. عموما شبکههای اجتماعی، گراف های بدون جهت هستند و بدان معناست که اگر دو کاربر دارای رابطه ی دوستی هستند آنها در لیست دوستان یکدیگر ظاهر خواهند شد. اما در توییتر، دو نوع از دوستی وجود دارد: ''پیرو'' و ''پیروی شونده''. کاربر میتواند برخی از کاربران را که علاقه مند به دنبال کردن آنهاست دنبال نماید که این کاربر ''پیرو'' خواهد بود و این کاربر همچنین می تواند ''پیروی شونده'' توسط کاربران دیگر باشد. بنابراین شبکه توییتر یک گراف جهتدار است

-3 متدولوژی پژوهش

در این مقاله، یک مدل پیشنهادی جهت تشخیص جوامع با محوریت موضوع در شبکه های اجتماعی پیشنهاد می گردد. شکل1 چارچوب مدل پیشنهادی را به تصویر کشیده است که در ادامه توضیحات هر قسمت ارائه خواهد شد.

ابتدا به تشکیل گرافی در نرم افزار پایگاه داده گراف محور Neo4J پرداخته شد که در آن هر گره معرف یک مقاله و هر یال معرف ارجاع آن گره به مقاله دیگر در بخش مراجع است. این بخش در شکل 1 با برچسب A نشان داده شده است.

شکل 3 چارچوب مدل پیشنهادی در متدولوژی پژوهش

در زمینه یال های برقرار کننده ارتباط بین اجتماعات در گراف پایگاهی تشکیل شده چهار حالت ها مختلف مشاهده شد که این حالتها به شرح زیر می باشند:

-1 گره ها در شاخههای فرعی اجتماعات از منابع مشترک استفاده کرده باشند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید