بخشی از مقاله
چکیده :
سابقه و هدف: Community1 structure یکی از خواص کلیدی شبکه های پیچیده است و نقش مهمی در توپولوژی و عملکرد آن دارد. در حالی که مقدار قابل توجه ای از کارها در مورد تشخیصCommunity انجام می شود توجه بسیار کمی تا کنون به منظور بررسی Community در شبکه های واقعی اختصاص داده شده است. تجزیه و تحلیل تجربی و سیستماتیک در موردخواص آماری Community ها با اطلاعات جامع، ارتباطات، فن آوری، بیولوژیکی و شبکه های اجتماعی ارائه کردیم.و به این نتیجه رسیدیم که شبکه ی سازمان های مزوسکوپی با مقوله ی یکسان به طور قابل ملاحظه ای مشابه یک دیگرهستند. این واقعیت در چند ویژگی Community structure منعکس شده است که می تواند به عنوان '' اثر انگشتی '' برای شبکه های خاص استفاده شود.
در حالی که توزیع اندازه Community همیشه گسترده است گروه های خاصی از شبکه ها عمدتا از Community ها درخت مانندی - شجره ای - تشکیل می شوند در حالی که دیگرگروه ها ماژول های متراکم تری دارند. میانگین طول مسیردر Community ها در ابتدا به صورت لگاریتمی و بسته به اندازه ی جامعه رشد می کند اشباع رشد و کاهش برای جوامع بزرگتر از اندازه مشخصه رخ میدهد. این رفتار به حضورمراکز فعالیت در Community ها مرتبط است که نقش آن در سراسر دسته متفاوت است. در این مقاله به بررسی خدمات شبکه های اجتماعی آنلاین - SNS - که در سال های اخیر رشد سریع داشته است می پردازیم.
-1مقدمه :
علم مدرن سیستم های پیچیده پیشرفت قابل توجه ای را پس از این کشف که نمودارها نشان دهنده ی چنین سیستم هایی با وجود سادگی آن هستند تجربه کرده است و مجموعه ای از ویژگی های که به منظور افشای خواص کلی ساختاری و مکانیسم عملکرد و تکامل اهمیت دارند را نشان میدهد. نشان دادن یک سیستم پیچیده در یک نمودار به معنی تبدیل واحدهای ابتدایی سیستم به گره است در حالی که ارتباط بین گره ها نشان دهنده ی تعاملات متقابل و روابط آن ها است. بسیاری از شبکه های پیچیده با توزیع گسترده ای از تعداد مجاورت یک گره به عنوان مثال درجه آن مشخص می شوند. که مسئول خواص عجیب و غریبی مانند نیرومندی در برابر شکست تصادفی وعدم وجود یک آستانه برای گسترش اِپیدمی می باشد.
یکی دیگر از ویژگی های مهم شبکه های پیچیده توسط ساختار مزوسکوپی آن ها نشان داده شده است و توسط حضورگروهی از گره ها و Community و یا ماژول با ظرفیت زیاد در ارتباط بین گره همان گروه و تراکم نسبتا پایین ارتباط بین گره های گروه ها ی مختلف مشخص میشود. این شبکه ی سازمانی در سیستم هایی با منشاء متنوع بسیار رایج است. این امر از قبل در دهه ی 1960 قابل توجه بود و اظهار داشت که یک ساختار مدولار سلسله مراتبی برای استحکام و ثبات سیستم های پیچیده الزامی میباشد و به آنها مزیت تکاملی می بخشد. بررسی Community شبکه ای به سه دلیل اصلی اهمیت دارد که عبارت است از :
- 1 آشکار کردن سازمان شبکه در سطح کلان که ممکن است به تدوین و فرموله کردن مکانیسم واقعی برای پیدایش وتکامل آن کمک کند.
- 2 درک بهتر فرایندهای پویا در حال وقوع در شبکه - به عنوان مثال فرآیندهای اپدیمیک ونوآوری - که ممکن است، بطور قابل توجهی توسط ساختار مدولار تحت تاثیر قرارگیرد.
- 3 کشف روابط بین گره ها که با بررسی کلی نمودار که به طور معمول می تواند به عملکرد سیستم نسبت داده شود آشکار نمیشود. بنابراین تعجب آور نیست که سال گذشته شاهد انفجار پژوهش در ساختار Community در نمودارها بودیم. مشکل اصلی این است که چگونه Community ها را در مکان اول قرار دهیم و این یک مسئله ضروریست که بیشتر مقالات به آن پرداخته اند. تعداد زیادی ازروش ها و تکنیک ها طراحی شده اند اما جامعه علمی هنوز در مورد اینکه کدام روش قابل اطمینان ترین روش است و چه زمانی یک روش باید یا نباید اجرا شود به توافق نرسیده است. این امر به خاطر این واقعیت است که مفهوم Community بد تعریف شده است. ازآنجا که تمرکز بر توسعه روش بوده است.
می توان گفت مطالعات بسیار کمی تا کنون در تمرکز به این سوال اساسی انجام شده است : Community در شبکه های واقعی شبیه چه هستند؟ این سوالی است که سعی درارزیابی آن در این مقاله خواهیم کرد. تحقیقات قبلی نشان داده اند که در طیف گسترده ای از شبکه ها توزیع اندازهCommunity با بسیاری از Community های کوچک همراه با برخی از آنهایی که بسیار بزرگترند گسترده تر می باشد. دامنه ی توزیع اغلب به خوبی توسط قانون قدرت جای میگیرد. محققان کیفیت Community را در شبکه های واقعی بررسی کردند. و دریافتند که پایین ترین ضریب هدایت که نشان دهنده ی ماژول های به خوبی تعریف شده اند در Community با اندازه ی 100 گره می باشند در حالی که Community بسیار بزرگتر در مقایسه با سایر شبکه مختلط تر می باشند.
به همین دلیل آنها نشان می دهند که سازمان شبکه ها ممکن است یک ساختار پیرامون هسته ای داشته باشند که در آن حاشیه متشکل از Community کوچک به خوبی تعریف شده و هسته شامل ماژول های بزرگتر می باشد که متصل به یکدیگر هستند در نتیجه تشخیص آن سخت تر میگردد. با این حال خواص اساسی Community درشبکه های واقعی هنوز ناشناخته است. کشف چنین ویژگی هایی هدف اصلی این مقاله است.
برای این منظور تجزیه و تحلیل آماری گسترده ای را از ساختار Community بسیاری از شبکه های واقعی از طبیعت Community و تکنولوژی انجام دادیم. نتیجه گیری اصلی این است که Community با ویژگی های متمایزی برای شبکه هایی از همان طبقه مشترک است اما از یک طبقه به دیگری متفاوت است مشخص میشوند. شایان ذکر است این خصوصیات مستقل از روش های خاص به تصویب رسیده برای پیدا کردن Community و ارتباطات می باشد.
-2روش تحقیق :
هدف مطالعه ی ویژگی های آماری Community است که نیاز به کارگیری مجموعه داده ها بر روی شبکه های بزرگ حاوی تعداد زیاد Community با اندازه های مختلف می باشد. مجموعه داده ها شامل : 105 گره به استثنا ی شبکه های تعامل - پین - که در آن بزرگترین مجموعه داده های در دسترس 104 گره هستند می باشد . جدول 1 مجموعه داده های شبکه ای که استفاده شده است را همراه با برخی ازآمارهای عمومی نشان می دهد. بسیاری از آنها از مجموعه اطلاعات شبکه ی اطلاعات استنفورد2 دانلود شده اند برخی از شبکه ها در اصل جهت دار هستند - به عنوان مثال نمودارهای وب - اما با آنها به عنوان شبکه های بدون جهت رفتار خواهیم کرد. به طور کلی، پنج دسته از شبکه ها در نظر گرفته شده است.
الف -شبکه های ارتباطات: این طبقه شامل شبکه ی ایمیل از یک نهاد بزرگ تحقیقاتی در اروپا و مجموعه ای ازروابط بین کاربران ویکیپدیا که از طریق صفحه بحث خود با یک دیگر ارتباط دارند می باشد. باید به این نکته توجه کرد که هر دو مورد ارتباطات لزوما شخصی نیست بلکه به عنوان مثال ایمیل های انبوه را می توانیم اشاره کنیم که در نتیجه این شبکه ها می توانند به عنوان شبکه های اجتماعی در نظر گرفته شوند.
ب- اینترنت: در اینجا دو نقشه از اینترنت درسطح سیستم خودمختار - AS - - به عنوان مثال گره ها که گروه هایی ازروترها هستند که توسط یک نهاد واحد ایجاد شده اند - و توسط دو پروژه های اصلی توپولوژی اینترنتی کشف شده اند: الف-3 CAIDA ب-DIMES4
ج-شبکه های اطلاعات: این طبقه شامل شبکه ای از مقالات آنلاین در5arxiv که شبکه ای از آیتم های خریدآمازون و دو نمونه از نمودارها می باشد که یکی نشان دهنده ی حوزه stanford.edu berkeley.edu - وب- - BS و دیگری توسط گوگل منتشر شده است.