بخشی از مقاله

چکیده -

هم اکنون وب، از مهمترین رسانههای مورد استفاده در تولید، انتشار و تبادل اطلاعات است که هدف آن ارائه بهینه اطلاعات در سطح شبکه جهانی می باشد، از طرف دیگر وب معنایی میتواند به صورت مشخص در جمع آوری تکنولوژیها موجود با تمرکز ویژه بر روی به روز رسانی کردن سیستم های اطلاعاتی مبتنی بر وب موجود به سمت معنا دار کردن آن ها استفاده کند .

در این مقاله قابلیتهای وب معنایی و کاربرد آن در سیستم های پیچیده مانند شبکه های نظیر به نظیر مورد تحلیل و بررسی قرار گرفته است. از آنجایی که وب معنایی بر مسئله اشتراک گذاری اطلاعات بین گره های مختلف متمرکز است، ترکیب وب معنایی و شبکه های توزیع شده ی نظیر به نظیر موجب ایجاد مجموعه وسیعی از داده های ساخت یافته خواهد شد. همچنین زیرساختی مقیاس پذیر برای سیستم های مبتنی بر وب معنایی بررسی گردیده است که در این میان، روش GridVine روشی است که هر دو مسئله قابلیت همکاری و مقیاس پذیری را به صورت موازی در سیستم های توزیع شده مورد بررسی قرار داده است.

-1 مقدمه

روند رو به توسعه ی تکنولوژی در دهه های اخیر باعث تجمیع انبوهی از اطلاعات گردید که این فزونی اطلاعات ایجاب میکند با مدیریت صحیح ، یکپارچگی اطلاعات را سر لوحه کارمان قرار دهیم .برای نیل به این هدف نیاز به اطلاعات وپردازش های مفهومی داریم به طوری که ماشین ها نیز توانایی فهم اطلاعات را داشته باشند. وب معنایی یک جنبش مشترک است که فرمت های رایج داده را روی شبکه گسترده جهانی ترویج می کند.

اگرچه وب معنایی تکنولوژی جدیدی در مسئله نمایش اطلاعات در شبکه جهانی وب محسوب میشود و آیندهی درخشانی را پیش رو دارد، اما جهتگیری این تکنولوژی به همراه ویژگی های آن مورد توافق عام نمیباشد . نمایش داده در وب به صورت اساسی در قالب چارچوب توصیف منابع مورد استفاده قرار میگیرد که اکنون آن را استاندارد W3Cدر نظر میگیرند. مدل RDFروشی را به منظور نمایش حداقلی داده ها را فراهم میآورد که مشابه زبان HTTP در شبکه جهانی وب است.

سیستمهای نظیر به نظیر ساخت یافته این امکان را فراهم میکنند تا با استفاده از یک مکانیزم مقیاس پذیر، داده ها را بر اساس اندیس ذخیره و بازیابی نمایند .نکته قابل توجه این است که این مکانیزم حتی در زمان خرابی گره نیز قابل کاربرد است .اما چالشی که سیستم های نظیر به نظیر با آن مواجه هستند عدم پشتیانی از مفهوم معناگرایی در اشتراک گذاری اطلاعات است .

بر این اساس نیاز ترکیب سیستم های توزیع شده نظیربه نظیر با مفهوم وب معنایی احساس میشود که در ادامه توضیحات کامل تری از این رویکرد ارائه خواهد شد .در ادامه، مطالب این مقاله به صورت زیر ارائه خواهد شد :در بخش دوم طرح های توزیع شده و معنایی در سیستم های توزیع شده نظیر به نظیر ارائه خواهد شد .در بخش سوم ذخیره سازی و بازیابی دادههای RDFدر سیستمهای توزیع شده نظیر به نظیر مبتنی بر وب معنایی ارائه خواهد شد ، در بخش چهارم سیستم مدیریت داده ها در سیستم های توزیع شده نظیر به نظیر ارائه خواهد شد و در نهایت در بخش پنجم مقاله، نتیجه گیری خواهد شد.

-2 مفاهیم توزیع شده و وب معنایی در سیستمهای نظیر به نظیر

هدفی که در این بخش دنبال می شود حل مشکل تبادل و پرس و جوی داده های معنایی است که در ادامه به توضیح کاملتر آن خواهیم پرداخت. در مقاله شماره []چارچوب توزیع شده و افزایش مقیاس پذیری مورد بررسی قرار گرفته که با مدل Master-Slave و پراکنده کردن آدرسهای seed توسط Master بین Slave ها ، اجرای یک دور از فرآیند کاوش توسط Slave ها پراکنده کردن URI ها توسط Slave ها بین یکدیگر در پایان هر دور مورد بررسی قرار گرفت

2-1 نگاشت معنایی با استفاده از تصمیم گیرنده

در مقاله [8] نگاشت معنایی بین گره های نظیر در سیستمهای توزیع شده نظیر به نظیر بر اساس یک روش تصمیم گیرنده صورت میگیرد تا بتوان به یک کیفیت حداکثر در نگاشت معنایی دست یافت .برای همین منظور در این مقاله الگوریتمی به نام QOMارائه شده است که در آن، مسئله تفسیر معنایی بین گره های نظیر در نظر گرفته شده است .یکی از ویژگیهای این روش نگاشت سریع است که در آن ساختارهای آنتولوژیکی بزرگ به سرعت در بین گره های نظیر به نظیر نگاشت می یابد که موجب تفسیر معنایی و تعیین شباهت معنایی بین مفاهیم گرههای نظیر میشود .نویسندگان این مقاله اثبات کردهاند که روش QOM در مقایسه با سایر روش ها پیچیدگی زمانی کمتری را نشان میدهد که این نشان دهنده تضاد بین کاهش دقت و افزایش بهینگی - از نظر زمان اجرا - است.

-1-2  تناسب معنایی از الگوی کلاس بندی نامتجانس

در مقاله [14 ] مسئله قابلیت همکاری مبتنی بر معناگرایی در بین گره های نظیر در سیستم های توزیع شده با تمرکز بر نگاشت زوجی بین الگوهای پویا مورد بررسی قرار گرفته است. در صورتی که الگوها از قبل تعیین نشده باشند - این حالت در شبکه های نظیر به نظیر که در آن گره های نظیر به صورت پویا در حال اتصال به شبکه و قطع ارتباط با آن هستند - نگاشت بازهم ایجاد خواهد شد .برای همین منظور دو ایده جدید قابل استفاده است : اولین مورد این است که نگاشتها باید به صورت روابط معنایی تعریف شوند - که نیازمند تفسیری کامل و دقیق از مدل و تئوری است - ؛

دومین مورد این است که هر معنی ضمنی در یک الگو به صورت یک معنی آشکار تبدیل شود که در این صورت مسئله نگاشت بین دو الگو به مسئله یافتن روابط معنایی بین دو الگو تبدیل میشود .لازم به ذکر است که هر الگو برای هر یک از عناصر خود برچسب های معنادار دارد .استنباط معنایی به منظور تعیین روابط معنایی بین الگو با سه سطح از دانش انجام میشود :دانش لغوی - دانشی در مورد در کلمات در برچسبها - ، دانش عمومی - دانشی در مورد روابط بین مفاهیمی که در کلمات بیان میشوند - ، و دانش ساختاری - ساختار گراف الگو . - زمانی که الگوها با استفاده از سه نوع دانش فوق کدگذاری شدند، الگوی مورد نظر با استفاده معنا و مفهوم تحت عمل استنتاج منطقی قرار می گیرد.

2-3 نگاشت معنایی با استفاده از تقریب

در مقاله [10] مسئله یافتن انطباقات در بین الگوهای نامتجانس مورد بررسی قرار گرفته است .در این مقاله روشی به منظور کشف نگاشتهای تقریبی بین دو مفهوم خاص پیشنهاد شده است. برای همین منظور یک تقریبی بین یک زوج از مفاهیم محاسبه می شود که یک مفهوم تا چه میزان مفهوم دیگر را نیز پوشش می دهد .به بیان دیگر این مقدار عددی را می توان به عنوان خطا در مسئله پوشش مفاهیم بر یکدیگر در نظر گرفت که در صورتی که این مقدار به صفر نزدیک باشد نشان دهنده آن است که الگوی اول به صورت حداکثر مفاهیم معنایی در الگو دوم را پوشش می دهد .در این مقاله نویسندگان دو ایده فوق را در محتوای آنتولوژی موسیقی اعمال نمودند که برای همین منظور از اطلاعات فراداده موسیقی که از طریق اینترنت جمع آوری شده بود، استفاده نمودند.

.3 ذخیره و بازیابی داده های RDF در سیستمهای توزیع شده

در ابتدای این بخش به تحقیقات صورت گرفته در زمینه ذخیره بازیابی داده های معنایی در سیستم های نظیربه نظیر خواهیم پرداخت .از آن جایی که مدل RDF ساختار متداول به منظور به دریافت اطلاعات معنایی است، این بخش را می توان با عنوان ذخیره سازی داده های RDF و تلاش به منظور بازیابی بهینه اطلاعات RDF ذخیره شده در سیستم های توزیع شده نظیر به نظیر در نظر گرفت.

3-1 مدل RDF و معماری های سنتی پرس و جو - بازیابی - اطلاعات

در مقاله [ 11 ] مسئله بازیابی داده های RDF در یک محیط توزیع شده از نقطه نظر معماری مورد بررسی قرار گرفته است .در این مقاله یک معماری میانی ارائه شده است که به عنوان قلب یک سیستم مبتنی بر معنا در نظر گرفته میشود .معماری میانی پرس و جو را دریافت کرده و در صورتی که مقصد پرس و جو از ساختار - طرح - متفاوتی به منظور ذخیره سازی داده استفاده نماید، معماری میانی پرس و جوی دریافتی را به صورت دیگر بازنویسی مینماید .

به منظور بهبود ویژگیهای تحمل خطا و مقیاس پذیری در روال ذخیره سازی و بازیابی اطلاعات RDF ، معماری های میانی متفاوتی ارائه شده است که نمونههای عبارتند از معماری میانی سلسله مراتبی 2 و معماری میانی شراکتی - مبتنی بر همکاری - 3. معماری HMA مسئول کاهش بار پردازشی پرس و جو در واحد میانی است که قبل از واحد میانی قرار دارد .همچنین این واحد - معماری - میتواند به عنوان بخشی از واحد میانی در نظر گرفته شده و بخشی از عملیات پردازش پرس و جوها را اجرا نماید .از معایب معماری HMA محدودیت در تحمل خطاست .

در معماری CMAواحدهای میانی به عنوان گره های مدیر در سیستمهای توزیع شده نظیر به نظیر در نظر گرفته و مابقی گره برای پرس و جو با گره های مدیر متصل میشوند .با این نوع سازماندهی ویژگیهای تحمل خطا و مقیاس پذیری را در زمان ذخیره سازی و بازیابی اطلاعات فراهم میشود .نکته قابل توجه این است که گرههای مدیر نیز خود با یک گراف تصادفی متصل شدهاند .از چالش این نوع معماری این است که خرابی گرههای مدیر موجب قطع پرس و جو میشود .علاوه بر این باید مسئله نسبت گرههای نظیر به نظیر به گرههای مدیر نیز در نظر گرفته شود.

3-2 پردازش پرس و جو در مدلRDF

یکی از تکنیکها در مسئله پردازش پرس و جوها در مدل RDF ، که یک ابزار پیشرفته به منظور پردازش پرس و جوهای RQL تکنیک SQPeer [12 ] می باشد .به منظور پردازش پرس و جوها، هر گره نظیر باید پایگاه های موردنظر خود را به فرمRVL در شبکه نظیربه نظیر اعلام نماید .تکنیک SQPeer پرس و جوی درخواستی را به نحوی قالب بندی مینماید که با اطلاعات اعلام شده - تبلیغ شده - توسط هر گره نظیر تکمیل شده و به عنوان پاسخ واقعی پرس و جوی مورد نظر تولید شود .

در صورتی که یک پرس و جوی پیچیده درخواست شود، پرس و جوی موردنظر به چند زیر پرس و جو تقسیم شده، سپس سرویس جستجوی نظیر به نظیر به منظور انطباق اطلاعات هر گره نظیر با پرس و جوی ورودی مورد استفاده قرار میگیرد .لازم به ذکر است که طراح پرس و جو طرحی به منظور اجرای پرس و جو تولید مینماید که این طرح با کمک گرههای نظیر مناسب و مرتبط اجرا خواهد شد-.

3-3 تحلیل تابعDHT 5 بر اساس گرافCayley

در مقاله [13 ] جداول مختلف - DHTبر اساس تئوری جبر مورد تحلیل و بررسی قرار گرفته و نتیجه حاصل در این مقاله این است که تعداد توابع DHT در سیستمهای توزیع شده نظیر به نظیر مبتنی بر تئوری گراف Cayley است .لازم به ذکر است که گراف Cayleyیک مدل تئوری به منظور تحلیل ارتباطات داخلی شبکه است .به عنوان مثال، مدل Chord حالت خاصی گرافCayley است که با استفاده از گراف دور بدست آمده است .همچنین این مقاله اثبات کرده است که نمونه توابع DHT غیر Cayley مانند P- Gridو Pastry/Tapestry نیز ویژگیهای گراف Cayley را دارند که مزایایی همچون تقارن، تعادل بار پردازشی، سلسله مراتب، تحمل خطا و ویژگی همیلتونی را در شبکه توزیع شده نظیربه نظیر فراهم میآورد .

به عنوان نتیجه از بخش می توان به این هدف اشاره کرد که هدف اصلی این است که بر اساس رویکرد طراحی جبری، توابع DHT به صورتی ساخته شوند که در آن داده ها و گرههای نظیربه نظیر نیازمند عمل هش 6 نباشند .این مسئله در وب معنایی از اهمیت بالایی برخوردار است؛ بدین صورت که سیستم های نظیربه نظیر ساخته یافته در صورت عدم استفاده از تابع هش، امکان اعمال مفهوم وب معنایی و تکنولوژیهای پایگاه داده را در مسئله مدیریت داده و پردازشپرس و جو فراهم نموده و در نتیجه ویژگی هایی همچون مقیاس پذیری و تحمل خطا به سیستم های توزیع شده نظیر به نظیر افزوده خواهد شد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید