چکیده

پایگاه دادههای رابطهای زیادی روی وب وجود دارد که دادههای مهم و مفید زیادی را دربر دارند ولی موتورهای جستجوی معنایی نمیتوانند از این دادههـا بـهعنـوان نتـایج جسـتجو استفاده کنند. بنابراین برای غلیه بر این مشکل لازم است، روشهایی برای نمایش معنایی این دادهها از طریق یکپارچهسازی پایگاه دادههای رابطهای با وب معنایی توسـعه داده شـود. در این مقاله روش انتقال برای یکپارچهسازی پایگاه داده رابطهای با وب معنایی شرح داده میشود.

کلمات کلیدی: وب معنایی، آنتولوژی، پایگاه داده رابطهای، شمای رابطهای، یکپارچهسازی، انتقال

مقدمه
هدف وب معنایی که بهعنوان وب دادههاٌنیز شناخته میشود، یکپارچهسازی و معنادار کردن دادههای منابع گوناگون است. در سال ۲۰۰۲، هـی و همکـاران ( He, Patel, Zhang and (Chen, 2007 مشخص کردند که دسترسی به دادههای صفحات وبی که با پایگاههای داده ارتباط دارند (صفحات پویای وبٍ)، حدود ۵۰۰ برابر بیش از دادههای صفحات ایستاست و تقریباً ۲۰ درصـد وبسایتها، از پایگاه دادههای رابطهای برای ذخیرهسازی دادههایشان استفاده میکنند. با وجود این مقدار عظیم از دادههایی کـه در پایگـاه دادههـای رابطـهای ذخیـره شـده اسـت، موفقیـت وب معنایی بهطرز چشمگیری به توسعه روشهایی برای یکپارچهسازی پایگاه دادههای رابطهای با وب معنایی گره خورده است.از سـوی دیگـر محبوبیـت آنتولـوژیهـا (مشخصـات صـریح و رسـمی مفهومسازی) از زمان ظهور وب معنایی بهسرعت در حال گسترش است، زیرا برای استفاده از وب معنایی، اطلاعات باید بهفرمت قابلفهـم بـرای ماشـین نمـایش داده شـوند. کنسرسـیوم ۳W3C چند فرمت برای نمایش دادهها در وب معنایی از جمله RDF، RDF Schema وOWL پیشنهاد کرده است. در این مقاله، ابتدا مفهوم آنتولوژی معرفی و سپس بهترتیب قابلیـتهـا، شـباهتهـا و تفاوتهای آنتولوژی و شمای رابطهای بیان میشود. در ادامه روشهای یکپارچهسازی پایگاه دادههای رابطهای با وب معنایی بیان شـده و روش انتقـال پایگـاه دادههـای رابطـهای بـه آنتولـوژی بـهطـور جامع شرح داده میشود.

آنتولوژی
آنتولوژی در وب معنایی اصطلاحات و ارتباط بین آنها در دامنهی مفروض را بیان میکند (شادگار و عصاره، .(۱۳۳۴ بهطـور رسـمی،یک آنتولـوژی، یـک چهارتـایی O(C, PC, R, H) است. در این جاO نام آنتولوژی با توجه بهدامنه مورد نظر است، C مجموعهای متناهی از مفاهیم یـا کـلاسهاسـت. PCمجموعـه متنـاهی از ویژگـیهـای مفـاهیم، R نمایـانگـر ارتباطات بین مفاهیم و H نیز سلسلهمراتب کلاسها و ویژگیهاست.در حال حاضر، مهمترین زبانهای آنتولوژی برای وب معنایی عبارتند از (شادگار و عصاره، :(۱۳۳۴
RDFُ که مدلی دادهای برای منابع و روابط بین آنهاست. RDF معنای سادهای روی مدل داده ایجاد میکند. این مدل داده با نحو XML قابل نمایش است.

DAML+ 5OILّ، یک زبان نشانهگذاری معنایی ْ است. این زبان گسترشی از زبان RDF است که سعی در کاهش برخی کمبودهای آن از طریق ساخت اولیههایَ غنـیتـر دارد. یکی از مهمترین خصوصیات این زبان، آن است که میتواند معانی اصطلاحات زبان را با اعمال تئوری منطق توصیفیُ فرمولنویسی کند.
RDF Schema یا RDFS، زبان توصیف ویژگیها و کلاسهای منابع RDF است. این زبان حاوی قواعدی برای تولید سلسلهمراتب ویژگیها و کلاسهاست.

OWLًٌ، نسبت به زبان RDFS زبان غنیتری برای توصیف ویژگیها و کلاسهاست؛ برای مثال رابطهی بین کلاسها (کلاسهای مستقلٌٌ)، کاردینالیتی (مثلاًدقیقـاً یـک)، تسـاوی، انـواع غنیتر ویژگی، مشخصات ویژگی (مثل تقارنٌٍ یا تراگذریٌ) و کلاسهای شمارشی در این زبان بهراحتی قابل بیان است. این زبان از واژگان RDF و نحو XML استفاده می

کند،ولی بر کمبودهایی که در دیگر زبانهای آنتولوژی مانند RDF و DAML+OIL وجود دارد، غلبه یافته است.زبان OWL قویترین زبان از نظر قدرت بیان در میـان سـایر زبـان-های آنتولوژی است. این زبان به سه زیرزبان یعنی OWL Lite، OWL DL، OWL Full تقسیمبندی شده است که بهترتیت از راست به چپ قدرت بیان آنها بیشتر مـیشـود و متناسـب با افزایش قدرت بیان، هزینهی محاسباتی نیز افزایش مییابد (شکل .(۱ در زبان OWL دو نوع ویژگی یعنی ویژگی نـوع دادهٍ و ویژگـی شـیء َ وجـود دارد. ویژگـی نـوع داده، ارتباطـات بـین کلاسها و مقادیر ثابتُ را نشان میدهد، درحالی که ویژگی شیء، ارتباطات بین نمونههای دو کلاس را بیان میکند.

شکل-۱ سلسلهمراتب نسخههای زبان آنتولوژی OWL

اهداف و کارآیی آنتولوژی مبتنیبر نوع کاربرد آنتولوژی نیز مختلف است. مهمترین اهداف ساخت آنتولوژی را میتوان بهصورت زیر برشمرد: توافق بر درک مشترکی از مفاهیمِ ساختارهای اطلاعاتی جوامع مختلف فراهمنمودن قابلیت تجزیه و تحیلل و استفادهی مجدد از دانش دامنهی مفروض بیان صریح فرضیات هر دامنه جداسازی دانش عملیاتیِ و دانش دامنهّ

این اهداففقط میتوانند برای آنتولوژیهای دامنه یعنی آنتولوژی مرجع مطرح شوند ولی آنتولوژیهای کاربردیْ یعنی آنتولوژی محلی پس از نگاشت به آنتولوژیهـای مرجـع، شـامل این موارد میشوند.

مشکلات ساخت آنتولوژی

چالشهای بسیاری در ساخت آنتولوژی وجود دارد. این چالشها ممکن است آنتولوژی محلی یا مرجع ویا هر دو را تحتِ تأثیر قرار دهد. چالشهای اصلی ساخت آنتولوژی عبارتند از: تأیید کاملبودن آنتولوژی مشکل اصلی پیرامون ساخت آنتولوژی، چگونگی تأیید کاملبودن آنتولوژی است. به این صورت که روندی ارائه شود که طی آن نشان داده شود که آنتولوژی موجـود تمـامی مفـاهیم مـرتبط بـا

دامنه را شامل میشود. پیشنهادهای بسیاری برای غلبه بر این چالش وجود دارد. یک پیشنهادکه برای طراحی آنتولوژی مرجع نیـز مطـرح اسـت، تعیـین کارشـناسِ خبـره در دامنـهی آنتولـوژی است. البته در مورد آنتولوژی محلی، طراحی مفهومی پایگاه داده کافی است و نیازی به کارشناس دامنه نیست، لذا هر شخصی که با دامنه مورد نظر آشـنایی کـافی داشـته باشـد، مناسـب خواهـد بود. پیشنهاد دوم این است که مفاهیم پرتکرار در دامنه مورد نظر شناسایی شوند. استفاده از موارد حقیقی و تجزیه و تحلیل آنها، به طراح کمک میکند کـه همگـی مفـاهیم مـرتبط بـا دامنـهی مورد بررسی را استخراج کند. پیشنهاد سوم، شناسایی مترادفهای مفاهیم است که با استفاده ازمخزن دانش واژگان مانند وردنت، میتـوان میـزان پوشـش آنتولـوژی از مفـاهیم مـرتبط را تعیـین کرد و یا حداقل به محدودسازی مسئله کاملبودن کمک نماید.

تکامل آنتولوژی چالش دوم تکامل آنتولوژی است که به تغییرات آنتولوژی درگذر زمان اشاره دارد. این تغییرات شامل افزایش، تغییر و حذف برخی مفاهیم بهکار رفته در آنتولوژی ساخته شـده اسـت.

این موضوع کاملاً طبیعی است زیرا خود دامنه نیز به مرور زمان تکامل مییابد. بزرگبودن آنتولوژی

موضوع دیگری که ساخت آنتولوژی را دشوار میسازد، بزرگبودن دامنهای است که آنتولوژی باید از آن استخراج شود. برای غلبه بر این چالش پیشنهاد میشـود تـا کارشـناس دامنـه بهطور دقیق محدودهی مورد نظر دامنه را که قرار است آنتولوژی در آن محدوده در برنامه کاربردی استفاده شود، تعیین کند. یک راهبرد دیگر بـرای تعیـین محـدودهی دامنـه مـورد نظر این است که دامنه به زیردامنهها شکسته شود، سپس آنتولوژی محلی هر زیردامنه تولید شود. ایدهی آنتولوژی محلی برای مدیریت ارتباطات بین مفاهیم کارایی خوبی دارد، زیرا

آنتولوژیهای محلی میتوانند به یک آنتولوژی مرجع که تمامی مفاهیم دامنه را نشان میدهد، نگاشت شوند. راه دیگر برای ایجاد آنتولوژی کلِ دامنه، یکپارچـهسـازی آنتولـوژیهـای محلی موجود با آنتولوژی مرجع است. با این دو روش، کارشناس دامنه میتواند اطمینان حاصل کند که ارتباطات بین مفاهیم درست و سازگار هستند.

قابلیتهای پایگاه داده رابطهای و آنتولوژی

از آنجایی که معمولاً برای تولید آنتولوژی از پایگاه داده رابطهای، از مدل رابطهای یا مدل مفهومی آن استفاده میشود، بنابراین در این بخش، قابلیتهای این دو منبع ورودی، از نظر قدرت بیان مفاهیم موجود در آنتولوژی بررسی میشوند. جدول ۱ محدودیتهای هریک از این دو منبع را نمایش میدهد.

جدول -۱ مقایسه بین مدلهای EER ، رابطهایSQLو آنتولوژی OWL
آنتولوژی OWL مدل رابطهای SQL مدلEER مفاهیم آنتولوژی
ممکن (کلاس) ممکن (جدول) ممکن (موجودیت) Concepts (Human)
ممکن (Object properties) ممکن(رابطه) ممکن (رابطه) Roles (Has child)
ممکن((Sub of غیرممکن ممکن (ISA) Inheritance
ممکن غیرمستقیم ممکن Multiple Inheritance
ممکن ممکن ممکن Cardinality Restriction
ممکن ممکن غیرممکن Value Restriction
ممکن ممکن غیرممکن has value Restriction
ممکن غیرممکن غیرممکن Transitive Property
ممکن غیرممکن غیرممکن Symmetric Property
ممکن ممکن ممکن Inverse Property
ممکن ممکن ممکن Functional Property
ممکن غیرممکن غیرممکن Inverse Functional
ممکن غیرممکن غیرممکن Equivalent Class/Property
ممکن ممکن (Check in) غیرممکن Enumerated Property
ممکن غیرممکن ممکن Disjoint Class
ممکن ممکن غیرممکن Individuals
ممکن غیرممکن غیرممکن Same/Different Individual
ممکن غیرممکن ممکن Sub Properties
غیرمستقیم ممکن ممکن Keys
غیرمستقیم غیرمستقیم ممکن Ternary and Higher Order Relations

شباهتهای بین شمای رابطهای و آنتولوژی

براساس تجزیه و تحلیل شباهتهای رسمی بین شمای رابطهای و آنتولوژی، شمای رابطهای شامل چندین جدول، جدول شامل چند فیلد، و رکوردها، مجموعـهای از مقـادیر فیلـدها هسـتند. درحالیکه آنتولوژی شامل چند کلاس، کلاس شامل چند ویژگی، و نمونهها، مجموعهای از مقادیر ویژگیها هستند. ایـن شـابهت رسـمی بـین جـداول، فیلـدها و رکوردهـا در شـمای رابطـهای و کلاسها، ویژگیها و نمونهها در آنتولوژی تبدیل یک مدل به دیگری را ممکن کرده است .(Sedighi and Javidan, 2012) تشابهات متناظر بین اجـزای شـمای رابطـهای و اجـزای آنتولـوژی OWL در جدول ۲ نمایش داده شده است.