بخشی از مقاله
مروری بر مبحث آنتولوژی و پیرامون آن
چکیده
هم اکنون آنتولوژی ها جایگاه ویژه خود را در وب معنایی، بازیابی اطلاعات و سایر علوم کامپیوتر پیدا کرده اند. آنتولوژی ها به عنوان دانش پس زمینه، مسئولیت بزرگی را برعهده دارند. اکنون بیش از چند صد آنتولوژی سطح بالا وجود دارند. امروزه با حجم عظیمی از اطلاعات مواجه هستیم. به منظور دستیابی موثر به اطلاعات، به سیستمی نیاز است که بتواند به طور مناسبی، اطلاعات را از وب استخراج کرده و به طور مناسبی به کاربران ارائه دهد. اما این کار به سادگی میسر نمی باشد. آنتولوژی به وجود آمده است تا این مشکلات را مرتفع سازد. در واقع با استفاده از آنتولوژی، داده ها در وب، معنا می یابند و جستجوها کاربردی تر خواهد بود. در این مقاله، ابتدا به بررسی مفهوم آنتولوژی می پردازیم و سپس برخی از جوانب آن نظیر تخمین هزینه ی آنتولوژی، زبان های پیاده سازی آنتولوژی، استخراج اطلاعات، آنتولوژی یاگو و امنیت آنتولوژی را مورد بررسی قرار می دهیم.
واژگان کلیدی: آنتولوژی، آنتولوژی یاگو، امنیت.
-1 مقدمه
آنتولوژی(هستان شناسی)، یک مدل خاص از دامنههای ویژه است که عمدتا شامل طبقه بندی و مجموعه ای از ارتباطات دارای مفهوم است. دادههایی که در اینجا دارای رابطه هستند به صورت لینکهایی به هم وصل میشوند و هر یک از این لینکها، یک نوع از رابطه را توصیف میکنند .(Philpot et al, 2005) آنتولوژی، شامل بیش از 80 هزار روابط بین مفهوم کلمات است. به عنوان مثال: synonym، hypernym، .(Tanaka et al, 2007) abbreviation آنتولوژی مدلی انتزاعی از جهان واقع است که مفاهیم و روابط میان آن را در قلمروی مورد بحث نمایش میدهد. آنتولوژیها که پایگاه دانش مفهومی هستند و در محدودهی وسیعی از قلمروها کاربرد دارند که برای نمونه میتوان به شبکههای جهان گستر معنایی1، موتورهای جستجو، تجارت الکترونیک، پردازش زبان طبیعی، مهندسی دانش، استخراج و بازیابی اطلاعات، سیستمهای چندعاملی، مدل سازی کیفی از سیستمهای فیزیکی، طراحی پایگاه داده، سیستمهای اطلاعات جغرافیایی و کتابخانه های رقمی اشاره نمود. در قلمروی کامپیوتر، آنتولوژی را می توان با یک چهارتایی (C,R,F,A) تعریف کرد که درآن (شمس فرد و عبداله زاده، :(1381
_ C مجموعه مفاهیم موجود در جهان مدل شده است.
_R مجموعه روابط میان مفاهیم است و خود به دو زیرمجموعه مجزای و افراز میشود.
_ مجموعه روابط طبقه ای2 میان مفاهیم است که سلسله مراتب مشمول را ایجاد میکند و دودویی است.
_ مجموعه روابط غیرطبقه ای است که ممکن است n تایی نیز باشد. (1≥ n)
_F مجموعه تصریحات آنتولوژی در مورد مفاهیم و روابط آنها است و خود به دو زیرمجموعه و افراز میشود:
_ مجموعه تصریحات آنتولوژی درباره روابط طبقه ای مفاهیم است. به عبارت دیگر، سلسله مراتب شمول را نشان میدهد.
_ مجموعه اصول بدیهی آنتولوژی دربارهی روابط غیر طبقه ای مفاهیم است.
_A مجموعه اصول بدیهی3 آنتولوژی است که به زبان صوری مثل منطق بیان میشود.
آنتولوژی ریشه در فلسفه دارد و مبدا آن را ارسطو می دانند. در فلسفه آنتولوژی شاخه ای از علم است که به بررسی موجودات و روابط میان آنها می پردازد. مفهوم آنتولوژی در وب معنایی کمی متفاوت از فلسفه است. آنتولوژی از دو واژه ی Onto به معنای هستی و Logia به معنای مطالعه به وجود آمده است و در کلمه معنی هستی شناسی دارد. آنتولوژی در وب معنایی واژه ها و ارتباط بین آنها در دامنه ای که استفاده می شود را نشان می دهد .(Gruber, 1993) عناصر اصلی تشکیل دهنده آنتولوژی عبارتند از مفاهیم، ارتباط بین آنها و خصوصیات آنها. در شکل1 نقش آنتولوژی در وب معنایی نشان داده شده است.
شکل -1 نقش آنتولوژی در وب معنایی
یک آنتولوژی مفاهیم، ارتباطات و سایر مختصاتی که برای مدل سازی یک دامنه مورد نیازهستند را تعریف می کند و لغات و مفاهیمی (معانی) که در تعریف و نمایش یک محدوده ای از دانش به کار می روند را تعیین می کنند و بنابراین معانی را استاندارد می کند .(Daconta et al, 2006) آنتولوژی ها توسط مردم، پایگاه های داده و برنامه های کاربردی که نیاز به اشتراک گذاری اطلاعات یک دامنه ی خاص دارند استفاده می شوند. در زمینه ی وب آنتولوژی ها یک فهم مشترک از یک دامنه را تامین می کنند. چنین فهم مشترکی برای حل مشترک چند معنایی لازم است. زیرا دو برنامه ی کاربردی ممکن است از دو ترم متفاوت برای یک معنای واحد استفاده کنند و یا بالعکس از یک ترم واحد برای دو مفهوم متفاوت استفاده کنند. در واقع آنتولوژی ها interperability معنایی را فراهم می کنند. عناصر مختلف آنتولوژی شامل موارد زیر است:
· نمونه ها
· کلاسها
· خاصیتها
· ارتباطات
· جملات تابعی
· قیدها
· قوانین
· قواعد کلی
· رخدادها
یک آنتولوژی دارای مشخصات صریح و روشنی از یک مفهوم است. آنتولوژی می تواند سلسله مراتبی از طبقه بندی کلاس ها، تعاریف کلاس و یا رابطه تابعیت باشد، اما به این اشکال محدود نمی شود. آنتولوژی نقش کلیدی در گرفتن دامنه دانش دارد و یک درک مشترک را ارائه می کند .(Youn and McLeod , 2007) آنتولوژی برای حمایت از انواع مختلف مدیریت دانش از جمله بازیابی، ذخیره سازی و به اشتراک گذاری دانش بکار می رود .(Pundt and Bishr , 1999) نیاز به تعیین میزان شباهت معنایی، ارتباط و یا فاصله بین دو مفهوم در آنتولوژی یا دو آنتولوژی مختلف، به طور فزاینده ای در حال تبدیل به وظیفه مهم در زمینه بازیابی اطلاعات می باشد .(Hawalah and Fasli, 2011)
شکل -4 مدل مفهومی آنتولوژی (Dan)
-2 دسته بندی آنتولوژی ها
آنتولوژی ها را میتوان از زوایای مختلف دسته بندی نمود. از یک زاویه میتوان آنتولوژی ها را براساس طیف معنایی آنها دسته بندی کرد. در این نوع دسته بندی، آنتولوژی ها بر اساس ساختار و محتوای داخلی آنها دسته بندی میشوند . بهطوریکه با توجه به بار معنایی آنها، از سبک وزن تا سنگین وزن، سازماندهی میشوند. در این بخش، آنتولوژی ها از جنبهای دیگر دسته بندی میشوند. در این دسته بندی میتوان آنتولوژی ها را بر اساس میزان عمومیت آنها یا نحوهی استفاده از آنها، تقسیمبندی نمود. بر این اساس، آنتولوژی ها به دسته های زیر تقسیم میشوند:
-1-2 آنتولوژی های عام4
در این نوع آنتولوژی مفاهیمی که از عمومیت زیادی برخوردارند، توصیف میشوند. این نوع از آنتولوژی ها به دامنهی خاصی بستگی نداشته و اغلب به مفاهیمی میپردازند که میتوانند به عنوان دست مایهای برای ایجاد آنتولوژی های خاص تر، مورد استفاده قرار بگیرند.
-2-2 آنتولوژی های دامنه5
این نوع آنتولوژی ها برای توصیف واژگان متعلق به یک حوزه یا دامنهی خاص، مورد استفاده قرار میگیرند. در فرایند ایجاد چنین آنتولوژیهایی معمولاً از مفاهیم توصیف شده در یک یا چند آنتولوژی عام، به نحو مطلوب استفاده شده و آن مفاهیم برای دامنهی مورد بحث، اختصاصی میشوند.
-3-2 آنتولوژی های وظیفه6
در این نوع آنتولوژی واژگانی گنجانده میشوند که برای توصیف یک وظیفه یا فعالیت کلی و عمومی در یک دامنه ی خاص، مورد نیاز میباشند. در فرایند ایجاد این نوع از آنتولوژی ها نیز میتوان از آنتولوژی های عام به نحو مطلوبی استفاده کرد.
-4-2 آنتولوژی های کاربرد7
در این نوع از آنتولوژی ها مفاهیمی توصیف میشوند که هم به یک دامنه خاص وابستهاند و هم به یک وظیفه ی خاص در آن دامنه وابستگی دارند. در حقیقت این مفاهیم مربوط به نقشهایی است که موجودیتها یا اشیای توصیف شده در آنتولوژی دامنه در انجام عملیات و وظایف توصیف شده در آنتولوژی وظیفه، به عهده دارند. این نوع از آنتولوژی هاعموماً قابلیت بهاشتراک گذاری کمتری دارد ولی در فرآیند ایجاد آنها از آنتولوژی های دامنه و وظیفه استفاده میشود (مشارکتکنندگان ویکیپدیا، .(2016
-3 تفاوت های اصلی بین آنتولوژی انسان و ماشین
آنتولوژی انسان بسیار وسیع تر از آنتولوژی ماشین است. اما آنتولوژی ماشین باید رسمی باشد. یعنی با یک زبان قابل فهم توسط ماشین بیان شود. همچنین باید شفاف و دقیق باشد. یعنی تمام جزئیات به صورت کامل و غیر مبهم توصیف شده باشد. اما همان طور که ذکر شد، آنتولوژی انسان به صورت ناگهانی و تلویحی شکل میگیرد (نوروزی و طاهریان، .(1390
-4 تفاوت در فلسفه و کامپیوتر
بین آنتولوژی در فلسفه و آنتولوژی در علوم کامپیوتر تفاوت اساسی وجود دارد. در فلسفه، از نظم و ترتیب میان مفاهیم به آنتولوژی می رسیم اما در علوم کامپیوتر، دارای چنین ترتیبی نیستیم و آنتولوژی را از روی ترتیبی که خود برای مفاهیم در نظر میگیریم، استخراج میکنیم. از سویی نگاه آنتولوژی در فلسفه نگاهی جامع و جهان شمول است و سعی می شود که مفاهیم مورد بررسی قرار بگیرند، در حالی که آنتولوژی در کامپیوتر دارای دامنه بسیار کوچک تری است و اصولا نیازی نیست تا مواردی را که در حیطه بحث نیستند، وارد آنتولوژی کنیم. نکته جالب تر طرز نگاه به بحث آنتولوژی در علوم کامپیوتر است. آنتولوژی در علوم کامپیوتر به مجموعه ای از لغات و فرضیات گفته می شود که با توجه به معنی آن لغات ایجاد گشته و به منظور توصیف یک واقعیت خاص طراحی می گردد. استفاده از این مفهوم در سال های اخیر بسیار رواج یافته است و دلیل این امر را می توان افزایش ارتباطات و اطلاعات دانست. امروزه آنتولوژی در هوش مصنوعی، مهندسی نرم افزار، مهندسی سیستم ها و معماری اطلاعات کاربرد دارد. عناصر اصلی تشکیل دهنده آنتولوژی عبارتند از:
· ارتباط بین مفاهیم
· خصوصیات آنها
به عبارت دیگرآنتولوژی ارتباط بین مفاهیم در اسناد وب و دنیای واقعی را مشخص می کند که با این کار اسناد مربوطه توسط ماشین ها قابل پردازش و فهم می شوند و اشتراک گذاری بین عامل ها را تسهیل می نماید. در واقع می توان گفت:
Vocabulary+Structure-Taxonomy
Constrsints&Rules=Ontology وTaxonomy+Relationship
Ontology+Instance-Knowledge
در فرهنگ وب، آنتولوژی ها مفهومی مشترک از یک دامنه را تأمین می کنند یا حداقل فرض می شود که این عمل را انجام می دهند (دور اندیش و سربی، .(1389
-5 تخمین هزینه ی آنتولوژی
موضوع مهم دیگری که در زمینه توسعه ی آنتولوژی ها مطرح است،بحث تخمین هزینه توسعه یک آنتولوژی می باشد. روشONTOCOM، به عنوان یکی از کارهای مناسبی که در این زمینه انجام شده است، قابل ذکر است. این متد در چند پروژه بزرگ نیز مورد استفاده قرار گرفته است. ONTOCOM در واقع مدلی برای تخمین هزینه ی فعالیت های اصلی موجود در بحث آنتولوژی نظیر توسعه، نگهداری و استفاده مجدد می باشد .(Fumblog.um.ac.ir)
-6 زبان های پیاده سازی آنتولوژی
زبان های پیاده سازی آنتولوژی عبارتند از :
RDF (S) (Resource Description Framework (Schema(
OIL (Ontology Interchange Language(
DAML+ OIL (DARPI Agent Markup Language + OIL(
OWL (Ontology Web Language(
XOL (XML- based Ontology exchange Language(
SHOE (Simple HTML Ontology Extension(
OML (Ontology Markup Language(
که به صورت کلی به دو دسته تقسیم می شوند:
• زبان های گزاره ای : Rules (RuleML, LP/Prolog), Description Logic (OIL, DAML+ OIL, OWL)
• زبان هایی که از گراف استفاده می کنند : RDF,UML
شکل-2 تشریح زبان (darroodi.ir) OWL
OIL در اتحادیه اروپا و DAML در آمریکا ساخته شد. کمی بعد W3C از روی این دو، زبان استانداردی که نقاط ضعف این دو زبان را برطرف کند را ایجاد کرد و نام آن را OWL گذاشت.
شکل-3 سه نسخه ی مختلف زبان (darroodi.ir) OWL
-7 آنتولوژی یاگو
آنتولوژی یک پایگاه دانش است که برای تحقق وب معنایی پیشنهاد شد و در زمینه های مختلف بازیابی اطلاعات کاربردهای