بخشی از مقاله

چکیده

وب کنونی، یک سرویس ارتباطی سند محور بر پایه جستجو بر اساس کلمات کلیدی و قابل فهم تنها برای انسان است، ازاین رو مشکلات زیادی در بازیابی اطلاعات موردنظر کاربر دارد و امروزه برای پشتیبانی از بسیاری نیازها ناکارآمد است. درنتیجه »وب معنایی« به عنوان یک راه حل مطرح شد که هدف آن را می توان بهبود نتایج جستجو، استنتاج و فهم اطلاعات توسط ماشینها و بازنمایی دانش، تحلیل محتویات وب و گنجاندن محتوی معنایی در صفحات وب دانست. در این راستا تکنولوژی های زیادی ازجمله RDF، OWL و آنتالوژی مطرح شده اند. این پژوهش به ارائه رویکردی جهت طراحی و ساخت معماری یک سیستم نرم افزاری در حوزه وب معنایی با زیرساخت آنتالوژی پرداخته است. سیستم CBA_CSA یک برنامه وب معنایی در حیطه تجارت الکترونیک است.

رویکرد طراحی و ساخت معماری این سیستم معنایی نوعی نگرش ساختاری پایین به بالا در طراحی و توسعه وب ها را با استفاده از برنامه نویسی معنایی دنبال می کند و به علت زیرساخت آنتالوژی این قابلیت را دارا است تا برحسب نوع کاربرد سیستم، طراحی و توسعه آنتالوژی با بهره گیری از متدولوژی متناسب با همان کاربرد صورت پذیرد. این نوع نگرش و معماری، بهبود جستجو را نه تنها در یک وب سایت بلکه در کل سطح وب به دنبال دارد.  رویکرد مطرح شده نمایانگر آن است که اگر معماری وب ها مبتنی بر زیرساخت آنتالوژی و طراحی از جزء بهکل، با الگوریتم هوشمند معنا محور صورت پذیرد، برخلاف برنامهنویسی »وب «2 مبتنی بر پایگاه دادههای رابطهای میتواند تمامی روابط بین کلمات را استنتاج و بازنمایی نماید و بهبود نتایج پرسوجو را در ارائه مرتبطترین پاسخها به کاربر به دنبال داشته باشند.

به عبارت دیگر نتایج ارزیابی، تحلیل نوع و ماهیت برنامه نویسی و اجرا سیستم CBA_CSA مبتنی بر برنامهنویسی »وب کنونی« و »وب معنایی« ازنظر ماهیت ساختاری، تکنولوژیکی و کیفیت انواع جستجو و بازیابی اطلاعات در هر دو عرصه »وب «2 و »وب «3 حاکی از آن است که معماری ارائهشده در سیستم معنایی CBA_CSA به علت ماهیت هوشمند آنتالوژی در استنتاج معنایی، انعطاف پذیری در متدولوژی های ساخت بر اساس نوع کاربرد سیستم ها و قابلیت توسعه برخلاف »وب «2 قادر است خود را به صورت هوشمند در سطح وب گسترش داده، بهصورت یک گراف یکپارچه ظاهر گردد که در بهبود نتایج جستجو و پوشش چالش تکنولوژیکی بین دو عرصه از وب نقش بسزایی ایفا خواهد کرد.

به طورکلی از مهم ترین دستاوردهای این پژوهش می توان به طراحی معماری و نوع نگرش متفاوت آن اشاره نمود که با ارائه یک معماری خاص در لایه آنتالوژی پشته وب معنایی دنبال شده است . متدولوژی متناسب با کاربرد در ساخت آنتالوژی می تواند علاوه بر بهبود جستجو، افزایش کارایی، انعطافپذیری، قابلیت استفاده مجدد، توسعه پذیری و مقیاس پذیری را نیز به دنبال داشته باشد. این نگرش همچنین در راستای همگرایی شکاف تکنولوژیکی بین »وب «2 و »وب «3 که یکی از چالشهای تکامل وب معنایی است مؤثر واقعشده و آن را تا حدی پوشش دهد.

-1 مقدمه

پیشینه وب را می توان شامل سه دوره در نظر گرفت که هر دوره مکمل دوره قبل از خود بوده است و سعی در پوشش دادن و برطرف نمودن نقاط ضعف آن داشته است. دوره آغازین یا »وب «1 - دوره قبل از سال : - 1999 همان ساختار عمومی وب هست. در این دوره امکانات انتقال فایل وجود داشت اما قابلیت استفاده مجدد و انعطاف پذیری محدود بود .[1] امکان توزیع آزادانه اطلاعات نبود . عصر »وب «1 بر روی شرکتها متمرکزشده بود.

»وب «2 - دوره بعد از سال 1999 است که تا امروز مورداستفاده هست - : این دوره به عنوان »وب خواندن و نوشتن« یا »وب اجتماعی« نامیده می شود .[3] مرکز این دوره از شرکت ها، به جوامع منتقل شده است. »وب «2 را می توان چتری بر تکنولوژیهای جدید دانست. تکنولوژیهایی که برای کاربر تجربه حضور بهتر در وب، فراتر از تواناییهای »وب «1 را فراهم میسازد .[3] نکته کلیدی در »وب «2 مشارکت کاربر و اعتماد به وی است. سرویسهای »وب «2 قابلیت استفاده مجدد، دسترس پذیری و قابلیت اطمینان بیشتری دارند؛ اما امروزه وب کنونی با مشکلات بسیاری روبرو است. ذخیرهسازی و انتشار اطلاعات به روش فعلی در وب کنونی، سبب ایجاد مشکلاتی در بازیابی اطلاعات شده است.

میلیاردها داده وجود دارند که پیدا نمودن مطلوب کاربر در بین آنها، همچنین جستجوی کور بر اساس کلمات کلیدی و قابلیت فهم و استدلال تنها برای انسان و نه ماشین ها از مهم ترین چالش های مطرح در وب کنونی هستند. ازاین رو وب کنونی امروزه برای بسیاری از نیازها پاسخگو نیست. »وب «3 یا تکامل وب معنایی: به عنوان یک راه حل برای چالش های وب کنونی برای اولین بار توسط آقای تیم برنرز لی مطرح گردید.

وب معنایی با تشویق به گنجاندن محتوی معنایی در صفحات وب به تبدیل شدن وب حاضر شامل اسناد ساختار نایافته به »وبی از فراداده ها« کمک میکند. از اهداف اصلی آن می توان به تسهیل در کار جمعی و مدیریت بهتر اطلاعات، بازنمایی دانش، آشکار نمودن معنای موجود در متن منابع، تعریف وابستگیها با گراف، بهبود در جستجوی اطلاعات، کدگذاری و بازیابی اطلاعات به گونه قابل فهم و پردازش برای ماشین ها اشاره نمود.

تکنولوژی های زیادی در این راستا مطرح شدند که هرکدام سعی در برطرف نمودن نقاط ضعف موارد قبل از خود داشتند نمونههایی از این تکنولوژیهاRDFS , RDF, XML و آنتالوژی هستند .[1,2] محققان و توسعه دهندگان، پس از تحقیقات بسیار، معماری وب معنایی را ارائه دادند که شکل - 1 - در سمت راست نشان داده شده است. فرآیند ایجاد »وب «3 که به صورت لایه ای انجام می پذیرد و معماری آن به گونه ایست که لایه ی بالایی باید توانایی فهم لایه های پایینتر را داشته باشد و برعکس .[2] شکل - 1 - در سمت چپ مقایسه ای اجمالی بین وب کنونی با وب معنایی را به تصویر کشیده است.

تفاوت جستجو بین »وب کنونی« و »وب معنایی« را می توان این گونه برشمرد که وب امروزیاصطلاحاً به عنوان وب نحوی شناخته می شود و منابع به یکدیگر به وسیله هایپرلینک مرتبط می شوند، اما اسناد در وب معنایی ساختاری گرافی دارند که با ساختار اسناد وب کنونی کاملاً متفاوت است .[2] وب معنایی، تنها وبی از اسناد نیست بلکه وبی از منابع و روابط بین آن ها است که نشان دهنده اشیاء در دنیای واقعی هستند. در وب معنایی، هر شیء با اطلاعاتی که توسط ماشین ها نیز قابل فهم است تعریف میشود و ارتباطات زیادی بین نودها و اسناد مختلف وجود دارد.

شکل : - 1 - معماری وب معنایی و مقایسه وب کنونی با وب معنایی [2] علاوه بر سه نسخه اصلی یادشده وب، یک مدل فرضی به نام »وب «2,5 در چرخه حیات وب توسط بعضی از متخصصان بهصورت یک ایده این گونه مطرح گردید: اگر »وب «2 - وب اجتماعی - یک حقیقت انجامیافته فرض شود، »وب «3 - سمانتیک وب - مدل مفهومینسبتاً شفافی است که البته بر مبنای آزمایش و با مشکلات خاصی قابل استقرار است.

با توجه به نسل های متفاوت وب، یک ثابت وجود دارد و آن احساس یک شکاف تکنولوژیکی و مفهومی بین »وب «2 و »وب «3 در یک طرف و نیاز به ارائه نسل جدیدی از وب سایت های اجتماعی که تمرکز بر جامعه انسانی داشته باشد، یعنی راهکارهای هوش مصنوعی برای پاسخگویی به نیاز انسانها را ارائه نمایند و مجموعه ای از تکنولوژی هایی معنایی که قابل استفاده برای اهداف عمومی وب معنایی باشند از سوی دیگر، موجب پیدایش یک مفهوم وسط بین »وب «2 و »وب «3 است که به عنوان »وب «2,5 نامیده میشود .

[4] شکل - 2 - موارد یادشده و تکامل نظری وب را با تکامل واقعی آن مورد مقایسه قرار داده است. »وب «1 یا وب نحوی که چشمانداز شبکه جهانی وب به تدریج جایگزین چشم انداز دسکتاپ گردید. »وب «2 اجتماعی قوی از وب که به وضوح ثابت شده است. در این دوره بهبود قابلیت های چندرسانه ای و امکانات به اشتراک گذاری محتوا یک واقعیت است. دهه سوم باید برنامه کاملی را از وب مبتنی بر معنا ارائه دهد. »وب «2,5 یک مدل از وب، فرض شده است که مفهومی فراتر از وب اجتماعی »وب «2 را در برمیگیرد اما هنوز بعد معنایی »وب «3 را ندارد .[4]

قسمت دوم این مقاله، به مفهوم آنتالوژی بهعنوان زیرساخت برنامههای وب معنایی و قسمت سوم به برنامه نویسی وب معنایی و قسمت چهارم به پیشینه تحقیق و معرفی نمونه های کاری پرداخته است. در قسمت پنجم معماری ساخت سیستم و رویکرد پیشنهادی که رویکردی مبتنی بر آنتالوژی است و ساخت سیستم معنایی CBA_CSA در حیطه تجارت الکترونیک به طور کامل توضیح داده شده است. سپس سیستم تحت دو نسخه از وب کنونی و وب معنایی مورد آنالیز و پیادهسازی قرارگرفته است. در ادامه به اجرا و ارزیابی رویکرد پیشنهادی و درنهایت نتیجه گیری کلی از زوایای مختلف موضوع، برای رویکرد پیشنهادی بیانشده است.

-2 آنتالوژی و مفهوم آن در وب معنایی

تعاریف مختلفی از آنتالوژی ارائه شده که در ادامه به برخی از آن ها اشاره شده است. آنتالوژی یک فهم مشترک در بعضی از زمینههای موردنظر است .[7 ,5] یک تئوری درباره موجودیت هایی است که میتواند در ذهن یک عامل هوشمند موجود باشد .[7] آنتالوژی یک طبقه بندی از مفاهیم را برای پایگاه دانش یک وظیفه یا دامنه خاص را توصیف می نماید که تفسیر معنایی آن دانش است .[8 ,7] یک مورد خیلی ساده می تواند سلسله مراتبی باشد که کلاس ها و روابط ردهبندی آنها را مشخص میکند. همچنین برای توصیف روابطی که در برخی پایگاه داده های مشترک وجود دارند و نیز محدودیت های جامعیتی که باید برای آن ها حفظ شود.

شماهای پایگاه داده رابطه ای نیز میتوانند بهصورت آنتالوژی بکار گرفته شوند .[8] در محیط وب، آنتالوژی فقط چارچوبی مفهومی نیست، بلکه علاوه بر آن ساختار نحوی و مشخصی است که معانی یک حوزه از دانش را مدل سازی می کند. تعریفی از آنتالوژی که بیشتر استناد می شود، تعریف گروبر است که »آنتالوژی را به مثابه مفهوم سازی ساده و جزئی از جهان که فقط از اشیاء، مفاهیم، موجودیتها تشکیلشده است فرض می شود. این مفهوم سازی، برای هدفی واضح ایجادشده است و به زبانی رسمی و ماشین پرداز تعریف میشود.[7,9] «

-1-2 زبانها و متدولوژی های ساخت آنتالوژی

زبانهای بیان آنتالوژی، امکان تعریف مفاهیم موجود در مدلهای یک حوزه را به صورت صوری و صریح فراهم می سازند. وجود قواعد نحوی که بهخوبی تعریف شده باشند، وجود معناشناسی صوری، پشتیبانی از استنتاج کارآمد، قدرت کافی در انتقال معنا و راحتی بیان، شرایط اصلی برای تحقق این اهداف هستند. همچنین وجود قواعد معین، در حوزه زبانهای برنامهنویسی، برای امکانپذیر شدن پردازش ماشینی اطلاعات یک شرط لازم است.

پیش نیاز کاربرد آنتالوژی ها در وب معنایی، توسعه استانداردی برای زبان های بازنمایی آنتالوژی است. در این راستا کنسرسیوم وب جهانی، زبان چارچوب توصیف منابع یا RDF را که لایه توصیفی وب معنایی است مطرح نمود و سپس زبان OWL را به عنوان زبان نشانه گذاری معنایی به منظور انتشار و تسهیم آنتالوژی های وب پیشنهاد کرد .[2,10] از میان زبانهای مطرح شده، OWL جدیدترین استاندارد زبانی بر مبنای RDF که امکانات بیشتری برای بیان مفاهیم و معانی دارد و قابلیت نمایش محتوای میانکنشپذیر رایانه ها در وب، امکان تعریف و برقراری ارتباط میان آنتالوژی ها، سازگاری و استنتاج پذیری بیشتری را فراهم میکند .

[7 ,2] انتخاب یکی از این زبان ها به عنوان زبان آنتالوژی، بسته به قدرت بیان و استدلال موردنیاز در دامنه موردنظر دارد. به علت قابلیتهای بسیار، در رویکرد پیشنهادی برای برنامهنویسی وب معنایی از زبان OWL استفادهشده است. نکته حائز اهمیت دیگر اینکه برای مشخص نمودن واژههای مورداستفاده در دامنه ای خاص و روابط بین آن ها، متدولوژی مشخصی وجود ندارد و برحسب نوع کاربرد است. آنتالوژی ها می توانند به صورت دستی، اتوماتیک، یا نیمه اتوماتیک ایجاد شوند و رهیافت های بالا به پایین، پایین به بالا و ترکیبی را دنبال کنند. در انتخاب نوع متدولوژی، ابتدا می بایست نوع آنتالوژیهای مناسب و اشیاء و مشخصات آن ها مشخص گردد.

در طراحی آنتالوژی، ابزارهایی متفاوتی وجود دارند. امروزه بیش از 90 ابزار متفاوت موجودند که مهمترین آنها را میتوان Jena,WebOnto Protégé,WordNet, برشمرد. Protégé، از ابزارهای رایگان مبتنی بر پایگاه دانش برای طراحی و ساخت آنتالوژی است. از مهمترین قابلیتهای آن میتوان به تولید سفارشیسازی آنتالوژی یک دامنه، قابلیت تعریف سلسله مراتب و روابط، محدودیت مقادیر و امکان پشتیبانی از حیطه های مختلف اشاره نمود. این موارد Protégé را از دیگر ابزارهای تولید آنتالوژی متمایز مینماید. .[11,13]

-3 برنامهنویسی وب معنایی

ساخت و ایجاد نرم افزارهای کاربردی بر روی وب معانی نگر یا برنامهنویسی وب معنایی نیازمند یک زبان اصلی برنامه نویسی مثل,Java، C، یک زبان وب معانی نگر مانند RDF و OWL، پروتکل های وب نظیر HTTP و ابزاری جهت ایجاد وب معنایی و سیستمهای استدلالگر است. مقایسه بین برنامه نویسی وب معنایی با برنامه نویسی وب کنونی همان طور که در جدول - 1 - هم به طور خلاصه اشاره شده است، حاکی از آن است که در برنامه نویسی وب معنایی، دادهها مستقل از برنامهها توسعه می یابند.

همچنین برنامه باید توانایی استفاده از منابع مختلف داده کهلزوماً از قبل مشخص و ثابت نبوده،در طول زمان دائماً در حال افزایش هستند یا دارای قابلیت اشتراک زیادی هستند را داشته باشد. ازاین رو یکپارچه سازی داده های منابع مختلف راحت تر است و انعطافپذیری و قابلیت توسعه برنامه زیاد است. با استفاده از قابلیت های آنتالوژی، مزایایی نظیر توانایی استنتاج به برنامه ها افزوده می شود. ازآنجاکه هدف وب معانی نگر، فراهم سازی منابع اینترنتی قابل فهم، به طور مستقیم و بدون واسطه توسط ماشین است، توانایی پردازش زبان وب آنتالوژی یکی از ویژگیهای حائز اهمیت است.

SPARQL زبان پرس وجوی وب معنایی برای ارسال انواع پرس وجو روی پایگاه داده RDF و روی گرافها است .[1,8] از تفاوتهای بارز SPARQL با SQL این است که SQL روی رکوردهای جداولی از داده های خام به صورت رابطهای در سطح همان جداول است، اما SPARQL روی فراداده ها یا داده های هوشمندی در کل بستر وب است و این دادههای هوشمند میتوانند در مخازن داده، پایگاه دادهای اطلاعاتی و حتی آنتالوژی در سطح کل وب و با هر فرمت ذخیرهشده باشند .[12]

-4 پیشینه تحقیق و نمونههای کاری

از نمونه برنامه های مبتنی بر وب معنایی، می توان به پروژه FOAF که یک مثال از چگونگی تلاش وب معنایی برای استفاده از ارتباطات درزمینهی اجتماعی با استفاده از میکرو فرمتها و RDF است اشاره نمود .[15,14]

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید