بخشی از مقاله
فناوری
چكيده
رشد سريع اطلاعات الكترونيكي در عصر حاضر، زمينهساز ايجاد انواع متعدد شبكههاي كتابشناختي گرديده است. دستيابي به اطلاعات الكترونيكي مستلزم استفاده از روش موثر در نمايهسازي و تشخيص كليدواژههاي مهم بيانگر محتواي يك مدرك است. در همين راستا، (او.سي.ال.سي)1 كه بزرگترين شبكه كتابشناختي جهان محسوب ميشود به منظور فراهم آوردن تسهيلات لازم براي دستيابي سريع وموثر به اطلاعات، اقدام به ساخت سيستمنمايهسازي خودتحت عنوان "وورد اسميت" نموده است.
مبناي كار اين سيستم، تشخيص خودكار مفاهيم، كلمات و عبارات كليدي در متن ماشينخوان، براساس »پردازش زبان طبيعي« است. به اين ترتيب شبكه (او.سي.ال.سي) با استفاده از تئوريهاي زبانشناسي محاسباتي و معنائي-كه مورد تأكيد پردازش زبان طبيعي است-و نيز با بكارگيري تئوريهاي اطلاعرساني و مدلهاي آماري، سعي در ساخت نمايهاي داشته است كه علاوه بر همخواني با حجم عظيم دادههاي اين شبكه، از كارآئي و توانائي كافي و لازم در بازيابي سريع و موثر اطلاعات از محيط شبكه نيز برخوردار باشد.
كليدواژهها: شبكه كتابشناختي (او.سي.ال.سي)، نمايهسازي (دبليو.اس)، نمايهسازي خودكار، پردازش زبان طبيعي
مقدمه
نمايه مهمترين ابزار در نظامهاي بازيابي اطلاعات و كليد اساسي براي دستيابي به اطلاعات مندرج در منابع اطلاعاتي است. ارزش هر نمايه در گرو تهيه بهترين نقاط دستيابي و تأمين رضايت استفادهكنندگان در بازيابي اطلاعات است.
سالهاست كه كتابداران مسائل مربوط به ذخيره و بازيابي اطلاعات را مدنظر قرار داده و براي كنترل موثر مواد سنتي، ابزاري را توسعه دادهاند. توجه به روند تكاملي فرآيند نمايهسازي مبيّن اين نكته است كه افزايش حجم انتشارات و تغيير در شكل ارائه خدمات اطلاعرساني، نظامهاي نمايهسازي را نيز دستخوش تحولات قابل توجهي نموده است. ابداع انواع نمايههاي پيشهمارا، پس همارا، نمايههاي خودكار و استفاده از انواع زبانهاي طبيعي، آزاد و ساخت يافته يا كنترل شده همه تلاشهايي بودهاند در جهت بهبود و تكميل فرآيند نمايهسازي در انجام رسالت خاص خود.
ايجاد شبكههاي متعدد كتابشناختي و نيز رشد سريع آنها، فرصتهاي متعدد و چالشهاي بيسابقهاي را فراروي حرفه كتابداري و اطلاعرساني براي دستيابي به حجم عظيمي از اطلاعات گذارده است. چنين شرايطي نياز به مجتمع و يكپارچهسازي منابع موجود در محيط وب و اينترنت همراه با انواع مواد سنتي كتابخانهاي، ضرورت بررسي مجدد ابزارهاي موجود در بازيابي اطلاعات و كنترل كتابشناختي را ايجاب مينمايد.
بزرگترين شبكهء كتابشناختي پيوستهء موجود، شبكه (او.سي.ال.سي) ميباشد (هسي-يي، 1996) كه در سال 1967 ايجاد شده است و حاوي بيش از 31 ميليون ركورد در فرمتهاي مختلف است. اين شبكه يك سازمان تحقيقاتي غيرانتفاعي واقع در اوهايو ميباشد كه با ارائه خدمات كتابخانهاي امكان دستيابي 41 هزار كتابخانهء مختلف را به اطلاعات فراهم ميآورد. هدف كلي (او.سي.ال.سي) افزايش دسترسپذيري منابع كتابخانهاي از طريق اشتراك در منابع و كاهش نرخ رشد هزينههاي كتابخانهاي است. شبكه (او.سي.ال.سي) در راستاي تحقق بخشيدن به اين هدف اقدام به تهيه پروژههائي نموده است كه يكي از مهمترين اين پروژهها، پروژه نمايهسازي دبليو.اس ميباشد.
هدف نمايهسازي دبليو.اس اصلاح و بهبود دستيابي به اطلاعات الكترونيكي با استفاده از روشهاي موءثر براي تشخيص كليدواژههاي مربوط به محتواي يك مدرك ميباشد. تشخيص كلمات و عبارات بايد به گونهاي باشد كه به بهترين نحوي مبيّن موضوع مدرك باشند و در نتيجه نمايههاي مفيد و كارآمدي براي مدارك موجود در وب ايجاد گردد. به همين منظور مبناي اين نمايهسازي، تشخيص خودكار مفاهيم در متن ماشينخوان براساس پردازش زبان طبيعي، مدلهاي آماري، زبانشناسي محاسباتي و تئوري ردهبندي ميباشد.
مقالهء حاضر ضمن معرفي شبكهء كتابشناختي (او.سي.ال.سي) و اشاره به خدمات، پايگاههاي اطلاعاتي و پروژههاي اين شبكه، بطور اجمالي به مرور نظامهاي نمايهسازي و زبانهاي بازيابي اطلاعات ميپردازد و سپس طراحي و ساختار نظام نمايهسازي دبليو.اس را تشريح مينمايد.
پايگاه كتابشناختي (او.سي.ال.سي)
انواع پايگاههاي كتابشناختي با هدف تسهيل و تسريع در ارائه خدمات كتابشناختي و كمك به پيشرفت دانش ايجاد شدهاند و از بدو پيدايش خود تاكنون با ارائه سرويسها و خدمات متعدد، افراد و كتابخانههاي مختلف را در تحقق اهداف خود ياري بخشيدهاند. اين پايگاهها دامنه وسيعي از خدمات را ارائه ميدهند از جمله خدمات تهيه مواد،
فهرستنويسي و خدمات مرجع. بسياري از كتابخانهها به دليل فشارهاي اقتصادي، رشد روزافزون حجم انتشارات و در نتيجه لزوم وجود شبكهاي براي اشتراك منابع و تعاون بين كتابخانهها و همچنين لزوم تغيير فاز از مالكيت به سمت دستيابي به اطلاعات، بر استفاده از اين شبكهها تأكيد دارند. بطور كلي از طريق اين پايگاهها ميتوان به سه پرسش اساسي پاسخ داد: 1) سئوالات كتابشناختي يعني امكان بدست آوردن اطلاعات كامل دربارهء يك كتاب، مجله يا انواع خاص ديگر مواد كتابخانهاي.
سيستمهاي شبكهاي معمولاً دادههاي فهرستنويسي كاملي بر روي صفحه (سي.آر.تي) پايانه ميآورند. 2) سئوالات تحقيقي (تعيين صحت و سقم چيزي) مربوط به تشخيص هجي صحيح نام يك نويسنده، نام ناشر، تاريخ و غيره. 3) سئوال در مورد تعيين محل مدرك. از طريق اين قبيل سيستمها ميتوان فهميد كه كدام كتابخانهها مواد اطلاعاتي مورد نياز را دارند.
سيستمهاي كتابشناختي مثل (آر.ال.آي.ان)، (او.سي.ال.سي) و غيره شبكههائي غيرانتفاعي و بينالمللي هستند كه با روشهاي متنوعي اداره ميشوند و به شكلهاي بسيار متفاوت اقدام به ارائه خدمات مينمايند. عملكردهاي خاص اين شبكهها عبارتند از: تعيين محل سريع كتاب، مقاله و غيره؛ فراهمآوري و تهيه مواد از طريق مستقيم يا غيرمستقيم؛ كنترل گردش و دستيابي فهرست راه دور و فهرستنويسي مشترك. هر سيستم شامل مدخلهاي فهرستگان ملي مثلاً ركوردهاي مارك است. اين ركوردها شامل همه فرمتها از جمله كتاب، نشريهء ادواري و نسخ دستي ميباشند.
بزرگترين شبكهء كتابشناختي موجود، شبكهء (او.سي.ال.سي) ميباشد (هسييي، 1996) كه به منظور دستيابي بيشتر به اطلاعات جهاني بوجود آمده است. موءسسات و كتابخانههاي دانشگاهي و تحقيقاتي (هر كدام با توجه به نوع نياز خود) در سطح وسيعي از اين شبكه استفاده ميكنند. اين شبكه، يك سازمان تحقيقاتي غيرانتفاعي است كه به ارائه خدمات كتابخانهاي ميپردازد و در اوهايو واقع شده است.
تاريخچه، اهداف و عضويت در (او.سي.ال.سي)
در سال 1967، مسئولين دانشكدهها و دانشگاهها در اوهايو، يك سيستم كامپيوتري به نام »مركز كتابخانهاي كالج اوهايو«2 را ايجاد نمودند كه در آن كتابخانههاي موءسسات آكادميك اوهايو ميتوانستند در منابع مشترك شوند و هزينهها را كاهش دهند. اولين دفاتر (او.سي.ال.سي) در كتابخانهء اصلي دانشگاه ايالتي اوهايو مستقر گرديدند و اولين دفتر كامپيوتري آن در مركز تحقيقاتي "او.سي.يو"3 جاي گرفت.
فردريك كليگور، اولين مسئول (او.سي.ال.سي) بود. در سال 1991 ساختمان مديريت OCLC توسعه يافت. اين شبكه داراي پنج مركز مديريت در كلمبو، اوهايو و كتابخانه اصلي دانشگاه ايالتي اوهايو ميباشد و محل كنوني آن در فرانتس رود 6565 در دوبلين است.
اداره (او.سي.ال.سي) با اعضاي آن است.ساختار مديريتي آن متشكل از اعضاي عمومي، شوراي اعضا و هيأت امناء است. (او.سي.ال.سي) از يك سيستم كامپيوتري منطقهاي براي 45 كالج اوهايو شروع شد و در نهايت به يك شبكهء بينالمللي تبديل گرديد. در سال 1977 اعضاي (او.سي.ال.سي) از اوهايو، با عضويت كتابخانههاي خارج از اوهايو موافقت كردند و به اين ترتيب، (او.سي.ال.سي) به او.سي.ال.سي.اينك تغيير نام داد و امروزه انواع مختلف كتابخانهها از سراسر دنيا از خدمات (او.سي.ال.سي) استفاده مينمايند. به دنبال آن شوراي استفادهكنندگان (او.سي.ال.سي) تشكيل گرديد (جردان، 1998).
اين شورا متشكل از كتابداران و ساير شركائي است كه شايستگي و صلاحيت آنها براي عضويت منوط به ميزان سهمي است كه در فهرستگان آنلاين (او.سي.ال.سي) دارند. با ايجاد اصلاحات در سختافزار، امكانات بيشتري براي استفادهكنندگان بيشتري فراهم نمود. از سال 1973 كتابخانههاي غيرآكادميك توانستند عضو (او.سي.ال.سي) شوند و نيز بر تعداد شبكههاي خارج از ايالتي كه به (او.سي.ال.سي) پيوستند افزوده گشت.
كتابخانهها با عضويت در (او.سي.ال.سي) ميتوانند به همهء اطلاعات جهاني و به تمامي خدمات و پايگاههاي اطلاعاتي دسترسي يابند. اين عضويت، بزرگترين كنسرسيوم كتابخانههاي جهاني را در بر ميگيرد و در بين ساير شبكههاي كتابشناختي بيشترين تعداد اعضاء را دارد. تعداد اعضاي آن تا سال 1991 بيش از 7000 كتابخانه در سراسر دنيا بود كه اكثر آنها از امريكا و كانادا بودند.
در سراسر تاريخ (او.سي.ال.سي) ارتباطات راه دور، يك وسيلهء مهم براي تداوم اهداف كلي خود در زمينهء افزايش دستيابي به اطلاعات جهاني و كاهش هزينهء اطلاعات بوده است (جردان، 1998). اين شبكه همچنان براساس پروتكل استاندارد صنعتي (تي.سي.پي/آي.پي) طي سه سال آينده در جهت تبديل به يك شبكه كاملاً باز به پيش ميرود. از طرف ديگر امكان دستيابي با كيفيت بالا را براي كتابخانهها فراهم ميسازد.
هدف كلي و اساسي (او.سي.ال.سي) كه بر مبناي افزايش سهولت دستيابي و استفاده از پيكره رو به رشد دانش و اطلاعات علمي، ادبي و آموزشي (گزارش ساليانه، 1995) قرار دارد، عبارت است از افزايش دسترسپذيري منابع كتابخانهاي و كاهش نرخ رشد هزينههاي كتابخانه. در راستاي تحقق اين هدف، اهداف ذيل را دنبال ميكند:
استقرار، نگهداري و پياده كردن يك شبكه كتابخانهاي كامپيوتري و افزايش استفاده از كتابخانه، بررسي و توجه به مسائل مربوط به كتابخانهها و كتابداري، فراهم نمودن امكانات و محصولاتي كه به نفع استفادهكنندگان كتابخانه وكتابخانهها باشد؛ از جمله افزايش قابليت دسترسي به منابع كتابخانه براي مراجعين به كتابخانهها و كاهش هزينههاي هر واحد كتابخانه.
كارهائي كه (او.سي.ال.سي) انجام ميدهد شامل خدمات فهرستنويسي، جستجو، امانت بين كتابخانهاي و فهرستگان ادواريها ميباشد. بطور كلي ميتوان گفت كه در سه زمينه خدمات مرجع و نشر الكترونيكي، توسعه فهرستنويسي، خدمات اشتراك منابع و توسعه بينالمللي پيشرفت داشته است.
شبكه و خدمات كتابشناختي (او.سي.ال.سي)
شبكه و خدمات كامپيوتري آن با بيش از 41000 كتابخانه در 82 كشور و قلمرو ارتباط برقرار مينمايد. (او.سي.ال.سي) از يك پايگاه كتابشناختي به نام "اپيك" نگهداي ميكند. در سال 1991 اين سيستم شامل 16 ميليون كتاب، يك ميليون سريال و 450000 رسانه سمعي بصري و همچنين 500000 گزارش بوده است. و تقريباً دو ميليون ركورد سالانه به آن اضافه ميشود (كاتز، 1974) بطوريكه هم اكنون اين پايگاه حاوي بيش از 31 ميليون ركورد در فرمتهاي مختلف كتاب، فيلم، گزارش يا تكنگاشت از كتابخانههاي عضو ميباشد.
(اپيك) مداخل متعددي از جمله دستيابي موضوعي و كليدواژهاي و جستجوي بولين را فراهم ميكند. دستيابي موضوعي فقط از سال 1990 ميسر بود. نرمافزار اپيك علاوه بر ركوردهاي او.سي.ال.سي امكان جستجوي پايگاههاي ديگر را از (اريك) و (ان.تي.آي.اس) فراهم ميسازد. سيستم اپيك هر ساله پايگاههاي اطلاعاتي جديدي به پايگاههاي خود ميافزايد. به اين ترتيب (او.سي.ال.سي) بزرگترين منبع اطلاعاتي جهاني است. نوارهاي مارك در قلب سيستم (او.سي.ال.سي) قرار دارد و نيز شامل فهرستنويسي اصلي مهم اعضا و موجودي همه كتابخانههاي دولتي است.
فهرستگان پيوسته (او.سي.ال.سي)، از نظر تعداد كتابخانههاي عضو و از نظر عمق و وسعت پوشش، پايگاه كتابشناختي پيشگام در دنياست. تا قبل از سال 1970 اكثر فعاليتهاي (او.سي.ال.سي) مربوط به تحقق در مورد طرح و عملكرد سيستم كامپيوتري فهرست آنلاين بود اما پس از آن تعداد 440711 فهرستبرگه آف لاين را نيز توليد كرد (پرومنشنكل، 2000).
در سال 1971 سيستم فهرست آنلاين شروع به كار كرد و در سال مالي 1972، كتابخانهها بيش از 330000 عنوان را فهرست كردند. در سال 1974 (او.ال.يو.سي) به يك ميليون ركورد، در 1975/76 به دو ميليون، سال بعد به سه ميليون و در دسامبر 1980 به هفت ميليون ركورد كتابشناختي رسيد (جردان، 1998). در 1994 اين پايگاه شامل بيش از 29 ميليون ركورد بود و نرخ افزايش ركورد آن در هفته 22000 ركورد ميباشد (كروك، 1995).
در ژانويه 1999، (او.سي.ال.سي) يك پروژه فوري اوليه تحت عنوان (كرك) يا فهرست منابع پيوسته تعاوني را ارائه نمود. هدف اين پروژه كه مبتني بر (دي.سي) يا استاندارد هسته فرادادهاي در دوبلين بود، توسعه يك فهرست منابع در محيط وب بود. در ژانويه سال 1999 مركز كامپيوتري كتابخانه اوهايو، پروژه "كورك" را آغاز نمود تا يك پايگاه اطلاعاتي جامع براي منابع پيوسته از طريق تعاوني بينالمللي با كتابخانهها ايجاد كند.
پايگاههاي اطلاعاتيو سرويسهاي (او.سي.ال.سي)
(او.سي.ال.سي) به منظور تامين نيازهاي انواع كتابخانهها، طيف وسيعي از خدمات را ارائه ميدهد كه شامل ابزار فهرستنويسي، پايگاههاي اطلاعاتي مرجع و خدمات جستجوي پيوسته، ابزار اشتراك منابع، خدمات حفاظت و ردهبندي دهدهي ديوئي ميباشد. همچنين امكان ارتباط با فروشندگان متعدد پايگاههاي اطلاعاتي را ميسر ميسازد.
بطور كلي پايگاههاي اطلاعاتي (او.سي.ال.سي) شامل WorldCat, ArticleFirst, Electronic Collection Online, NetFirst, PAIS International, PaperFirst, Proceedings First, OCLC Union Lists of Periodicals ميباشد. در اينجا به دو پايگاهها يعني "وورلدكات" و فهرستگان پايگاه اطلاعاتي مجلات در (او.سي.ال.سي) يا بطور مختصر اشاره ميشود.
در مركز خدمات (او.سي.ال.سي)، پايگاه اطلاعاتي "وورلدكات" قرار دارد كه بيشترين استفاده را در آموزش عالي دارد و سابقه دانش بشري را از 4000 سال گذشته تاكنون به 400 زبان دربرميگيرد. "وورلدكات" بزرگترين پايگاه اطلاعاتي كتابشناختي در جهان است كه حاوي بيش از 46 ميليون ركورد فهرستنويسي از كتابخانههاي سراسر جهان بوده و هر پانزده ثانيه يك ركورد جديد به آن اضافه ميگردد (پرومنشنكل، 2000). اين ركوردها شامل كتاب، نسخ دستي، نوارهاي ويدئويي و صوتي، نشريات ادواري، روزنامهها، نقشهها، و برنامههاي كامپيوتري ميباشد. به علاوه محصولات ميكروفيلم و ميكروفيش را به شكل نوار يا فرمت كارتي فهرست ميكند. ورلدكات طرحهايي را براي توسعه مجموعه، فهرستنويسي، كنترل مستند، و خدمات گذشتهنگر ارائه مينمايد. ميتوان از طريق سيستمهاي محلي به طرو مستقيم به ورلدكات دسترسي يافت.
فهرستگان پايگاه اطلاعاتي مجلات در او.سي.ال.سي، يكي ديگر از پايگاههاي اطلاعاتي اين شبكه است كه شامل ميليونها (ال.دي.آر) ميباشد و به بيش از 750000 ركورد كتابشناختي مرتبط شده است. هر (ال.دي.آر) مجموعه اطلاعاتي خاصي از نشريات ادواري را فراهم ميكند.
سيستم فرعي كنترل نشريات ادواري در (او.سي.ال.سي) از سال 1975 مورد استفاده قرار گرفته است و هدف از طراحي آن، فراهمآوري امكان مشاركت موءسسات در كنترل آنلاين نشريات ادواري است.
اين سيستم داراي چهار جزء است: كنترل، پيگيري، كنترل صحافي و فهرستگان، تا سال 1980 فقط جزء كنترل آن كار ميكرد اما كتابخانهها ميتوانستند از سيستم كنترل محدود ادواريها نيز استفاده كنند. پردازش يك نشريهء ادواري جديد و يا تغيير يك عنوان، يكي از مشكلترين كارهايي است كه سيستم فرعي كنترل ادواريها در (او.سي.ال.سي) بايد انجام دهد. مبناي فرآيند كنترل خودكار سيستم فرعي كنترل ادواريها در (او.سي.ال.سي)، كد بسامد يك ركورد دادهاي محلي است. اما اين كدها هميشه روزآمد نميشوند. حل مسائل مربوط به تغيير بسامد، منوط به استفاه از جزء پيگري كنترل ادواريهاست (رافتون، 1982).
يكي از مهمترين سرويسهاي (او.سي.ال.سي)، سرويس امانت بين كتابخانهاي است كه در سال 1979 معرفي گرديد و از آن زمان با استفاده از اين سرويس بيش از 14 ميليون امانت بين 6700 كتابخانهء سراسر جهان انجام گرفت. يكي ديگر از اين سرويسها، خدمات جستجوي اوليه ميباشد كه به عنوان يك ابزار مرجع در سال 1991 معرفي شد و اكنون در 19246 كتابخانه استفاده ميشود. وظيفه آن ارائه خدمات در زمينهء مجلات الكترونيكي به كتابخانهها و تأمين نيازهاي استفادهكنندگان راه دور است.
اين سرويس با ايجاد يك ذخيرهء اطلاعات و فراهم نمودن امكان اشتراك كتابخانهها (بطور مستقيم از طريق ناشر) در مجموعه چاپي مجلات علمي، نقش خود را در توسعهء مجموعه ايفا مينمايد. مقالات مجلات در (او.سي.ال.سي) بطور الكترونيك ذخيره ميشود و كتابخانهها ميتوانند از طريق وب، با استفاده از يك مرورگر وب اشتراكي و از طريق رابط پشتيبانيكننده از جستجو در مجلات، به آنها دست يابند. از طريق خدمات جستجوي اوليه استفادهكنندگان ميتوانند به 70 پايگاه اطلاعاتي مشهور و شناخته شده دسترسي پيدا كنند.در حال حاضر اين سرويس داراي صفحات جستجو و گرافيكهاي جديدي است كه انجام جستجوهاي اساسي و پيشرفته را براي استفادهكنندگان به مراتب راحتتر كرده است (هيزل، 1996).
يكي ديگر از سرويسهاي (او.سي.ال.سي)، سرويس همكاري كتابخانهاي مركز خدمات غرب است (فورد، 2000). اين سرويس به منظور استفاده از قدرت جمعي 1700 كتابخانه عضو بر سه نوع خدمات متمركز است: فراهمآوري امكاناتي براي ايجاد پايگاه اطلاعاتي؛ حفاظت و رقمي كردن منابع؛ و ايجاد فرصتهاي آموزش.
ايجاد پايگاه اطلاعاتي، تخفيفهاي قابل توجهي از لحاظ مشترك شدن در منابع الكترونيكي به همراه دارد. حفاظت و رقمي كردن نيز به اصلاح دستيابي به اطلاعات كمك ميكند و همچنين به اعضا در نگهداري مجموعه كمك مينمايد. (او.سي.ال.سي) همچنين با كنسرسيومهاي رسمي و غيررسمي كتابخانهها، موزهها و آرشيوها در تعيين روشهاي حفاظت مشاركت دارد.
بخش حفاظت از منابع، اقدام به ارائه خدمات ميكروفيلمي و رقمي در غرب مينمايد و نيز با شبكههاي منطقهاي و ساير سازمانها براي تهيه خدمات مشاورهاي و آموزشي مرتبط همكاري مينمايد. بطور كلي ميتوان گفت مهمترين فعاليتهاي اصلي مركز خدمات غرب، عبارتند از: برگزاري كارگاههاي آموزشي و به نمايش گذاشتن محصولات و خدمات (او.سي.ال.سي)، توسعه فعاليتهاي مربوط به آموزش فهرستنويسي، توسعه برنامههاي مديريت كتابخانه، خدمات مرجع، حفاظت و رقميسازي (پرومنشنكل، 2000).
(او.سي.ال.سي)، كتابخانهها و اينترنت
محيط وب و اينترنت، مكانيزم ديگري براي تحول مدرك در راستاي هدف عمومي (او.سي.ال.سي) يعني افزايش دستيابي به اطلاعات جهاني و كاهش هزينههاي اطلاعاتي است در اختيار (او.سي.ال.سي) قرار ميدهد. شبكهء اينترنت روشهاي جديد و مهيّجي در زمينهء خدمات فني فراروي (او.سي.ال.سي) و كتابخانههاي عضو قرار ميدهد.
كتابخانههاي عضو (او.سي.ال.سي) به سرعت در حال افزايش استفاده از خدمات وب و اينترنت ميباشند. در حال حاضر تقريباً 85% از كاربرد جستجوي اوليه و 18% از فهرستنويسي پريزم و اشتراك منابع بر روي اينترنت موجود است. (او.سي.ال.سي) از طريق http://www.oclc.org/ در روي وب قابل دسترسي است.
با افزايش تعداد كتابخانهها، كنسرسيومها و شركتهايي كه به اينترنت وصل ميشوند، اين شبكه جهاني با محدوديتهاي فني روبرو ميشود (لايبريز، 2002). در همين زمينه مهندسين شبكه (او.سي.ال.سي) و فراهمآورندگان خدمات اينترنت جهت رفع مسائل ناشي از افزايش ترافيك اينترنت كه بر قابليت دسترسي و زمان پاسخگوئي تأثيرگذار است، با يكديگر همكاري مينمايند.
دسترسي به (او.سي.ال.سي)
(او.سي.ال.سي) در ابتداي تشكيل خود، در سال 1971، يك امكان دستيابي ويژه به نام (multidrop dedicated) و در 1974، يك امكان دستيابي تلفني (dial-access) فراهم نمود. بيست سال بعد (multidrop) متداولترين روش دستيابي باقي ماند. در سال 1991، (او.سي.ال.سي) يك شبكه جديد x.25 را نصب كرد كه نه تنها سريع، قابل اعتماد و از نظر هزينه، سودمند بود بلكه ميتوانست با نيازهاي فزاينده خدمات كتابشناختي (او.سي.ال.سي) سازگار باشد.
در سال 1995، (او.سي.ال.سي) شروع به فراهم آوردن دستيابي اينترنتي براي خدمات فهرستنويسي و خدمات اشتراك منابع خود نمود (جردان، 1998). استفاده كننده ميتواند به طور خودكار به (او.سي.ال.سي) وصل شود و پايگاههاي اطلاعاتي انتخابي خود را جستو نمايد. همچنين ميتواند به طور مستقيم و يا از طريق شبكههاي منطقهاي مثل دانشگاه ايالتي شبكه كتابخانهاي (او.سي.ال.سي) نيويورك يا "نلينت" به (او.سي.ال.سي) دسترسي يابد. هزينههاي ورودي در هر يك از اين سيستمها متفاوت است. هزينههاي (او.سي.ال.سي) شامل استنادهاي آنلاين و نيز تجهيزات، نگهداري و هزينههاي ارتباط راه دور هستند (كاتز، 1974).
(او.سي.ال.سي) بر روي ديسكهاي فشرده نيز قابل دسترسي ميباشد. مجموعه ديسكهاي فشرده (كت)CD450 حاوي زيرمجموعههائي از ركوردهاي پايگاه اطلاعاتي اصلي ميباشد كه بطور فصلي روزآمد ميشوند. اين ديسكها در پنج زمينهء موضوعي كشاورزي، آموزش، هنر، علوم انساني، علوم و تكنولوژي به فروش ميرسند.
هر مجموعه، علاوه بر افزايش نمايهها، دستيابي به ركوردهاي (او.سي.ال.سي) در اين زمينههاي موضوعي را فراهم ميكنند. مثلاً بستهء نرمافزاري آموزشي شامل ركوردهاي (او.سي.ال.سي) در آموزش و نيز ديسكهاي جاري و گذشتهنگر اريك ميباشد.
پروژههاي (او.سي.ال.سي)
(او.سي.ال.سي) داراي پروژههائي است كه عبارتند از: Kilory, Scorpion, Marc, Xml, ، (آر.دي.اف)،Dublin, Kilory, WordSmith به طور كلي اينترنت را مورد جستجو قرار ميدهد و با پايگاههاي اطلاعاتي تمام متن و پايگاههاي اطلاعاتي فرادادهاي از منابع اينترنتي ارتباط برقرار ميكند. Iteract كه در سال 1993 شروع و در سال 1996 تكميل گرديد.
عبارت است از يك سيستم بررسي تحقيقاتي (او.سي.ال.سي) از نظر ماهيت و اندازه منابع اينترنتي و تأثير بالقوهء آنها بر عمليات كتابخانهاي Mantis به منظور سازماندهي و دستيابي به منابع الكترونيكي، استفاده و جامعيت سيستمهاي Kilory, Scorpion, Marc, Xml, ، (آر.دي.اف)،Dublin Core و WordSmith را مورد تحقيق و بررسي قرار ميدهد. اسكورپيون پروژه جديدي است كه به بررسي نمايهسازي و فهرستنويسي منابع الكترونيكي ميپردازد.
با توجه به افزايش اطلاعات موجود در وب، و در نتيجه افزايش مدت زمان لازم براي يافتن اطلاعات مورد نياز و نيز افزايش هزينهء دستيابي به آن، پروژه اسكورپيون در نظر دارد نمايهسازي و فهرستنويسي را با يكديگر تركيب كند و مخصوصاً ابزاري براي تشخيص خودكار موضوع براساس طرحهاي شناخته شدهء ردهبندي ديوئي تهيه نمايد. در صورتي كه سرعنوانهاي موضوعي يا دامنههاي مفهومي را بتوان بطور خودكار به مدارك الكترونيك تخصيص داد، ميتوان در زمينهء ايجاد ابزار فيلتركنندهاي براي جستجو اقدام نمود (شيفر، 1996). پروژهء وورداسميت، سيستم نمايهسازي او.سي.ال.سي است كه محور اصلي اين مقاله را تشكيل ميدهد.
يكي از اهداف كوتاه مدت پروژهء (او.سي.ال.سي)، توسعهء نرمافزاري است كه بتواند عبارات را بطور خودكار تشخيص داده و اين عبارات را هوشمندانه در مدارك تمام متن سازماندهي كند و به اين ترتيب نمايههاي مفيدتري براي پايگاههاي اطلاعاتي ايجاد گردد. به همين منظور با استفاده از روشهاي توسعهيافته در زبانشناسي محاسباتي و نيز استفاده از نرمافزار NetOwl امكان تشخيص و مقولهبندي اسامي خاص در متن غيرساختاري و نيز تهيهء ليستهاي مقولهبندي شده مناسب از اسامي اشخاص و اسامي جغرافيائي فراهم آمد (گودبي، 1998). چند خروجي نمايه در شكل 1 نشان داده شده است.
Have havey haw
Havei havice hawing
Havel havill hawed
Haven havilland hawker
شكل1. نمايش قسمتي از يك نمايه تكواژهاي
مدخل نمايه، اسم كامل يك مفهوم مشخص را در متن تعيين ميكند مثلاً عباراتي كه در شكلهاي 2 و 3 آمده است.
Air pollutants air power
Air pollution air pressure
Air pollution air quality
شكل2. عبارات اسمي در يك پايگاه اطلاعاتي در محيط وب
Yevette Abel Tasman
Haskins National Park
Yevgeny Abercorn
KafeInikov Street
شكل 3. اسامي اشخاص و اسامي جغرافيائي در يك پايگاه اطلاعاتي در محيط وب