انواع زبان های نمایه سازی

در یک تقسیم بندی ، زبانهای نمایه سازی به زبان طبیعی، آزاد و کنترل شده تقسیم می شود، که در ادامه به آنها می پردازیم.

زبان طبیعی

زبان طبیعی نوعی زبان نمایه سازی است که به متن اثر به همان شکلی که نویسنده اصلی مدرک تدارک دیده است، اشاره دارد. چنین متنی تنها از قواعد معمولی و طبیعی صحبت کردن و نوشتن پیروی میکند (بتز، ۱۹۸۸).

نیز و زبان طبیعی را زبانی میداند که انسانها برای ارتباطات شفاهی استفاده می کنند و واژه های آن به کلیدواژه معروف هستند (نیزو، ۱۹۹۷).

زبان طبیعی در حقیقت زبانی مشخص یا ثابت نیست، بلکه زبان عادی مدارکی است که باید نمایه شوند. نظام های زبان طبیعی، نوعی از نظامهای واژه گرفتی هستند که در آن همه توصیفگرها از مدرکی که نمایه می شود، استخراج گردد و هر واژه ای که در مدرک ظاهر می شود، گزینه ای برای واژه های نمایه است. در نمایه سازی زبان طبیعی معمولاً بر واژه های موجود در عنوان ها و چکیده ها تأکید شده است، اما به طور فزایندهای، متن کامل مدرک نیز به عنوان مبنایی برای نمایهسازی مورد استفاده قرار میگیرد. این نوع نمایه سازی که از متن کامل مدرک استفاده می کند، شاید بسیار مفصل باشد و در بعضی نظام ها، مکانیسم هایی برای تصمیم گیری درباره مهمترین واژه های مدرک تعیین شده است و یکی از آنها بر تحلیل آماری بسامد نسبی حضور واژه ها استوار است. نمایه سازی زبان طبیعی به وسیله نمایه ساز یا به صورت خودکار با رایانه قابل اجرا است. رایانه هر واژه مدرک را به جز آنهایی که در یک سیاهه بازدارنده آمده اند نمایه می کند، یا تنها واژه هایی را نمایه می کند که در اصطلاح نامه موجود در رایانه فهرست شده باشند (راولی و فارو، ۲۰۰۰: ۱۲۶-۱۲.

 کلیولند و کلیولند زبان طبیعی را زبانی میدانند که واژههای آن به طور مستقیم از واژه های موجود در متن مدرک به همان صورت که نویسنده نوشته است استخراج میشود. به اعتقاد آنها این زبان، واژگانی گسترده است که موجب بیان عمیق می شود و توانایی برقراری ارتباط در سطحی بالا را فراهم می کند. در نمایه سازی زبان طبیعی، نمایه ساز قادر است واژه ها را برای نمایه سازی، مستقیم از متن انتخاب کند. از آنجا که واژه ها از درون متن استخراج می شوند، این شیوه را می توان نمایه سازی به وسیله استخراج قلمداد کرد. استدلال این رویکرد، بر این عقیده استوار است که نویسنده ها از واژه ه ایی استفاده میکنند که با زمینه موضوعی مورد بحث منطبق است. آنها با خواننده به زبانی قابل فهم ارتباط برقرار می کنند. چنین زبانی پویا و رایج است و مانعی در ارتباط میان نویسنده و خواننده ایجاد نمی کند. از انجایی که اصطلاحات نمایه ای از درون مدارک استخراج می شوند، این واژگان مطابق با افزودن مدارک جدید به نظام رشد می کنند و روزآمد می شوند. اما این زبان پیچیدگی معنایی دارد که موجب فهم نادرست می شود. مجاز دانستن هر واژه در زبان برای ارائه محتوا، مسائلی را پدید می آورد که سریع آشکار نمی شود. کاربرد مجموعه ای از واژه ها یا عبارت های نامحدود یا کنترل نشده برای نمایه سازی یا جستجو، به دلیل حجم وسیع واژه ها به تلاشی بیهوده در جستجو میانجامد زیرا کاربران همه واژه هایی که به وسیله نمایه ساز یا نویسنده ای مدارک استفاده شده باشد را انتخاب نمی کنند. در بسیاری از موارد، کاربر شاید واژه های مورد استفاده نمایه ساز را با فهمی متفاوت از معنی آنها انتخاب کند. از این رو استفاده از واژگان کنترل شده توسعه یافت (کلیولند و کلیولند، ۲۰۰۱: ۳۵-۳۸)

 در نمایه سازی با زبان طبیعی، از زبان مدرک استفاده می شود و معمولا براساس تخصیص ماشینی واژه های موجود در عنوان و چکیده صورت می گیرند. در این نوع نمایه سازی انتخاب ساده است و نیازی به تحلیل مدرک ندارد (راولی، ۱۹۸۲: ۴۷-۴۸)

استفاده از زبان طبیعی در نمایهسازی مزایا و معایبی دارد. «پراشتر» یکی از مزایای زبان طبیعی را روزآمدی واژگان آن میداند که با سرعت رشد مفاهیم جدید هماهنگ می شود. به اعتقاد او این زبان قواعد نحوی و دستوری خاصی دارد که موجب انتقال معنی صحیح موضوعی خاص می شود. اما به رغم این مزایا، زبان طبیعی به علت وجود واژه های مترادف و مشابه در سازماندهی فایل نمایه ای سودمند نیست (پراشر، ۱۹۸۹: ۳۷).

لنکستر عبارت زبان طبیعی را متضاد واژگان کنترل شده میداند و معتقد است در زمینه بازیابی اطلاعات، این عبارت معمولاً به واژه هایی اشاره دارد که در متن چاپی ظاهر شده اند و بدین ترتیب می توان آن را با متن آزاد مترادف دانست. متن آزاد میتواند شامل عنوان، چکیده، و متن کامل اثر باشد. استفاده از زبان طبیعی نقاط دسترسی بیشتری برای بازیابی ایجاد می کند و جامعیت بیشتر اما مانعیت کمتر به همراه دارد؛ زیرا هر چه نقاط دسترسی بیشتری ایجاد شود، احتمال ارتباط برخی از آنها به جنبههای فرعی مدرک بیشتر است هنگامی که از متن کامل مدارک به عنوان اساس نظام بازیابی استفاده شود،«پرسش جستجو» با شیوه ای که مدارک نمایه شده اند، محدود نمیشود، اما امکان بازیابی مدارک نامرتبط افزایش مییابد.

عامل مورد توجه دیگر تازگی است. واژه های جدید قبل از اینکه در واژگان کنترل شده ظاهر شوند، در عنوانها و چکیده ها مورد استفاده قرار می گیرند.بنابراین برای موضوع های جدید، زبان طبیعی کاربرد بهتری دارد و نسبت بهتری از مانعیت ایجاد می شود. استفاده از زبان طبیعی موجب جامعیت بیشتر می شود زیرا جستجوگر به حدس زدن واژه هایی که باید استفاده کند نیاز نخواهد داشت. بنابراین جستجوی زبان طبیعی شاید نتایج خوبی در مورد مفاهیم خاص، موضوعهای تازه، و اصطلاحات جدید ارائه کند، اما در مورد مفاهیم عمومی به این صورت نیست؛ بنابراین یکی دیگر از مزایای زبان طبیعی این است که هیچ توقفی در الحاق واژه های جدید در آن وجود ندارد.

 از طرفی جستجوی زبان طبیعی یا کلیدواژه ای مشکلاتی ایجاد می کند، زیرا کاوشگر باید الزاماً در هر زمان راهبرد جدیدی برای جستجو ایجاد کند. به عبارتی به تمام شیوه های ممکن در جستجو فکر کند. علاوه آن، استفاده کنترل نشده کلیدواژه ها، به مانعیت پایینتر از حد متوسط می انجامد(لنکستر,(۱۹۹۱,۱۹۳-۲۰۲

 قواعد نحوی است که برای نمایه سازی مورد استفاده قرار می گیرد. در این نوع نمایه سازی واژه های متن عیناً به عنوان توصیفگرهای مدرک انتخاب میشوند. زبان طبیعی مقابل واژگان کنترل شده به کار میرود استفاده  در نمایه سازی ماشینی کاربرد بیشتری دارد.

مثال:

 اهمیت و نقش کتابخانه های آموزشگاهی در آموزش

ناهید مرتضوی

چکیده :

اهمیت مطالعه در دوران کودکی و نوجوانی و قابلیت گسترش ان در سنین بالا بر کسی پوشیده نیست. جامعه دانش آموزی برای به دست آوردن روحیه پژوهشی و مطالعه فردی از نخستین سال دبستان تا اخرین سال دبستان به کتابخانه مجهز نیاز دارد. در این مقاله ابتدا کتابخانه آموزشگاهی در – طع تحصیلی تعریف و سپس اهداف، وظایف و تشکیلات آن بیان می شود. در پایان برای بهبود وضعیت ۔موجود کتابخانه های آموزشگاهی پیشنهاد هایی ارائه شده است.

کلید واژه ها: کتابخانه های آموزشگاهی، مطالعه، پژوهشی، اموزش

نکته: در این چکیده مقاله، نویسنده متن، کلید واژه های یاد شده را از متن ܚ اصلی استخراج کرده بدون انکه انها را با یک فهرست مستند مانند اصطلاح نامه یا فهرست سرعنوان های موضوعی مطابقت دهد؛ بنابراین زبان نمایه سازی، زبان .است .طبیعی است

برگرفته از: مرتضوی، ناهید. “اهمیت و نقش کتابخانه های آموزشگاهی در آموزش ” فصلنامه کتاب، دوره سیزدهم، شماره دوم، تابستان ۱۳۸۱. ص. ۱۱۳-۱۲۰

استفاده از زبان طبیعی در نمایه سازی مزایا و معایبی دارد که در ذیل به آن اشاره می کنیم:

مزایا

با استفاده از آن نمایه سازی به سهولت انجام میگیرد و به تحلیل مدرک و استخراج مفاهیم نیاز ندارد.

  • استفاده از آن امکان خودکار سازی ایجاد نمایه را فراهم می آورد و سرعت نمایه سازی افزایش مییابد.
  • به تازگی و روزآمد سازی آن بیشتر است، زیرا کلیدواژه ها را از مدارک جدید استخراج می کند و همگام با رشد مدارک
  • مانعیت را افزایش میدهد.

معایب

  • کاربر مجبور است برای بازیابی مدرک مورد نیاز همه کلید واژه های ممکن را حدس بزند.
  • وجود واژه های متشابه و مترادف در زبان طبیعی موجب بازیابی مدارک نامرتبط می شود.
  • به علت دامنه وسیع انتخاب واژه ها شکست نهایی در جستجو به همراه دارد و موجب اتلاف وقت و تلاش کاربران می شود.