بخشی از مقاله

چکیده

روند فزاینده پیشرفتهای فناوری امکان تنوعبخشی به روشهای شناسایی و استخراج ویژگیهای دادهها و کشف ارتباط و شیوه اندرکنش آنها در پدیدههای دنیای تکوین را بیش از پیش فراهم نموده است. در سالهای اخیر، رویکرد شبکهای بررسی متون در دادههای شبکههای اجتماعی محمل تحلیل رفتاری کاربران قرار گرفته ولی پژوهشهای زبانشناسی رایانهای در این خصوص به تازگی شروع شده است. تشکیل شبکه واژگان قرآن نیز در این راستا قابل توجه است چون امکان سنجش ارتباط و میزان نقشآفرینی آنها در ساختار ظاهری دادهها را تقویت میکند.

در این بررسی گراف بدونجهت کلمات همنشین در آیات 10 سوره با حجم داده یکسان تشکیل و شاخصهای مختلف مرکزیت و دانسیته آنها استخراج گردید. ضمن استفاده از فاصله بین کلمات به عنوان معیار تفکیک واژه، هزینه خاصی برای تفاوت فاصله بین کلمات در یک آیه لحاظ نشد و وزندهی بر اساس میزان تکرار واژه تعیین گردید.

نتایج نشان داد که به منظور تقویت کارایی تحلیل موضوعی واژگان، ضرورت دارد که پیشپردازش دادهها با حذف کلمات دارای تکرار زیاد ولی بدون تأثیر در موضوعیابی از طریق پیادهسازی الگوریتمهای بازیابی، انجام شود. علاوه بر این، با توجه به بالا بودن ضریب بودن همبستگی بین بعضی از شاخصها، استفاده از روشهای کاهش ابعاد و همچنین شناسایی و استخراج شاخصهای الگوی طیفی گرافها پیشنهاد گردید.

مقدمه

در دهههای اخیر، نگرش شبکهای یا اندرتنیدگی یکپارچه در علوم و مهندسی نسبت به طیف وسیعی از پدیدههای طبیعی، اجتماعی، اقتصادی، زیستشناسی، و غیره، کاربرد فزایندهای پیدا کرده است. شناخت نحوه رفتار افراد در هنگام خرید کالا و سفارش خدمات، شناسایی میزان تراکم و روان بودن تردد خودروها در نقاط مختلف معابر شهری، بررسی تغییرات بهوجود آمده در نرخ تولید و ارتباطات مواد شیمیایی واسط تولید و مصرف پروتئینهای مشخص در بدن، ارزیابی پتانسیل گسترش ابتلای به یک بیماری خاص در مکانهای مختلف برای اقشار مردم، و رصد دینامیک سلایق و علایق اجتماعی در رابطه با موضوعات سیاسی از جمله این زمینهها است.

هر شبکه یا گراف از گره و یالهایی تشکیل شده که پیوند و اندرکنش آنها در ساختار یا ویژگیهای آن نقش تعیین کننده داشته و شاخصهای محلی و سراسری1 زیادی برای شرح و تحلیل ساختار آنها مطرح است . - Kolaczyk, 2009 - شاخصهای این سیستمها خارج از جریان متداول آماری بوده و در مبانی تئوری گراف، علوم کامپیوتر، دینامیک اجتماعی، و حتی مکانیک آماری در فیزیک، ریشه دارد. این ویژگیها میتواند شامل نحوه جریانیابی اطلاعات، کالا، و خدمات - شاخصهای مسیر - ، اهمیت گره در گراف - مرکزیت - ، و نقش قسمتی از گرهها در رفتار دینامیکی - گروه، زیرمجموعه، جامعه - باشد. شناخت این ویژگیها، محمل بهینهسازی توزیع و تخصیص منابع در شبکهها را فراهم میسازد.

شاخصهای مختلفی برای تحلیل گرافهای بدونجهت و جهتدار وجود دارد که هر کدام بر روی ویژگی خاصی از ساختار و رفتار شبکه تمرکز دارد . - Newman, 2010 - در مهمترین این شاخصها نوعی از مرکزیت2 احصاء شده و شامل درجه، نزدیکی3، و بینابینی4 میشود. میزان پیوند یا اتصال یک گره با دیگر گرهها به طریقی نشانگر شدت نقشآفرینی یا اعتبار تلقی میشود. روایت دیگر از این نوع شاخص، مرکزیت بردار ویژه5 است که در آن، میزان اهمیت به وزن گره پیوند شده ربط داده میشود. به عبارت دیگر، یک گره میتواند به تعدا زیادی گره غیرمهم اتصال داشته باشد که لزوماً نقشی در ساختار و رفتار شبکه ندارند و بنابراین، نشانگر اهمیت گره مذکور نیستند.

بر این اساس، یک گره میتواند تعداد زیادی اتصال داشته، تعداد کمی اتصال با همسایگان پراهمیت داشته، یا ترکیبی از این دو را دارا باشد که در هر حالت، مقدار مرکزیت بردار ویژه آن زیاد است. در شاخص نزدیکی، میانگین فاصله یک گره با دیگر گرهها اندازهگیری میشود. میزان سر راه دیگر گرهها قرارگرفتن یک گره، در شاخص میانی سنجش میشود. در این شاخص، تعداد اتصال با دیگر گرهها به طور کلی یا گرههای پراهمیت یا فاصله با آنها، اهمیت نداشته بلکه میزان کنترل صورت گرفته به خاطر عبور میزان زیادی از جریان - کالا، خدمات، اطلاعات، و غیره - ، نقش گره را زیاد میکند.

یکی از سوالاتی که در رابطه با ساختار ظاهری قرآن مطرح است، چیدمان دادهها است. در یک کتاب عادی علمی یا فلسفی، فصول میتوانند مستقل از یکدیگر باشند و بنابراین، جابهجایی امکانپذیر است. حتی میتوان یک فصل کم یا اضافه کرد. حجم دادهها در یک فصل با تالرانسی مشابه یکدیگر بوده و تفاوت حجم داده مثل سوره حمد و بقره یا آیه اول با 282 سوره بقره وجود ندارد.

موضوعات گوناگون دانشی و ارزشی در یک فصل یا موضوعات مشابهی در فصلهای مختلف مطرح نمیشود. تعدد و تنوع موضوعات، فراگیر بودن مسائل، و همگانی و همیشگی بودن اصول و قواعد مطرح شده از دیگر ویژگیهای خاص دادههای »بودنی« و »بایدی« قرآنی است که لایههای نزولی آن از لوح محفوظ تا عربی مبین، یکپارچگی و وحدت طولی کتاب را دارا میباشد.

یکی از روشهای بررسی ابعاد نهفته ساختار ظاهری دادههای قرآنی، استفاده از رویکرد تئوری گراف است. این رویکرد را میتوان در سطوح مختلف از سوره تا حرف پیادهسازی نمود. اگر مقیاس، کلمه در نظر گرفته شود، برای تولید شبکه واژگان در یک سوره، هر کلمه یک گره تلقی شده و شناسه یکتایی داشته و بین آنها یال ایجاد میشود. شبکه واژگان یک آیه با شماره خاص یا شبکههای واژگان موضوعی نیز میتواند در دستور کار قرار گیرد.

هدف از این نوع مطالعه، بررسی ویژگیهای ساختار ظاهری 10 سوره با حجم حدود 1 درصد داده در قرآن است تا بتوان با استفاده از قاعده تناسب ساختار با محتوا، به تدریج به بررسیهای تطبیقی دادهکاوی با دیگر کتب مرتبط - روایی - و غیرمرتبط و به جنبههای منظومه محتوایی دادههای قرآنی و وجوه اشتراک و تمایز، تقابل و تعامل، یا اندرکنش و همافزایی آنها ورود توصیفی یا استنباطی پیدا نمود.

مواد و روشها

تفکیک کلمات بر روی روایت دیجیتالی دادههای قرآنی صورت گرفت - ترکیان، - 1395 و 10 سوره با حجم داده مشابه انتخاب گردید. کلمات هر آیه یک مقوله در نظر گرفته شده و پیوند بدون جهت بین کلمات برقرار شد. هر کلمه شناسه یکتایی داشته و میتواند نقش مبدأ یا مقصد ایفا نماید. از نرمافزارهای گفی و متلب برای شناسایی و استخراج شاخصهای گرافها استفاده شد.

نتایج و بحث

تشکیل گراف

رویکرد گراف را میتوان در مقیاسهای مختلف سوره، آیه، و کلمه با موضوع خاص پیادهسازی نمود. در مقیاس سوره، کلمات یک آیه را میتوان یک مقوله در نظر گرفت و لینک از یک کلمه به کلمات دیگر آن آیه ایجاد کرد. این گراف میتواند جهتدار یا بدون جهت باشد ولی در این بررسی برای سادهسازی، گراف بدون جهت سوره فلق در جدول 1 توضیح داده شده و گراف همآیی کلمات بعضی از سور با حجم داده همسان در شکل 1 نشان داده شده است. هر کلمه شناسه یکتایی داشته و در شبکه نهایی نقش یک گره را ایفا میکند.

بین کلمات یک آیه بهصورت دو به دو یال ایجاد میشود. در صورت تکرار همآیی کلمات در سوره، وزن یال مربوط به این ارتباط اضافه میشود. کلمات داخل یک آیه با فواصل مختلف به همدیگر وصل هستند و بین »اعوذ« و »برب « که مجاور هم هستند و »اعوذ« و »الفلق« که یک فاصله دارند، بایستی تفاوت قائل شد که در این آرایش در نظر گرفته نشده است. همچنین، آیه اول »قل اعوذ برب الفلق« به بقیه قسمتها متصل نیست چون کلمه مشترکی با دیگر آیات ندارد این سوال مطرح است که کلمات آیات مختلف چگونه باید به هم وصل شوند تا یکپارچگی ساختار ظاهری حفظ شود. جزئیات روند محاسبات در شبهکد جدول 2 نشان داده شده است.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید