بخشی از پاورپوینت

اسلاید 1 :

پیدا کردن قوانین همبستگی در دادههای پیوندی

اسلاید 2 :

سرفصل مطالب
ضرورت انجام پژوهش
هدف از انجام پروژه
مفاهیم اولیه
روشهای موجود
مشکلات و چالشها
ساختمان دادههای مورد استفاده
روش پیشنهادی در کاوش دادههای وب معنایی
روش پیشنهادی در کاوش دادههای پیوندی
دادههای مورد استفاده
نتایج ارزیابی
جمع بندی
کارهای آینده

اسلاید 3 :

ضرورت انجام پژوهش
حجم زیاد دادههای موجود
تکنیکهای داده کاوی
نیاز به استخراج دانش از دادهها
منابع داده ای مورد استفاده
طبقه بندی
قوانین همبستگی
خوشه بندی
فایلهای مسطح
پایگاه دادهها
.
وب سنتی (وب اسناد)
وب معنایی (وب داده)
کاوش قوانین همبستگی از دادههای وب معنایی
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 4 :

هدف انجام پژوهش
دادههای وب معنایی
نمایش دادههای وب معنایی
بانکهای اطلاعاتی رابطه ای
منابع داده مسطح
تک منبع داده
اتصال چندین منبع داده وب معنایی به یکدیگر (دادههای پیوندی)
کاوش قوانین همبستگی از دادههای پیوندی
صفحات HTML، مرورگرهای وب معنایی، عاملهای کاربردی
ذخیره دادههای وب معنایی
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 5 :

قوانین همبستگی
تعیین احتمال رخداد یک حالت، بعد از رخ دادن یک یا چند حالت دیگر
ساده ترین حالت: آنالیز سبد خرید
کسانی که نان و پنیر می خرند، کره نیز می خرند (78%)
مبنای کار
تراکنش: چند حالت (عنصر) که با یکدیگر رخ می دهند.
شماره تراکنش
عناصر تراکنش
پارامترها
درجه پشتیبانی
درجه اطمینان
بخشهای قانون
مقدم - نتیجه
الگوریتم Apriori
مبنایی ترین روش کاوش قوانین همبستگی
دو فاز: تولید مجموعه عناصر بزرگ و تولید قوانین همبستگی
شناسایی عناصر بزرگ بر اساس تراکنشها
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 6 :

مثال از الگوریتم Apriori
Database D
Scan D
Scan D
Scan D

اسلاید 7 :

وب معنایی
ذخیره داده به همراه توصیف دادهها
دادهها: ذخیره داده در گرامرهای مختلف و به صورت سه تایی
توصیف دادهها: آنتولوژی
دادههای وب معنایی
سه تایی (فاعل، گزاره، مفعول)
علی احمد را می شناسد.
علی: فاعل
شناختن: گزاره
احمد: مفعول
زبان استخراج دادهها
SPARQL
قابلیت نمایش دادهها در قالب گراف
pd:cygri
Richard Cyganiak
dbpedia:Berlin
foaf:name
foaf:based_near
foaf:Person
rdf:type
pd:cygri = http://richard.cyganiak.de/foaf.rdf#cygri
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج
dbpedia:Berlin = http://dbpedia.org/resource/Berlin

اسلاید 8 :

دادههای پیوندی
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج
اتصالات صفحات وب سنتی
لینکهای بدون نوع
اتصالات صفحات وب معنایی
دادههای پیوندی
لینکهای نوع دار
فاعل – گزاره - مفعول

اسلاید 9 :

مثال از دادههای وب معنایی
کسانی که در دانشگاه صنعتی اصفهان درس می خوانند  دکتر نعمتبخش را می شناسند.
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج
چالش اصلی: عدم وجود تراکنش در دادههای وب معنایی

اسلاید 10 :

1) Victoria Nebot و Rafael Berlanga
Finding association rules in semantic web data
توصیف
نگاه به دادهها در قالب گراف
ایجاد تراکنش به کمک یک الگوی کاوش که کاربر وارد می کند.
استفاده از الگوریتمهای داده کاوی سنتی
Q = (Target Concept,Context Concept,Features)
Target Concept: بیان می کند که اطلاعات مرتبط به چه چیزی باید استخراج شود؟ (بیمار - پزشک)
Context Concept: بیانگر معیار ساخت تراکنش است (TID)
Features: بیانگر عناصری است که در یک تراکنش قرار می گیرند.
تمرکز اصلی روش
ساخت تراکنش از روی دادهها و سپس استفاده از یک روش سنتی
10
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 11 :

1) Victoria Nebot و Rafael Berlanga (ادامه)
11
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 12 :

1) Victoria Nebot و Rafael Berlanga (ادامه)
12
CREATE MINING MODEL
{
?patientRESOURCE TARGET
?drugRESOURCE
?jadiLITERAL
?diseaseRESOURCE PREDICT
?reportRESOURCECONTEXT
}
WHERE
{
?patientrdf:typePatient.
?drugrdf:typeDrug.
?diseaserdf:typeDisease.
?reportrdf:typeReport.
?reportdamageIndex?jadi.
}
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 13 :

1) Victoria Nebot و Rafael Berlanga (ادامه)
13
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج
دادههای استخراجی به همراه مسیرهای تجمعی
دادههای استخراجی به همراه مسیرهای تجمعی اصلاح شده
تراکنشهای استخراج شده

اسلاید 14 :

2) Ziawasch Abedjan و Felix Naumann
Context and Target Configurations for Mining RDF Data
توصیف
سه تایی: فاعل، گزاره و مفعول
استفاده از یکی از این مقادیر به عنوان شماره شناسایی تراکنش (محتوی)
استفاده از یکی دیگر از مقادیر به عنوان عناصر تراکنش (هدف)
حذف مقدار باقیمانده سوم
ساخت تراکنش بر اساس دو مقدار از سه مقدار ممکن
استفاده از الگوریتمهای سنتی
14
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 15 :

3) Venkata Narasimha et al
LiDDM: A Data Mining System for Linked Data
کاوش دادههای پیوندی
استخراج داده از چندین منبع داده
استخراج به کمک زبان SPARQL
شناسایی نقطه پایانی و ساختار منابع داده
ادغام دادههای استخراج شده
استفاده از الگوریتمهای سنتی
طبقه بندی
خوشه بندی
کاوش قوانین همبستگی
15
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 17 :

4) کاوش گراف
17
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 18 :

5) کاوش درخت
18
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 19 :

مشکلات و چالشها در برخورد با دادههای وب معنایی
عدم وجود تعریف دقیق از تراکنش
تعریف تراکنش بر اساس الگوهایی خاص
کاوش قوانین همبستگی بدون در نظر گرفتن تراکنش
وجود روابط نوع دار بین موجودیتها
هر عنصر، متشکل از یک موجودیت به همراه یک رابطه است.
ساختار ناهمگن دادهها
وجود صفات مختلف به ازاء موجودیتهای یکسان
استفاده از ساختار لیست پیوندی
دخالت شدید کاربر در فرآیند کاوش
آگاهی کاربر از ساختار منابع داده و زبانهای استخراج داده
19
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج

اسلاید 20 :

جریان کاری الگوریتم ارائه شده
مراحل اصلی
فراهم سازی دادههای مورد نیاز به صورت سه تایی
پیش پردازش
پردازش و تولید قانون
استفاده از قوانین تولیدی
20
مفاهيم اوليه
کارهاي مشابه
کاوش از دادههای وب معنایي
کاوش از دادههاي پيوندي
تست و نتايج
سه تایی
منبع داده کامل
بخشی از یک منبع داده
(SPARQL)
اتصال چندین منبع داده
(Linked Data)
گسسته سازی دادهها
حذف موجودیتهای نامکرر
استخراج مجموعه عنصر بزرگ با طول 2
ساخت تمام مجموعه عناصر بزرگ
تولید قوانین همبستگی
تبدیل دادهها به مقادیر عددی
قوانین همبستگی
پیش پردازش
پردازش
MinConf, MinSup

در متن اصلی پاورپوینت به هم ریختگی وجود ندارد. برای مطالعه بیشتر پاورپوینت آن را خریداری کنید