مقاله در مورد حل مساله کمترین مربعات وزندار با استفاده از تجزیه قائم کامل

word قابل ویرایش
117 صفحه
12700 تومان

چکیده
حل مساله کمترین مربعات وزندار به صورت از طریق روش تجزیه قائم کامل موردنظر است‌.‌در عمل ماتریس وزن‌ها می‌تواند بسیار بدحالت باشد و در نتیجه روش‌های متداول، ممکن است جواب‌های نادقیق بدست بدهند‌.‌استوار و تاد یک نرم‌ کراندار را برای مساله کمترین مربعات وزندار برقرار کردند که مستقل از ماتریس وزن D است‌.‌واوازیز یک زوش پایدار (NSH) را بر اساس نرم کراندارد برقرار

کرد‌.‌جواب محاسبه شده بوسیله الگوریتم پایدار فوق یک کران دقیق را که مستقل از ماتریس وزن بدحالت D است، برقرار کرد‌.‌تحلیل خطای پیشرو نشان می‌دهد که الگوریتم COD در این حالت پایدار است، اما این الگوریتم نسبت به الگوریتم NSH که بوسیله واوازیز بررسی شد، ساده‌تر است.

پیشگفتار
حل مساله کمترین مربعات وزندار به صورت

از طریق روش‌های مستقیم با توجه به فرض‌های زیر موردنظر است:
۱٫ ماتریس دارای رتبه ستونی کامل باشد.
۲٫ ماتریس متقارن معین مثبت و قطری حقیقی باشد.
۳٫ ماتریس بسیار بدحالت باشد.
همچنین دستگاه خطی مربعی به صورت

را یک دستگاه تعادلی گویند، که با توجه به فرض‌های فوق با مساله کمترین مربعات بالا در بدست آوردن جواب y معادل است.
این دستگاه کاربردهای زیادی دارد‌.‌در سال ۱۹۸۸ استرنگ برخی از کاربردهای آن را در زمینه‌های بهینه‌سازی، المان‌های متناهی و شبکه‌های الکتریکی مشاهده کرد و به این نتیجه رسید که در اکثر موارد ماتریس وزن D برای آنها بسیار بدحالت می‌شدند‌.‌این موجب شد که یک سال بعد استوارت یک نرم کراندار را برای دستگاه‌های تعادلی فوق برقرار کند‌.‌این حرکتی شد برای واوایز که در سال ۱۹۹۴ روش پایدار NSH را برای دستگاه‌های تعادلی فوق تحت نتایج تعریف شده استوار بوجود آورد‌.‌از آن پس روش NSH به عنوان یکی از روش‌های مفید برای دستگاه‌های تعادلی که ماتریس وزن D آنها بسیار بدحالت بودند، مورد استفاده قرار گرفت‌.‌
نشان داده شد که کران بالای جواب این روش مستقل از D و عدد حالت D است‌.‌

این مزیتی برای روش NSH محسوب می‌شود، زیرا روش‌های قبلی فاقد چنین کرانی بودند.
بالاخره در سال ۱۹۹۷ هاگ و واوازیز، روش پایدار دیگری را تحت نتایج تعریف شده استوارت بوجود آوردند که به روی COD موسوم شد.
این روش هم از لحاظ کارایی، و هم از نظر سادگی تکنیک‌های استاندارد بکار گرفته شده و هم به خاطر دارا بودن یک آزمون برای وابستگی سطرهای ماتریس A در مقابل وزن‌هایشان، به عنوان روشی بسیار مفید برای حل اینگونه مسائل مورد استفاده قرار گرفت.
این رساله به صورت زیر سازماندهی می‌شود:
۱٫ در فصل اول مقدماتی از جبر خطی عددی را بررسی خواهیم کرد که شامل نمادها و الگوریتم‌های پایه‌ای، آنالیز ماتریس، آنالیز خطا، تجزیه ماتریس و دستگاه‌های خطی می‌باشد.
۲٫ در فصل دوم حل مساله کمترین مربعات وزندار را با استفاده از روش‌های دستگاه معادلات نرمال، تجزیه QR و SVD از نظر عددی و پایداری بررسی خواهیم کرد.
۳٫ در فصل سوم دستگاه‌های تعادلی و حل مساله کمترین مربعات وزندار را با استفاده از الگوریتم‌های مربوط به این دستگاه (روش‌های فضای پوچ و NSH)، از نظر عددی و پایداری مورد تحلیل قرار خواهیم داد.
۴٫ در فصل چهارم حل مساله را با استفاده از تجزیه قائم کامل COD از نظر عددی و پایداری بررسی خواهیم کرد.
۵٫ در فصل پنجم الگوریتم‌های فوق را از نظر عددی، پایداری و کارایی مورد مقایسه قرار می‌دهیم‌.‌الگوریتم‌ها را با استفاده از Matlab پیاده‌سازی می‌کنیم و مورد آزمون قرار می‌دهیم.

فصل اول
مقدمات
در فصل حاضر سعی بر این است که مقدمات لازم را برای فصول آینده جمع‌آوری کنیم‌.‌این فصل شامل پنج بخش به صورت زیر است‌.‌بخش اول، به یادآوری و بررسی مختصری از نمادها و الگوریتم‌های پایه‌ای از جمله: بردار، ماتریس، ضرب داخلی دو بردار، ضرب ماتریس با بردار، ضرب ماتریس با ماتریس و همچنین ماتریس‌های متعامد و خواص آنها و‌.‌..‌.‌می‌پردازد‌.‌بخش دوم، به

بررسی مختصری از آنالیز ماتریس‌ از جمله فضای برد و پوچ و روش‌های محاسبه ماتریس پایه برای این فضاها و همچنین نرم‌های برداری و ماتریسی و خواص آنها می‌پردازیم‌.‌بخش سوم، بررسی آنالیز خطا از جمله تعریفی از سیستم نقطه شناور و نمایش اعداد حقیقی و ماتریس و تحلیل خطا و عملیات پایه‌ای مربوط به آنها را در این سیستم و همچنین تحلیل الگوریتم از لحاظ پایداری و ناپایداری را شامل می‌شود‌.‌بخش چهارم، به بررسی اجمالی در مورد تجزیه‌های چولسکی، QR، SVD یک ماتریس و الگوریتم‌های مربوط به آن می‌پردازد‌.‌بخش پنجم، مختصری در مورد تعریف و حالت و حل روش‌های مختلف دستگاه‌های خطی را بررسی می‌کند.

۱‌.‌۱ نمادها و الگوریتم‌های پایه‌ای

۱‌.‌۱‌.‌۱ نماد ماتریس
فرض کنیم R نماذ مجموعه اعداد حقیقی باشد‌.‌در این صورت فضای تمام ماتریس‌های حقیق m×n را به صورت زیر نشان می‌دهیم:

که A(i,j) درایه (i,j)ام ماتریس A می‌باشد.
۱‌.‌۱‌.‌۲ نماد بردار
اگر نماد Rn یک فضای برداری n بعدی حقیقی باشد، در این صورت هر را یک بردار می‌‌نامیم:

که x(i) مولفه iام بردار x می‌باشد.
تذکر ۱‌.‌۱‌.‌۱‌.‌هر بردار ستونی را یک ستونی n×۱ و هر بردار سطری را یک ماتریس ۱×n نیز می‌نامیم‌.‌
۱‌.‌۱‌.‌۳‌.‌نماد بلوک (زیرماتریس)
فرض یک ماتریس و بردارهای صحیح باشند، به طوری که ‌.‌در این صورت A(i,j) را یک بلوک r×c می‌نامیم‌.‌هرگاه داشته باشیم:

۱‌.‌۱‌.‌۴‌.‌نماد (:)
این نماد وسیله مفید برای تعیین بردار و ماتریس می‌باشد.

۱‌.‌۱‌.‌۵‌.‌نماد ماتریس به صورت ستونی و سطری
صورت سطری و ستونی ماتریس به قرار زیر است:

۱‌.‌۱‌.‌۶‌.‌نماد ماتریسی بلوکی

ماتریس را یک ماتریس بلوکی می‌نامیم‌.‌هرگاه هر درایه از آن یک بلوک از ماتریس باشد و به صورت زیر نمایش می‌دهیم.

تعریف ۱‌.‌۱‌.‌۱‌.‌یک جمع و ضرب پی در پی به صورت t=a+b×c را یک فلاپ گویند.
۱‌.‌۱‌.‌۷‌.‌ضرب داخلی بردار
اگر در آن صورت ضرب داخلی را به صورت زیر تعریف می‌کنیم:

الگوریتم ۱‌.‌۱‌.‌۱ (ضرب داخلی دو بردار با استفاده Matlab)‌.‌فرض کنیم در این صورت الگوریتم زیر z=xTy را محاسبه می‌کند:
function z=dot(x,y)
z=0

n=length(x)
for i:1:n
z=z+x(i)×y(i)
end
توجه داریم که در الگوریتم تعداد فلاپ‌های مورد نیاز برابر n است.
۱‌.‌۱‌.‌۸‌.‌ضرب بردار با ماتریس
فرض می‌کنیم در این صورت محاسبه y=Ax را می‌توان به صورت‌های زیر نوشت:
(۱)
(۲)
(۳)
الگوریتم ۱‌.‌۱‌.‌۲ (برای محاسبه y=Ax با بکارگیری رابطه ۳ و با استفاده از Matlab)‌.‌فرض می‌کنیم به طوری که Aj بلوک ستونی jام A و n=(n1,…,nq).
function y=matvec(A,x,n)
q=leght(n);
[m,n]=size(A);
y(1:m)=0;1=0
for j=1:q
f=1+1=f+n(j)-1;
w=A(:,f:1)×(f:1);
y=y+w;
end
تعداد فلاپ‌ها در این حالت برابر mn است.
۱‌.‌۱‌.‌۹‌.‌ضرب ماتریس با ماتریس

 

اگر در این صورت حاصلضرب دو ماتریس را می‌توان به صورت‌های زیر نوشت:
(۴)
(۵)
(۶)
الگوریتم ۱‌.‌۳‌.‌۱ (برای محاسبه AB با بکارگیری صورت بلوکی (۶) و با استفاده از Matlab)‌.‌فرض کنید دو ماتریس به طوری که Ai و Bi به ترتیب بلوک ستونی و سطری باشند و n(i) تعداد ستون‌های Ai و تعداد سطرهای .
function C=matmat (A, B, n)
N=length(n);
[m,r]=size(A)’
[r,n]=size(B);
C=zeros(n,m);1=0
for j=1:N
f=1+1;1=f+n(i)-1
W=A(:,f:1)×B(f:1,:)
end
در این الگوریتم تعداد فلاپ‌ها برابر با mnr است.
۱‌.‌۱‌.‌۱۰‌.‌ماتریس قطری
در حالت کلی ماتریس قطری به صورت زیر نشان داده می‌شود:

همچنین ضرب یک ماتریس قطری را با یک ماتریس به صورت زیر نمایش می‌دهیم:

تعریف ۱‌.‌۱‌.‌۲‌.‌ماتریس را بالا مثلثی گوییم، هرگاه برای و پایین مثلثی گوییم، هرگاه برای .
تعریف ۱‌.‌۱‌.‌۳‌.‌ماتریس را یک ماتریس متعامد گوییم، هرگاه:

در این صورت ATA=I‌.‌حال اگر m=n، آنگاه ATA=AAT=I که در این صورت، ماتریس A را متعامد نرمال و یا به اختصار نرمال گوییم.
تعریف ۱‌.‌۱‌.‌۴‌.‌یک ماتریس جابجایی، یک ماتریس یکانی با جابجایی سطرها، با ستون‌هاست.
لم ۱‌.‌۱‌.‌۱‌.‌فرض کنیم P2, P1, P ماتریس‌های جابجایی n×n باشند، در اینصورت روابط زیر برقرار هستند:
۱٫ PX همان X با جابجایی سطرها و XP همان X با جابجایی ستون‌هاست.
۲٫ P-1=PT.
3. .
4. P1P2 نیز یک ماتریس جابجایی است.

۱‌.‌۲ آنالیز ماتریس
۱‌.‌۲‌.‌۱‌.‌فضای برد، فضای پوچ و رتبه ماتریس
برای ماتریس m×n, A زیرفضاهای برداری N(A), R(A) را به ترتیب فضای برد و فضای پوچ ماتریس A می‌نامیم و به صورت زیر تعریف می‌کنیم:

زیرفضاهای N(A), R(A) به ترتیب زیرفضاهای برداری Rn, Rm هستند.
حال اگر افراز ستونی A باشد، در آن صورت و رتبه ماتریس، تعداد ستون‌ها با سطرهای مستقل خطی می‌باشد و به صورت تعریف می‌شود.
همچنین می‌توانیم نشان دهیم که و برای ماتریس روابط زیر را داریم:

روابط فوق نشان می‌دهد که اگر rank(A)=n آنگاه A دارای رتبه ستونی کامل و ستون‌های آن یک پایه برای R(A) است‌.‌همچنین اگر باشد، آنگاه رتبه سطری A کامل و سطرهای آن یک پایه برای است، ولی اگر ، ماتریس A را رتبه ناقص گویند.
لم ۱‌.‌۲‌.‌۱‌.‌روابط زیر برقرارند:
۱٫ زیرفضاهای مکمل متعامدند:

۲٫ زیرفضاهای مکمل متعامدند:

لم ۱‌.‌۲‌.‌۲‌.‌تجزیه رتبه نمای ماتریس A
اگر با آنگاه می‌توان نشان داد که ماتریس‌های G، m×n و r×n, H موجودند، به طوری که:

لم ۱‌.‌۲‌.‌۳‌.‌برای با روابط زیر برقرار است:

۱‌.‌۲‌.‌۲‌.‌ماتریس پایه برای زیرفضاها
تعریف ۱‌.‌۲‌.‌۱‌.‌یک ماتریس با ستون‌های مستقل خطی را که ستون‌هایش مولد زیرفضا باشد، یک ماتریس پایه برای زیرفضا گویند‌.‌توجه داریم که اگر

آنگاه داریم:

توجه: اگر n×(n-r), Z با ستون‌های مستقل خطی به گونه‌ای باشد که HZ=0 و n×r, Y با ستون‌های مستقل خطی به گونه‌ای باشد که YZ=0 آنگاه Z یک ماتریس پایه برای N(A) و Y یک ماتریس پایه برای R(AT) است‌.‌جدول زیر ماتریس‌های پایه را برای زیرفضاهای چهارگانه وابسته به ماتریس A خلاصه می‌کند.
توضیحات بعد ماتریس پایه زیرفضا
A=GH m×r G R(A)

GTK=0 m×(m-r) K N(AT)
HZ=0 n×(n-r) Z N(A)
YTZ=0 n×r Y(=HT) R(AT)
1‌.‌۲‌.‌۳‌.‌نرم برداری
تعریف ۱‌.‌۲‌.‌۲‌.‌تابع را یک نرم‌برداری گویند، هرگاه دارای خواص زیر باشد:

که می‌توان نشان داد که تعریف

یک نرم است برای x=1 و p=2 داریم:

نامساوی زیر را می‌توان اثبات کرد:
(نامساوی کوشی ـ شوارتز)

۱‌.‌۲‌.‌۴‌.‌نرم ماتریسی
تعریف ۱‌.‌۲‌.‌۳‌.‌تابع را یک نرم ماتریسی گویند هرگاه دارای خواص زیر باشد:

می‌توان نشان داد که تعریف

یک نرم ماتریسی است‌.‌این نرم را یک نرم ماتریسی وابسته به نرم‌برداری گویند‌.‌خواص زیر را می‌توان به اثبات رساند:

در بالا ویژه مقدار iام ATA و بزرگترین مقدار تکین ماتریس A (بعداً در مورد مقادیر تکین توضیح خواهیم داد)، و نرم ||A||F نرم ماتریسی فروبینیوس با تعریف زیر است:
(نرم ـ فروبینیوس)

۱‌.‌۳ آنالیز خطا
تعریف ۱‌.‌۳‌.‌۱‌.‌نماد معرف اعداد نقطه شناور در ماشین برای نمایش اعداد حقیقی است.
۱‌.‌۳‌.‌۱‌.‌نمایش اعداد حقیقی
نمایش اعداد حقیقی، در سیستم شناور به صورت زیر است:

که برای که diها ارقام اعداد صحیح در مبنای و ‌.‌عدد صفر را به صورت نمایش می‌دهند‌.‌به این صورت نمایش اعداد، صورت نرمالیزه شده گویند.
تذکر ۱‌.‌۳‌.‌۱‌.‌در سیستم مبنای عدد، p تعداد اعداد قابل ملاحظه در مانتیس، M بزرگترین نما، m کوچکترین نما و مقیاس سیستم است.
تذکر ۱‌.‌۳‌.‌۲‌.‌در سیستم F، ناحیه زیرریز و سرریز به ترتیب به صورت زیر نشان داده می‌شود:

تذکر ۱‌.‌۳‌.‌۳‌.‌معمولاً در اجرای برنامه‌های کامپیوتری، اعداد واقع شده در ناحیه زیرریز به صورت تقریبی با صفر و در ناحیه سرریز، یک پیغام خطا توسط ماشین داده و اجرای برنامه متوقف می‌شود.
تذکر ۱‌.‌۳‌.‌۴‌.‌خطای نسبی در روی گرد کردن و بریدن را به عنوان خطای روند عدد یک می‌نامند و با نشان می‌دهند‌.‌رابطه زیر برای هر عددی که در دو ناحیه سرریز یا زیر ریز واقع نشود، به صورت زیر برقرار است:

که در آن fl(y) عددی است که در ماشین به جای y قرار می‌گیرد و

که صورت (۱) از روی گرد کردن و صورت (۲) از روش بریدن بدست می‌آید.

۱‌.‌۳‌.‌۲‌.‌عملیات سیستم نقطه شناور
فرض کنیم اعداد x و y در سیستم نقطه شناور قابل نمایش باشند و به عنوان عملگر دو عملوند فوق باشد، در این صورت x op y مقدار دقیق و fl(x op y) به عنوان مقدار محاسبه شده توسط ماشین هستند‌.‌عملیات اصلی با انتقال عملوندها به ثبات‌ها (با حافظه ۱+p2، برای مانیتس) و انجام عمل مربوطه در واحد محاسباتی و حفظ آن در ثبات دیگر انجام می‌شود و نهایتاً نتیجه، از ثبات نهایی به حافظه با p رقم روند می‌شود‌.‌چون خطا از رقم p به بعد ظاهر می‌شود، در نتیجه همان نتیجه قبلی برای خطا درست است و خواهیم داشت:

به عبارت دیگر، داریم:

تعریف ۱‌.‌۳‌.‌۲‌.‌اگر تقریب ، آنگاه خطای مطلق (eA) و نسبی (eR) به صورت زیر تعریف می‌شوند:

تذکر ۱‌.‌۳‌.‌۵‌.‌خطای مطلق و نسبی در برخی موارد گمراه کننده هستند، یعنی اگر x خیلی بزرگ باشد، آنگاه e¬A¬ می‌تواند بزرگ و اگر x خیلی کوچک باشد، آنگاه eR می‌تواند بزرگ باشد‌.‌گرچه تخمینی مناسب برای x باشد، تعریف زیر در بسیاری موارد مناسب‌تر است.

توجه داریم که در تعریف اخیر، اگر x خیلی کوچک باشد، رابطه و اگر x خیلی بزرگ باشد، رابطه را خواهیم داشت.
تعریف ۱‌.‌۳‌.‌۳‌.‌گوییم از مرتبه ، ( توانی از عدد ۱۰ است) هرگاه ای وجود داشته باشد، که پ و آن را با نمایش می‌دهیم

 

۱‌.‌۳‌.‌۳‌.‌آنالیز الگوریتم
لم ۱‌.‌۳‌.‌۱‌.‌اگر عدد صحیح k و عدد مثبت به گونه‌ای باشد که در رابطه صدق کنند‌.‌آنگاه:

یا

تعریف ۱‌.‌۳‌.‌۴‌.‌یک الگوریتم را نسبه به الگوریتم دیگر پایدارتر گویند اگر جواب‌های محاسبه شده توسط آن بر روی دسته مسائل بیشتری دارای خطای کمتری از جواب‌های محسابه شده توسط الگوریتم دیگر باشد.
تعریف ۱‌.‌۳‌.‌۵‌.‌فرض کنیم d1, d2 داده‌های نزدیک به هم باشند و s(d¬۲), s(d¬۱) جواب‌های مساله p در داده‌های فوق باشند، در این صورت عدد حالت (cond(p)) p حول d1 و d2 به صورت زیر تعریف می‌شود:

تذکر ۱‌.‌۳‌.‌۶‌.‌اگر عدد حالت بزرگ باشد، مساله بدحالت و اگر کوچک باشد، مساله خوش حالت تعریف می‌شود‌.‌
تذکر ۱‌.‌۳‌.‌۷‌.‌برای مسائل بدحالت نمی‌توان انتظار داشت که حتی الگوریتم‌های پایدار نیز جواب خوبی به دست دهند‌.‌معمولاً برای مسائل بدحالت، جواب‌های محاسبه شده با خطاهایی فاحش همراه هستند.
لم ۱‌.‌۳‌.‌۲‌.‌اگر در این صورت می‌توان خطای ضرب داخلی را به صورت زیر نشان داد:

اگر xiها و yiها هم‌علامت باشند، آنگاه و حد بالای خطا کوچک خواهد شد‌.‌ولی اگر xiها و yiها هم‌علامت نباشند، در این صورت امکان تولید خطای زیاد موجود است، به ویژه زمانی که .
با توجه به لم بالا و همچنین لم (۱‌.‌۳‌.‌۱) فرض می‌کنیم که ، در این صورت داریم:

که c یک ثابت از مرتبه (۱) است.
۱‌.‌۳‌.‌۴ نمایش ماتریس در سیستم نقطه شناور
اگر ، در این صورت نمایش ماتریس در سیستم نقطه شناور معادل با نمایش هر درایه به عنوان عدد حقیقی در سیستم نقطه شناور خواهد بود.
تعریف ۱‌.‌‌۳‌.‌۶‌.‌‌ اگر ، یک ماتریس n m باشد، آنگاه را به عنوان تقریب نقطه شناور ماتریس A می‌نامیم و به صورت زیر تعریف می‌کنیم:
,
تعریف ۱‌.‌‌۳‌.‌‌۷‌.‌‌ اگر تقریب ماتریس A باشد، آنگاه خطای نسبی به صورت زیر خواهد بود:

۱‌.‌‌۳‌.‌‌۵ تحلیل خطا برای عملیات پایه ای ماتریس در سیستم نقطه شناور]۱۰[
اگر A و B ماتریسهای شناور باشند و یک حقیقی در این سیستم باشد، آنگاه روابط زیر بر

قرارند:

,
,
,
,
و همچنین داریم:

,
,

۱‌.‌‌۴ تجزیه ماتریس(]۴[، ]۵[ و ]۱۰[)
تجزیه‌های ماتریس اساسی ذیل را در بخشهای آتی بررسی می‌کنیم:
۱‌.‌‌۴‌.‌‌۱‌.‌‌تجزیه مقادیر تکین(SVD)
1‌.‌‌۴‌.‌‌۲‌.‌‌تجزیه چولسکی.
۱‌.‌‌۴‌.‌۳‌.‌‌تجزیه QR.
1
‌.‌‌۴‌.‌‌۱‌.‌‌تجزیه مقادیر تکین(SVD)
قضیه ۱‌.‌‌۴‌.‌‌۱‌.‌‌برای هر ماتریس ، ماتریسهای قائم نرمال و و ماتریس قطری یافت می‌شوند به طوری که:

که بطوری که ، و ،
ماتریسهای متعامدند.
تذکر۱‌.‌‌۴‌.‌‌۱‌.‌‌در تجزیه SVD ماتریس A ، روابط و برای برقرارند، که در آن ها، مقادیر تکین و و ، به ترتیب بردارهای تکین راست و چپ گفته می‌شوند.

این فقط قسمتی از متن مقاله است . جهت دریافت کل متن مقاله ، لطفا آن را خریداری نمایید
wordقابل ویرایش - قیمت 12700 تومان در 117 صفحه
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد