بخشی از پاورپوینت
اسلاید 1 :
خط لوله و پردازش موازی
اسلاید 2 :
معرفی
خط لوله:
هدف: کوتاه کردن مسیر بحرانی با اضافه کردن لچ
نتیجه:
افزایش سرعت کلاک یا نمونه برداری
یا کاهش توان مصرفی
پردازش موازی:
هدف: چند خروجی به صورت موازی در یک دوره تناوب کلاک محاسبه می شوند.
نتیجه:
افزایش سرعت نمونه برداری موثر
یا کاهش توان مصرفی
اسلاید 3 :
مثال
مثال: یک فیلتر FIR با سه ضریب
زمان نمونه برداری (فاصله بین نمونه ها) باید از زمان مسیر بحرانی (شامل یک ضرب و دو جمع) بیشتر باشد.
اگر در یک کاربرد زمان واقعی نرخ نمونه بیش از این مقدار باشد، دیگر این ساختار قابل استفاده نخواهد بود و باید با یکی از روش های خط لوله یا پردازش موازی مشکل را حل کرد.
اسلاید 4 :
خط لوله
چند نکته:
سرعت کلاک سیستم توسط مسیر بحرانی (طولانی ترین مسیر بین دو لچ، یا ورودی و یک لچ، یا یک لچ و خروجی، یا ورودی و خروجی) محدود می شود.
با اضافه کردن لچ به شکل مناسب می توان مسیر بحرانی را کوتاه کرد.
لچ های خط لوله را فقط می توان یالهای یک کات ست فیدفوروارد اضافه کرد.
با قرار دادن لچ در M-1 کات ست یک خط لوله M سطحی خواهیم داشت که می تواند حداکثر M مرتبه نرخ کلاک را بهبود دهد.
همان فیلتر قبل را می توان به این شکل اجرا کرد:
در حالی که جمع کننده چپ محاسبه تکرار فعلی را انجام می دهد، جمع کننده سمت راست محاسبه تکرار قبلی را انجام می دهد.
در هر لحظه دو خروجی به طور همزمان در حال محاسبه شدن هستند.
تذکر: خط لوله latency را افزایش می دهد.
اسلاید 5 :
مثال
در شکل a اگر هر گره یک واحد تاخیر داشته باشد، مسیر بحرانی 4 واحد تاخیر دارد.
شکل b تاخیر مسیر بحرانی را به 2 واحد کاهش می دهد ولی عملکرد آن معادل شکل a نیست!!
شکل c معادل a است و تاخیر مسیر بحرانی را به 2 واحد کاهش می دهد.
اسلاید 6 :
تغییر طول مسیر بحرانی با ساختار توزیع داده
قضیه تغییر شکل (transposition): اگر در یک SFG جای ورودی و خروجی و جهت تمام یال ها را عوض کنیم عملکرد سیستم بلاتغییر باقی خواهد ماند.
ساختار توزیع داده: به جای آنکه داده ها اول در عناصر ذخیره کننده ذخیره شوند، در عناصر محاسباتی توزیع شده و سپس به عناصر ذخیره کننده داده می شوند.
این تغییر مسیر بحرانی را در یک فیلتر سه ضریبه کاهش می دهد (چنین کاهشی را پیشتر با دو لچ اضافه به دست آوردیم):
Tcrit. path =Tm+2Ta
Tcrit. path =Tm+Ta
اسلاید 7 :
دستیابی به حداکثر کارایی خط لوله با خط لوله ریزدانه
فرض کنید TM=10 و TA=2 باشد.
سخت افزار ضرب کننده را به دو بخش تقسیم می کنیم که 6 و 4 واحد تاخیر داشته باشند.
زمان مسیر بحرانی به 6 کاهش می یابد.
اسلاید 8 :
پردازش موازی
پردازش موازی و خط لوله سازی دوگان هم هستند اگر خط لوله سازی مفید باشد موازی سازی هم مفید خواهد بود.
نحوه موازی سازی:
بر خلاف سیستم های خط لوله ای، در سیستم های پردازش موازی داریم:
نرخ دریافت نمونه ها بیش از نرخ کلاک است.
اسلاید 9 :
مثال: فیلتر FIR با سه ضریب.
در شکل روبرو لچ ها با Tclk کار می کنند که سه برابر دوره تناوب دریافت نمونه هاست. یعنی در هر دوره کلاک سه نمونه دریافت می شود
اسلاید 10 :
یک سیستم کامل پردازش موازی شامل مبدل سریال به موازی و موازی به سریال هم هست:
در این مبدل از لچ هایی استفاده می شود که یا نرخ نمونه کلاک می خورند (نه نرخ کلاک)
اسلاید 11 :
سوال: اگر با خط لوله می توان به اندازه پردازش موازی بهبود ایجاد کرد چرا سراغ پردازش موازی برویم؟
جواب: در برخی مسیرها (به ویژه در مسیرهای ارتباطی پرتاخیر) نمی توان لچ اضافه کرد.
اگر Tcommunication>Tcomputation آنگاه اصطلاحا سیستم محدود به ارتباطات خواهد بود و سرعت کلاک را نمی توان از Tcomun کمتر انتخاب کرد.
حداکثر کارایی خط لوله تا حدی است که به این محدودیت برسیم و از آن بیشتر نمی توان توقع داشت.
راه حل: ترکیب خط لوله و پردازش موازی برای دستیابی به سرعت های بیشتر:
اسلاید 12 :
استفاده از خط لوله و پردازش موازی برای کاهش توان مصرفی
تا کنون از این روشها برای افزایش نرخ نمونه برداری استفاده شد.
اگر نیاز نباشد نرخ نمونه برداری افزایش یابد، می توان از این روش ها برای کاهش توان مصرفی بهره برد.
دو رابطه اساسی:
در مدارات VLSI توان مصرفی از رابطه روبرو بدست می آید:
ظرفیت خازنی کل مدارت باید لحاظ شود.
با فرض ثابت بودن جریان، فرکانس کلاک بر اساس تاخیر انتشار در مسیر بحرانی بدست می آید که آن هم تقریبا برابر است با:
اسلاید 13 :
کاهش توان در خط لوله
اسلاید 14 :
کاهش توان در پردازش موازی