بخشی از پاورپوینت

--- پاورپوینت شامل تصاویر میباشد ----

اسلاید 1 :

چرا کارایی بالا مورد نیاز  است؟

  • سرعت بالاتر(حل سریع مسائل)
  • پیش بینی هوا
  • خط مرگ نرم و سخت
  • گذردهی بالاتر(حل مسائل بیشتر)
  • پردازش تراکنش ها
  • قدرت محاسباتی بالاتر(حل مسائل طولانی)
  • پیش بینی هوا برای یک هفته در کمتر از 24 ساعت

اسلاید 2 :

آرگومان سرعت نور

  • سرعت نور تقریبا 30 cm/ns است.
  • سیگنال با یک سوم سرعت نور در سیم مسی انتقال می یابد.
  • اگر برای اجرای یک دستورالعمل سیگنال ها باید 1cm انتقال یابند، بنابراین این دستور حداقل در 0.1ns اجرا می شود. در نتیجه کارایی آن محدود به 10GIPS خواهد شد.
  • این محدودیت تا حدودی با روش های حداقل سازی معماری همانند حافظه ی نهان بر طرف می شود.

اسلاید 3 :

چرا پردازش موازی نیاز است؟

Parallelism = Concurrency

  Doing more than one thing at a time

Has been around for decades, since early computers

I/O channels, DMA, device controllers, multiple ALUs

The sense in which we use it in this course

Multiple agents (hardware units, software processes) collaborate to perform our main computational task

- Multiplying two matrices

- Breaking a secret code

- Deciding on the next chess move

اسلاید 4 :

1.2 مثالی از موازی سازی

پیدا نمودن اعداد اول بین 1 تا 30 با روش غربال نمودن اعداد

هر عدد ترکیبی(غیر اول) مضربی از اعداد اول کوچکتر یا مساوی رادیکال آن عدد ترکیبی می باشد.

اسلاید 5 :

Status of Computing Power (circa 2000)

GFLOPS on desktop: Apple Macintosh, with G4 processor

TFLOPS in supercomputer center: 

    1152-processor IBM RS/6000 SP (switch-based network)

    Cray T3E, torus-connected

PFLOPS on drawing board: 

    1M-processor IBM Blue Gene (2005?)

    32 proc’s/chip, 64 chips/board, 8 boards/tower, 64 towers

    Processor: 8 threads, on-chip memory, no data cache

    Chip: defect-tolerant, row/column rings in a 6 ´ 6 array

    Board: 8 ´ 8 chip grid organized as 4 ´ 4 ´ 4 cube

    Tower: Boards linked to 4 neighbors in adjacent towers

    System: 32´32´32 cube of chips, 1.5 MW (water-cooled)

اسلاید 6 :

1.5  Roadblocks to Parallel Processing

  • Grosch’s law: Economy of scale applies, or power = cost2
  • Minsky’s conjecture: Speedup tends to be proportional to log p
  • Tyranny of IC technology: Uniprocessors suffice (x10 faster/5 yrs)
  • Tyranny of vector supercomputers: Familiar programming model

 

  • Software inertia: Billions of dollars investment in software
  • Amdahl’s law: Unparallelizable code severely limits the speedup

اسلاید 7 :

اثر گذاری پردازش موازی

   P  تعداد پردازنده ها

   W(pکار انجام شده توسط p پردازنده

   T(pزمان اجرایی توسط p پردازنده

  T(1) = W(1);   T(p) £W(p)

  S(p) = T(1) / T(p)  افزایش سرعت

راندمان  E(p) = T(1) / [p T(p)]

   افزونگی   R(p)= W(p) / W(1)

بکارگیری  U(p) = W(p) / [p T(p)]

   کیفیت  Q(p)= T3(1) / [pT2(p) W(p)]

اسلاید 8 :

     A  Amdahl’s Law (Speedup Formula)

  Bad news – Sequential overhead will kill you, because:

     Speedup  =  T1/Tp  £ 1/[f + (1 – f)/p] £ min(1/f, p)

  Morale: For f = 0.1, speedup is at best 10, regardless of peak OPS.

     B  Brent’s Scheduling Theorem

  Good news – Optimal scheduling is very difficult, but even a naive

  scheduling algorithm can ensure:

      T1/p  £ Tp < T1/p + T¥ =  (T1/p)[1 + p/(T1/T¥)]

  Result: For a reasonably parallel task (large T1/T¥), or for a suitably

  small p (say, p < T1/T¥), good speedup and efficiency are possible.

     C  Cost-Effectiveness Adage

  Real news – The most cost-effective parallel solution may not be

  the one with highest peak OPS (communication?), greatest speed-up

  (at what cost?), or best utilization (hardware busy doing what?).

  Analogy: Mass transit might be more cost-effective than private cars

  even if it is slower and leads to many empty seats.

 

در متن اصلی پاورپوینت به هم ریختگی وجود ندارد. برای مطالعه بیشتر پاورپوینت آن را خریداری کنید