Procesor w systemach równoległych

W latach 80-tych do tworzenia multikomputerów o nazwie Transputer. Transputer składał się z jednego procesora rdzeniowego, małej pamięci SRAM, głównego interfejsu pamięci DRAM i czterech kanałów komunikacyjnych, a wszystko to na jednym chipie. Aby umożliwić równoległą komunikację komputerową, kanały zostały połączone w sieć Transputers. Brakuje mu jednak mocy obliczeniowej i dlatego nie może sprostać rosnącemu zapotrzebowaniu na aplikacje równoległe. Ten problem został rozwiązany przez rozwój procesorów RISC i był również tani.

Nowoczesny komputer równoległy wykorzystuje mikroprocesory, które używają równoległości na kilku poziomach, takich jak paralelizm na poziomie instrukcji i równoległość na poziomie danych.

Procesory o wysokiej wydajności

Procesory RISC i RISCy dominują na dzisiejszym rynku komputerów równoległych.

Charakterystyka tradycyjnego RISC to -

  • Ma kilka trybów adresowania.
  • Ma ustalony format instrukcji, zwykle 32 lub 64 bity.
  • Posiada dedykowane instrukcje ładowania / przechowywania do ładowania danych z pamięci w celu rejestracji i przechowywania danych z rejestru do pamięci.
  • Operacje arytmetyczne są zawsze wykonywane na rejestrach.
  • Wykorzystuje rurociągi.

Większość dzisiejszych mikroprocesorów jest superskalarna, tj. W równoległym komputerze wykorzystuje się potoki wielu instrukcji. Dlatego procesory superskalarne mogą wykonywać jednocześnie więcej niż jedną instrukcję. Skuteczność procesorów superskalarnych zależy od ilości równoległości na poziomie instrukcji (ILP) dostępnej w aplikacjach. Aby potoki były wypełnione, instrukcje na poziomie sprzętu są wykonywane w innej kolejności niż kolejność programu.

Wiele nowoczesnych mikroprocesorów wykorzystuje podejście superpotokowe . W superpotokach , aby zwiększyć częstotliwość zegara, praca wykonywana na etapie potoku jest zmniejszona, a liczba stopni rurociągu jest zwiększona.

Bardzo duże procesory ze słowami instrukcji (VLIW)

Pochodzą one z poziomego mikroprogramowania i przetwarzania superskalarnego. Instrukcje w procesorach VLIW są ​​bardzo duże. Operacje w ramach pojedynczej instrukcji wykonywane są równolegle i przekazywane do wykonania do odpowiednich jednostek funkcjonalnych. Tak więc po pobraniu instrukcji VLIW jej operacje są dekodowane. Następnie operacje są wysyłane do jednostek funkcjonalnych, w których są wykonywane równolegle.

Procesory wektorowe

Procesory wektorowe są koprocesorami do mikroprocesorów ogólnego przeznaczenia. Procesory wektorowe są na ogół rejestrami lub pamięcią. Instrukcja wektorowa jest pobierana i dekodowana, a następnie wykonywana jest określona operacja dla każdego elementu wektorów operandów, podczas gdy w normalnym procesorze operacja wektora wymaga struktury pętli w kodzie. Aby uczynić to bardziej wydajnym, procesory wektorowe łączą kilka operacji na wektorach razem, tj. Wynik jednej operacji wektorowej jest przekazywany do innego jako operand.

Buforowanie

Pamięci podręczne są ważnym elementem wysokowydajnych mikroprocesorów. Po każdych 18 miesiącach prędkość mikroprocesorów wzrasta dwukrotnie, ale chipy DRAM dla pamięci głównej nie mogą konkurować z tą prędkością. Tak więc pamięci podręczne są wprowadzane w celu wypełnienia luki w szybkości między procesorem a pamięcią. Pamięć podręczna to szybka i niewielka pamięć SRAM. O wiele więcej pamięci podręcznych jest stosowanych w nowoczesnych procesorach, takich jak bufory translacji (TLB), pamięci podręczne instrukcji i danych itp.

Bezpośrednio mapowana pamięć podręczna

W bezpośrednich mapowanych pamięciach podręcznych funkcja „modulo” jest używana do mapowania jeden do jednego adresów w pamięci głównej na lokalizacje pamięci podręcznej. Ponieważ ten sam wpis pamięci podręcznej może mieć przypisane do niego wiele głównych bloków pamięci, procesor musi być w stanie określić, czy blok danych w pamięci podręcznej jest blokiem danych, który jest faktycznie potrzebny. Ta identyfikacja odbywa się poprzez przechowywanie tagu razem z blokiem pamięci podręcznej.

W pełni asocjacyjna pamięć podręczna

W pełni asocjacyjne mapowanie pozwala na umieszczenie bloku pamięci podręcznej w dowolnym miejscu pamięci podręcznej. Korzystając z pewnych zasad wymiany, pamięć podręczna określa wpis pamięci podręcznej, w którym przechowuje blok pamięci podręcznej. W pełni asocjacyjne pamięci podręczne mają elastyczne mapowanie, co minimalizuje liczbę konfliktów z wpisami do pamięci podręcznej. Ponieważ w pełni asocjacyjna implementacja jest kosztowna, nigdy nie są one używane na dużą skalę.

Pamięć podręczna asocjacyjna

Mapowanie zbiorowo asocjacyjne to połączenie mapowania bezpośredniego i mapowania w pełni asocjacyjnego. W tym przypadku wpisy pamięci podręcznej są podzielone na zestawy pamięci podręcznej. Podobnie jak w przypadku mapowania bezpośredniego, istnieje stałe mapowanie bloków pamięci do zestawu w pamięci podręcznej. Ale w zestawie pamięci podręcznej blok pamięci jest mapowany w sposób w pełni asocjacyjny.

Strategie pamięci podręcznej

Oprócz mechanizmu mapowania pamięci podręczne wymagają również szeregu strategii, które określają, co powinno się stać w przypadku określonych zdarzeń. W przypadku (ustaw-) asocjacyjnych pamięci podręcznych, pamięć podręczna musi określić, który blok pamięci podręcznej ma zostać zastąpiony nowym blokiem wchodzącym do pamięci podręcznej.

Niektóre dobrze znane strategie wymiany to:

  • First-In First Out (FIFO)
  • Najrzadziej używane (LRU)