Sistemul cu informații Înlănțuire 1 pagină

În discutarea moduri de procesare paralelă, sa constatat că unul dintre modurile este doar modul de pipelining. Există două tipuri de banda transportoare: conducta de instrucțiuni și o conductă de date. În primul rând a apărut și a găsit imediat largi comenzi de aplicare transportoare. Aproape toate computerele moderne folosesc acest principiu de tratament. Odata cu aceasta, multe sisteme informatice utilizează și conducte de date. Combinația acestor două transportoare poate realiza o productivitate foarte ridicată, mai ales în cazul în care mai multe procesoare pot funcționa simultan și independent unul față de celălalt. Această abordare este folosită în construcția de cele mai multe sisteme de înaltă performanță de astăzi.

Nu putem ignora sistemele informatice străine din această clasă, cum ar fi IBM 360/370. random access memory - RAM, un procesor de comandă, dispozitivul de operare - procesoare pentru efectuarea virgulă mobilă, punct fix și aritmetica zecimală funcționează simultan și independent unul față de celălalt. La fel ca BESM-6, numita memorie RAM construit într-un sistem modular

Procesoare funcționează pe cuvinte de 32 de biți sau 64 de biți, sau numere. Structura generalizată a sistemului reprezentat în figura 4.1.

procesoare de transport nu sunt reglate întotdeauna la o anumită operație. Cel mai adesea ele sunt făcute multifuncțional,

introducerea unui număr de segmente care implementează setul complet de operații, precum și în funcție de operațiunile efectuate de întregul traseu al transportorului este ajustat în mod corespunzător.

Din numărul total de sisteme de transport nu poate ignora sistem Cray, dintre care a apărut la mijlocul anilor '70 ai secolului trecut. După ceva timp, sistemul a devenit cunoscut ca unul dintre cele mai rapide supercomputere din lume. Este folosit pentru a maximiza ambele tipuri de benzi transportoare: conducte de instrucțiuni și aritmetica de conducte și operații logice.

Schematic arhitectura CRAY este prezentată în figura 4.2. Se aplică un combinat de informații de manipulare mai multe dispozitive. A face posibilă atingerea unor performanțe foarte ridicate de sistem - până la 250 de milioane de instrucțiuni pe secundă în rezolvarea problemelor științifice și inginerești ..

toryh fiecare poate cuprinde valori ale vectorilor 64, în care vectorul este format din 64 elemente (amintesc reprezentare vectorială a numărului în format binar). timpul de acces la un registru separat, este destul de mic și este de numai 6 ns. Figura arată că între RAM. A-, S- și V registre în sistem, există două grupuri suplimentare: În registrele de 24 biți și T-registre de 64 de biți. Acest număr de registre permite procesoare pipeline să funcționeze la o viteză maximă posibilă pentru ei, cu recurs puțin sau deloc la RAM. Operanzii provin din registru, precum și rezultatele operațiunilor sunt trimise la registre. Sistemul are o altă inovație - registre grație, procesoare cu lanț transportor poate lega, iar apoi rezultatul obținut de un procesor, variabila de intrare este conducta de celălalt procesorului.

Sistemul este operații versatil, dar în loc împărțirea unei operațiuni de calcul al valorii de feedback. Numărul de tranzacții - 128. Instrucțiunile pot fi în două formate - 16 biți și 32.

Intrări-ieșiri informația prin canalul 24, împărțite în patru grupe, din care o parte lucrează numai la ieșire, iar cealaltă porțiune numai la intrare. Informațiile de intrare și de ieșire sunt prezentate în secvențele doi octeți.

Sistemul de operare oferă o sarcini de procesare multiprogramming 63, este un compilator de la optimizarea ciclurilor Fortran care recunosc, asamblare macro, biblioteca de programe standard, încărcător, și alte mijloace.

Toate cele de mai sus asigură performanța sistemului CRAY

Anterior, definiția unui sistem informatic a fost dat. Aici ne uităm la cele mai interesante structuri de acest tip de sisteme și să înceapă să facă acest lucru cu sistemele de matrice. La prima vedere, organizarea de sisteme de matrice este destul de simplu. Sistemul cuprinde în general 2 n de dispozitive de procesare (deseori denumite elemente de procesare - PE) conectate într-un dispozitiv de matrice și de control comun. Elementele de procesor care funcționează în paralel și în mod independent, este tratat în conformitate cu aceleași comenzi, fiecare propriul său flux de date. Natura relației dintre elementele de procesare pot fi variate, precum și natura interacțiunii lor. Acest lucru determină în cele din urmă diferitele proprietăți ale sistemelor. Sistemele de tip matrice sunt o clasă de SIMD, și este cea mai potrivită pentru a face față provocărilor, caracteristicile-rizuyuschihsya obiecte independente paralele sau Parallels

ism de informare. Un exemplu de implementare a acestei arhitecturi este cunoscut pe larg sistem ILLIAC-IV, dezvoltat de Universitatea din Illinois (SUA) și produs de „Burrows“ în 1974. A fost aproape primele vânzări ale sistemului de matrice. ILLIAC-IV de proiectare a sistemului prezentat în Fig. 4.3.

Proiectul prevede că sistemul va avea 256 de elemente de procesare, împărțite în patru grupe - cadrane: 64 procesor. Fiecare cadran trebuie să fie gestionate de către procesorul său special de control (CP), și sistemul în ansamblu - un procesor de comandă central (MCC). Cu toate acestea, din cauza unor dificultăți tehnice cu punerea în aplicare a circuitelor integrate RAM și problemele economice legate de proiect a fost implementat într-o cantitate redusă. Sistemul a fost construit și pus în funcțiune cu o capacitate de 200 de milioane de cadranului. Operații pe secundă. Și timp de mai mulți ani a fost considerat cel mai ridicat din lume.

Sistemul sa dovedit destul de interesant și, s-ar putea spune, originale. Elementele de procesare legate și formează o matrice de 8x8 (fig. 4.4).

Vă rugăm să rețineți că diagrama de conectare de procesare elemente pentru ao compara cu cele prezentate în continuare în calcul matricea de text. Fiecare PE este asociat cu alte patru PE. Atunci când un astfel de transfer de date de conexiune între două procesoare efectuat nu mai mult de 7 cicluri (etape). Fiecare PE este echipat cu propriul său RAM și comunică cu mediul extern, opereaza cuvinte pe 64 de biți (numere), și efectuează un set universal de operațiuni.

Viteza procesorului este destul de mare. De exemplu, operația de adiție este efectuată timp de 240 ns și multiplicare

400 ns. prin urmare, procesorul efectuează o medie de 3 Mill. pe secundă, și în consecință performanța sistemului egal 3h64 = 200 Mill. per secundă.