Лекция 3: Распараллеливание в ВС на уровне исполнительных устройств
План:
1. Конвейеры операций
2. Векторные конвейеры. "Зацепление" векторов
3. Обобщенная процедура динамического распараллеливания в многофункциональном АЛУ
Аннотация: Изучается проблема второго уровня распараллеливания — уровня исполнительных устройств. Рассматривается организация конвейеров операций, векторных конвейеров, выполнения операций на стеке. Исследуются принципы динамического распараллеливания в многофункциональном арифметическо-логическом устройстве.
Ключевые слова: операции, ВС, делимое, время выполнения, быстродействие, время такта, поток команд, доступ, диаграмма, количество уровней конвейера, глубина перекрытия, АЛУ, векторный конвейер, класс, векторно-конвейерная ВС, супер-ЭВМ, векторизация, моделирование, разбиение, группа, загрузка, значение, маска, логическая переменная, "зацепление" векторов, структура данных, стек, очередь, механизмы, команда, сумматор, указатель вершины стека УВС, адрес, вершина стека, загрузка стека, слово, регистр, память, польская инверсная (бесскобочная) запись, ПОЛИЗ, программа, запись из стека, коды операций, работ, опыт, адресный стек, блок динамического распределения регистров, список свободных регистров, стек выполнения, команда выполнения операции, регистр адреса, адресное распараллеливание, полностью сегментированы
Конвейеры операций
Выполнение любой операции складывается из нескольких последовательных этапов, каждый из которых может выполняться своим функциональным узлом. Это легко показать на операциях сложения и умножения. Выполнение деления мантисс (порядки вычитаются) чаще всего производятся с помощью вычитания из делимого делителя, сдвига влево полученного остатка, нового вычитания делителя из результата сдвига и т.д. В некоторых ВС находится обратная величина делителя с помощью аппроксимирующих полиномов. Затем делимое умножается на эту величину.
Пусть задана операция, выполнение которой разбито на n последовательных этапов. Пусть ti — время выполнения i -го этапа. При последовательном их выполнении операция выполняется за время
а быстродействие ЭВМ или одного процессора ВС, выполняющего только эту операцию, составит
Выберем время такта — величину tT = max ti} и потребуем при разбиении на этапы, чтобы для любого i = 1, ...,n выполнялось условие ti + t(i+1) mod n > tT. Т.е. чтобы никакие два последовательных этапа (включая конец и новое начало операции) не могли быть выполнены за время одного такта.
Функциональные узлы, выполняющие последовательные этапы одной операции, целесообразно выстроить в единую конвейерную линию, где устройство, выполняющее некоторый этап, закончив его для операции над одним набором данных, переходило бы в следующем такте к выполнению этого же этапа той же операции для другого набора исходных данных.
Например, на рис. 3.1 представлен конвейер выполнения операции сложения.
Do'stlaringiz bilan baham: |