1 Основные направления применения микропроцессорных систем 1





Название1 Основные направления применения микропроцессорных систем 1
страница8/473
Дата публикации19.08.2013
Размер44.9 Mb.
ТипДокументы
100-bal.ru > Информатика > Документы
1   ...   4   5   6   7   8   9   10   11   ...   473

506.По настоящему AMD преимущества МП проявились с появлением Socket A (Socket 462) процессоров на 0.18 мкм ядре Thunderbird. На нем, как и в случае с Pentium III, располагался полноскоростной L2-кэш объемом 256 Кб, притом, что L1- кэша имел объем 128 Кб L1 (при 32 Кб у Intel Pentium III Coppermine). Правда, «узким местом» осталась шина между кэшем второго уровня и процессорным ядром — всего 64 бита (256 бит - у Pentium 4). Первые процессоры работали на шине 200 МГц (100 МГц  2). С достижением рубежа 1 ГГц AMD стала выпускать процессоры парами, как для шины 200 МГц, так и 266 МГц (133 МГц  2). Пропускная способность на таких частотах составила 2.1 Гб/с. 55

507.Не так давно начали появляться процессоры с еще более новым ядром Palomino, но выполненные по все той же 0.18 мкм технологии. Сначала это были мобильный Athlon 4 и серверный Athlon MP (первый процессор AMD, официально поддерживающий двухпроцессорные конфигурации). Затем, компания официально объявила настольное решение на ядре Palomino — Athlon XP, призванное составить еще более сильную конкуренцию для Pentium 4. 55

508.В отличие от Pentium 4, несовместимого со своими старыми платами, Athlon XP вполне успешно может работать и на старых Socket A-платах, лишь бы те поддерживали необходимую частоту. Как показала практика, в большинстве случаев удается даже обойтись без перепрошивки BIOS. 55

509.Немалым преимуществом ядра Palomino является также поддержка не только инструкций 3D Now!, но системы команд Intel'овских процессоров SSE, всего 107 SIMD-инструкций. Все вместе называется 3D Now! Professional Technology. Теперь Athlon XP не только может эффективно работать с программами, оптимизированными под SSE, но и даёт больше свободы разработчикам при создании приложений. 55

510.Еще одним нововведением стал чуть более тонкий пластиковый корпус OPGA (Organic Pin Grid Array). Во-первых, он дешевле традиционного керамического, во-вторых, он должен сыграть свою роль при переходе на 0.13 мкм процесс. Дело в том, что такая упаковка позволяет организовать лучший отвод тепла от процессора и переместить конденсаторы, фильтрующие цепи питания поближе к ядру. Появился и ранее отсутствовавший в Athlon'ax, зато наличествовавший еще в Intel Pentium III, термодиод, расположенный прямо на кристалле процессора. 56

511.Летом 2000 г. начался выпуск процессоров AMD Duron. В AMD Duron, так же, как и в AMD Athlon, кэш-память обоих уровней интегрирована на кристалле процессора. Кэш L1 имеет тот же объем, что и в AMD Athlon (128 Кбайт), кэш L2 вмещает 64 Кбайт. Частота внешней шины у AMD Duron равна 200 МГц, ядро процессора включает 3 конвейера для выполнения операций с данными в формате с плавающей точкой. Теперь сравните это с показателями Intel Celeron - 32+128 Кбайт, 66 МГц, 1 конвейер FPU. 56

512.В июне 2000 в продажу поступили версии Duron с тактовой частотой 600/ 650/700 МГц, а несколько позже и модификации 1-1,4 ГГц, основанные уже на ядре, аналогичном Athlon XP. По результатам отдельных тестов Duron на 25% превосходит по производительности процессоры Celeron компании Intel с аналогичной тактовой частотой и ценой (исключение Celeron 1,2 Ггц, на ядре Tualatin и современные модификации Celeron 1,7 Ггц и выше). 56

513.В Duron, начиная с частоты 1 ГГц, используется более совершенное ядро Morgan. Для производства Morgan используется 0.18 мкм технологический процесс с использованием алюминиевых соединений. Фактически, ядро Morgan отличается от другого процессорного ядра, Palomino, используемого AMD в своих производительных процессорах (для настольных компьютеров - Athlon XP, для двухпроцессорных серверов - Athlon MP и для мобильных компьютеров - Athlon 4), лишь размером кэша второго уровня. Процессоры на ядре Morgan оснащаются 64-килобайтным кэшем, в то время как Palomino располагает L2 кэшем с размером 256 Кбайт. 56

514.Но, прогресс движется вперёд, и, на сегодняшний день, выпуск процессоров Duron прекращён. 56

515.Компания AMD с конца 2002 года перестала использовать 0.18-микронный технологический процесс для производства своих CPU. Ядро Palomino во всех процессорах линейки Athlon XP, включая и младшие модели, заменено ядром Thoroughbred (технология 0.13-микронн). То же касается процессоров серверного семейства - Athlon MP , которые теперь также будут производиться с использованием более нового ядра Thoroughbred, имеющего более низкое тепловыделение. 56

516.В октябре 2002 года компания AMD объявила два новых процессора - Athlon XP 2700+ и Athlon 2800+, а несколько ранее Athlon XP 2400+ и Athlon XP 2600+. Процессоры Athlon XP 2700+ и Athlon XP 2800+, а также, часть Athlon XP 2600+ имеют одно основное отличие от своих предшественников - они рассчитаны на использование процессорной шины с частотой 333 МГц. Использование этой частоты позволило достичь пропускной способности процессорной шины в 2.7 Гбайт в секунду, что, очевидно, дает возможность AMD добиться в Socket А платформах полного эффекта от использования SDRAM. 56

519.Переход на использование более скоростной шины позволил AMD добиться некоторого прироста в производительности своих CPU без увеличения тактовой частоты процессорного ядра. В результате, теперь для выяснения частоты процессоров Athlon XP придется пользоваться следующей таблицей: 57

521.Процессор 57

522.Частота CPU, МГц/Частота шины, МГц 57

523.Athlon XP 1500+ 57

524.1333/266 57

525.Athlon XP 1600+ 57

526.1400/266 57

527.Athlon XP 1700+ 57

528.1467/266 57

529.Athlon XP 1800+ 57

530.1533/266 57

531.Athlon XP 1900+ 57

532.1600/266 57

533.Athlon XP 2000+ 57

534.1667/266 57

535.Athlon XP 21 00+ 57

536.1733/266 57

537.Athlon XP 2200+ 57

538.1800/266 57

539.Athlon XP 2400+ 57

540.2000/266 57

541.Athlon XP 2600+ 57

542.2133/266 57

543.Athlon XP 2700+ 57

544.2166/333 57

545.Athlon XP 2800+ 57

546.2250/333 57

548.Отметим, что Athlon XP 2800+, благодаря своей увеличенной тактовой частоте и возросшей частоте шины, во многих тестах превосходит по скорости Pentium 4 2.8 ГГц, причем он дешевле более чем в 1,5 раза. 57

549.В настоящее время наиболее популярными продуктами от компании AMD остаются процессоры семейства Athlon XP, в которых используется уже процессорное ядро Barton с 512-килобайтным кэшем второго уровня и 333 или 400-мегагерцовой шиной. 57

5.1. Архитектурные особенности современных микропроцессоров 58

5.1.1. Типы команд микропроцессоров 58

5.1.2. Структурный параллелизм микропроцессоров 58

5.1.3. Структурные методы уменьшения времени доступа к памяти 60

552.По организации кэш с прямым отображением является самым простым типом буфера. Адрес памяти однозначно определяет строку кэша, в которую будет помещен блок информации. При этом предполагается, что оперативная память разбита на блоки и каждому такому блоку в кэше отводится только одна строка. 61

553.Допустим, что в компьютере используется 32-разрядный адрес оперативной памяти. Размер блока равен 4 байтам, а емкость кэша равна 64 Кбайта (16К блоков по 4 байт). В этом случае для формирования адреса буфера достаточно 16 разрядов, из которых два младших определяют один из четырех байтов в строке, а 14 старших разрядов адресуют один из 16К блоков кэша. В соответствии с этим адрес основной памяти можно разбить на два поля: младшие 16 разрядов — поле индекса, старшие 16 разрядов — поле признака. Индекс определяет адрес кэш-памяти (строку кэша), а признак позволяет отличить блок, находящийся в кэш от находящегося только в оперативной памяти. Хранится он в специальной памяти признаков (рис. 2.10). 61

554. 62

555.Рис.2.10. Кэш-память с прямым отображением 62

556.При обращении центрального процессора к основной памяти, например, по чтению, поле индекса определяет выбор одной из строк кэша. Тег (признак), хранящийся в соответствующей строке памяти тегов, сравнивается с 16 старшими разрядами адреса, выданного центральным процессором. Если выбранная из памяти признаков информация совпадает с этими разрядами, то это означает, что необходимые данные находятся в буфере — они считываются из кэша и передаются в процессор; если не совпадает, то это свидетельствует об отсутствии информации в кэш-памяти и в выбранную строку считывается требуемый блок информации из основной памяти. 62

557.Этот подход к реализации кэша позволяет решить проблему конфликта адресов, свойственную кэш-памяти с прямым отображением. 63

558. 64

559.Рис.2.11. Кэш-память с полностью ассоциативным отображением 64

560.При каждом обращении к оперативной памяти необходимо сравнивать адрес, выданный процессором, со всеми адресами, хранящимся в памяти тэгов. Такая организация разрешает проблему конфликта адресов, но ценой дополнительного оборудования и увеличения времени обработки запроса в память. 64

561.Частично ассоциативная кэш сочетает в себе преимущества кэш с прямым отображением и полностью ассоциативной кэш. В этом типе кэш строки разбиваются на группы, в которые могут входить две, четыре и т.д. строки. В соответствии с их количеством различают двухвходовую частично ассоциативную кэш, четырехвходовую частично ассоциативную кэш и т.д. 64

562.Например, двухвходовая частично ассоциативная кэш может иметь 8К групп по две строки в каждой, два младших разряда по-прежнему определяют байт в блоке, а остальные разряды поля индекса выбирают одну из 8К групп. Старшие 16 разрядов адреса (признак) записываются в строку памяти тэгов. Для блоков с одним и тем же индексом отводятся две строки буфера. Поэтому, если одна из строк группы занята некоторым блоком, то следующий блок с таким же индексом записывается в свободную строку, перезаписи не требуется, т.е. в пределах группы кэш является полностью ассоциативной. По сравнению с полностью ассоциативной кэш количество сравнений с признаками сокращается до двух. 64

563.Расслоение памяти. Другим структурным способом уменьшения времени доступа к памяти служит расслоение памяти. В предположении, что выборка из памяти выполняется по последовательным адресам возможно использование k блоков памяти с размещением в блоке i, где i=0,..., k-1, слов с адресами n=i+krrp mod k, где р=0,1,..., М. В этом случае возможно k параллельных обращений в память по адресам, принадлежащим различным блокам. Поэтому выборка команд программы за исключением команд, выбираемых как результат ветвления, может быть ускорена применением расслоения памяти. Аналогично может быть ускорена обработка массивов данных, последовательные элементы которых помещаются в разные блоки памяти. 68

564.Пакетный доступ к памяти иллюстрирован рисунком 5.2,а. 68

565. 68

566.Рис.5.2,а. Схема пакетного доступа 68

568.По этому методу производится одновременный доступ к ячейкам памяти в соседних банках, запись производится в регистр данных RGD, к которому производится последовательный доступ. Т.к. время доступа к регистру меньше времени доступа к памяти, то среднее время доступа сокращается. 68

569.Конвейерная обработка доступа иллюстрирована рисунком 5.2,б. 68

570. 68

571.Рис. 5.2,б. Схема конвейерного доступа 68

573.По этому методу память разбивается на множество банков, организуется очередь запросов доступа. Если два соседних запроса требуют доступа к разным банкам памяти, то последний запрос может не дожидаться окончания предыдущего доступа. 69

574.Многоуровневая иерархия и расслоение памяти могут использоваться совместно. 69

5.1.4. Классификация архитектур микропроцессоров 69

5.1.5. Средства аппаратного ускорения работы МП 71

5.1.6. Стандартизация архитектур микропроцессоров 72

5.2. Суперскалярные процессоры 74

5.2.1 Архитектура суперскалярных процессоров 74

576.Работа с памятью. Для вычисления адреса памяти, как правило, требуется, по крайней мере, одно сложение. После вычисления адреса может понадобиться его преобразование в физический адрес, осуществляемое буфером трансляции адресов (TLB). 82

577.Завершение выполнения команды. Завершающей фазой исполнения команды является фаза изменения состояния процессора в соответствии с выполненной командой. Назначение этой фазы - сохранение последовательной модели исполнения программы, при реальном параллельном выполнении отдельных команд и условном выполнении команд ветвления. Для изменения состояния процессора применяются два основных способа, причем оба основаны на использовании двух состояний: состояния, измененного в результате операции, и состояния, требуемого для восстановления. 82

5.2.2. Направления развития суперскалярной архитектуры 84

5.3. Мультискалярные процессоры 86

5.3.1 Мультискалярная модель выполнения программы 86

5.3.2. Мультискалярные программы 92

5.3.3. Мультискалярные аппаратные средства 94

5.3.3. Преимущества мультискалярной архитектуры 95

6. МИКРОПРОЦЕССОРЫ ДЛЯ РАБОЧИХ СТАНЦИЙ И СЕРВЕРОВ 97

6.1. Микропроцессоры с архитектурой SPARC 97

581.Линия процессоров с архитектурой SPARC включает 32-разрядные микропроцессоры MicroSPARC, SuperSPARC, HiperSPARC и 64-разрядный микропроцессор UltraSPARC [33]. Традиционно системы на основе SPARC микропроцессоров - это высокопроизводительные рабочие станции для научных расчетов и Unix-серверы. С выпуском нового поколения микропроцессоров значительно улучшились возможности SPARC-систем по обработке графики и видеоизображений. UltraSPARC представляет собой один из первых процессоров общего назначения, в котором эти функции реализованы аппаратно. Он имеет специальный модуль для обработки видеоданных и графики, представленной в RGB и альфа-формате. Функции обработки видеоизображений могут работать сразу с 8 элементами изображения. Обработка изображений выполняется в блоке FPU, который обычно выполняет операции над 64-битовыми данными с плавающей точкой. В этом блоке выполняется логическое сложение и умножение элементов изображения. В систему команд микропроцессора включен набор команд (VIS - Visual Instruction Set), позволяющий загружать и обрабатывать данные в виде 64-битовых блоков. VIS насчитывает 30 команд для эффективной обработки мультимедиа, графики, изображений и других алгоритмов, ориентированных на целочисленную обработку. Команды VIS включают в себя сложение, умножение и вычитание, что позволяет параллельно выполнять за один такт до 8 целочисленных операций над байтами или полусловами. 97

582.При реализации алгоритма компрессии-декомпрессии MPEG больше всего времени требует та часть алгоритма, которая выполняет анализ движения и сравнение каждой части текущего кадра с предыдущим. Благодаря наличию специальных команд в UltraSPARC эти действия выполняются как одна графическая операция. Специальная подсистема памяти автоматически загружает элемент изображения в 8-байтовые блоки. Для этого не требуется выполнения отдельной команды. При конвейеризации этих специальных команд микропроцессор будет выполнять одну операцию за такт. Использование таких специализированных команд обеспечивает 80-кратное повышение скорости выполнения обработки изображений по сравнению с другими SPARC-процессорами. 97

583.UltraSPARC имеет также несколько специальных средств, улучшающих его работу с памятью. Это повышает производительность программ мультимедиа и других системных задач. Самым крупным изменением является новая команда перемещения блока данных по шине "процессор-память" со скоростью 600 Мбайт/с. Это позволяет основному процессору работать как видеопроцессор, передавая данные с экрана на экран. Перемещение блока можно с выгодой использовать и в других приложениях, например в сетевом программном обеспечении для перемещения пакетов данных. 97
1   ...   4   5   6   7   8   9   10   11   ...   473

Похожие:

1 Основные направления применения микропроцессорных систем 1 iconПрограмма дисциплины “Микропроцессорные устройства технических систем” для подготовки инженеров
Изучение особенностей применения микропроцессорных устройств в системах автоматики и телеуправления, а также в изделиях электронной...
1 Основные направления применения микропроцессорных систем 1 iconКонспект лекций по курсу "Микропроцессоры и микро-эвм в Персональной...
Целью настоящего курса является дать понятие о микропроцессорах и однокристальных микро-эвм, области их применения, дать основы функционирования...
1 Основные направления применения микропроцессорных систем 1 iconМетодические указания к самостоятельной работе по дисциплине «Микропроцессорные...
Цель работы изучение современных однокристальных микроконтроллеров с cisc- и risc- архитектурой, организации их памяти и функционирования,...
1 Основные направления применения микропроцессорных систем 1 iconПроектирование микропроцессорных систем методические указания к курсовому проектированию
...
1 Основные направления применения микропроцессорных систем 1 iconПравительство Российской Федерации Московский институт электроники...
Целью курса "Микропроцессорные системы" является ознакомление студентов с микропроцессорными средствами и методами проектирования...
1 Основные направления применения микропроцессорных систем 1 iconРеферат на тему: «Основы микропроцессорных систем»
Эвм, но имеющие несравнимо меньшие размеры. Микропроцессоры относятся к классу микросхем, особенностью которых является возможность...
1 Основные направления применения микропроцессорных систем 1 iconРабочая программа учебной дисциплины «основы микропроцессорной техники»
Изучение дисциплины направлено на освоение принципов построения и функционирования микропроцессорных систем, а также работы в среде...
1 Основные направления применения микропроцессорных систем 1 iconНегосударственное Аккредитованное Частное Образовательное Учреждение...
Распределенные объектные архитектуры программных систем. Многоуровневые приложения. Основные понятия архитектуры распределенных систем....
1 Основные направления применения микропроцессорных систем 1 iconМосковский энергетический институт (технический университет) институт электротехники (иэт)
Целью дисциплины является изучение физических и математических основ компьютерной и микропроцессорной техники и принципов построения...
1 Основные направления применения микропроцессорных систем 1 iconУчебной дисциплины физика (с основами астрономии) для специальности 2201
Изучение дисциплины базируется на знаниях, полученных на уроках по физике и математике в школе, и является базой для изучения цифровой...
1 Основные направления применения микропроцессорных систем 1 iconРабочая программа учебной дисциплины «электронные промышленные устройства»
«Электроника электропривода», «Программные средства пэвм», «Теория автоматического управления», «Основы микропроцессорной техники»...
1 Основные направления применения микропроцессорных систем 1 iconПубличный отчёт «сош д. Звягино» в 2010-11 учебном году Основные направления
Основные направления, содержание и формы деятельности педагогического коллектива регламентировались нормативными документами
1 Основные направления применения микропроцессорных систем 1 iconРеферат Тема. Парапульпарные штифты Основные вопросы для изучения:...
Исходящая информация: необходима для правильного клинического применения парапульпарных штифтов
1 Основные направления применения микропроцессорных систем 1 iconРасширенная программа дисциплины “ Экологическая геология
Рассматриваются основные направления использования геофизических методов для геолого-экологического мониторинга окружающей среды...
1 Основные направления применения микропроцессорных систем 1 iconРеферат на тему: «Вакансии по специальности экономическая кибернетика»
Занимается в области применения информационных систем, решает функциональные задачи, а также управляет информационными, материальными...
1 Основные направления применения микропроцессорных систем 1 iconКонспект лекций по дисциплине: теория систем и системный анализ санкт-Петербург...
Выбор показателя эффективности, математическая постановка задачи


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск