Реферат: Процессоры
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИХАНТЫ-МАНСИЙСКИЙ АВТОНОМНЫЙ ОКРУГ
ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ И НАУКИ
МУНИЦИПАЛЬНОЕ ПРОФЕССИОНАЛЬНОЕ УЧИЛИЩЕ №1
УТВЕРЖДЕНОЗам. директора по УПР
_______
«____»________2002 г.
ПИСЬМЕННАЯ ЭКЗАМЕНАЦИОННАЯРАБОТА
Учащегося:Специальность:____________________________
Тема:_____________________________________
__________________________________________
Преподаватель:
Консультант:
Дата выдачи задания: «___»_____2002 г.
Срок сдачи: «___»_____2002 г.
Подпись учащегося: «___»_____2002 г.
г. Покачи 2002 г.
Содержание
1. Введение в персональный компьютер.
2. Отличия процессоров.
2.1. Отличия пpоцессоpов SX, DX, SX2, DX2и DX4.
2.2. Обозначение «SL-Enhanced» yпpоцессоpов Intel 486.
2.5. Идентификация чипов Intel и AMD.
2.5.2. Версия процессора.
2.5.4. Перемаркированные процессоры.
3. Процессоры фирмы Intel.
3.1. Современная микропроцессорнаятехнология фирмы Intel.
3.2. Первые процессоры фирмы Intel.
3.3. Процессор 8086/88.
3.4. Процессор 80186/88.
3.5. Процессор 80286.
3.6. Процессор 80386.
3.7. Процессор 80486.
3.7.1.Процессор i486SX.
3.8. Intel OverDrive процессор.
3.9. Процессор Pentium.
3.10. Процессор Pentium Pro.
3.10.1. Общее описание процессора.
3.10.2. Два кристалла в одном корпусе.
3.10.3. Значения тестов для некоторыхчипов фирмы Intel.
4. Процессоры конкурентов Intel.
4.1. Первые процессоры конкурентов Intel.
4.2. Процессоры фирмы AMD.
4.2.1. Судебное разбирательство с Intel.
4.2.2. Процессоры семейства AMD5k86.
4.2.2.1 Экскурсия по внутреннейархитектуре.
4.2.2.2. Пример маркировки микропроцессораAMD5k86-P75.
4.2.2.5. AMD планирует выпустить K5.
4.3. Процессоры NexGen.
4.4. Процессоры Cyrix.
4.5. Процессоры Sun Microsystems.
4.6. Процессоры Digital Equipment.
4.7. Процессоры Mips.
4.8. Процессоры Hewlett-Packard.
4.9. Процессоры Motorola.
5. Лабораторные испытания и тестированиемикропроцессоров.
5.1. Лабораторные испытания процессоровi386DX.
5.2. Результатытестирования микропроцессоров с помощью пакета Speed Test.
6. Сравнительныйанализ. ……………….. 7. Pentium II. …………………………….………………………. 7.1 Pentium II. ……………………………………………………..……. 7.2 Deschutes. …………………………………………………………… 7.3 Мобильный Pentium II. ……………………………………………. 7.4Celeron. ……………………………………………………………… 7.5 Pentium “Xeon”. ……………………………………………………
1. Введение в персональный компьютер.
Персональныйкомпьютер — это такой компьютер, который может себе позволить купить отдельныйчеловек.
Наиболее«весомой» частью любого компьютера является системный блок (иногдаего называют компьютером, что является недопустимой ошибкой). Внутри негорасположены блок питания, плата с центральным процессором (ЦП), видеоадаптер,жесткий диск, дисководы гибких дисков и другие устройства ввода / выводаинформации. Зачастую видеоадаптер и контроллеры ввода/ вывода размещены прямона плате ЦП. В системном блоке могут размещаться средства мультимедиа:звуковая плата и устройство чтения оптических дисков — CD-ROM. Кроме того, впонятие «компьютер» входит клавиатура и монитор. Манипулятор мышьявляется необязательной, но весьма важной деталью. Теперь коротко о выбореосновных компонентов ПК. Процессор является основным компонентом любого ПК. Внастоящее время наиболее распространены процессоры фирмы Intel, хотя ЦП другихфирм (AMD, Cyrix, NexGen и др.) составляют им достойную конкуренцию. Имеетсятакже материнская (MotherBoard) плата. Основной характеристикой материнскихплат является их архитектура. Основными шинами до недавнего времени считалисьISA (Industrial Standard Architecture) и EISA (Extended ISA), и имеющиеразрядность 10 и 32 соответственно. Для обеспечения нормальной работывидеоадаптеров был разработан стандарт VESA (Video Electronic Standart Association),рассчитанный на применение процессора серии 486, работающей на частотепроцессора и являющейся «приставкой» к шине ISA или EISA. Споявлением процессора Pentium была разработана самостоятельная шина PCI,которая на сегодняшний день является наиболее быстрой и перспективной. Обычно вПК присутствует дисковод для гибких дисков. Существует два стандарта:5.25" и 3.5". На сегодняшний день большинство компьютеровпоставляется с дисководом 3.5". Жeсткий диск (винчестер), начав своешествие с объема в 5 МБ, достиг небывалых высот. На сегодняшний день не удивятдиски объемом 2 или 4 ГБ. Для большинства приложений вполне достаточно объема420 — 700 МБ, однако если вам приходится работать с полноцветными графическимиизображениями или версткой, то придется подумать о диске в 1.5- 2 ГБ или дажепаре таких дисков. Следует придать значение не только емкости диска, но и еговременным характеристикам. В качестве оптимальных можно порекомендоватьвинчестеры фирмы Western Digital, Seagate или Corner. Для оперативной памяти(RAM, ОЗУ) закон простой: чем больше, тем лучше. В настоящее время трудно найтиконфигурацию с объемом памяти менее 4 МБ. Для нормальной работы большинствапрограммных продуктов желательно иметь хотя бы заметить, что при увеличении ОЗУболее чем 32 МБ быстродействие ПК увеличивается менее значительно, и такаяконфигурация необходима художникам и мультипликаторам. Hеотъемлемой частью ПКявляется клавиатура. Стандартной в России является 101 — клавишная клавиатурыс английскими и русскими символами. Мышь. Необходима для работы с графическимипакетами, чертежами, при разработке схем и при работе под Windows. Следуетотметить, что некоторое игровое и программное обеспечение требует наличиемыши. Основной ха мыши является разрешающая способность, измеряемая в точках надюйм (dpi). Нормальной считается мышь, обеспечивающая разрешение 300-400 dpi.Неплохо иметь также специальный коврик под мышь, что обеспечивает еесохранность и долговечность. Выбору монитора ПК следует уделить особоевнимание, поскольку от качества монитора зависит сохранность вашего зрения иобщую утомляемость при работе. Мониторы имеют стандартный размер диагонали в14,15,17,19,20 и 21 дюйм. Необходимый размер диагонали монитора выбираетсяисходя их разрешения, при котором вы собираетесь работать. Так, длябольшинства приложений вполне достаточно иметь 14 дюймовый монитор, которыйобеспечивает работу при разрешениях до 800 на 600 точек. ПК может иметьзвуковую карту. С одной стороны, звуковая карта не является необходимымэлементом компьютера, но, с другой стороны, позволяет превратить его в мощноеподспорье при обучении и написании музыки, изучении языков. Да и какой интересбить врагов на экране, если не слышишь их предсмертные крики. Простейшей картойявляется Adlib, который позволяет воспроизводить только музыку безоцифрованной речи. И CD-ROM, с одной стороны, также не являются необходимойдля функционирования компьютера частью, но становится все более и болеепопулярными в связи с тенденцией поставлять профессиональное, обучающее иигровое программное обеспечение на CD-дисках.
2. Отличия процессоров.
2.1. Отличия процессоров SX, DX, SX2, DX2 и DX4.
SX и DX обозначает«облегченную» и полную версию одного и того же процессора. Для 386вариант SX был сделан с 16-pазpядным интерфейсом, что позволяло экономить наобвязке и устанавливать память по два SIMM, а не по четыре, как для DX. Пpиработе с 16-pазpядными программами 386SX почти не отстает от 386DX на той жечастоте, однако на 32-pазpядных программах он работает ощутимо медленнее из-заразделения каждого 32-pазpядного запроса к памяти на два 16-pазpядных. Hа самомже деле большинство компьютеров с 386DX работают быстрее компьютеров с SX дажена 16-pазpядных программах – благодаря тому, что на платах с 386DX чаще всегоустановлен аппаратный кэш, которого нет на большинстве плат с SX. внутренняяархитектура 386SX — полностью 32-pазpядная, и программно обнаружить разницумежду SX и DX без запроса кода процессора или измерения скорости работымагистpали в общем случае невозможно.
Для 486 SXобозначает вариант без встроенного сопроцессора. Ранние модели представлялисобой просто отбраковку от DX с неисправным сопроцессором – сопроцессор в нихбыл заблокирован, и для установки такого процессора вместо DX требовалось перенастроитьсистемную плату. Более поздние версии выпускались самостоятельно, и могутустанавливаться вместо DX без изменения настройки платы. Кроме отсутствиясопроцессора и идентификационных кодов, модели SX также ничем не отличаются отсоответствующих моделей DX, и программное различение их в общем случае тоженевозможно.
SX2, DX2 и DX4 –варианты соответствующих процессоров с внутренним удвоением или утроениемчастоты. Hапpимеp, аппаратная настройка платы для DX2-66 делается, как дляDX33, и на вход подается частота 33 МГц, однако в программной настройке можетпотребоваться увеличение задержек при обращении к памяти для компенсациивозросшей скорости работы процессора. Все внутренние операции в процессорахвыполняются соответственно в два и три раза быстрее, однако обмен по внешнеймагистpали определяется внешней тактовой частотой. За счет этого DX4-100работает втрое быстрее DX33 только на тех участках программ, которые целикомпомещаются в его внутренний кэш, на больших фрагментах это отношение можетупасть до двух с половиной и меньше.
Hекотоpые сериипроцессоров AMD (в частности – 25253) выпускались с единым кристаллом DX4,который мог переключаться в режим удвоения по низкому уровню на выводе B-13.маркировка как DX2 или DX4 проводилась по результатам тестов; соответственно,процессор, маркированный как DX4, мог работать как DX2 и наоборот. ПроцессорыIntel DX4 – 100 могут переключаться в режим удвоения по низкому уровню навыводе R – 17.
процессор AMD 5x86 стандартно работает с утроениемвнешней частоты, а низкий уровень на выводе R – 17 переключает его в режимучетвеpения.
2.2. Обозначение «SL – Enhanced» упроцессоров Intel 486.
Hаличие SMM (System Management Mode — режим управлениясистемой), используемого главным образом для перевода процессора в экономичныйрежим. Еще обозначается как «S – Series», с добавлением к обозначениюпроцессора суффикса "–S". В SL – Enhanced процессорах имеется такжекоманда CPUID, которая возвращает идентификатор процессора.
2.3. Отличия процессоров UMC 486 U5 от Intel, AMD идругих.
Прежде всего — оптимизированным микрокодом, за счет чего часто используемые командывыполняются за меньшее число тактов, чем в процессорах Intel, AMD, Cyrix идругих. Пpоцессоpы U5 не имеют внутреннего умножения частоты, а результаты в 65МГц и подобные, получаемые некоторыми программами, получаются потому, что дляопределения частоты программе необходимо правильно опознать процессор — точнее,число тактов, за которое он выполнит тестовую последовательность, абольшинство распространенных программ не умеют правильно опознавать U5. По этойже причине на U5 зависает игра Heretic, ошибочно найдя в нем сопроцессор — чтобы это исключить, нужно в командной строке Heretic указать ключ "-debug".
2.4. Чипы RISC иCISC.
RISC — это аббревиатура от ReducedInstruction Set Computer (компьютер с сокращенным набором команд), а CISC — аббревиатура от Comlex Instruction Set Computer (компьютер с полным наборомкоманд). Существенная разница между ними состоит в следующем: чипы RISC понимаютлишь некоторые инструкции, но каждую из них они могут выполнить очень быстро.Программы для RISC-машин достаточно сложны, но выполняются они быстрее тех,которые совместимы с CISC-машинами. Hо, может быть, это и не так? (Исследованияпроизводительности еще не завершены.)
Все чипы Intel 80x86 (как и чипы Motorola 680x0
(68010,68020,..,68040), используемые в компьютерах Macintosh и NeXT)являются яркими представителями CISC-чипов. Hекоторые рабочие станции, начинаяс IBM, используют чипы RISC.
2.5. Идентификация чипов Intel и AMD.
2.5.1. Кодексы даты.
Просите у продавцакодексы даты прежде, чем Вы купите процессор. Все ЦПУ имеют дату выпуска,которая проставляется на корпусе. Удостоверьтесь, что Вы приобретаете новыйпроцессор, а не прошлогодний.
Например A80486DX33 ( by Intel )
V74400223
V — первый символ, код завода (plantcode);
7 — второй символ, этопоследняя цифра года выпуска процессора, рассматриваемый процессор выпущен в1987 году;
44 — следующие две цифры, 44-я рабочаянеделя в этом году (1987); 002 — следующие 3 цифры, номер партии (sequencenumber);
3 - код замены (change code).
Hапример E6 9433 DPD (on AMD CPUs)
E6 — версия реализации (versionrelease);
9433 — выпущен на 33 рабочей неделе 1994года;
DPD — шифр серии (wafer number);
2.5.2. Версия процессора.
Просите данные оверсии процессора. Сравните версию процессора, который Вам предлагают спроцессорами Intel 800-468-3548 или AMD 800-222-9323, так как более ранниеверсии процессоров имеют ошибки и различные дефекты.
2.5.3. Demo-образцы.
Никогда не платитеполную цену за demo-образцы. AMD и Intel делают технические образцы для каждойверсии процессора, прежде, чем будет начат серийный выпуск процессора. ТакойЦПУ может иметь ошибки(дефекты), так как обычно создан для испытания. Совершенноне предполагается, что такой процессор продадут конечному пользователю.
Hапример:
Нормальная версия (normal version):i486DX-33:
Разработка образцов(engineering samples): i486DX-33 E
2.5.4. Перемаркированные процессоры.
Перемаркированныепроцессоры (remaked CPUs) — это процессоры, которые разгоняют сильнее, чеморигинальные для более высокой цены и прибыли. Эти действия считаютсянезаконными. Использование такого ЦПУ всегда рискованно. Разгонка процессораиногда бывает успешной, например, с 33MHz до 40MHz, или с 25MHz до 33MHz, ноне всегда. Использование разогнанного процессора приводит к перегреванию чипа иего нестабильной работе, что часто служит причиной всевозможных ошибок, сбоеви зависаний системы. Перемаркированный и разогнанный ЦПУ имеет гораздо меньшийсрок службы, чем оригинальный процессор, благодаря перегреванию чипа.
3. Процессоры фирмы Intel.
3.1. Современная микропроцессорная технология фирмыIntel.
Достижения фирмыIntel в искусстве проектирования и производства полупроводников делаютвозможным производить мощные микропроцессоры в все более малых корпусах.Разработчики микропроцессоров в настоящее время работают с комплиментарнымтехнологическим процессом метал – оксид полупроводник (CMOS) с разрешениемменее, чем микрон.
Использованиесубмикронной технологии позволяет разработчикам фирмы Intel располагать большетранзисторов на каждой подложке. Это сделало возможным увеличение количестватранзисторов для семейства X86 от 29,000 в 8086 процессоре до 1,2 миллионов впроцессоре Intel486 DX2, с наивысшим достижением в Pentium процессоре. Выполненныйпо 0.8 микронной BiCMOS технологии, он содержит 3.1 миллиона транзисторов.Технология BiCMOS объединяет преимущества двух технологий: биполярной(скорость) и CMOS ( малое энергопотребление ). С помощью более, чем в два разабольшего количества транзисторов Pentium процессора по сравнению с Intel486,разработчики поместили на подложке компоненты, ранее располагавшимися снаружипроцессора. Наличие компонентов внутри уменьшает время доступа, что существенноувеличивает производительность. 0.8 микронная технология фирмы Intel используеттрехслойный металл и имеет уровень, более высокий по сравнению с оригинальной1.0 микронной технологией двухслойного металла, используемой в процессореIntel486.
3.2. Первые процессоры фирмы Intel.
За 20-летнюю историюразвития микропроцессорной техники, ведущие позиции в этой области занимаетамериканская фирма Intel (INTegral ELectronics). До того как фирма Intel началавыпускать микрокомпьютеры, она разрабатывала и производила другие виды интегральныхмикросхем. Главной ее продукцией были микросхемы для калькуляторов. В 1971 г.она разработала и выпустила первый в мире 4-битный микропроцессор 4004. Фирмапервоначально продавала его в качестве встроенного контроллера (что-то вродесредства управления уличным светофором или микроволновой печью). 4004 былчетырехбитовым, т.е. он мог хранить, обрабатывать и записывать в память илисчитывать из нее четырехбитовые числа. После чипа 4004 появился 4040, но 4040поддерживал внешние прерывания. Оба чипа имели фиксированное число внутреннихиндексных регистров. Это означало, что выполняемые программы были ограниченычислом вложений подпрограмм до 7.
В 1972 г., т.е.спустя год после появления 4004, Intel выпустила очередной процессор 8008, ноподлинный успех ей принес 8-битный микропроцессор 8080, который был объявлен в1973 г. Этот микропроцессор получил очень широкое распространение во всем мире.Сейчас в нашей стране его аналог — микропроцессор KP580ИК80 применяется вомногих бытовых персональных компьютерах и разнообразных контроллерах. С чипом8080 также связано появление стека внешней памяти, что позволило использоватьпрограммы любой вложенности.
Процессор 8080 был основной частью первого небольшого компьютера,который получил широкое распространение в деловом мире. Операционная системадля него была создана фирмой Digital Research и называлась Control Program forMicrocomputers (CP/M).
3.3. Процессор 8086/88.
В 1979 г. фирмаIntel первой выпустила 16-битный микропроцессор 8086, возможности которогобыли близки к возможностям процессоров миникомпьютеров 70-х годов.Микропроцессор 8086 оказался «прародителем» целого семейства,которое называют семейством 80x86 или х86.
Hесколько позже появился микропроцессор 8088,архитектурно повторяющий микропроцессор 8086 и имеющий 16-битный внутренние регистры,но его внешняя шина данных составляет 8 бит. Широкой популярностимикропроцессора способствовало его применение фирмой IBM в персональныхкомпьютерах PC и PC/XT.
3.4. Процессор 80186/88.
В 1981 г. появились микропроцессоры 80186/80188,которые сохраняли базовую архитектуру микропроцессоров 8086/8088, но содержалина кристалле контроллер прямого доступа к памяти, счетчик/таймер и контроллерпрерываний. Кроме того, была несколько расширена система команд. Однакоширокого распространения эти микропроцессоры (как и персональные компьютерыPCjr на их основе), не получили.
3.5. Процессор 80286.
Следующим крупным шагом в разработке новых идей сталмикропроцессор 80286, появившийся в 1982 году. При разработке были учтеныдостижения в архитектуре микрокомпьютеров и больших компьютеров. Процессор80286 может работать в двух режимах: в режиме реального адреса он эмулируетмикропроцессор 8086, а в защищенном режиме виртуального адреса (ProtectedVirtual Adress Mode) или P-режиме предоставляет программисту много новыхвозможностей и средств. Среди них можно отметить расширенное адресноепространство памяти 16 Мбайт, появление дескрипторов сегментов и дескрипторныхтаблиц, наличие защиты по четырем уровням привилегий, поддержку организациивиртуальной памяти и мультизадачности. Процессор 80286 применяется в ПК PC/AT имладших моделях PS/2.
3.6. Процессор 80386.
При разработке32-битного процессора 80386 потребовалось решить две основные задачи — совместимость и производительность. Первая из них была решена с помощьюэмуляции микропроцессора 8086 — режим реального адреса (Real Adress Mode) илиR-режим.
В Р – режимепроцессор 80386 может выполнять 16-битные программы (код) процессора 80286 безкаких-либо дополнительных модификаций. Вместе с тем, в этом же режиме он можетвыполнять свои «естественные» 32-битные программы, что обеспечиваетповышение производительности системы. Именно в этом режиме реализуются всеновые возможности и средства процессора 80386, среди которых можно отметитьмасштабированную индексную адресацию памяти, ортогональное использованиерегистров общего назначения, новые команды, средства отладки. Адресноепространство памяти в этом режиме составляет 4 Гбайт.
Микропроцессор 80386дает разработчику систем большое число новых и эффективных возможностей,включая производительность от 3 до 4 миллион операций в секунду, полную32-битную архитектуру, 4 гигабитное (2 байт) физическое адресное пространствои внутреннее обеспечение работы со страничной виртуальной памятью.
Несмотря на введениев него последних достижений микропроцессорной техники, 80386 сохраняетсовместимость по объектному коду с программным обеспечением, в большомколичестве написанным для его предшественников, 8086 и 80286. Особый интереспредставляет такое свойство 80386, как виртуальная машина, которое позволяет80386 переключаться в выполнении программ, управляемых различными операционнымисистемами, например, UNIX и MS-DOS. Это свойство позволяет производителяморигинальных систем непосредственно вводить прикладное программное обеспечениедля 16-битных машин в системе на базе 32-битных микропроцессоров. Операционнаясистема P-режима может создавать задачу, которая может работать в режимевиртуального процессора 8086 (Virtual 8086 Mode) или V-режим. Прикладнаяпрограмма, которая выполняется в этом режиме, полагает, что она работает напроцессоре 8086.
32-битнаяархитектура 80386 обеспечивает программные ресурсы, необходимые для поддержки«больших » систем, характеризуемых операциями с большими числами,большими структурами данных, большими программами (или большим числомпрограмм) и т.п. Физическое адресное пространство 80386 состоит из 2 байт или4 Гбайт; его логическое адресное пространство состоит из 2 байт или 64терабайт (Тбайт). Восемь 32-битных общих регистров 80386 могут быть взаимозаменяемоиспользованы как операнды команд и как переменные различных способов адресации.Типы данных включают в себя 8-, 16- или 32-битные целые и порядковые,упакованные и неупакованные десятичные, указатели, строки бит, байтов, слов идвойных слов. Микропроцессор 80386 имеет полную систему команд для операций надэтими типами данных, а также для управления выполнением программ. Способыадресации 80386 обеспечивают эффективный доступ к элементам стандартных структурданных: массивов, записей, массивов записей и записей, содержащих массивы.
Микропроцессор 80386реализован с помощью технологии фирмы Intel CH MOSIII — технологическогопроцесса, объединяющего в себе возможности высокого быстродействия технологииHMOS с малым потреблением технологии кмоп. Использование геометрии 1,5 мкм ислоев металлизации дает 80386 более 275000 транзисторов на кристалле. Сейчасвыпускаются оба варианта 80386, работающих на частоте I2 и I6 МГц без состоянийожидания, причем вариант 80386 на 16 МГц обеспечивает скорость работы 3-4миллиона операций в секунду.
Микропроцессор 80386 разделен внутри на 6 автономно ипараллельно работающих блоков с соответствующей синхронизацией. Все внутренниешины, соединяющие эти блоки, имеют разрядность 32 бит. Конвейерная организацияфункциональных блоков в 80386 допускает временное наложение выполненияразличных стадий команды и позволяет одновременно выполнять несколькоопераций. Кроме конвейерной обработки всех команд, в 80386 выполнение рядаважных операций осуществляется специальными аппаратными узлами. Блокумножения/деления 80386 может выполнять 32-битное умножение за 9-41 тактсинхронизации, в зависимости от числа значащих цифр; он может разделить32-битные операнды за 38 тактов (в случае чисел без знаков) или за 43 такта (вслучае чисел со знаками). Регистр группового сдвига 80386 может за один тактсдвигать от 1 до 64 бит. Обращение к более медленной памяти (или к устройствамввода/вывода) может производиться с использованием конвейерного формированияадреса для увеличения времени установки данных после адреса до 3 тактов присохранении двухтактных циклов в процессоре. Вследствие внутреннего конвейерногоформирования адреса при исполнении команды, 80386, как правило, вычисляет адреси определяет следующий магистральный цикл во время текущего магистральногоцикла. Узел конвейерного формирования адреса передает эту опережающуюинформацию в подсистему памяти, позволяя, тем самым, одному банку памятидешифрировать следующий магистральный цикл, в то время как другой банкреагирует на текущий магистральный цикл.
3.7. Процессор 80486.
В 1989 г. Intel представила первого представителясемейства 80х86, содержащего более миллиона (а точнее, 1,2 миллиона) транзисторов в чипе. Этот чип во многом сходен с 80386. Он на 100% программносовместим с микропроцессорами 386(ТМ) DX & SX. Один миллион транзисторовобъединенной кэш-памяти (сверхбыстрой оперативной памяти), вместе с аппаратуройдля выполнения операций с плавающей запятой и управлением памяти на одноймикросхеме, тем не менее поддерживают программную совместимость с предыдущимичленами семейства процессоров архитектуры 86. Часто используемые операции выполняютсяза один цикл, что сравнимо со скоростью выполнения RISC-команд.Восьмикилобайтный унифицированный кэш для кода и данных, соединенный с шинойпакетного обмена данными со скоростью 80/106 Мбайт/сек при частоте 25/33 Мгерцгарантируют высокую производительность системы даже с недорогими дисками(DRAM). Новые возможности расширяют многозадачность систем. Новые операцииувеличивают скорость работы с семафорами в памяти. Оборудование на микросхемегарантирует непротиворечивость кэш-памяти и поддерживает средства дляреализации многоуровневого кэширования. Встроенная система тестированияпроверяет микросхемную логику, кэш-память и микросхемное постраничноепреобразование адресов памяти. Возможности отладки включают в себя установкуловушек контрольных точек в выполненяемом коде и при доступе к данным. Процессорi486 имеет встроенный в микросхему внутренний кэш для хранения 8Кбайт команд иданных. Кэш увеличивает быстродействие системы, отвечая на внутренние запросычтения быстрее, чем при выполнении цикла чтения оперативной памяти по шине.Это средство уменьшает также использование процессором внешней шины. Внутреннийкэш прозрачен для работающих программ. Процессор i486 может использоватьвнешний кэш второго уровня вне микросхемы процессора. Обычно внешний кэш позволяетувеличить быстродействие и уменьшить полосу пропускания шины, требуемуюпроцессором i486.
3.7.1.Процессор i486SX
Появлениенового микропроцессора i486SX фирмы Intel вполне можно считать одним изважнейших событий 1991 года. Уже
предварительныеиспытания показали, что компьютеры на базе i486SX с тактовой частотой 20 МГцработают быстрее (примерно на 40%) компьютеров, основанных на i80386DX стактовой частотой 33 МГц. Микропроцессор i486SX, подобно оригинальному i486DX,содержит на кристалле и кэш-память, а вот математический сопроцессор у негозаблокирован. Значительная экономия (благодаря исключению затрат натестирование сопроцессора) позволила фирме Intel существенно снизить цены нановый микропроцессор. Надо сказать, что если микропроцессор i486DX былориентирован на применение в сетевых серверах и рабочих станциях, тоi486SX послужил отправной точкой для создания мощных настольных компьютеров.Вообще говоря, в семействе микропроцессоров i486 предусматривается несколько новыхвозможностей для построения мультипроцессорных систем: соответствующие командыподдерживают механизм семафоров памяти, аппаратно — реализованное выявлениенедостоверности строки кэш-памяти обеспечивает согласованность междунесколькими модулями кэш-памяти и т.д. Для микропроцессоров семейства i486допускается адресация физической памяти размером 64 Тбайт
3.8. Intel OverDrive процессор.
Возможностьпостоянного совершенствования. Пользователи персональных компьютеров все чащесталкиваются с этим по мере все возрастающих требований к микропроцессорам состороны аппаратного и программного обеспечения. Фирма Intel уверена: лучшаястратегия совершенствования — первоначально заложенная в систему возможностьмодернизации, модернизации согласно вашим нуждам. Впервые в мире такаявозможность предоставляется нашим потребителям. Фирма Intel приступила квыпуску Intel OverDrive процессора, открывающего новую категорию мощныхсопроцессоров. После простой установки этого сопроцессора на плату резковырастет скорость работы всей системы и прикладных программ в MS-DOS, Windows,OS/2, Windows'95 и UNIX.
С помощью этойодной-единственной микросхемы Вы сразу же сможете воспользоватьсяпреимуществами новой стратегии фирмы Intel, заложенной в нашей продукции. Когданастанет неотвратимый момент, когда Вам потребуется производительность большая,чем у Вашего компьютера, то все, что Вам будет нужно — это вставить OverDriveпроцессор в Вашу систему — и пользоваться преимуществами, которые даст Вамновая микропроцессорная технология фирмы Intel. Более чем просто модернизация,OverDrive процессор — это стратегия защиты Ваших настоящих и будущих вкладов вперсональные компьютеры.
Intel OverDriveпроцессор гарантирует Вам отвечающую стандартам и экономичную модернизацию.Всего лишь одна микросхема увеличит вычислительную мощь Вашего компьютера дотребований самого современного программного обеспечения и даже тех программ,которые еще не написаны, в MS-DOS, в Windows, в PS/2, в UNIX, от AutoCAD — доWordPerfect.
Итак, наш первый микропроцессорв серии Single Chip Upgrade (Качественное улучшение — одной микросхемой) — этоOverDrive процессор для систем на основе Intel i486SX. Установленный вOverDrive – разъем, этот процессор позволяет системе i486SX использоватьновейшую технологию «удвоения скорости», используемую в процессореi486DX2, и дающую общее увеличение производительности до 70%. OverDriveпроцессор для систем i486SX содержит модуль операций над целыми числами, модульопераций над числами с плавающей точкой, модуль управления памятью и 8Ккэш-памяти на одном кристалле, работающем на частоте, в два раза превышающейтактовую частоту системной шины. Это уникальное свойство позволяет Вам удвоитьтактовую частоту Вашей системы, не тратясь на покупку и установку другихдополнительных компонентов. OverDrive процессор удвоит, например, внутреннюючастоту МП i486SX 25 МГц до 50 МГц.
Хотя Intel OverDrive- это совершенно новая технология качественной модернизации, в нем узнаются ифамильные черты Intel. Изготовленный и испытанный в соответствии с жесткимистандартами Intel, OverDrive отличается зарекомендовавшими себя свойствами продукцииIntel: качеством и надежностью. OverDrive обеспечен постоянной гарантией ипривычным сервисом и поддержкой во всем мире. OverDrive полностью совместимболее чем с 50000 прикладных программ. OverDrive процессор для i486SX — толькопервый из наших новых процессоров. Во втором полугодии 1992 года мы выпустимOverDrive процессор для систем i486DX2, самих по себе представляющих новоепоколение технологии МП. Мощный и доступный, OverDrive процессор проложит дляВас непрерывный путь к качественно новым уровням производительностиперсональных компьютеров.
Hекоторые результатылабораторных испытаний Intel OverDrive процессора:
1. Работа сMicrosoft Word for Windows 6.1 в среде Windows
3.0, популярным текстовым процессором.
Тест исполнялся насистеме с i486SX 20 МГц с файлом 330 КВ. WordPerfect, преобразованном в форматWindows Word, было выполнено 648 контекстных поисков и замен, проверкаправописания во всем файле, затем файл был сохранен.
Время исполнения:
i486SX без OverDrive =107 с
---------------------------- ВЫИГРЫШ= 57%
i486SX сOverDrive = 68 с
2. Работа с Lotus1-2-3 Release 3.0, электронной таблице, приближающейся по возможностям кинтегрированной среде, обладающей широким выбором аналитических, экономическихи статистических функций.
Тест исполнялся наi486SX 20 МГц с таблицей объемом 433К на 10000 ячеек, которая была загружена ипересчитана. Кроме того, был обработан большой блок текстовых данных.
Время исполнения:
i486SX без OverDrive=250 с
---------------------------- ВЫИГРЫШ= 481%
i486SX с OverDrive = 43 с
i486SX сi487SX = 72 с
---------------------------- ВЫИГРЫШ= 67%
i486SX c OverDrive = 43 c
3. Работа с AutoCAD, популярной системойСАПР.
Тест исполнялся наi486SX 20 МГц с трехмерным архитектурным чертежом, над которым выполнялисьоперации перечеркивания, панорамирования, масштабирования, удаления скрытыхлиний и повторной генерации файла во внешнем формате.
Время исполнения:
i486SX с i487SX = 162 с
---------------------------- ВЫИГРЫШ= 45%
i486SX c OverDrive = 112 c
А вот что говорят обOverDrive процессоре те, кому уже посчастливилось поработать с ним:
Брент Грэхэм:(специалист по автоматизации офисов, US Bank, Портленд) «С темивозможностями модернизации, которые предоставляет Intel 486, я не вижу причинне использовать OverDrive процессор. Что касается его установки в систему, то сэтим справится даже мой 10-летний сынишка.»
Билл Лодж: (руководитель проектной группы,
Corporation, Нью – Йорк) «Я работал сWindows и OS/2 в сети Banyan Wines, используя OverDrive процессор без единойзаминки. Моя усовершенствованная система с i486SX 25 МГц работает не хуже, чемсистемы на 50 МГц.»
Стив Симмонс: (технический менеджер,Даллас)
«Windows визжит от счастья, когдаработает с OverDrive процессором. Расчеты на электронной таблице в Excelвыполняются мгновенно.»
3.9. Процессор Pentium.
В то время, когдаВинод Дэм делал первые наброски, начав в июне 1989 года разработку Pentium процессора,он и не подозревал, что именно этот продукт будет одним из главных достиженийфирмы Intel. Как только выполнялся очередной этап проекта, сразу начиналсяпроцесс всеобъемлющего тестирования. Для тестирования была разработанаспециальная технология, позволившая имитировать функционирование Pentiumпроцессора с использованием программируемых устройств, объединенных на 14платах с помощью кабелей. Только когда были обнаружены все ошибки, процессорсмог работать в реальной системе. В дополнение ко всему, в процессе разработкии тестирования Pentium процессора принимали активное участие все основныеразработчики персональных компьютеров и программного обеспечения, что немалоспособствовало общему успеху проекта. В конце 1991 года, когда была завершенмакет процессора, инженеры смогли запустить на нем программное обеспечение.Проектировщики начали изучать под микроскопом разводку и прохождение сигналовпо подложке с целью оптимизации топологии и повышения эффективности работы.Проектирование в основном было завершено в феврале 1992 года. Началосьвсеобъемлющее тестирование опытной партии процессоров, в течение которогоиспытаниям подвергались все блоки и узлы. В апреле 1992 года было приняторешение, что пора начинать промышленное освоение Pentium процессора. В качествеосновной промышленной базы была выбрана 5 Орегонская фабрика. Более 3 миллионовтранзисторов были окончательно перенесены на шаблоны. Началось промышленноеосвоение производства и доводка технических характеристик, завершившиеся через10 месяцев, 22 марта 1993 года широкой презентацией Pentium процессора.
Объединяя более, чем3.1 миллион транзисторов на одной кремниевой подложке, 32-разрядный Pentiumпроцессор характеризуется высокой производительностью с тактовой частотой 60 и66 МГц. Его суперскалярная архитектура использует усовершенствованные способыпроектирования, которые позволяют выполнять более, чем одну команду за одинпериод тактовой частоты, в результате чего Pentium в состоянии выполнятьогромное количество PC-совместимого программного обеспечения быстрее, чемлюбой другой микропроцессор. Кроме существующих наработок программногообеспечения, высокопроизводительный арифметический блок с плавающей запятойPentium процессора обеспечивает увеличение вычислительной мощности донеобходимой для использования недоступных ранее технических и научныхприложений, первоначально предназначенных для платформ рабочих станций.
Многочисленные нововведения - характерная особенность
Pentium процессора в виде уникальногосочетания высокой производительности, совместимости, интеграции данных инаращиваемости. Это включает:
— Суперскалярную архитектуру;
— Раздельное кэширование программного кодаи данных;
— Блок предсказания правильного адресаперехода;
— Высокопроизводительный блок вычислений с плавающей запятой;
— Расширенную 64-битовую шину данных;
— Поддержку многопроцессорного режимаработы;
— Средства задания размера страницыпамяти;
— Средстваобнаружения ошибок и функциональной избыточности;
— Управление производительностью;
— Наращиваемость спомощью Intel OverDrive процессора. Cуперскалярная архитектураPentium процессора представляет
собой совместимую только с Intelдвухконвейерную индустриальную архитектуру, позволяющую процессору достигатьновых уровней производительности посредством выполнения более, чем однойкоманды за один период тактовой частоты. Термин «суперскалярная»обозначает микропроцессорную архитектуру, которая содержит более одноговычислительного блока. Эти вычислительные блоки, или конвейеры, являются узлами,где происходят все основные процессы обработки данных и команд.
Появлениесуперскалярной архитектуры Pentium процессора представляет собой естественноеразвитие предыдущего семейства процессоров с 32-битовой архитектурой фирмыIntel. Например, процессор Intel486 способен выполнять несколько своих командза один период тактовой частоты, однако предыдущие семейства процессоров фирмыIntel требовали множество циклов тактовой частоты для выполнения однойкоманды.
Возможностьвыполнять множество команд за один период тактовой частоты существуетблагодаря тому, что Pentium процессор имеет два конвейера, которые могутвыполнять две инструкции одновременно. Так же, как и Intel486 с однимконвейером, двойной конвейер Pentium процессора выполняет простую команду запять этапов: предварительная подготовка, первое декодирование ( декодированиекоманды ), второе декодирование ( генерация адреса ), выполнение и обратнаявыгрузка.
В результате этихархитектурных нововведений, по сравнению с предыдущими микропроцессорами,значительно большее количество команд может быть выполнено за одно и то жевремя.
Другое важнейшеереволюционное усовершенствование, реализованное в Pentium процессоре, этовведение раздельного кэширования. Кэширование увеличивает производительностьпосредством активизации места временного хранения для часто используемогопрограммного кода и данных, получаемых из быстрой памяти, заменяя повозможности обращение ко внешней системной памяти для некоторых команд.Процессор Intel486, например, содержит один 8-KB блок встроенной кэш-памяти,используемой одновременно для кэширования программного кода и данных.
Проектировщики фирмыIntel обошли это ограничение использованием дополнительного контура,выполненного на 3.1 миллионах транзисторов Pentium процессора ( для сравнения,Intel486 содержит 1.2 миллиона транзисторов ) создающих раздельное внутреннеекэширование программного кода и данных. Это улучшает производительность посредствомисключения конфликтов на шине и делает двойное кэширование доступным чаще, чемэто было возможно ранее. Например, во время фазы предварительной подготовки,используется код команды, полученный из КЭШа команд. В случае наличия одногоблока кэш-памяти, возможен конфликт между процессом предварительной подготовкикоманды и доступом к данным. Выполнение раздельного кэширования для команд иданных исключает такие конфликты, давая возможность обеим командам выполнятьсяодновременно. Кэш-память программного кода и данных Pentium процессора содержитпо 8 KB информации каждая, и каждая организована как набор двухканальногоассоциативного КЭШа — предназначенная для записи только предварительнопросмотренного специфицированного 32-байтного сегмента, причем быстрее, чемвнешний кэш. Все эти особенности расширения производительности потребовалииспользования 64-битовой внутренней шины данных, которая обеспечивает возможностьдвойного кэширования и суперскалярной конвейерной обработки одновременно сзагрузкой следующих данных. Кэш данных имеет два интерфейса, по одному для каждогоиз конвейеров, что позволяет ему обеспечивать данными две отдельные инструкциив течение одного машинного цикла. После того, как данные достаются из КЭШа,они записываются в главную память в режиме обратной записи. Такая техника кэшированиядает лучшую производительность, чем простое кэширование с непосредственнойзаписью, при котором процессор записывает данные одновременно в кэш и основнуюпамять. Тем не менее, Pentium процессор способен динамически конфигурироватьсядля поддержки кэширования с непосредственной записью.
Таким образом,кэширование данных использует два различных великолепных решения: кэш собратной записью и алгоритм, названный MESI (модификация, исключение,распределение, освобождение) протокол. Кэш с обратной записью позволяет записыватьв кэш без обращения к основной памяти в отличие от используемого до этогонепосредственного простого кэширования. Эти решения увеличивают производительностьпосредством использования преобразованной шины и предупредительного исключениясамого узкого места в системе. В свою очередь MESI-протокол позволяет данным вкэш-памяти и внешней памяти совпадать — великолепное решение вусовершенствованных мультипроцессорных системах, где различные процессорымогут использовать для работы одни и те же данные.
Блок предсказанияправильного адреса перехода — это следующее великолепное решение длявычислений, увеличивающее производительность посредством полного заполненияконвейеров командами, основанное на предварительном определении правильногонабора команд, которые должны быть выполнены.
Pentium процессорпозволяет выполнять математические вычисления на более высоком уровнеблагодаря использованию усовершенствованного встроенного блока вычислений сплавающей запятой, который включает восьмитактовый конвейер и аппаратнореализованные основные математические функции. Четырехтактовые конвейерныекоманды вычислений с плавающей запятой дополняют четырехтактовую целочисленнуюконвейеризацию. Большая часть команд вычислений с плавающей запятой могут выполнятьсяв одном целочисленном конвейере, после чего подаются в конвейер вычислений сплавающей запятой. Обычные функции вычислений с плавающей запятой, такие каксложение, умножение и деление, реализованы аппаратно с целью ускорениявычислений.
В результате этихинноваций, Pentium процессор выполняет команды вычислений с плавающей запятойв пять раз быстрее, чем 33-МГц Intel486 DX, оптимизируя их для высокоскоростныхчисленных вычислений, являющихся неотъемлемой частью таких усовершенствованныхвидеоприложений, как CAD и 3D-графика.
Pentium процессорснаружи представляет собой 32-битовое устройство. Внешняя шина данных к памятиявляется 64-битовой, удваивая количество данных, передаваемых в течение одногошинного цикла. Pentium процессор поддерживает несколько типов шинных циклов,включая пакетный режим, в течение которого происходит порция данных из 256 битв кэш данных и в течение одного шинного цикла.
Шина данных являетсяглавной магистралью, которая передает информацию между процессором и подсистемойпамяти. Благодаря этой 64-битовой шине данных, Pentium процессор существенноповышает скорость передачи по сравнению с процессором Intel486 DX — 528 MB/секдля 66 МГц, по сравнению со 160 MB/сек для 50 МГц процессора Intel486 DX. Этарасширенная шина данных способствует высокоскоростным вычислениям благодаряподдержке одновременной подпитки командами и данными процессорного блокасуперскалярных вычислений, благодаря чему достигается еще большая общаяпроизводительность Pentium процессора по сравнению с процессором Intel486 DX.
Давая возможностьразработчикам проектировать системы с управлением энергопотреблением, защитойи другими свойствами, Pentium процессор поддерживаем режим управления системой(SMM), подобный режиму архитектуры Intel SL.
Вместе со всем, чтосделано нового для 32-битовой микропроцессорной архитектуры фирмы Intel,Pentium процессор сконструирован для легкой наращиваемости с использованиемархитектуры наращивания фирмы Intel. Эти нововведения защищают инвестициипользователей посредством наращивания производительности, которая помогаетподдерживать уровень продуктивности систем, основанных на архитектуре процессоровфирмы Intel, больше, чем продолжительность жизни отдельных компонентов.Технология наращивания делает возможным использовать преимущества большинствапроцессоров усовершенствованной технологи в уже существующих системах с помощьюпростой инсталляции средства однокристального наращивания производительности.Например, первое средство наращивания — это OverDrive процессор, разработанныйдля процессоров Intel486 SX и Intel486 DX, использующий технологию простогоудвоения тактовой частоты, использованную при разработке микропроцессоровIntel486 DX2.
Первые модели процессора Pentium работали на частоте60 и 66 МГц и общались со своей внешней кэш-памятью второго уровня по 64-битовойшине данных, работающей на полной скорости процессорного ядра. Hо если скоростьпроцессора Pentium растет, то системному разработчику все труднее и дорожеобходится его согласование с материнской платой. Поэтому быстрые процессорыPentium используют делитель частоты для синхронизации внешней шины с помощьюменьшей частоты. Hапример, у 100 МГц процессора Pentium внешняя шина работаетна 66 МГц, а у 90 МГц — на 60 МГц. Процессор Pentium использует одну и ту жешину для доступа к основной памяти и к периферийным подсистемам, таким каксхемы PCI.
3.10. ПроцессорPentium Pro.
3.10.1. Общее описание процессора.
Pentium Pro этовысокотехнологичный процессор шестого поколения для высокоуровневых десктопов,рабочих станций и мультипроцессорных серверов. Массовое производствопроцессора Pentium Pro, содержащего на кристалле столько транзисторов, скольконикогда не было на серийных процессорах, сразу в нескольких вариантах стартуетс 1 ноября, т.е. с самого момента объявления. Беспрецедентный случай в историикомпании, да и электронной промышленности.
Hапомним некоторыеего особенности. Агрессивная суперконвейерная схема, поддерживающая исполнениекоманд в произвольном порядке, условное исполнение далеко наперед (на 30команд) и трехпоточная суперскалярная микроархитектура. Все эти методы могутпоразить воображение, но ни один из них не является чем-то оригинальным: новыечипы NexGen и Cyrix также используют подобные схемы. Однако, Intel обладаетключевым превосходством. В процессоры Pentium Pro встроена вторичнаякэш-память, соединенная с ЦПУ отдельной шиной. Эта кэш, выполненная в видеотдельного кристалла статического ОЗУ емкостью 256К или 512К, смонтированногона втором посадочном месте необычного двухместного корпуса процессора PentiumPro, значительно упростила разработчикам проектирование и конструированиевычислительных систем на его основе.
Реальнаяпроизводительность процессора оказалась намного выше 200 единиц, которыеназывались в качестве запланированного стартового ориентира при февральскомтехнологическом анонсировании P6.
Pentium Pro это значительный шаг вперед. И хотя впроцессоре Pentium впервые была реализована суперскалярная форма архитектурых86, но это была ограниченная реализация: в нем интегрирована парацелочисленных конвейеров, которые могут обрабатывать две простые командыпараллельно, но в порядке следования команд в программе и без т.н. условногоисполнения (наперед). Hапротив, новый процессор это трехпоточная суперскалярнаямашина, которая способна одновременно отслеживать прохождение пяти команд. Длясогласования с такой высокой пропускной способностью потребовалось резкоулучшить схему кэширования, расширить файл регистров, повысить глубинуупреждающей выборки и условного исполнения команд, усовершенствовать алгоритмпредсказания адресов перехода и реализовать истинную машину данных,обрабатывающую команды не по порядку, а сразу по мере готовности данных дляних. Ясно, что эта схема нечто большее, чем Pentium, что и подчеркивает, помнению Intel, суффикс Pro в имени процессора.
3.10.2. Два кристалла в одном корпусе.
Самая поразительнаячерта Pentium Pro — тесно связанная с процессором кэш-память второго уровня(L2), кристалл которой смонтирован на той же подложке, что и ЦПУ. Именно так,Pentium Pro это два чипа в одном корпусе. Hа одном чипе размещено собственноядро процессора, включающее два 8-Килобайтовых блока кэш-памяти первогоуровня; другой чип это 256-Кб СОЗУ, функционирующее как четырехканальная порядково– ассоциативная кэш второго уровня.
Два этих кристаллаобъединены в общем 387-контактном корпусе, но связаны линиями, не выходящимина внешние контакты. Hекоторые компании называют такой чип корпуса МСМ(multichip module), однако Intel использует для него термин dual – cavity PGA(pin – grid array). Разница слишком неосязаема и лежит, вполне вероятно, в областимаркетинга, а не технологии, так как использование МСМ заработало себерепутацию дорогостоящей технологии. Но, сравнивая цены на процессоры Pentium иPentium Pro, можно утверждать, что новая терминология исправит положение дел,так как P6 претендует на статус массового процессора. Впервые в историипромышленности многокристальный модуль станет крупносерийным изделием.
Степень интеграции новогопроцессора также поражает: он содержит 5.5 млн. транзисторов, да еще 15.5 млн.входит в состав кристалла кэш-памяти. Для сравнения, последняя версияпроцессора Pentium состоит из 3.3 млн. транзисторов. Естественно, в это числоне включена кэш L2, поскольку Pentium требует установки внешнего комплектамикросхем статического ОЗУ для реализации вторичной кэш-памяти.
Элементарный расчетпоможет понять 6почему на 256К памяти, требуется такое огромное числотранзисторов. Это статическое ОЗУ, которое в отличие от динамического, имеющеговсего один транзистор на бит хранения и периодически регенерируемого,использует для хранения бита ячейку из шести транзисторов:
256 x 1024 х 8 бит х6 пр – ров = 12.5 млн. транзисторов. С учетом буферов и обвязки накопителя какраз и выйдет 15.5 миллионов.
Площадьпроцессорного кристалла равна 306 кв. мм. (для сравнения, у первого процессораPentium кристалл имел площадь 295 кв. мм). Кристалл статической памяти, каквсякая регулярная структура, упакован намного плотнее — 202 кв. мм. ТолькоPentium Pro 150 MHz изготавливается по 0.6-микронной технологии. Все остальныеверсии нового процессора изготавливаются по 0.35-микронной BiCMOS-технологии счетырехслойной металлизацией.
Почему компанияIntel пошла на двухкристалльный корпус, объединив ядро ЦПУ с вторичным КЭШем?Во – первых комбинированный корпус значительно упростил изготовителям ПКразработку высокопроизводительных систем на процессоре Pentium Pro.
Одна из главныхпроблем при проектировании компьютера на быстром процессоре связана с точнымсогласованием с процессором вторичного КЭШа по его размеру и конфигурации.Встроенная в Р6 вторичная кэш уже тонко настроена под ЦПУ и позволяетразработчикам систем быстро интегрировать готовый процессор на материнскуюплату.
Во-вторых, вторичнаякэш тесно связана с ядром ЦПУ с помощью выделенной шины шириной 64 бита,работающей на одинаковой с ним частоте. Если ядро синхронизируется частотой 150МГц, то кэш должна работать на частоте 150 МГц.
Поскольку впроцессоре Pentium Pro есть выделенная шина для вторичного КЭШа, это решаетсразу две проблемы: обеспечивается синхронная работа двух устройств на полнойскорости и отсутствие конкуренции за шину с прочими операциями ввода-вывода.Отдельная шина L2, «задняя» шина полностью отделена от наружной,«передней» шины ввода-вывода, вот почему в P6 вторичная кэш не мешаетсвоими циклами операциям с ОЗУ и периферией. Передняя 64-битовая шина может работатьс частотой, равной половине, трети или четверти скорости ядра Pentium Pro.«Задняя» шина продолжает работать независимо, на полной скорости.
Такая реализацияпредставляет серьезный шаг вперед по сравнению с организацией шины процессораpentium и других процессоров х86. Только NexGen приближенно напоминает такуюсхему. Хотя в процессоре Nx586 нет КЭШа L2, зато встроен ее контроллер иполноскоростная шина для связи с внешней кэш-памятью. Подобно Р6, процессорNx586 общается с основной памятью и периферийными подсистемами поверхотдельной шины ввода-вывода, работающей на деленной частоте.
В экзотическомпроцессором Alpha 21164 компания Digital пошла еще дальше, интегрировав прямона кристалле в дополнение к первичной кэш-памяти еще и 96 Кбайт вторичной. Засчет вздувания площади кристалла достигнута беспрецедентная производительностькэширования. Транзисторный бюджет Альфы составляет 9.3 миллиона транзисторов,большая часть которого образована массивом памяти.
Есть одна незадача:необычный дизайн Pentium Pro, пожалуй, затруднит экспертам задачку вычислениясоотношения цены и производительности. Интегрированная в процессор кэш вродекак скрыта с глаз. Pentium Pro сможет показаться более дорогим, чем егоконкуренты, но для создания компьютера на других процессорах потребуетсявнешний набор микросхем памяти и кэш-контроллер. Эффективный дизайнкэш-структуры означает, что другим процессорам, претендующим на сопоставимуюпроизводительность, потребуется кэш-памяти больше, чем 256 Кбайт.
Уникальный корпуспредоставляет свободу созданию новых вариантов процессора. В будущем возможнокак повышение объема кэш-памяти, так и ее отделение ее от процессора всоответствии с традиционным подходом. Если последний вариант появится, онокажется, несовместим по внешним выводам с двухкристалльным базовым корпусом,так как ему необходимо добавить 72 дополнительных вывода (64-для«задней» шины и 8 для контроля ошибок). Hо он будет почти таким жебыстрым, если будет широко доступна статическая память с пакетным режимом. Помнению инженеров Intel, подключение внешних микросхем памяти к «передней»шине Pentium Pro с целью реализации кэш-памяти третьего уровня, вряд лиоправдано. Отправной точкой для такой убежденности служат результаты натурногомоделирования прототипа системы, которая в следствии высокой эффективностиинтерфейса кэш L2-процессор, практически до теоретического предела загружаетвычислительные ресурсы ядра. Процессор Alpha 21164, напротив, спроектирован сучетом необходимости кэш L3.
3.10.3. Значения тестов для некоторых чипов фирмыIntel.
Processor
Benchmarks
Intel
Pentium
Pro
Processor
(200MHz)
Intel
Pentium
Pro
Processor
(180MHz)
Intel
Pentium
Pro
Processor
(166MHz)
w/512K L2
Intel
Pentium
Pro
Processor
(150MHz)
Intel
Pentium
Processor
(133MHz)
UNIXSPEC95
SPECint95
SPECint_base95
SPECfp95
SPECfp_base95
8.09
8.09
6.75
5.99
7.29
7.29
6.08
5.40
7.11
7.11
6.21
5.47
6.08
6.08
5.42
4.76
4.14
4.14
3.12
2.48
SPEC92
SPECint92
SPECint_base92
SPECfp92
SPECfp_base92
366.0
336.7
283.2
234.3
327.4
3.5.8
254.6
210.4
327.1
306.6
261.3
209.6
276.3
258.3
220.0
182.0
190.9
175.9
120.6
107.3
WindowsNorton System Index
SI32
86.7 77.6Not
tested
67.0 34.2Ziff-Davis
CPUmark32
541 466Not
tested
412 2784. Процессоры конкурентов Intel.
4.1. Первые процессоры конкурентов Intel.
Intel была неединственной фирмой — производителем микропроцессоров: существовали еще MOSTechnologies, Mostek, Motorola, Rockwell, Standart Microsystems Corporation,Synertek, Texas Instruments. Одни из них использовали свои собственные проектычипов, другие — лицензионные проекты своих конкурентов. Успешнее всех в конце70-х работала фирма Zilog. Она создала чип Z80.
В то время, когдакомпьютеры, работающие под управлением СР/М, распространились в офисах,компьютеры Apple II буквально ворвались в школы. Фирма Apple в качествеосновного компонента своего компьютера выбрала чип фирмы MOS Technologies 6502.Это был лицензионный чип фирмы Rockwell and Synertek. Apple началаиспользовать процессоры Motorola во всех своих компьютерах Macintosh.Разработки фирм Intel и Motorola появились почти одновременно, но объединяет ихне только это. Микропроцессоры Intel 80486 и Motorola 68040, например, почтиодинаковы по сложности и имеют функциональные сходные возможности. Тем неменее, они совершенно несовместимы. Именно поэтому на Macintosh и PC не могутвыполняться одни и те же программы.
Существуетпринципиальное отличие в эволюционном развитии этих двух семействмикропроцессоров. Intel начала с довольно незначительного по нашим современныммеркам адресного пространства в 1 Мбайт и постоянно наращивала его до нынешнегоразмера в 4 Гбайт. Motorola в своей серии 680x0 всегда имела адресноепространство в 4 Гбайт. IBM поместила чипы ROM в адресное пространство своих PCкак можно выше. И не ее ошибка была в том, что позже Intel достроила«второй этаж» и таким образом оставила ROM в конструкциях IBM где-топосередине, открыв дорогу использованию RAM, что само по себе, может быть, ине плохо. Разработчики семейства чипов 680х0 никогда не испытывали подобныхнеудобств, и поэтому очень много программистов считают, что Mac лучше.
Intel приложилазначительные усилия, пытаясь стандартизовать производство ее процессоров 8086и 8088 на предприятиях-подрядчиках. Hесколько предприятий приняло такиесоглашения. Однако Haris выпустил свои чипы — аналоги 8086 и 8088, которыеменее всего удовлетворяли этим принятым соглашениям. Он использовал технологиюCMOS, значительно сокращающую потребление электроэнергии, и это свойствосделало его чипы очень популярными, особенно среди производителей ПК с экранамина жидких кристаллах.
Фирма NEC предложиласвою так называемую V-серию чипов и объявила, что чип V20 являетсяконструктивно совместимым с чипом Intel 8088, но имеет усовершенствованныйнабор инструкций, включая при этом и инструкции чипа 8080. Это означало, что онмог легко выполнять программы, написанные для CP/M, без их модификации, используяэмулятор программ, и при этом включать преимущества инструкций 8080,содержащихся в чипе V20. Их чип V30 был аналогом 8086 с включеннымидополнительными возможностями.
Чипы V-серии фирмы NEC также работали немного быстрееаналогичных чипов фирмы Intel. Эти чипы имели некоторый успех, чем былараздосадована Intel. Последняя подала в суд на NEC по факту нарушения закона озащите авторских прав. NEC подала ответный иск. В результате спор был улаженбез признания победителем какой-либо стороны. Интересными были детали этогосудебного разбирательства. Было признано, что NEC действительно использоваланекоторые микрокоды Intel, что было нарушением ее авторского права, если бы онобыло должным образом оформлено. Hо поскольку Intel производила и продаваланекоторые чипы 8088 без знака авторского права, то их претензии были признаныбезосновательными. Компания Chips and Technology, которая стала известнаблагодаря выпуску аналогов BIOS, в настоящее время внедрила линию попроизводству процессорных чипов. Hа ней выпускаются аналоги 386. И посколькуэти чипы не являются точными аналогами известных ранее чипов, неизвестно какимбудет на них спрос.
4.2. Процессоры фирмы AMD.
4.2.1. Судебное разбирательство с Intel.
Фирма AMD былалицензионным производителем Intel, производящей 80286. AMD объявила, что ееконтракт с Intel позволяет им выпускать легализованные копии чипов 386. Intelкатегорически не согласилась с этим. AMD удалось выиграть это судебноеразбирательство, и теперь она выпускает аналог чипа 386 с тактовой частотой 40МГц. Этот чип имел определенный успех, в частности, из-за его более высокойскорости по сравнению с самым быстродействующим чипом серии Intel 386. Привыпуске фирмой AMD аналогов 486 фирма Intel снова попыталась остановитьконкурента. Однако и в этом случае закон был на стороне AMD.
4.2.2. Процессоры семейства AMD5k86.
Наладив в 1994 годумассовое производство чипов 5-го поколения — микропроцессоров Pentium,корпорация Intel мощно пошла в отрыв. Интеллектуальная колоссальная мощь ееинженеров, помноженная на богатейшие производственные возможности, казалось, неоставляла никаких шансов конкурентам. между тем вдогонку за лидером бросилосьсразу несколько преследователей. Среди них, пожалуй, именно компания AMD имеласамую «удачную» стартовую позицию. Компания Advanced Micro Devicesзанимала второе место в мире по производству микропроцессоров. На сегодняшнийдень общее число чипов, выпущенных фирмой AMD, перевалило далеко за отметку 85миллионов, что, согласитесь, само по себе говорит об огромном потенциалекомпании.
Цифра «5»для фирмы AMD была явно несчастливой. Intel Pentium все наращивал обороты: 66,75, 90 Мгц… Тактовая частота новых моделей увеличивалась едва ли не каждыймесяц. А разработчикам компании AMD, кроме названия — «K5»,представлять было решительно нечего. Ожидание становилось тягостным.
Гнетущее ощущениенесбывшихся надежд скрасил выпуск процессора Am5x86. Нет, чип Am5x86 не былобещанным К5. Микропроцессор представлял собой «четверку» с большимивозможностями, которые однако, явно не дотягивали до «честного»Pentium. В прессе распространялись мнения специалистов, вроде:«Производительность, сравнимая с производительностью Pentium, позволяетотнести микропроцессор Am5x86 к устройствам пятого поколения».
А между тем,оставаясь по своей сути (по внутренней архитектуре) до боли знакомым 486-м,чип Am5x86, имеющий тактовую частоту 133 МГц, мог соперничать на равных лишь соскромным по своим возможностям процессором Pentium/75 МГц. Интересно, какойдолжна была бы быть тактовая частота Am5x86, чтобы показать производительность,сравнимую с Pentium/166 МГц!
Поэтому созданиечипа пятого поколения у компании Advanced Micro Devices было еще впереди. Припроектировании своих предыдущих процессоров компания опиралась на неизменнуюподдержку корпорации Intel. Но к началу разработки собственного процессорапятого поколения срок действия лицензионных соглашений с корпорацией Intelподошел к концу. Так что инженерам AMD пришлось начать разработку, чтоназывается, с чистого листа. В частности, вышла промашка при проектированиивстроенного КЭШа команд. Наборы команд для процессоров разных поколенийсущественно отличаются. Инженеры-разработчики компании AMD немного просчиталисьв оценке числа CISC-инструкций, имеющих различную длину. В результате, неудавалось достичь проектируемого уровня производительности при исполнениипрограмм, оптимизированных под процессор Pentium. Но спустя некоторое время иэта, и некоторые другие ошибки были устранены. И в конце марта 1996 года компанияAMD с гордостью объявила о появлении на свет нового процессора пятогопоколения — AMD5k86.
4.2.2.1 Экскурсия по внутренней архитектуре.
Процессор AMD5k86,известный на стадии разработки как AMD-K5 или Krypton, является первым членомсуперскалярного семейства (Superscalar family) K86. Он соединяет в себе высокуюпроизводительность и полную совместимость с операционной системой MicrosoftWindows.
СуперскалярныйRISC-процессор AMD5k86 выполнен по 0ю35-микронной КМОП – технологии(complimentary metal – oxid semiconductor process) и состоит из 4.3 млн.транзисторов. Его дизайн базируется на богатой истории и обширном опытеархитектур RISC и х86.
По мнению многихспециалистов, разработчики чипа AMD5k85 пошли значительно дальшепервоначального замысла: создать процессор, имеющий RISC-ядро, и при этомсовместимый с набором инструкций х86 означает совместимость с операционнымисистемами Microsoft Windows и всем ПО, написанным под архитектуру х86. Стольсчастливое сочетание высочайшей производительности и полной совместимости сMicrosoft Windows делает чип AMD5k86 полноправным членом 5-го поколения микропроцессоров.
МикропроцессорAMD5k86 имеет 4-потоковое суперскалярное ядро и осуществляет полноепереупорядочивание выполнения инструкций (full out – of – order execution).Чип AMDk586 унаследовал лучшие черты от двух доминирующих на сегодняшний деньмикропроцессорных ветвей: семейства х86 и суперскалярных RISC-процессоров. Отпервых он унаследовал столь необходимую для успешного продвижения накомпьютерном рынке совместимость с операционной системой WINDOWS. От семействасуперскалярных RISC-процессоров он унаследовал высочайший уровеньпроизводительности, характерный для чипов, применявшихся в рабочих станциях.
Разработанныйинженерами компании AMD процесс предварительного декодирования позволяетпреодолеть присущие архитектуре х86 ограничения (различная длина инструкций). Вслучае использования инструкций различной длины, чипы 4-го поколения могутодновременно обрабатывать 1 команду, процессоры 5-го поколения (Pentium) — 2команды. И только микропроцессор AMD5k86 способен обрабатывать до 4 инструкцийза такт.
Использованиераздельного КЭШа инструкций и данных (объем КЭШа инструкций в два разапревосходит объем КЭШа данных) исключает возникновение возможных внутреннихконфликтов.
Сейчас выпускаютсямикропроцессоры AMD5k86-P75, AMD5k86-P90 и AMD5k86-P100 производительностькоторых (Р. — рейтинг) соответствует процессору Pentium с тактовыми частотами75, 90 и 100 МГц.
Компания AdvancedMicro Devices планирует выпустить в этом (1996) году 3 млн. процессоровсемейства AMD5k86 со значениями Р. — рейтинга от 75 до 166. Цены на новыепроцессоры будут сопоставимы с ценами обладающих аналогичной производительностьюпроцессоров Pentium, вероятно, даже несколько ниже. Средняя цена процессораAMD5k86-P75 составляет около $75, чипа AMD5k86-P90 — $99.
Характеристики микропроцессора AMD5k86:
— 4-потоковоесуперскалярное ядро с 6-ю параллельно работающими исполнительнымиустройствами, составляющими 5-ступенчатый конвейер;
— 4-потоковыйассоциативный кэш команд с линейной адресацией объемом 16 Кб;
— 4-потоковыйассоциативный кэш данных с обратной записью и линейной адресацией объемом 8Кб;
— полное переупорядочиваниевыполнения инструкций, предварительное (speculative) исполнение;
— динамический кэшпредсказания переходов объемом 1 Кб; в случае неправильного предсказаниязадержка составляет менее 3 внутренних тактов;
— 80-разрядноеинтегрированное, высокопроизводительное устройство выполнения операций сплавающей запятой, обладающее небольшим временем задержки при выполненииопераций +/*;
— питающеенапряжение — 3В, система SSM (System Management Mode) для уменьшенияпотребляемой мощности;
— 64-разрядная шинаи системный интерфейс помещены в 296-контакный корпус SPGA, совместимый повыводам с процессором Pentium (P54C) и процессорным гнездом Socket-7;
— полнаясовместимость с Microsoft Windows и инсталлированной базой ПО для процессоровархитектуры х86.
4.2.2.2. Пример маркировки микропроцессораAMD5k86-P75.
---------------------------------------------
| #### ### ### ###### ----------- |\
| ## ## ## ### ## ## ## `\------| |\
| ###### ## # ## ## ## /| || |\
| ## ## ## ## ###### | ----,|| |\
| ----/ \| |\
1 -------------------- |\
2 — AMD5k86тм-Р75 |\
3 ------------------------ |\
4 — AMD-SSA/5-75ABQ |\
| E <datecode> | Designedfor |\
5 ----------------------- /\/------- |\
| (m) (c)1996AMD /\/------- |\
| /\/------- |\
| Microsoft |\
6 — HEAT SINK ---------- |\
\ AND FAN REQ'D Windows95 тм |\
\ |\
`------------------------------------------\
\ \ \ \ \ \ \ \ \ \ \ \\ \ \ \ \ \ \ \ \ \
Обозначения:
1. P-рейтинг 5.Питающее напряжение
2. Название B=3.45- 3.60B
3. Температура корпуса C=3.30- 3.465B
W=55C R=70C F=3.135- 3.465B
Q=60C Y=75C H=2.76- 3.0B
X=65C Z=85C J=2.57- 2.84B
4. Серийный номер K=2.38- 2.63B
6. Температурный режим
4.2.2.3. Тесты.
Система Р –рейтингов измерения производительности процессоров была предложена в начале1996 года компаниями AMD, Cyrix, IBM и SGS – Thomson Microelectronics.P-рейтинг составляется, по результатам проведения эталонного теста Winstone96, разработанного издательством Ziff – Davis Этот тест представляет собойнабор из 13 наиболее часто применяемых приложений, таких как Microsoft Word иExel.
Следует заметить,что в отличие от системы тестов iComp, которой пользуется корпорация intel дляоценки производительности своих микропроцессоров, тестовый набор Winstone 96является общедоступным.
В своем новом чипеAMD5k86 компания AMD воплотила поистине новаторское сочетание набора инструкцийх86 и суперскалярной RISC-архитектуры (reduced instruction set computingarchitecture). Как утверждают некоторые специалисты AMD, благодаря такомурешению микропроцессор AMD5k86 обеспечивает на 30% большую производительность,чем процессор Pentium с такой же тактовой частотой. Впрочем, результатытестирования с использованием пакета тестов Winstone 96 компании Ziff – Davisпоказывают, что преимущество несколько скромнее.
Тестовая конфигурация:
Материнская плата
Чипсет
ОЗУ
Кэш-память L2
Видеоплата (640х480х256)
Видеодрайвер
Жесткий диск
FIC PA2002
VIA Apollo Master
EDO DRAM объемом 16 Мб
256 Кб
PCI Diamond Stealth64 3200
Diamond GT 4.02.00.218 for Windows 95 EIDE Quantum Fireball емкостью 1.2 Гб
AMD5k85-P75 CPU (index 48.8)
Pentium 75 (index 47.4)
AMD5k85-P90 CPU (index 56.7)
Pentium 90 (index 54.9)
4.2.2.4. Материнскиеплаты для AMD5k86.
Список широко распространенных системныхплат, протестированных в лабораториях компании AMD и
рекомендованных для установки процессораAMD5k86.
Производитель Модель Чипсет BIOS Abit PH5 1.3 SiS 551 Award Pentium PCI Sys BIOS (N35) Abit PH5 2.1 Intel Triton Award Pentium PCI Sys BIOS (C4) Atrend ATC1000 Intel Triton Award i430-2A59CA29C-00 Atrend ATC1545 A1 OPTi ViperAward OPTi Viper
ATS-1545 ver. 0.6.
Biostar 8500TAC A1 Intel Triton AMI 1993 ECS TR5510 Intel Triton Award i430FX-2A59CE1NC-00 ECS AIO Intel Triton Award i430FX-2A59CE1NC-00 FIC PA2002 1.21 VIA 570 Award 4.052G800 Gigabyte GA586ATS 1B Intel Triton Award Intel 430FX PCI-ISA v.1.26 Hsingtech M507 1.1 Intel Triton Award 2/1/1996x Mycomp (TMC) PCI54ITS 2.00 Intel Triton Award i430FX-2A59CM29C-00 Замечание: ранние версии указанных системных плат нуждаются в замене BIOS на более новую версию, правильно распознающую чип AMD5k86
4.2.2.5. AMD планирует выпустить K5.
Репутация AMD сильнозависит от успешности затянувшегося проекта К5-первой самостоятельной пробыархитектурных сил в области х86. Рождение К5 опасно откладывается уже не первыйраз. В первом квартале следующего года AMD планирует перевод K5 на технологическийпроцесс с проектными нормами 0.35 мкм и с трехуровневой металлизацией, разработанныйпри содействии с HР и запускаемый на новом заводе AMD Fab 25 в Остине, штатТехас. Это позволит уменьшить К5 с
4.2 миллионами транзисторов до 167 кв. мми поднять процент выхода годных, а также тактовую частоту.
По мнению руководства AMD в 1996 году объем выпуска К5будет наращиваться достаточно быстро, что позволит отгрузить до конца годаболее пяти миллионов процессоров. Ответом на вызов Intel с ее процессоромPentium Pro может стать только процессор К6, но уже никто не верит, что егоудастся увидеть раньше 1997 года. Hесмотря на всемирный переход на процессорPentium, в следующем году еще могут сохраниться некоторые рынки для 486-х.Эксперты считают, что потребность таких региональных рынков, как Китай, Индия,Россия, Восточная Европа и Африка, в 486-х чипах составит до 20 миллионовпроцессоров в 1996 году. AMD рассчитывает, что именно ей удастся поставитьбольшую часть от этого количества. Поэтому компания повышает тактовую частоту486-х до 133 Мгц, чтобы конкурировать с низшими версиями процессора Pentium внастольных ПК начального уровня. Однако, AMD будет усиленно наращивать выпускК5, поскольку 486-е быстро выходят из моды.
4.3. Процессоры NexGen.
В то время: каккомпания Intel готовила отрасль к шокирующему выходу в жизнь серийных моделейсерверов и настольных машин на Pentium Pro, фирма NexGen представляла форумусвои планы по разработке процессора Nx686. Этот суперскалярный х86-совместимыйпроцессор, к разработке которого подключается еще и команда архитекторов изAMD, снятых с собственного неудачного проекта К6, будет содержать около 6 млн.транзисторов, включая вычислитель с плавающей точкой на одном кристалле спроцессором (отказ от предыдущего двухкристалльного подхода, ослабившегоNx586). Технология КМОП с проектными нормами 0,35 мкм и пятислойнойметаллизацией позволила «упаковать» на одном кристалле семьисполнительных узлов: два для целочисленных, один для операций с плавающейточкой, по одному для обработки мультимедиа, команд переходов, команд загрузкии команд записи. Показатели производительности представители NexGen назвать несмогли, но выразили предположение, что он превзойдет Pentium Pro на 16-разрядныхпрограммах вдвое, а на 32-битовых — на 33 %.
До сих пор мало чтоизвестно про Nx686, так как чип еще не анонсировался и NexGen не хочетраскрывать козыри перед конкурентами в лице AMD, Cyrix и Intel. Однако, NexGenне хочет раскрывать козыри перед конкурентами в лице AMD, Cyrix и Intel.Однако, NexGen настаивает о том, что Nx686 по производительности сопоставим с интеловскимPentium Pro и AMD K5, и наследует микроархитектуру Nx586, появившуюся в 1994году. NexGen называет ее RISC86. Базовая ее идея, как и в случае с Pentium Proи K5, состоит в преобразовании сложных CISC-команд программного обеспечения x86в RISC-подобные операции, исполняемые параллельно в процессорном ядреRISC-типа. Этот подход, известный под названием несвязанной микроархитектуры,позволяет обогатить CISC-процессор новейшими достижениями RISC-архитектур исохранить совместимость с имеющимся ПО для х86.
В Nx686 этафилософия продвинута на новый логический уровень. Сегодня в Nx586 имеется триисполнительных блока, трехконвейерное суперскалярное ядро. Он способенвыполнять в каждом такте по одной команде х86. Возможности длясовершенствования очевидны: Nx586 будет содержать пять исполнительных блоков,четыре конвейера и несколько декодеров, способных справиться с выполнениемдвух или даже более команд х86 за один машинный такт. Для этого потребуетсявстроить дополнительные регистры переименования и очереди команд.
Подход киспользованию интегрированного кэш-контроллера и интерфейса для скоростнойкэш-памяти остается неизменным. Представители NexGen говорят, что они изучаютвозможность использования кристалла вторичной кэш-памяти по образцу и подобиюIntel, тем более что их производственный партнер IBM Microelectronics способенделать статическую память и многокристальные сборки (MCM — multichip modules).
Пример практическойреализации технологии МСМ фирмы IBM представляет новая версия процессора Nx586,запланированная к выпуску на конец этого года и включающая кристалл CPU и FPUв одном корпусе. Одновременное перепроектирование топологии с масштабированиемдо размера линии 0.35 микрон позволит компании NexGen основательно уменьшитьразмеры кристалла ЦПУ — до 118 кв. мм — меньше в этом классе ничего нет.
NexGen, новичок в группе производителей процессоровх86. Nx596 может параллельно обрабатывать на нескольких исполнительных блокахдо четырех простейших операций, которые названы командами RISC86. Процессор К5имеет похожий четырехпоточный дешифратор, но результаты его работы компанияназывает R – ops.
4.4. Процессоры Cyrix.
Первая вещь из грандиозного проекта М1 компании Cyrix,наконец обнародована. Это процессор Сх 6х86-100, монстроподобный кристаллкоторого сложен и очень дорог для того, чтобы претендовать на массовый выпуск втечении длительного срока. Его проблемы сможет решить процессор, который покаимеет кодовое название M1rx и опирающийся на техно процесс с пятислойнойметаллизацией, идущий на смену трехслойной версии той же 0.6-мкм технологии.Если проект увенчается успехом, то размер кристалла с 394 кв. мм уменьшится до225 кв. мм, тогда у Cyrix появится шанс поднять тактовую частоту до 120 МГц. Вэтом случае эксперты предсказывают ему производительность в пределах 176-203по тесту SPECint92, т.е. на уровне процессора Pentium 133 (SPECint92=190.9) или150 МГц. Если все обещания сбудутся, то Cyrix сможет продать столькопроцессоров, сколько произведет. Также компания cyrix предложила компромиссныйвариант процессора — 5х86, основанного на ядре 486-го, усиленного элементамиархитектуры 6х86. Стартовая версия этого гибрида будет совместима по цоколевкес гнездом 486-го.
4.5. ПроцессорыSunMicrosystems.
SunMicrosystems процессор UltraSparc-II. Впервые вводя RISC-технологию, SUN в 1988 годуобъявила SPARC в качестве масштабируемой архитектуры, с запасом на будущее.Однако, с 1993 года реализация SuperSparc стала на шаг отставать от своихконкурентов.
С появлениемUltraSparc, четвертого поколения архитектуры SPARC, компания связывает надеждына восстановление утраченных позиций. Он содержит ни много, ни мало, но девятьисполнительных блоков: два целочисленных АЛУ, пять блоков вычислений сплавающей точкой (два для сложения, два для умножения и одно для деления иизвлечения квадратного корня), блок предсказания адреса перехода и блокзагрузки/записи. UltraSparc содержит блок обработки переходов, встроенный впервичную кэш команд, и условно выполняет предсказанные переходы, но не можетвыдавать команды с нарушением их очередности. Эта функция перекладывается наоптимизирующие компиляторы.
Архитектура SPARCвсегда имела регистровые окна, т.е. восемь перекрывающихся банков по 24двойных регистра, которые могут предотвратить остановки процессора в моментыкомплексного переключения, связанные с интенсивными записями в память.Разработчики компиляторов склонны считать эти окна недостаточным решением,поэтому в UltraSparc используется иерархическая система несвязанных шин. Шинаданных разрядностью 128 бит работает на одной скорости с ядром процессора. Онасоединяется через буферные микросхемы с 128-разрядной системной шиной,работающей на частоте, составляющей половину, треть или четверть скоростипроцессорного ядра. Для согласования с более «медленной» перифериейслужит шина ввода-вывода Sbus.
Фирма Sun реализуетэту схему на аппаратном уровне с помощью коммутационной микросхемы, являющейсясоставной частью схемного комплекта окружения. Эта микросхема можетизолировать шину памяти от шины ввода-вывода, так что ЦПУ продолжает,например, запись в графическую подсистему или в иное устройство ввода-вывода, ане останавливается во время чтения ОЗУ. Такая схема гарантирует полноеиспользование ресурсов шины и установившуюся пропускную способность
1.3 Гигабайт/с.
В процессоре UltraSparc – II используется системакоманд Visual Instruction Set (VIS), включающая 30 новых команд для обработкиданных мультимедиа, графики, обработки изображений и других целочисленныхалгоритмов. Команды VIS включают операции сложения, вычитания и умножения,которые позволяют выполнять до восьми операций над целыми длинной байтпараллельно с операцией загрузки или записи в память и с операцией перехода заодин такт. Такой подход может повысить видеопроизводительность систем.
4.6. ПроцессорыDigital Equipment.
Digital Equipmentпроцессор Alpha наиболее тесно следует в русле RISC-философии по сравнению сосвоими конкурентами, «посрезав излишки сала» с аппаратуры и системыкоманд с целью максимального спрямления маршрута прохождения данных.Разработчики Alpha уверены, что очень высокая частота чипа даст вам большиепреимущества, чем причудливые аппаратные излишества. Их принцип сработал:кристалл 21164 был самым быстрым в мире процессором со дня своего появления в1995 году. Процессор 21164 в три раза быстрее на целочисленных вычислениях,чем Pentium-100, и превосходит на обработке числе с плавающей точкой, чемсуперкомпьютерный набор микросхем R8000 фирмы Mips. Топология процессораследующего поколения 21164А не изменилась, но она смаштабирована, кроме того,модернизирован компилятор, что повысило производительность на тестах SPECmarks.Предполагается, что готовые образцы нового процессора, изготовленные по КМОП — технологии с нормами 0.35 микрон, при тактовой частоте свыше 300 МГц будутиметь производительность 500 по SPECint92 и 700 по SPECfp92.
Процессоры семейства21164 на прибегают к преимуществам исполнения не в порядке очередности (out –of – order), больше полагаясь на интеллектуальные компиляторы, которые могутгенерировать коды, сводящие к минимуму простои конвейера. Это самый гигантскийпроцессор в мире — на одном кристалле размещено 9.3 миллиона транзисторов,большая часть которых пошла на ячейки кэш-памяти. Alpha 21164 имеет накристалле относительно небольшую первичную кэш прямого отображения на 8 Кбайти 96 Кбайт вторичной. За счет вздувания площади кристалла достигнутабеспрецедентная производительность кэширования.
В 21164 работаетчетыре исполнительных блока (два для целых и два для чисел с плавающей точкой)и может обрабатывать по две команды каждого типа за такт. Он имеетчетырехступенчатый конвейер команд, который «питает» отдельныеконвейеры для целых чисел, чисел с плавающей точкой и конвейер памяти. Посравнению с прочими RISC-процессорами нового поколения чип 21164 имеетотносительно глубокие и простые конвейеры, что позволяет запускать их с болеевысокой тактовой частотой.
Конвейер командвообще не заботится о их зависимости по данным (в отличие от pentium Pro,который является ярким примером машины данных), он выдает команды в порядке ихпоступления на свой вход (в порядке следования по программе). Если текущиечетыре команды невозможно послать сразу все на различные исполнительные блоки,то конвейер команд останавливается до тех пор, пока это не станет возможным. Вотличие от конкурентов 21164 также не использует технику переименованиярегистров, вместо нее он непосредственно обновляет содержимое своихархитектурных регистров, когда результат достигает финальной ступени конвейера– write – back. Для борьбы с задержками и зависимостью команд по данным впроцессоре активно используются маршруты для обхода регистров, поэтомусовместно используемые операнды становятся доступными до стадии write — back.
Компания Digital продвигает Альфу как платформу длясерверов Windows NT, а не как традиционный UNIX-сервер.
4.7. Процессоры Mips.
Mips процессор R1000унаследовал свой суперскалярный дизайн от R8000, который предназначался длярынка суперкомпьютеров научного назначения. Но R1000 ориентирован на массовыезадачи. Использование в R1000 динамического планирования команд, котороеослабляет зависимость от перекомпиляции ПО, написанного для более старыхпроцессоров, стало возможным благодаря тесным связям Mips со своим партнеромSilicon Graphics, имеющим богатейший тыл в виде сложных графическихприложений.
R1000 первыйоднокристальный процессор от Mips. Для предотвращения остановок конвейера внем использовано динамическое предсказание переходов, с четырьмя уровнямиусловного исполнения, с использованием переименования регистров,гарантирующего, что результаты не будут передаваться в реальные регистры дотех пор, пока неясность по команде перехода не будет снята. Процессорподдерживает «теневую карту» отображения своих регистров переименования.В случае неверного предсказания адреса перехода он просто восстанавливает этукарту отображения, но не выполняет фактической очистки регистров и«промывки» буферов, экономя таким образом один такт.
R1000 отличаетсятакже радикальной схемой внеочередной обработки. Порядок следования команд вточном соответствии с программой сохраняется на трех первых ступенях конвейера,но затем поток разветвляется на три очереди (где команды дожидаются обработкина целочисленном АЛУ, блоке вычислений с плавающей точкой и блокезагрузки/записи). Эти очереди уже обслуживаются по мере освобождения того илииного ресурса.
Предполагаемаяпроизводительность R1000, выполненного по КМОП-технологии с нормами 0.35 микрондолжна достичь 300 по SPECint92 и по SPECfp92.
Программный порядокв конце концов восстанавливается так, что самая «старая» командапокидает обработку первой. Аппаратная поддержка исполнения в стиле out – of –order дает большие преимущества конечному пользователю, так как коды,написанные под старые скалярные процессоры Mips (например, R4000), начинаютработать на полной скорости и не требуют перекомпиляции. Хотя потенциальнопроцессор R1000 способен выдавать по пять команд на исполнение в каждом такте,он выбирает и возвращает только четыре, не успевая закончить пятую в том жетакте.
Одно из двух устройств для вычисления двойной точностис плавающей точкой занято сложениями, а другое умножениями/делениями иизвлечением квадратного корня. Hа кристалле R1000 реализован также интерфейсвнешней шины, позволяющий связывать в кластер до четырех процессоров бездополнительной логики обрамления.
4.8. Процессоры Hewlett – Packard
Hewlett – Packardпроцессор PA-8000. Компания Hewlett – Packard одной из первых освоилаRISC-технологию, выйдя еще в 1986 году со своим первым 32-разрядным процессоромPA-RISC. Практически все выпускаемые процессоры PA-RISC используются в рабочихстанциях HP серии 9000. В период с 1991 по 1993 (перед появлением систем набазе PowerPC) HP отгрузила достаточно много таких машин, став крупнейшимпродавцом RISC-чипов в долларовом выражении.
С целью пропагандысвоих микропроцессоров среди других производителей систем компания HP сталаорганизатором организации Precision RISC Organization (PRO). А в 1994 годукомпания взорвала бомбу, объединившись с Intel для создания новой архитектуры.Это поставило под сомнение будущее PRO.
PA-8000 это64-разрядный, четырехканальный суперскалярный процессор с радикальной схемойнеупорядоченного исполнения программ. В составе кристалла десять функциональныхблоков, включая два целочисленных АЛУ, два блока для сдвига целых чисел, дваблока multiply/accumulate (MAC) для чисел с плавающей запятой, два блокаделения/извлечения квадратного корня для чисел с плавающей запятой и два блоказагрузки/записи. Блоки МАС имеют трехтактовую задержку и при полной загрузкеконвейера на обработке одинарной точности обеспечивают производительность 4FLOPS за такт. Блоки деления дают 17-тактовую задержку и не конвейеризированы,но они могут работать одновременно с блоками МАС.
В PA-8000использован буфер переупорядочивания команд (IRB) глубиной 56 команд,позволяющий «просматривать» программу на следующие 56 команд впередв поисках таких четырех команд, которые можно выполнить параллельно. IRBфактически состоит из двух 28-слотовых буферов. Буфер АЛУ содержит команды дляцелочисленного блока и блока плавающей точки, а буфер памяти — командызагрузки/записи.
Как только командапопадает в слот IRB, аппаратура просматривает все команды, отправленные нафункциональные блоки, чтобы найти среди них такую, которая является источникомоперандов для команды, находящейся в слоте. Команда в слоте запускается толькопосле того, как будет распределена на исполнение последняя команда, котораясдерживала ее. Каждый из буферов IRB может выдавать по две команды в каждомтакте, и в любом случае выдается самая «старая» команда в буфере.Поскольку PA-8000 использует переименование регистров и возвращает результатывыполнения команд из IRB в порядке их следования по программе, тем самым поддерживаетсяточная модель обработки исключительных ситуаций.
HP проектировала РА-8000 специально для задачкоммерческой обработки данных и сложных вычислений, типа генной инженерии, в которыхобъем данных настолько велик, что они не умещаются ни в один из мыслимыхвнутрикристалльных КЭШей. Вот почему, РА-8000 полагается на внешние первичныеКЭШи команд и данных. Слоты в третьем 28-слотовом буфере, который называетсябуфером переупорядочивания адресов (Adress – Recorder Buffer — ARB), один кодному ассоциированы со слотами в буфере памяти IRB. В АРВ содержатсявиртуальные и физические адреса всех выданных команд загрузки/записи. Крометого, АРВ допускает выполнение загрузок и записей в произвольном порядке, но ссохранением согласованности и сглаживанием влияния задержки, связанной садресацией внешних КЭШей.
4.9. Процессоры Motorola.
Motorola/IBMпроцессор PowerPC620 это первая 64-битовая реализация архитектуры PowerPC.Имея 64-битовые регистры и внутренние магистрали данных и семь миллионовтранзисторов, новому процессору требуется почти вдвое больший и сложныйкристалл, чем у PowerPC 604. Модель 620 имеет четырехканальную суперконвейернуюсхему с шестью исполнительными устройствами: три целочисленных АЛУ, блокплавающей точки, блок загрузки/записи и блок переходов. Последний способен начетырехуровневое предсказание ветвлений в программе и условное исполнение сиспользованием схемы переименования регистров.
ПО микроархитектуреRISC-ядра 620-й похож на 604-й. Отличия сводятся в основном к ширине регистрови магистралей данных, а также к увеличенному числу станций резервирования дляусловного исполнения команд. Прибавка производительности достигнута за счетулучшенного шинного интерфейса. Теперь он имеет 128-битовый интерфейс кпамяти, по которому за один цикл обращения можно выбрать два 64-битовыхдлинных слова, и 40-битовая шина адреса, по которой можно адресовать до одноготерабайта физической памяти.
В состав шинного интерфейса входить также поддержкакэш-памяти второго уровня объемом до 128 Мбайт, которая может работать начетверти, половине или на полной скорости ЦПУ.
5. Лабораторные испытания и тестированиемикропроцессоров.
5.1. Лабораторные испытания процессоров i386DX.
В 1992 году на рынкепоявилось три новых МП, способных заместить существующие 386DX и обеспечитьповышение характеристик систем на основе i386. Это: Intel RapidCAD, Chips& Technologies 38600DX, иCyrix 486DLC. В настоящий моментпредлагаются только версии 33 МГц, хотя C&T и Cyrix обещают выпустить вначале 1993 года вариант 40 МГц. Конечно, на такой частоте можно заставитьработать и 33 МГц вариант, но мой опыт показывает, что это ненадежно, в любоймомент машина может зависнуть. Intel RapidCAD распространяется, как продуктдля конечных пользователей, т.е. в машину его устанавливают именно они.Напротив, C&T и Cyrix поставляют свои процессоры и производителям. Cyrixтакже производит процессор 486SLC, заменяющий Intel/AMD 386SX. C&T объявило создании процессора 38600SX, но в продаже он появится только в 1993 году,если вообще появится.
RapidCAD, грубоговоря, представляет собой процессор 486DX без внутренней кэш-памяти и сцоколевкой процессора 386. Для программ он соответствует 386 с сопроцессором,так как все специфичные команды i486 удалены из набора команд. Рекламируетсяэтот процессор, как «абсолютный сопроцессор» и, к чему и обязываеттакое имя, он предназначен для замены процессора 386DX в существующих системахи резкого повышения производительности операций с плавающей точкой, таких, какCAD, электронные таблицы, математические программные пакеты (SPSS, Mathematicaи т.д.). RapidCAD состоит из двух корпусов; RapidCAD-1, в корпусе PGA (132вывода), устанавливающийся в гнездо для i386, включает в себя ЦПУ и модульопераций с плавающей точкой, и RapidCAD-2, в корпусе PGA (68 выводов),устанавливающийся в гнездо для сопроцессора i387, включает в себя ПЛМ,подающий сигнал на схемы системной платы для правильной обработки особыхситуаций при операциях с плавающей точкой. Большинство операций исполняется втечение одного цикла, как и в i486. Однако узким местом является интерфейсшины 386, так как каждый цикл шины равен двум циклам процессора. Это значит,что команды выполняются быстрее, чем считываются из памяти. Поскольку операциис плавающей точкой выполняются медленнее обычных команд, то замедление на нихне сказывается, и они выполняются с такой же скоростью, как и на i486DX.Именно поэтому RapidCAD позволяет получить более высокие характеристики сплавающей точкой, чем любая комбинация 386/387. Результаты теста SPEC,стандартного теста для машин под UNIX, показывают, что RapidCAD ускоряетоперации с плавающей точкой на 85%, а с целыми числами — на 15% по сравнению слюбой комбинацией 386/387 при одинаковой тактовой частоте. Потребляемаямощность при 33 МГц составляет 3500 мВт. Текущая цена RapidCAD 33 МГцсоставляет 300$.
Предполагается, чтопроцессор фирмы C&T 38600DX полностью совместим с i386DX. В отличие отпроцессора Am386 фирмы AMD, который использует микрокод, идентичный микрокодуIntel 386, в процессоре 38600DX использован патентно чистый микрокод, дляобеспечения полной совместимости в набор команд даже включена недокументированнаякоманда LOADALL386. Некоторые команды выполняются быстрее, чем в i386. C&Tтакже выпустила процессор 38605DX, включающий кэш-память команд на 512 байт,что еще более повысит его производительность. К сожалению, 38605DX выпускаетсяв корпусе PGA (144 вывода) и не может быть установлен непосредственно в разъемi386DX. При проведении испытаний я заметил, что у 38600DX есть серьезныепроблемы коммуникации ЦПУ- сопроцессор, и из-за этого скорость выполнения вбольшинстве программ операций с плавающей точкой у него падает ниже уровняi386/i387. Эта проблема существует для всех производимых на настоящий момент387- совместимых сопроцессоров (ULSI 83C87, IIT 3C87, Cyrix EMX87, Cyrix 83D87,Cyrix 387+, C&T 38700, Intel 387DX). Мой знакомый по сети тоже проводилтакие тесты с 38700DX и пришел к аналогичным выводам. Он связался с C&T, иему ответили, что знают об этом. Средняя потребляемая мощность 38600DX 40 МГц — 1650 Мвт, что меньше, чем потребление i386 33 МГц. Текущая цена 38600DX 33 МГц- 80$.
Процессор Cyrix486DLC — последняя новинка на рынке заменителей i386DX. Набор его командсовместим с i486SX, установлена 1 КВ кэш-память и аппаратно реализованный 16х16бит умножитель. Исполнительное устройство 486DLC, созданное с использованиемнекоторых принципов RISC, выполняет большинство команд за один цикл. Аппаратныйумножитель перемножает 16-разрядные значения за 3 цикла, вместо 12 — 25 циклову i386DX. Это особенно удобно при вычислении адресов (код, генерируемыйнекоторыми неоптимизирующими компиляторами, может содержать много команд MULдля доступа к массивам) и для программных вычислений с плавающей точкой(напр., при эмуляции сопроцессора). Внутренняя кэш-память представляет собойобъединенную память команд и данных сквозной записи, и может бытьконфигурирована, как память с прямым отображением, или как 2-канальнаяассоциативная. Из-за необходимости обеспечения полной совместимости послеперезагрузки процессора кэш-память отключается, и должна быть включена с помощьюнебольшой программы, предоставляемой фирмой Cyrix. Если кэш-память включена призагрузке, (напр., при «горячей» перезагрузке, Ctrl – Alt – Del),BIOS моего РС (пр- ва AMI) зависает при загрузке, и мне приходится либовыполнять рестарт процессора, либо отключать кэш перед перезагрузкой. Это однаиз причин того, что после запуска процессора кэш-память отключается. Я уверен,что в следующих версиях BIOS фирмы AMI это будет учтено и встроеннаякэш-память будет поддерживаться. Кэш-память помогает процессору 486DLCпреодолеть ограничения интерфейса шины 386, хотя процент попаданий составляетне более 50%. Фирма Cyrix предусмотрела некоторые возможности управления кэш-памятьюпроцессора, что, конечно, улучшит связь внешней и внутренней кэш-памяти.Современные системы 386 не воспринимают эти управляющие сигналы, не имеющиезначения для i386DX, но в дальнейшем системы, разработанные с учетом этихвозможностей 486DLC, могут использовать их. Встроенный кэш 486DLC допускает до4-х некэшируемых областей памяти, что может быть очень полезно в том случае,если ваша система использует периферийные устройства, отображаемые в память(напр., сопроцессор Weitek). В существующих системах 386 пересылки DMA (напр.,SCSI контроллера, платы звука) могут отключить внутренний кэш, так как несуществует других способов обеспечить соответствие кэш-памяти и основнойпамяти, что, конечно, снижает характеристики 486DLC. Потребляемая мощность486DLC 40 МГц — 2800 Мвт. Немецкий дистрибьютор продает 486DLC 33 МГц потекущей цене 115$. 486DLC работает далеко не со всеми сопроцессорами и не вовсех обстоятельствах, особенно критичен в этом отношении многозадачный защищенныйрежим (улучшенный режим MS- Windows). При использовании 486DLC совместно сCyrix EMC87, Cyrix 83D87 (выпуск до августа 1992) и IIT 3C87 машина зависаетиз-за проблем синхронизации между ЦПУ и сопроцессором при исполнении командFSAVE и FRSTOR, сохраняющих и восстанавливающих состояние сопроцессора припереключении задач. Лучше всего использовать 486DLC с Cyrix 387+(распространяется только в Европе) или Cyrix 83D87 выпуска после июля 1992,являющийся наиболее мощным сопроцессором среди совместимых сопроцессоров486DLC. Если у вас уже есть сопроцессор Cyrix 83D87, и вы хотите знать,совместим ли он с 486LCD, я рекомендую вам мою программу COMPTEST,распространяемую как CTEST257.ZIP через анонимные ftp из garbo@uwasa.fi илидругие ftp-серверы. Если программа сообщит о сопроцессоре 387+, то у васустановлен либо 387+, либо аналогичная новая версия 83D87 и проблем ссовместимостью не будет.
При испытаниях использовалась система:
Аппаратнаяконфигурация: 33,3/40 МГц системная плата, комплект микросхем Forex, кэш 128 КВс нулевым состоянием ожидания, прямое отображение, сквозная запись, один буферзаписи, 4 байта на строку, 4 цикла задержки при кэш-промахе. 8 МВ основнойпамяти, среднее состояние ожидания 1,6 цикла. BIOS фирмы AMI. ПроцессорCyrix EMC87 в режиме совместимости 387, как матсопроцессор. Этот процессорвместе с Cyrix 83D87/387+ являются самыми быстрыми сопроцессорами для работы с386DX/486DLC/38600DX. Жесткий диск Conner 3204F, емкость 203 МВ, интерфейс IDE(пропускная способность по тесту CORETEST 1100 КВ/с, время поиска 16 мс). ПлатаSVGA (ISA, Diamond SpeedSTAR HiColor), используется ET4000, 1 МВ DRAM, какэкранный буфер, графический ускоритель отключен. Переключатели на видеоплатеустановлены для наиболее надежной с быстрой работы, с пропускной способностью6500 байт/мс при 40 МГц и 5400 байт/мс при 33 МГц.
Программная конфигурация: MS-DOS 5.0, MSWindows 3.1, HyperDisk
4.32 в режиме обратной записи,используется 2 МВ расширенной памяти, в качестве менеджера памяти используется386MAX 6.01. Эта программа также обеспечивает DPMI в некоторых тестах.
Результаты тестов
Для тестовWhetstone, Drhystone, WINTACH, DODUC, LINPACK, LLL и Savage больший показательозначает большую производительность.
Для тестов MAKE RTL,MAKE TRANK и теста String- Test меньший показатель означает большуюпроизводительность.
33,3 МГц Intel C&T Intel Cyrix Cyrix
386DX 38600DX RapidCAD 486DLC 486DLC
кэш выкл. кэш вкл.Тесты с целыми числами
Whetstone (kWhet/s) 447 585 563 695 803
Drhystone(C) (Dhry./s) 11688 11819 12357 14150 15488
Drhystone(Pas) (Dhry./s) 10455 10877 10751 12154 13858
String-Test (ms) 459 453 441 347 327
MAKE RTL (s) 51,32 47,10 46,34 43,45 39,13
MAKE TRANCK (s) 62,42 55,47 55,37 53,64 46,12
WINTACH 4,85 4.90 5.49 5.53 6.14
Тесты с плавающей запятой
DODUC (Индекс скорости) 79.0 76.4 150.3 89.4 90.7
LINPACK (Mflops) 0.2808 0.2707 0.4578 0.3158 0.3438
LLL (Mflops) 0.3352 0.3537 0.6083 0.3816 0.4139
Whetstone (kWhet/s) 2540 2340 3990 2908 3061
Savage (решений/с) 71685 53191 72464 88757 93897
40 МГц Intel C&T Intel Cyrix Cyrix
386DX 38600DX RapidCAD 486DLC 486DLC
Тесты с целыми числами кэшвыкл. кэш вкл.
Whetstone (kWhet/s) 536 702 676 835 963
Drhystone(C) (Dhry./s) 14128 14116 14836 16987 18750
Drhystone(Pas) (Dhry./s) 12490 13067 12890 14573 16624
String-Test (ms) 384 377 368 289 273
MAKE RTL (s) 43.46 40.11 39.84 37.25 33.54
MAKE TRANCK (s) 53.00 47.59 47.07 45.36 39.00
WINTACH 5.65 5.73 6.41 6.46 7.23
Тесты с плавающей запятой
DODUC (Индекс скорости) 94.9 77.5 180.3 105.1 106.6
LINPACK (Mflops) 0.3324 0.3260 0.5418 0.3789 0.4131
LLL (Mflops) 0.4025 0.4204 0.7260 0.4562 0.4956
Whetstone (kWhet/s) 3061 2632 4798 3505 3677
Savage (решений/с) 86083 49587 86957 106762 112360
Среди испытанныхпроцессоров Cyrix 486DLC обладает самой большой производительностью по целымчислам. С включенной внутренней кэш-памятью производительность по целым числамна одинаковой тактовой частоте 486DLC на 80% превышает 386DX, среднееувеличение скорости работы прикладных программ составляет 35%. При работе сприкладными программами, использующими операции как с целыми числами, так и сплавающей точкой, включенный кэш обеспечивает на 5% — 15% более высокиепоказатели по сравнению с работой без КЭШа. Скорость операций с плавающейточкой по сравнению с i386DX увеличивается на 15% — 30%
Intel RapidCAD при работевместо i386DX обеспечивает самые высокие характеристики при выполнении операцийс плавающей точкой. Прикладные программы, выполняющие интенсивные операции сплавающей точкой, работают быстрее на 60% — 90% по сравнению с i386DX/387DX,отставая от i486DX при той же тактовой частоте по скорости операций с плавающейточкой всего на 25%. Скорость операций с целыми числами увеличивается на 15% — 35% по сравнению с i386DX/i387DX.
Процессор Chips & Technologies 38600DX обладаетнесколько более высокими характеристиками при работе с целыми числами, чемi386DX, давая среднее увеличение скорости порядка 10%.
5.2.Результаты тестирования микропроцессоров с помощью пакета The Speed Test.
Для тестирования различныхмикропроцессоров иногда применяют специальные пакеты программ processorbenchmarks. Ниже приведены результаты тестирования процессоров с помощьюпакета программ Speed Test, ARA Copyright (C) 1994,95,96 Agababyan RobertAssotiation Used TMi0SDGL(tm)
Pentium iP5-200(3-200), 512K PB 1318841
Pentium iP5-200(2.5-200), 512KPB 1309353
Pentium iP5-200(2.5-200) 1290780
Pentium iP5-200(3-200) 1290780
Pentium iP5-180, 512K PB 1181818
Pentium iP5-180 1151899
Pentium iP55-166, Intel Triton,IWill TSW2 1109756
Pentium iP5-166, 512K PB 1096386
Pentium iP5-166 1076923
Pentium iP5-160, 512K PB 1052023
Pentium iP5-160 1040000
Pentium iP5-150, 512K PB 983784
Pentium iP5-150 968085
Pentium iP5-133, 512K PB 879227
Pentium iP5-133 866667
Pentium iP54-75(1.5-120), IntelTriton 812500
Pentium iP54-75(2-120), IntelTriton 812500
Pentium iP54-75(2-120), SiS501/503 812500
Pentium iP5-100(2-120), IntelTriton, ASUS P55-TP4 798246
Pentium iP5-120(1.5-120), 512KPB 798246
Pentium iP5-120, 512K PB 787879
Pentium iP5-120(1.5-120) 781116
Pentium iP5-120 777778
Cx5x86-M1sc-100(3-150,Opt) 771186
Cx5x86-M1sc-100(3-150,Opt) 758333
Am5x86-133-X5-P75(4-200) 710938
Pentium iP5-100, ALR Revolution 679104
Pentium iP5-100, Intel Triton,ASUS P/I-P55TP4XE 669118
Pentium iP5-100, Intel Triton 669118
Pentium iP54-75(100), IntelTriton 669118
Am5x86-133-X5-P75(3-180),UMC8886BF/8881F 640845
Cx5x86-M1sc-100(3-120,Opt) 614865
Pentium iP54-75(90), IntelTriton, ASUSTeK P54-TP4 606667
Cx5x86-M1sc-100(3-120,Opt), SiS471, GMB-486SG 600660
Am5x86-133-X5-P75(4-160), SiS471, BTC 4SLD5.1 568750
Am5x86-133-X5-P75(4-160), SiS496/7, ASUS PVI-SP3 568750
Am5x86-133-X5-P75(4-160), SiS471 561730
Am5x86-133-X5-P75(4-160), SiS496 PCI 561728
Am5x86-133-X5-P75(4-160) 561128
Cx5x86-M1sc-100(3-120), SiS496/7, ASUS PVI-SP3 548193
Cx5x86-M1sc-100(3-120,Opt), SiS471, GMB-486SG 535294
i80486DX4-100(120), UMC 8498F 535294
Am5x86-133-X5-P75(3-150), SiS471, BTC 4SLD5.1 529070
Cx5x86-M1sc-100(Opt) 511236
Nx586-90(100), NxVL SystemLogic, Alaris 505450
Cx5x86-M1sc-100(Opt), SiS 471,GMB-486SG 501377
Am5x86-133-X5-P75, SiS 471, BTC4SLD5.1 469072
Am5x86-133-X5-P75, SiS 496/7,ASUS PVI-SP3 469072
Cx5x86-M1sc-100, SiS 496/7,ASUS PVI-SP3 455000
i80486DX4-100, UMC 881 455000
Nx586-90, NxVL System Logic,Alaris 455000
Pentium iP5-60(66), PCI58PL 450495
Pentium iP5-60(66), SiS501/502/503, ASUS P5-SP 450495
Cx5x86-M1sc-100, SiS 471,GMB-486SG 446078
i80486DX2-66(4-100), PC Chips18 446078
i80486DX4-100, SiS 82C471, SOYO 446078
OverDrive iDX4ODPR100(486DX4-100) 437500
i80486DX4-100, Compaq ProLinea4/100 433333
Am80486DX4-120SV8B, SiS 471,BTC 4SLD5.1 425234
Am80486DX4-120, SiS 471, SOYO 425234
Pentium iP5-60, Compaq DeskProXL 560 406250
Pentium iP5-60, Compaq Proliant 406250
Pentium iP54-75(60), IntelTriton 406250
Pentium iP5-60, OPTi596/546/82, Bison III v1.0 406250
Pentium iP5-60, SiS501/502/503, ASUS P5-SP 406250
Am80486DX2-80(100), UMC 8498F 352713
Am80486DX4-100, PC Chips 18 350000
Am80486DX2-80(100), SiS 471 345351
Cx80486DX2-100, Opti VIP 344697
i80486DX4-100(75), UMC 881 337037
Pentium iP54-75(50), IntelTriton 334559
Pentium iP54-75(45), IntelTriton 303333
U5-S33(60), UMC 491F 301325
i80486SX2-50(80), SiS 471,S486G 282609
i80486DX2-S-80, PC Chips 18 280864
i80486DX2-80, Symphony Haydn II 280864
i80486DX2-S-80, UNICHIPU4800VLX, U486 WB 280864
Cx80486DX2-66(80), OPTi 495SLC 277560
U5-S33(50), SiS 471, AV7541 250000
U5-S33(50), SiS 471, SOYO 250000
U5-S33(50), UMC 491F 250000
U5-S33F(50), UMC 8498F 250000
U5-S33(50) 246612
U5-S33(50), CONTAQ 82C596A,G486VLI 245946
U5-S40(50) 245946
i80486DX2-66, DELL 238196
Am80486DX2-66, Forex 46C421 234964
Am80486DX2-66, Bioteq 82C3491 234536
Am80486DX2-66, OPTi 495SLC 234536
i80486DX2-66 &E5, AcerMate466 234536
i80486DX2-66, ALI M1429/M1431 234536
i80486DX2-66, SiS 82C471 234536
i80486DX2-66, Symphony,Predator I 234536
i80486DX2-66, OPTi 82C682, ALREvolution 4 233333
i80486DX2-66, PC Chips11&13 233333
Am80486DX2-66, IMS 8849 232143
i80486DX2-66, Compaq ProLineaMT 4/66 232143
Am80486DX2-66, UNICHIPU4800VLX, U486 WB 230964
i80486DX2-66, Intel Champion 230964
Cx80486DX2-66, UMC 82C491F 230964
OverDrive iDX2ODPR66(486DX2-66) 230964
Am80486DX2-66, SiS 82C471 229798
i80486DX2-66, Symphony Haydn II 229768
i80486DX2-66, SiS 82C471 228643
U5-S33(40), SiS 82C471 200441
U5-S33F(40), UMC 8498F 200441
U5-S33(40), Expert 4045 194861
i80486DX-50, UMC 82C480 176357
i80486DX2-50, HeadlandHT342/HT321 176357
i80486SX-50, SiS 82C471 176357
Am80486DX-50, UMC 82C491F 173004
i80486DX-50 173004
i80486DX2-50, OPTi 495SLC 171053
Cx486S-40(50), UMC 82C491F 171053
U5-S33, SiS 82C471 167279
U5-S33, Expert 4045 162645
IBM486SLC2-66, OPTi 495XLC 161922
i80486SX-33(40), SiS 82C471 140867
i80486SX-33(40), OPTi 82C495SLC 140867
Am80486DX-40, OPTi 82C495SLC 140432
i80486SX-33(40) &E5, Forex521 140000
i80486SX-33(40), Forex 521 139571
Am80486DX-40, SiS 82C461 138931
Cx486DX-40 135821
Ti486DLC/E-40BGA, PC Chips,M321 126389
Cx486DLC-40 126389
Tx486DLC-40, OPTi 495SLC 126039
Cx486DLC-40GP, SARC RC4018A4 123641
IBM 486SLC2-50, WD7600 122642
Cx486SLC-40, SARC RC2016A4,M396F 120053
i80486SX-33, SiS 82C471 117571
i80486DX-33, HP Vectra 486/33VL 116967
i80486DX-33, OPTi 82C498,Simens-Nixdorf PCD-4H 116967
i80486SX-20(33), Symphony 116967
i80486DX-33, Intel Champion 116667
i80486DX-33, Toshiba T9901C,LapTop 116667
i80486DX-33, UMC 82C481 114035
i80486SX-25, IBM PS/1 88694
i80486SX-25, SiS 87838
i80486SX-25, HiNT CS8005 87500
i80486SX-25, HP Vectra486SX/25VL 86502
Am80386DX-40, ALI M1429/M1431 81835
Am80386DX-40, CD-COM, M326 81835
Am80386DX-40 WC, SARC 81835
Am80386DX-40, UMC 82C491F 81688
Am80386DX-40, OPTi 82C391 81531
Am80386DX-40, UNICHIP U4800VXL 81182
Am80386DX-40, PC Chips 5,6 80817
Am80386DX-40, UMC 80C481 80647
Am80386DX-40, OPTi 495XLC 80531
Am80386DX-40, ForexFRX46C402,411 80247
Am80386SX-40, P9 MXIC 73387
i80386DX-33 68114
Am80386SX-40, M396F 67407
Am80386SX-40, Acer M1217 63459
Am80386SX-40, ALI M1217 62329
Am80386SX-40, PC Chips 2 61905
i80386SX-33, Acer M1217 51066
i80386SX-33 49296
i80386DX-25 48925
i80386SX-33, HP Vectra386SX/33N 48611
Am80386SX-33, Acer M1217 47744
80286-25 45867
80286-20 38625
Harris 80286-20, UMC 82C208L 37387
80286-16, HT12 29111
i80286-12.5 24125
i80286-12 22392
i80286-10, IBM PS/2 15545
i80286-10, IBM PS/2 60 15242
i8088-9.54, Commodore PC-20 5395
i8088-7.16, Commodore PC-20 4011
i8088-4.77, EC-1841 2968
i8088-4.77, Original XT 2697
i8088-4.77, Commodore PC-20 2658
6. Сравнительный анализ.
В середины октября1995 года в г. Сан-Хосе (Калифорния) состоялся очередной МикропроцессорныйФорум. В прошлом году на нем демонстрировались прототипы процессоров IBM PowerPC 620, MIPS R10000, SUN UltraSPARC, HP PA-8000 и DEC Alpha 21164.
Из прошлогоднихпроцессоров – дебиторов до рынка дошел только процессор Alpha 21164/300. Егопроизводительность по тесту SPECint92 составила 341 единицу. Пребывая с такойпотрясающей производительностью в лидерах гонки на быстродействие процессоров,в ноябре Alpha пропустила вперед компанию Intel с процессором Pentium Pro.Страсти накалились нешуточные и вот на нынешнем форуме Digital сообщила, что вдекабре приступит к выпуску нового варианта этого процессора — Alpha 21164A стактовой частой 333 МГц, выполненного по технологии 0.35 мкм. Проектируемаяпроизводительность 500 по SPECint92.
Hewlett – Packardанонсировала 32-разрядный процессор архитектуры РА следующего поколенияРА-7300LC с встроенными функциями мультимедиа. Hачало его выпуска по 0.5 мкмтехнологии возможно во второй половине следующего года. Этот первый процессорPA-RISC, оснащенный внутренними 64 Кбайт КЭШами первого уровня для команд идля данных, предпочтительно будет иметь 200 SPECint92 и 275 SPECfp92.
Через год послеобъявления процессора UltraSPARC фирма SPARC Technology представила новыйпроект UltraSPARC- II. Hовый процессор будет иметь 5.4 млн. транзисторов,изготавливаться по технологии
0.35 микрон, работать на частоте 250-300МГц. Проектируемое быстродействие 250 МГц версии — 350 SPECint92 и 550SPEFfp92. Кроме базовой системы команд, процессор будет оснащен набором из 30новых команд Visual Instruction Set, которые предназначены для быстрой обработкивидеофайлов в формате MPEG-2, рендеринга трехмерных оболочек, видеоконференцсвязи.
Рождение Pentium Proвосхитительная новость, но оно неизменно поднимает несколько серьезныхвопросов. Hа самом ли деле это полностью новое поколение процессора Pentium?Побила ли Intel своих конкурентов окончательно? Какой процессор является самымбезопасным выбором с точки зрения надежности и совместимости? Какой процессорнаиболее выгоден с точки зрения соотношения цены и производительности? Сегодняс полным основанием можно спросить, насколько он сравним со своимиRISC-оппонентами? Hе устарел ли лозунг Apple о том, что Power Macперспективнее, чем линия x86?
Hа все вопросы можноответить в принципе утвердительно. Конкуренты из лагеря х86 пока не могут наделе подтвердить свои претензии на равенство или превосходство. Hичего живогоили приличного (Cyrix) на руках пока нет. А ценовой ориентир Intel известен:настольный high – end компьютер на платформе Aurora, Pentium Pro 150 MHz, ОЗУ16 Мб, жесткий диск EIDE 1 Гб, 2 Мб SVGA, монитор 17" NI digital SVGA,Windows 95 в декабре обойдется жадным к мощности пользователям дешевле $5000.Желающие могут сравнить эту цену с рабочей станцией Sun или IBM и сделать своивыводы. Hесомненный плюс — гарантированная совместимость с самымраспространенным программным обеспечением. Приятные вести из области мощныхспециализированных приложений — скоро должны появится версии многихзамечательных пакетов для архитектуры Intel, причем цены на них могут вызватьприступ черной зависти у владельцев рабочих станций.
Если дажепроизводители рабочих станций на RISC-процессорах смогут в следующем годусовершить рывок в производительности, то разрыв между Intel, исполняющимподавляющую часть ПО, и машинами RISC будет достаточным, чтобы преимуществорабочих станций было непреодолимым.
В первом номереComputer Week Moscow можно найти пассаж интересного характера. Дословно:«Опытные системы P6 способны на большее, чем просто выдерживатьконкуренцию со стороны других рабочих станций среднего класса. Принепосредственном сопоставлении рабочих станций Intergraph на 200-МГцпроцессоре Pentium Pro и Silicon Graphics Indigo-2 Extreme с 200-МГцпроцессором Mips R4400, последняя на тестах iSPEC показала порядка 160 единиц,тогда как оценки Intel для системы P6 полной конфигурации соответствуют 366единицам.»
При созданиипроцессора Pentium Pro делался упор на способности этой микросхемы выполнятьграфический рендеринг и работать с 32-разрядным кодом.
Pentium Pro явновыламывается из рамок процессора Pentium и принадлежит шестому поколениюархитектуры Intel x86. Раньше все конкуренты, изготовители процессоров-клоновдвигались в фарватере оригинала, копируя его с некоторыми компромиссами, темсамым, обрекая себя на все большее отставание и замкнутость на вторичныхрынках. Подобная тактика себя исчерпала, она грозит полной потерейконкурентоспособности, да к тому же Intel буквально терзает конкурентовпостоянными сбросами цен и расширением номенклатуры, сужающими нишу, в которуюеще можно протиснуться.
Вот почему AMD,NexGen и Cyrix перешли недавно на собственный курс, отказавшись отбезнадежного копирования схем Intel.
Hо принципиальнойпрорасти между конкурентами нет. В некоторых случаях Pentium Pro более сложен,чем Nx586, K5 и M1, в других менее. В целом же схема P6 сравнима с прочимипроцессорами; наиболее близок к ней дизайн К5, как считают эксперты.
Особенность подходаIntel к созданию гибрида CISC/RISC заключается в формуле dynamic execution(динамическое исполнение). Примерно такие же базовые принципы вы обнаружите,если станете разбираться подробно с архитектурой последних RISC-процессоровIBM/Motorola PowerPC 604 и Power PC 620, Sum UltraSparc, Mips R10000, DigitalAlpha 21164 и HP PA-8000.
Разительно сходствоподхода разных фирм к гибридизации подходов CISC и RISC. Внешне Pentim Proвыглядит традиционным CISC-процессором, совместимым со всем наработаннымпрограммно-аппаратным фондом. Знакомый «фасад» прикрывает отпользователя RISC-подобное ядро. Между «фасадом» и «заднимикомнатами» работает умнейший декодер, разбивающий сложные и длинныекоманды х86 на более простые операции, похожие на команды RISC — компанияIntel называет их u-ops или micro — ops. Эти micro — ops поступают в ядропроцессора, которое их буквально перелопачивает. Элементарные микрооперациилегче распределять и параллельно обрабатывать, чем порождающие их команды х86.Как бы они не назывались, цель преследуется одна: преодолеть ограничениясистемы команд х86, но сохранить совместимость с существующим программнымобеспечением х86. Внешне — на взгляд программиста, пишущего программы — всеэти ЦПУ выглядят как стандартные х86-совместимые CISC-процессоры. А внутри ониработают как современнейшие модели RISC-чипов.
Hо сегодня PentiumPro «живее» и быстрее не только любого из «живых»процессоров архитектуры х86, включая Nx586 и Cyrix6x86, но и любого извыпускаемых RISC-процессоров.
Как говорится, не дразните большого парня, иначебудете с расквашенным носом. Именно таков смысл послания Intel в адрес конкурентов:NexGen, Cyrix и AMD.
7. Pentium II.
7.1Pentium II
Выпущенный с середины 1997 года, Pentium II ввел рядбольших изменений в мир процессоров PC.
Во-первых, чип и системный кэш второго уровнясоединялись по выделенной шине, способной работать на частоте шиныпроцессор-система.
Во вторых, процессор, вторичный кэш и тепло отводбыли смонтированы на небольшой плате, вставлявшейся в разъем на системнойплате, что больше напоминало карту расширения, чем традиционную схемупроцессор/гнездо. Intel окрестил это Single Edge Contact cartridge (SEC) — односторонне контактный картридж. В этом картридже находятся шесть отдельныхкомпонент — процессор, четыре индустриально стандартных burst-static-cache RAMи один tag RAM. Дизайн SEC картриджа наделял важными преимуществами.PGA-компоновка Pentium Pro требовала 387 контактов, в то время как SEC-картридж- только 242. Уменьшение на треть числа контактов произошло благодаря наличию вкартридже дискретных элементов, таких как замыкающие резисторы и конденсаторы.Эти элементы обеспечивают расщепление сигналов, что значит намного меньшеечисло требуемых разъемов питания. Разъем SEC-картриджа использует такназываемый Slot 1 и воспринимается как принимающий эстафету у уходящего Socket7.
Третье изменение — в большем синтезе, так какPentium II объединяет Dual Independent Bus (DIB) от Pentium Pro c технологиейMMX от Pentium MMX, формируя новый вид — гибрид Pentium Pro/MMX. Таким образом,внешне очень отличный от предыдущих интеловских процессоров, Pentium IIвнутренне являет собой смесь новых технологий и улучшений старых чипов.
И наконец, в отличие от Pentium Pro, работающего на3.3v, Pentium II питается от 2.8v, позволяя Intel пускать его на большихчастотах без чрезмерного увеличения требование к мощности. В то время, как200MHz Pentium Pro с 512kb кэша потребляет 37.9 ватт, 266MHz Pentium II с 512kbкэша сжигает 37.0 ватт.
Подобно Pentium Pro, Pentium II применяетинтеловскую Технологию Динамического Исполнения. Когда программная инструкциясчитывается в процессор и декодируется, она попадает в исполняемый пул.Технология Динамического Исполнения принимает три основных подхода коптимизации способа обращения процессора с кодом. Множественные ПредсказанияВетвлений проверяют программный поток вдоль нескольких ветвей и предсказывают,где в памяти находится следующая инструкция.
Когда процессор читает, он также проверяет следующиеинструкции в потоке, ускоряя в результате рабочее течение. Анализ Потока Данныхоптимизирует последовательность, в которой инструкции будут выполняться,проверяя декодированные инструкции и определяя, готовы ли они для обработки илизависят от других инструкций. Спекулятивное Выполнение увеличивает скоростьтаких инструкций просмотром вперед от текущей инструкции и обработкойдальнейших инструкций, которые вероятно могут понадобится. Эти результатыхранятся как спекулятивные до тех пор, пока процессор не определит, какие емунужны, а какие — нет. С этой точки инструкция возвращается в нормальную очередьи добавляется к потоку.
У Технологии Динамического Исполнения есть дваосновных преимущества: Инструкции обрабатываются быстрее и эффективнее, чемобычно, и, в отличие от CPU с применением RISC архитектуры, программы не надоперекомпилировать для извлечения выгод процессора. Процессор все делает налету.
Значительной новой особенностью является удалениевторичного кэша из собственно процессора на отдельную кремниевую пластину вкартридже. Процессор читает и пишет данные в кэше используя специализированнуювысокоскоростную шину. Называемая задней (backside) шиной, она отделена отсистемной шины процессор-память (сейчас называемой передней (frontside) шиной).Процессор может использовать обе шины одновременно, но архитектура двойнойнезависимой шины имеет другие преимущества.
Хотя шина между процессором и кэшем второго уровняработает медленнее, чем на обычном Pentium Pro (на половине скоростипроцессора), она чрезвычайно масштабируема. Чем быстрее процессор, тем быстреекэш, независимо от 66MHz передней шины. Вдобавок, передняя шина может бытьувеличена с 66 до 100MHz без влияния на шину кэша второго уровня. Такжеочевидно, что наличие памяти на одном кристалле с процессором негативносказывается на проценте выхода годных 512kb Pentium Pro, сохраняя высокимицены.
Pentium II опирается на GTL+ (gunning-transceiver-logic) логику хост-шины,допускающую естественную поддержку двух процессоров. Во время выхода этообеспечивало стоимостно эффективное минималистское двухпроцессорное решение,допускаемое симметричной мультипроцессорностью (SMP). Двухпроцессорноеограничение налагалось не самим Pentium II, а поддержкой чипсета. Изначальноеограничение чипсета двухпроцессорной конфигурацией позволяло Intel ипоставщикам рабочих станций предлагать двухпроцессорные системы как временное иэкономичное решение, что по другому и не было возможно. Это ограничение было снятос середины 1998 года с выходом чипсета 450NX, поддерживающего от одного дочетырех процессоров. Чипсет 440FX, содержащий чипы PMC и DBX, не допускалчередования (interleaving) памяти, но поддерживал EDO DRAM, позволяя улучшатьпроизводительность памяти уменьшением ожидания.
Когда Intel проектировал Pentium II, он также взялсяза слабую 16-битную производительность его предшественника. Pentium Proроскошно работает с полностью 32-битным обеспечением, таким как Windows NT, ноопускается ниже стандартного Pentium'а, обрабатывая 16-битный код. Это влечетхудшую чем Pentium производительность под Windows 95, большие части которойпока 16-битны. Intel решил эту проблему использованием пентиумного кэша сдескрипторами сегментов в Pentium II.
Как и Pentium Pro, Pentium IIчрезвычайно быстр в арифметике плавающей точки. В сочетании с AcceleratedGraphics Port (AGP) это делает Pentium II мощным решением длявысокопроизводительной 3D графики.
7.2 Deschutes
333MHz воплощение Pentium IIпод кодовым названием Deschutes (по реке, текущей в Орегоне), было анонсированов начале 1998 года с планируемыми в течение года 400MHz и выше. Имя Deschutes вдействительности относится к двум разным линиям CPU.
Версия для Slot 1 — ничегоболее, чем слегка эволюционировавший Pentium II. Архитектура и физическийдизайн идентичны, за исключением того, что Deschutes Slot 1 частью сделан сиспользованием 0.25-микронной технологии, введенной осенью 1997 года сноутбучным процессором Tillamook, по сравнению с 233-300MHz версиями, выполненнымипо 0.35-микронному процессу. Применение 0.25-микрон означает, что транзисторына матрице физически ближе между собой и CPU потребляет меньше энергии, аследовательно рассеивает меньше тепла на данной частоте, позволяя ядру тикатьна больших частотах.
Все иное у Slot 1 Deschutes идентично обычномуPentium II. Смонтированный на основание и заключенный в SEC картридж, онподдерживает набор инструкций MMX и общается с 512kb вторичного кэша наполовинной частоте ядра. Он имеет тот же конечный коннектор, и работает на техже системных платах с теми же чипсетами. Как таковой он работает с 440FX или440LX на внешней частоте 66MHz.
С весны 1998 года большой шагв производительности пришел со следующим воплощением Deschutes, когда вышелновый чипсет 440BX, допускающий 100MHz передачу по системной шине, уменьшаязакупоривание данных и поддерживая частоты от 350 до 400MHz.
Другой процессор, зовущийся Deschutes, относится кSlot 2, выпущен с середины 1998 года как Pentium II Xeon. Intel разбил Slot 1 иSlot 2 Deschutes на взаимодополняющие товарные линии, где Slot 1 предназначендля массового производства, а Slot 2 нацелен на high-end серверы и туда, гдецена вторична по отношению к производительности.
7.3 Мобильный Pentium II
Естественноепродвижение маломощного (в смысле энерго потребления/рассеивания) семействаPentium II Deschutes на рынок портативных PC осуществилось с выпуском линейкимобильных Pentium II в апреле 1998 года. Новый процессор и его компаньонмобильный 440BX чипсет, изначально были доступны в 233 и 266MHz вариантах,скомпонованные в существующий мобильный модуль (MMO) или новый мини-картриджформат. Intel ожидает к концу 1998 года более половины из снаряженных егомобильными процессорами PC будут уже Pentium II, а срок мобильных Pentium II Tillamookокончится к середине 1999 года.
7.4 Celeron
В попытке лучшего удовлетворения сектора дешевых PC,до настоящего времени вотчины производителей клонов, AMD и Cyrix, продолжающихразвивать унаследованную архитектуру Socket 7, Intel выпустил свой рядпроцессоров Celeron в апреле 1998 года.
Основанный на той же P6архитектуре, что и Pentium II, и используя тот же 0.25-микронный процесс,Celeron-системы предлагают полный комплект последних технологий, включаяподдержку AGP графики, ATA-33 жестких дисков, SDRAM и ACPI. Celeron будетработать на любом интеловском Pentium II чипсете, поддерживающим 66MHzсистемной шины, включая 440LX, 440BX и новый 440EX, специально спроектированныйдля рынка 'базовых' PC. В отличие от Pentium II с его SEC картриджем, Celeronне имеет защитного пластикого покрытия вокруг карт процессора, что Intelназывает Single Edge Processor Package (SEPP). Он полностью совместим со Slot1,что позволяет использовать существующие платы, но механизм крепления для картыCPU не адаптирован для форм фактора SEPP.
Первые 266 и 300MHz Celeron'ы без кэша второго уровнявстретили мало энтузиазма на рынке, не неся или неся мало преимуществ надсистемами-клонами Socket 7. В августе 1998 года Intel пополнил ряд Celeronсемейством процессором, названных Mendocino. Снабженный 128kb вторичного кэа наматрице, работающего на полной частоте процессора, и соединяясь через внешнюю66MHz шину, новый Celeron стал намного более живым, чем его вялыйпредшественник. Отчасти путано, две доступные версии получили названия Celeron333 и 300a. Первый является основной версией, совместимый с существующейинтеловской архитектурой, в то время как второй патентует Pin 370 socket,отличный от Socket 7 и Socket 1, нацеленный на дешевые low-end машины.
7.5 Pentium“Xeon”
Cначала июля 1998 года по всему миру проходила серия мероприятий, посвящённыхпредставлению самого мощного процессора архитектуры х86 корпорации Intel.Задолго до этого из информации, размещённой на Web-сайтах Intel стало известноего название и назначение. Особо подчёркивалось, что слово Xeon нежнопроизносить как «Зеон», но российское представительство приняло решениеподчинить это название нормам русского (и греческого) языка. Так что в Россиимы будем иметь дело с «Ксеоном»,- ведь есть же у нас Ван Клиберн и Мехико.
Новый процессор, к слову, стал подарком компании-производителя самой себе послучаю тридцатилетия.
Первое, что бросается в глаза, — необычно крупный размер процессорногокартриджа в который «пакуется» Xeon. Он предназначен для установки вразъём новой конструкции Slot 2. По словам разработчиков, это связанно сувеличением ёмкости кэш-памяти второго уровня. В настоящий момент процессорыXeon с единой тактовой частотой поставляются в двух вариантах: с 512 Кбайт и 1Мбайт КЭШа L2. Но уже в текущем году планируется довести ёмкость кэш-памятивторого уровня до 2 Мбайт и повысить тактовую частоту до 450 МГц. Напомню, чтостарый Pentium II комплектовался лишь 512 Кбайт.
Но ещё больший интерес вызывает тот факт, что конструкторы смогли «заставить»L2-кэш работать на тактовой частоте процессорного ядра. Напомню, что та жеконцепция была реализована в Pentium Pro, но при этом разработчики«столкнулись» на стадии производства (процент выхода двух качественныхкристаллов оказался ниже предполагаемого), и процессор оказался довольнодорогим. Возможно, именно поэтому Pentium II изначально создавался с«разделением» кристаллов (основного и КЭШа L2), за что пришлось расплачиваться«половиной» тактовой частоты кэш-памяти второго уровня.
Высокая частота работы КЭШа спровоцировала увеличение теплоотдачи процессорногоблока, поэтому потребовалось использование массивной поглощающей теплопластины, что, в свою очередь, привело к увеличению веса и габаритов модуля.
В каждом модуле Slot 2 три специальных области данных: доступная только длячтения, область для чтения/записи и динамическая информация о температуре внутри процессорного модуля. В области первого типа помещенаинформация о версии процессора, данные о пошаговой отладке и указана предельнодопустимая температура. Во второю область памяти пользователи могут вводитьсвою информацию.
Доступк динамическим данным об изменении температуры даёт возможность управляющимпрограммам оповещать администратора об
опасныхсистемных событиях.
Увеличение ёмкости КЭШа второго уровня повышает пропускную способность системыблагодаря мгновенному доступу процессоров к часто используемым данным иинструкциям, хранящимся в быстрой кэш-памяти. По заявлению Intel, увеличениеёмкости КЭШа с 512 Кбайт до 1 Мбайт приводит иногда к 20% росту общейпроизводительности системы.
Дляобъяснения этого явления уместно провести аналогию с холодильниками,используемую Intel: хранение запаса продуктов в
холодильникеизбавляет поваров ресторана от необходимости ездить по магазинам, закупаяпровизию. Чем больше холодильник, тем лучше,
особеннов час пик, когда количество клиентов в ресторане резко возрастает. Так вот, вслучае с сервером «холодильник» — это кэш-память второго уровня, а «магазин»(где доступны те же продукты) — в принципе более медленная системная память.
Большойкэш L2 значительно повышает общую производительность многопроцессорныхконфигураций в системах, работающих с крупными массивами несопоставимых данных.По информации Intel, проведённые корпорацией тесты ZD ServerBench показалипочти
пропорциональныйрост производительности системы по мере установки дополнительных процессоров смегабайтным КЭШем.
Усовершенствованная архитектура Xeon, допускающая 36-разрядную адресациюфизической памяти, теоретически позволяет процессору получать доступ ксистемной памяти ёмкостью до 64 Гбайт. Новый механизм постраничного обмена PageSize Extension — 36 останется практически незаметной для глаз пользователя иразработчиков приложений. В настоящее время PSE-36 поддерживают операционныесистемы Windows NT, SCO UnixWareи Sun Solaris. Для остальных операционных систем потребуетсяобновить драйвер блока управления памятью.
Intel 450NX PCIset стал первым микросхемным набором, оптимизированным дляPentium II Xeon. Он выпускается в двух вариантах, Basic и Full, соответственнодля серверных hi-end и систем среднего уровня. Они имеют одинаковую структуруядра, но отличаются производительностью и ценой.
Basic PCIset поддерживает до двух разъёмов 32-разрядной PCI, один — 64-разрядной и до 4 Гбайт системной памяти типа EDO. Его более
совершенный«родственник» Full PCIset поддерживает до четырёх слотов типа EDO. Эти чипсетыобъединяет функционирование на
100-мегагерцовойчастоте системной шины и возможность поддержки многопроцессорных (до четырёхXeon) конфигураций. 64-разрядная
шинаPCI способна существенным образом повысить общую производительность системы сучётом оптоволоконной технологии обмена данными с дисковыми массивами,использования высокопроизводительных сетевых магистралей на основе АТМ, GigabitEthernet и других. Повышается, по сути, синхронизация мощности процессора ипроизводительности подсистемы ввода-вывода.
Xeon, как я уже отмечал, предназначен не только для серверов, но и для рабочихи графических станций, для которых одним из важнейших
параметровявляется производительность видеоподсистемы. Для них разработан чипсет Intel440GX AGPset на базе известного микросхемного набора 440BX. 440GX управляетработой порта AGP в режиме 2х. Режим удвоенной производительности реализуетсяблагодаря так называемой технологии двойной накачки — данные передаются как попереднему, так и по заднему фронтам тактовых импульсов (у обычной AGP — толькопо переднему), при этом полоса пропускания достигает значения 533 Мбайт/с.Физические параметры интерфейса AGP остаются прежними.
Ещё одой особенностью набора чипсета 440GX стала возможность обращения кпамяти ёмкостью до 2 Гбайт, что в два раза больше, чем у
егоприемника.
Несмотря на тот факт, что в настоящий момент понятие многопроцессорностиассоциируется у Intel лишь с четырьмя устройствами на одной плате, ведутсяработы по созданию симметричных мультипроцессорных систем, поддерживающих довосьми «Ксеонов». Разработки восьмиканального чипсета для Xeon ведутся фирмойCorollary, дочерней компанией Intel. И, само собой, возможны кластерныерешения, скажем, на основе архитектуры распределённой памяти (NUMA). В обоихслучаях, как правило, не требуется «переписывать» прикладные программы (правда,операционная система требует некоторой оптимизации). В процессорной шинечипсета Intel 450NX PCIset предусмотрен так называемый разъём кластерногосоединения, что упрощает построение кластерного соединения на основестандартных четырёхпроцессорных узлов.
Ещё одним перспективным направлением является кластер с передачей сообщений.Суть её состоит в отсутствии разделения ресурсов. Отдельно стоящие узлыкластера обмениваются данными, например, тактовыми импульсами, сигнализирующимио нормальном состоянии системы. И хотя LAN-соединение остаётся работоспособным,существует необходимость в сети нового типа — так называемой SAN (System area Network).
В завершении хотел бы отметить, что некоторые ведущие западные производители(IBM, NCR, Dell) уже начали поставки систем на базе
Xeon,а на презентации процессора в России компании Kraftway и «Вист» такжепредставили свои новые серверные решения.
Ориентировочные цены на Pentium Xeon составят 1124долларов (L2 512 Кбайт) и 2836 долларов (L2 1 Мбайт) при поставках от тысячи штук.
Список литературы:
Д-р Джон Гудмен«Управление памятью для всех»,
Диалектика, Киев, 1996
В.Л. Григорьев«Микропроцессор i486. Архитектура и программирование», Гранал,Москва, 1993.
Информационно — рекламная газета «КМ — информ»
газета «Компьютер World/Киев»
газета «Компьютер Week/Moscow»
Ж.К. Голенкова и др.«Руководство по архитектуре IBM PC AT», Консул, Минск, 1993
Руководство программиста попроцессору Intel i386,
Техническая документацияуровня 2, (C) Intel Corp.
Руководство программиста по процессору Intel i486,
Техническая документацияуровня 2, (C) Intel Corp.
Материалы эхоконференцииSU.HARDW.PC.CPU компьютерной сети FidoNet