Реферат: Процессоры

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИХАНТЫ-МАНСИЙСКИЙ АВТОНОМНЫЙ ОКРУГ

ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ И НАУКИ

МУНИЦИПАЛЬНОЕ ПРОФЕССИОНАЛЬНОЕ УЧИЛИЩЕ №1

УТВЕРЖДЕНО

Зам. директора по УПР

_______

«____»________2002 г.

ПИСЬМЕННАЯ ЭКЗАМЕНАЦИОННАЯ

РАБОТА

Учащегося:

Специальность:____________________________

Тема:_____________________________________

__________________________________________

Преподаватель:

Консультант:

Дата выдачи задания: «___»_____2002 г.

Срок сдачи: «___»_____2002 г.

Подпись учащегося: «___»_____2002 г.

г. Покачи 2002 г.

Содержание

1. Введение в персональный компьютер.

2. Отличия процессоров.

2.1. Отличия пpоцессоpов SX, DX, SX2, DX2и DX4.

2.2. Обозначение «SL-Enhanced» yпpоцессоpов Intel 486.

2.5. Идентификация чипов Intel и AMD.

2.5.2. Версия процессора.

2.5.4. Перемаркированные процессоры.

3. Процессоры фирмы Intel.

3.1. Современная микропроцессорнаятехнология фирмы Intel.

3.2. Первые процессоры фирмы Intel.

3.3. Процессор 8086/88.

3.4. Процессор 80186/88.

3.5. Процессор 80286.

3.6. Процессор 80386.

3.7. Процессор 80486.

     3.7.1.Процессор i486SX.

      3.8. Intel OverDrive процессор.

3.9. Процессор Pentium.

3.10. Процессор Pentium Pro.

3.10.1. Общее описание процессора.

3.10.2. Два кристалла в одном корпусе.

3.10.3. Значения тестов для некоторыхчипов фирмы Intel.

4. Процессоры конкурентов Intel.

4.1. Первые процессоры конкурентов Intel.

4.2. Процессоры фирмы AMD.

4.2.1. Судебное разбирательство с Intel.

4.2.2. Процессоры семейства AMD5k86.

4.2.2.1 Экскурсия по внутреннейархитектуре.

4.2.2.2. Пример маркировки микропроцессораAMD5k86-P75.

4.2.2.5. AMD планирует выпустить K5.

4.3. Процессоры NexGen.

4.4. Процессоры Cyrix.

4.5. Процессоры Sun Microsystems.

4.6. Процессоры Digital Equipment.

4.7. Процессоры Mips.

4.8. Процессоры Hewlett-Packard.

4.9. Процессоры Motorola.

5. Лабораторные испытания и тестированиемикропроцессоров.

5.1. Лабораторные испытания процессоровi386DX.

5.2. Результатытестирования микропроцессоров с помощью пакета Speed Test.

6. Сравнительныйанализ. ………………..                                          7.  Pentium II. …………………………….……………………….      7.1 Pentium II. ……………………………………………………..……. 7.2 Deschutes. …………………………………………………………… 7.3 Мобильный Pentium II. ……………………………………………. 7.4Celeron. ……………………………………………………………… 7.5  Pentium “Xeon”. ……………………………………………………

1. Введение в персональный компьютер.

Персональныйкомпьютер — это такой компьютер, который может себе позволить купить отдельныйчеловек.

Наиболее«весомой» частью любого компьютера является систем­ный блок (иногдаего называют компьютером, что является недопусти­мой ошибкой). Внутри негорасположены блок питания, плата с цен­тральным процессором (ЦП), видеоадаптер,жесткий диск, дисководы гибких дисков и другие устройства ввода / выводаинформации. Зачас­тую видеоадаптер и контроллеры ввода/ вывода размещены прямона пла­те ЦП. В системном блоке могут размещаться средства мультимедиа:звуковая плата и устройство чтения оптических дисков — CD-ROM. Кро­ме того, впонятие «компьютер» входит клавиатура и монитор. Манипу­лятор мышьявляется необязательной, но весьма важной деталью. Те­перь коротко о выбореосновных компонентов ПК. Процессор является основным компонентом любого ПК. Внастоящее время наиболее распрос­транены процессоры фирмы Intel, хотя ЦП другихфирм (AMD, Cyrix, NexGen и др.) составляют им достойную конкуренцию. Имеетсятакже ма­теринская (MotherBoard) плата. Основной характеристикой материнскихплат является их архитектура. Основными шинами до недавнего времени считалисьISA (Industrial Standard Architecture) и EISA (Extended ISA), и имеющиеразрядность 10 и 32 соответственно. Для обеспечения нормальной работывидеоадаптеров был разработан стандарт VESA (Video Electronic Standart Association),рассчитанный на применение процес­сора серии 486, работающей на частотепроцессора и являющейся «прис­тавкой» к шине ISA или EISA. Споявлением процессора Pentium была разработана самостоятельная шина PCI,которая на сегодняшний день является наиболее быстрой и перспективной. Обычно вПК присутствует дисковод для гибких дисков. Существует два стандарта:5.25" и 3.5". На сегодняшний день большинство компьютеровпоставляется с дисково­дом 3.5". Жeсткий диск (винчестер), начав своешествие с объема в 5 МБ, достиг небывалых высот. На сегодняшний день не удивятдиски объемом 2 или 4 ГБ. Для большинства приложений вполне достаточно объема420 — 700 МБ, однако если вам приходится работать с полноц­ветными графическимиизображениями или версткой, то придется поду­мать о диске в 1.5- 2 ГБ или дажепаре таких дисков. Следует при­дать значение не только емкости диска, но и еговременным характе­ристикам. В качестве оптимальных можно порекомендоватьвинчестеры фирмы Western Digital, Seagate или Corner. Для оперативной памяти(RAM, ОЗУ) закон простой: чем больше, тем лучше. В настоящее время трудно найтиконфигурацию с объемом памяти менее 4 МБ. Для нор­мальной работы большинствапрограммных продуктов желательно иметь хотя бы заметить, что при увеличении ОЗУболее чем 32 МБ быстродей­ствие ПК увеличивается менее значительно, и такаяконфигурация необ­ходима художникам и мультипликаторам. Hеотъемлемой частью ПКявляет­ся клавиатура. Стандартной в России является 101 — клавишная клавиа­турыс английскими и русскими символами. Мышь. Необходима для рабо­ты с графическимипакетами, чертежами, при разработке схем и при ра­боте под Windows. Следуетотметить, что некоторое игровое и прог­раммное обеспечение требует наличиемыши. Основной ха мыши является разрешающая способность, измеряемая в точках надюйм (dpi). Нор­мальной считается мышь, обеспечивающая разрешение 300-400 dpi.Неп­лохо иметь также специальный коврик под мышь, что обеспечивает еесохранность и долговечность. Выбору монитора ПК следует уделить осо­боевнимание, поскольку от качества монитора зависит сохранность ва­шего зрения иобщую утомляемость при работе. Мониторы имеют стандар­тный размер диагонали в14,15,17,19,20 и 21 дюйм. Необходимый раз­мер диагонали монитора выбираетсяисходя их разрешения, при кото­ром вы собираетесь работать. Так, длябольшинства приложений вполне достаточно иметь 14 дюймовый монитор, которыйобеспечивает работу при разрешениях до 800 на 600 точек. ПК может иметьзвуковую карту. С одной стороны, звуковая карта не является необходимымэлементом компьютера, но, с другой стороны, позволяет превратить его в мощноеподспорье при обучении и написании музыки, изучении языков. Да и ка­кой интересбить врагов на экране, если не слышишь их предсмертные крики. Простейшей картойявляется Adlib, который позволяет воспроиз­водить только музыку безоцифрованной речи. И CD-ROM, с одной сторо­ны, также не являются необходимойдля функционирования компьютера частью, но становится все более и болеепопулярными в связи с тен­денцией поставлять профессиональное, обучающее иигровое програм­мное обеспечение на CD-дисках.

 

2. Отличия процессоров.

2.1. Отличия процессоров SX, DX, SX2, DX2 и DX4.

SX и DX обозначает«облегченную» и полную версию одного и того же процессора. Для 386вариант SX был сделан с 16-pазpядным интерфейсом, что позволяло экономить наобвязке и устанавливать па­мять по два SIMM, а не по четыре, как для DX. Пpиработе с 16-pазpядными программами 386SX почти не отстает от 386DX на той жечастоте, однако на 32-pазpядных программах он работает ощутимо мед­леннее из-заразделения каждого 32-pазpядного запроса к памяти на два 16-pазpядных. Hа самомже деле большинство компьютеров с 386DX работают быстрее компьютеров с SX дажена 16-pазpядных программах – благодаря  тому, что на платах с 386DX чаще всегоустановлен аппаратный кэш, которого нет на большинстве плат с SX. внутренняяархитектура 386SX — полностью 32-pазpядная, и программно обнаружить разницумежду SX и DX без запроса кода процессора или измерения скорости работымагистpали в общем случае невозможно.

Для 486 SXобозначает вариант без встроенного сопроцессора. Ранние модели представлялисобой просто отбраковку от DX с неисправным сопроцессором – сопроцессор в нихбыл заблокирован, и для уста­новки такого процессора вместо DX требовалось перенастроитьсистем­ную плату. Более поздние версии выпускались самостоятельно, и могутустанавливаться вместо DX без изменения настройки платы. Кроме от­сутствиясопроцессора и идентификационных кодов, модели SX также ни­чем не отличаются отсоответствующих моделей DX, и программное различение их в общем случае тоженевозможно.

SX2, DX2 и DX4 –варианты соответствующих процессоров с внутренним удвоением или утроениемчастоты. Hапpимеp, аппаратная настройка платы для DX2-66 делается, как дляDX33, и на вход подает­ся частота 33 МГц, однако в программной настройке можетпотребоваться увеличение задержек при обращении к памяти для компенсациивозросшей скорости работы процессора. Все внутренние операции в процессорахвыполняются соответственно в два и три раза быстрее, одна­ко обмен по внешнеймагистpали определяется внешней тактовой часто­той. За счет этого DX4-100работает втрое быстрее DX33 только на тех участках программ, которые целикомпомещаются в его внутренний кэш, на больших фрагментах это отношение можетупасть до двух с полови­ной и меньше.

Hекотоpые сериипроцессоров AMD (в частности – 25253) выпус­кались с единым кристаллом DX4,который мог переключаться в режим удвоения по низкому уровню на выводе B-13.маркировка как DX2 или DX4 проводилась по результатам тестов; соответственно,процессор, маркированный как DX4, мог работать как DX2 и наоборот. ПроцессорыIntel DX4 – 100 могут переключаться в режим удвоения по низкому уровню навыводе R – 17.

процессор AMD 5x86 стандартно работает с утроениемвнешней частоты, а низкий уровень на выводе R – 17 переключает его в режимучетвеpения.

2.2. Обозначение «SL – Enhanced» упроцессоров Intel 486.

Hаличие SMM (System Management Mode — режим управлениясис­темой), используемого главным образом для перевода процессора в эко­номичныйрежим. Еще обозначается как «S – Series», с добавлением к обозначениюпроцессора суффикса "–S". В SL – Enhanced процессорах имеется такжекоманда CPUID, которая возвращает идентификатор процессора.

2.3. Отличия процессоров UMC 486 U5 от Intel, AMD идругих.

Прежде всего — оптимизированным микрокодом, за счет чего часто используемые командывыполняются за меньшее число тактов, чем в процессорах Intel, AMD, Cyrix идругих. Пpоцессоpы U5 не имеют внутреннего умножения частоты, а результаты в 65МГц и подобные, по­лучаемые некоторыми программами, получаются потому, что дляопределения частоты программе необходимо правильно опознать процессор — точнее,число тактов, за которое он выполнит тестовую последова­тельность, абольшинство распространенных программ не умеют правильно опознавать U5. По этойже причине на U5 зависает игра Heretic, ошибочно найдя в нем сопроцессор — чтобы это исключить, нужно в командной строке Heretic указать ключ "-debug".

2.4. Чипы RISC иCISC.

RISC — это аббревиатура от ReducedInstruction Set Computer (компьютер с сокращенным набором команд), а CISC — аббревиатура от Comlex Instruction Set Computer (компьютер с полным наборомкоманд). Существенная разница между ними состоит в следующем: чипы RISC пони­маютлишь некоторые инструкции, но каждую из них они могут выпол­нить очень быстро.Программы для RISC-машин достаточно сложны, но выполняются они быстрее тех,которые совместимы с CISC-машинами. Hо, может быть, это и не так? (Исследованияпроизводительности еще не завершены.)

Все  чипы  Intel  80x86  (как  и   чипы       Motorola    680x0

(68010,68020,..,68040), используемые в компьютерах Macintosh и NeXT)являются яркими представителями CISC-чипов. Hекоторые рабочие стан­ции, начинаяс IBM, используют чипы RISC.

2.5. Идентификация чипов Intel и AMD.

2.5.1. Кодексы даты.

Просите у продавцакодексы даты прежде, чем Вы купите про­цессор. Все ЦПУ имеют дату выпуска,которая проставляется на корпу­се. Удостоверьтесь, что Вы приобретаете новыйпроцессор, а не прош­логодний.

Например A80486DX33 ( by Intel )

V74400223

V   — первый символ, код завода (plantcode);

7 — второй символ, этопоследняя цифра года выпуска процессора, рассматриваемый процессор выпущен в1987 году;

44 — следующие две цифры, 44-я рабочаянеделя в этом году (1987); 002 — следующие 3 цифры, номер партии (sequencenumber);

3  -  код замены (change code).

Hапример E6 9433 DPD (on AMD CPUs)

E6   — версия реализации (versionrelease);

9433 — выпущен на 33 рабочей неделе 1994года;

DPD  — шифр серии (wafer number);

2.5.2. Версия процессора.

Просите данные оверсии процессора. Сравните версию процес­сора, который Вам предлагают спроцессорами Intel 800-468-3548 или AMD 800-222-9323, так как более ранниеверсии процессоров имеют ошибки и различные дефекты.

2.5.3. Demo-образцы.

Никогда не платитеполную цену за demo-образцы. AMD и Intel делают технические образцы для каждойверсии процессора, прежде, чем будет начат серийный выпуск процессора. ТакойЦПУ может иметь ошиб­ки(дефекты), так как обычно создан для испытания. Совершенноне предполагается, что такой процессор продадут конечному пользователю.

Hапример:

Нормальная версия (normal version):i486DX-33:

Разработка образцов(engineering samples): i486DX-33 E

2.5.4. Перемаркированные процессоры.

Перемаркированныепроцессоры (remaked CPUs) — это процессо­ры, которые разгоняют сильнее, чеморигинальные для более высокой це­ны и прибыли. Эти действия считаютсянезаконными. Использование та­кого ЦПУ всегда рискованно. Разгонка процессораиногда бывает успеш­ной, например, с 33MHz до 40MHz, или с 25MHz до 33MHz, ноне всегда. Использование разогнанного процессора приводит к перегреванию чипа иего нестабильной работе, что часто служит причиной всевозможных оши­бок, сбоеви зависаний системы. Перемаркированный и разогнанный ЦПУ имеет гораздо меньшийсрок службы, чем оригинальный процессор, бла­годаря перегреванию чипа.


3. Процессоры фирмы Intel.

3.1. Современная микропроцессорная технология фирмыIntel.

Достижения фирмыIntel в искусстве проектирования и произ­водства полупроводников делаютвозможным производить мощные микроп­роцессоры в все более малых корпусах.Разработчики микропроцессоров в настоящее время работают с комплиментарнымтехнологическим процессом метал – оксид полупроводник (CMOS) с разрешениемменее, чем микрон.

Использованиесубмикронной технологии позволяет разработчи­кам фирмы Intel располагать большетранзисторов на каждой подложке. Это сделало возможным увеличение количестватранзисторов для се­мейства X86 от 29,000 в 8086 процессоре до 1,2 миллионов впроцессо­ре Intel486 DX2, с наивысшим достижением в Pentium процессоре. Вы­полненныйпо 0.8 микронной BiCMOS технологии, он содержит 3.1 мил­лиона транзисторов.Технология BiCMOS объединяет преимущества двух технологий: биполярной(скорость) и CMOS ( малое энергопотребление ). С помощью более, чем в два разабольшего количества транзисторов Pentium процессора по сравнению с Intel486,разработчики поместили на подложке компоненты, ранее располагавшимися снаружипроцессора. Наличие компонентов внутри уменьшает время доступа, что существенноувеличивает производительность. 0.8 микронная технология фирмы Intel используеттрехслойный металл и имеет уровень, более высокий по сравнению с оригинальной1.0 микронной технологией двухслойного ме­талла, используемой в процессореIntel486.

3.2. Первые процессоры фирмы Intel.

За 20-летнюю историюразвития микропроцессорной техники, ве­дущие позиции в этой области занимаетамериканская фирма Intel (INTegral ELectronics). До того как фирма Intel началавыпускать микрокомпьютеры, она разрабатывала и производила другие виды интег­ральныхмикросхем. Главной ее продукцией были микросхемы для кальку­ляторов. В 1971 г.она разработала и выпустила первый в мире 4-бит­ный микропроцессор 4004. Фирмапервоначально продавала его в качес­тве встроенного контроллера (что-то вродесредства управления улич­ным светофором или микроволновой печью). 4004 былчетырехбитовым, т.е. он мог хранить, обрабатывать и записывать в память илисчиты­вать из нее четырехбитовые числа. После чипа 4004 появился 4040, но 4040поддерживал внешние прерывания. Оба чипа имели фиксированное число внутреннихиндексных регистров. Это означало, что выполняемые программы были ограниченычислом вложений подпрограмм до 7.

В 1972 г., т.е.спустя год после появления 4004, Intel вы­пустила очередной процессор 8008, ноподлинный успех ей принес 8-битный микропроцессор 8080, который был объявлен в1973 г. Этот микропроцессор получил очень широкое распространение во всем мире.Сейчас в нашей стране его аналог — микропроцессор KP580ИК80 приме­няется вомногих бытовых персональных компьютерах и разнообразных контроллерах. С чипом8080 также связано появление стека внешней па­мяти, что позволило использоватьпрограммы любой вложенности.

Процессор 8080 был основной частью первого небольшого ком­пьютера,который получил широкое распространение в деловом мире. Операционная системадля него была создана фирмой Digital Research и называлась Control Program forMicrocomputers (CP/M).

3.3. Процессор 8086/88.

В 1979 г. фирмаIntel первой выпустила 16-битный микропро­цессор 8086, возможности которогобыли близки к возможностям процес­соров миникомпьютеров 70-х годов.Микропроцессор 8086 оказался «пра­родителем» целого семейства,которое называют семейством 80x86 или х86.

Hесколько позже появился микропроцессор 8088,архитектурно повторяющий микропроцессор 8086 и имеющий 16-битный внутренние ре­гистры,но его внешняя шина данных составляет 8 бит. Широкой попу­лярностимикропроцессора способствовало его применение фирмой IBM в персональныхкомпьютерах PC и PC/XT.

3.4. Процессор 80186/88.

В 1981 г. появились микропроцессоры 80186/80188,которые сохраняли базовую архитектуру микропроцессоров 8086/8088, но содер­жалина кристалле контроллер прямого доступа к памяти, счетчик/тай­мер и контроллерпрерываний. Кроме того, была несколько расширена система команд. Однакоширокого распространения эти микропроцессоры (как и персональные компьютерыPCjr на их основе), не получили.

3.5. Процессор 80286.

Следующим крупным шагом в разработке новых идей сталмикроп­роцессор 80286, появившийся в 1982 году. При разработке были учтеныдостижения в архитектуре микрокомпьютеров и больших компьютеров. Процессор80286 может работать в двух режимах: в режиме реального адреса он эмулируетмикропроцессор 8086, а в защищенном режиме вир­туального адреса (ProtectedVirtual Adress Mode) или P-режиме пре­доставляет программисту много новыхвозможностей и средств. Среди них можно отметить расширенное адресноепространство памяти 16 Мбайт, появление дескрипторов сегментов и дескрипторныхтаблиц, на­личие защиты по четырем уровням привилегий, поддержку организациивиртуальной памяти и мультизадачности. Процессор 80286 применяется в ПК PC/AT имладших моделях PS/2.

3.6. Процессор 80386.

При разработке32-битного процессора 80386 потребовалось ре­шить две основные задачи — совместимость и производительность.  Пер­вая из них была решена с помощьюэмуляции микропроцессора 8086 — ре­жим реального адреса (Real Adress Mode) илиR-режим.

В Р – режимепроцессор 80386 может выполнять 16-битные прог­раммы (код) процессора 80286 безкаких-либо дополнительных модифика­ций. Вместе с тем, в этом же режиме он можетвыполнять свои «естес­твенные» 32-битные программы, что обеспечиваетповышение производи­тельности системы. Именно в этом режиме реализуются всеновые воз­можности и средства процессора 80386, среди которых можно отметитьмасштабированную индексную адресацию памяти, ортогональное использо­ваниерегистров общего назначения, новые команды, средства отладки. Адресноепространство памяти в этом режиме составляет 4 Гбайт.

Микропроцессор 80386дает разработчику систем большое число новых и эффективных возможностей,включая производительность от 3 до 4 миллион операций в секунду, полную32-битную архитектуру, 4 гига­битное (2 байт) физическое адресное пространствои внутреннее обес­печение работы со страничной виртуальной памятью.

Несмотря на введениев него последних достижений микропро­цессорной техники, 80386 сохраняетсовместимость по объектному коду с программным обеспечением, в большомколичестве написанным для его предшественников, 8086 и 80286. Особый интереспредставляет такое свойство 80386, как виртуальная машина, которое позволяет80386 пе­реключаться в выполнении программ, управляемых различными операцион­нымисистемами, например, UNIX и MS-DOS. Это свойство позволяет производителяморигинальных систем непосредственно вводить приклад­ное программное обеспечениедля 16-битных машин в системе на базе 32-битных микропроцессоров. Операционнаясистема P-режима может соз­давать задачу, которая может работать в режимевиртуального процес­сора 8086 (Virtual 8086 Mode) или V-режим. Прикладнаяпрограмма, ко­торая выполняется в этом режиме, полагает, что она работает напро­цессоре 8086.

32-битнаяархитектура 80386 обеспечивает программные ресур­сы, необходимые для поддержки«больших » систем, характеризуемых операциями с большими числами,большими структурами данных, больши­ми программами (или большим числомпрограмм) и т.п. Физическое ад­ресное пространство 80386 состоит из 2 байт или4 Гбайт; его логи­ческое адресное пространство состоит из 2 байт или 64терабайт (Тбайт). Восемь 32-битных общих регистров 80386 могут быть взаимоза­меняемоиспользованы как операнды команд и как переменные различных способов адресации.Типы данных включают в себя 8-, 16- или 32-бит­ные целые и порядковые,упакованные и неупакованные десятичные, ука­затели, строки бит, байтов, слов идвойных слов. Микропроцессор 80386 имеет полную систему команд для операций надэтими типами дан­ных, а также для управления выполнением программ. Способыадресации 80386 обеспечивают эффективный доступ к элементам стандартных струк­турданных: массивов, записей, массивов записей и записей, содержа­щих массивы.

Микропроцессор 80386реализован с помощью технологии фирмы Intel CH MOSIII — технологическогопроцесса, объединяющего в себе возможности высокого быстродействия технологииHMOS с малым потреб­лением технологии кмоп. Использование геометрии 1,5 мкм ислоев ме­таллизации дает 80386 более 275000 транзисторов на кристалле. Сей­часвыпускаются оба варианта 80386, работающих на частоте I2 и I6 МГц без состоянийожидания, причем вариант 80386 на 16 МГц обеспечи­вает скорость работы 3-4миллиона операций в секунду.

Микропроцессор 80386 разделен внутри на 6 автономно ипарал­лельно работающих блоков с соответствующей синхронизацией. Все внут­ренниешины, соединяющие эти блоки, имеют разрядность 32 бит. Конве­йерная организацияфункциональных блоков в 80386 допускает времен­ное наложение выполненияразличных стадий команды и позволяет однов­ременно выполнять несколькоопераций. Кроме конвейерной обработки всех команд, в 80386 выполнение рядаважных операций осуществляется специальными аппаратными узлами. Блокумножения/деления 80386 может выполнять 32-битное умножение за 9-41 тактсинхронизации, в зависи­мости от числа значащих цифр; он может разделить32-битные операнды за 38 тактов (в случае чисел без знаков) или за 43 такта (вслучае чисел со знаками). Регистр группового сдвига 80386 может за один тактсдвигать от 1 до 64 бит. Обращение к более медленной памяти (и­ли к устройствамввода/вывода) может производиться с использованием конвейерного формированияадреса для увеличения времени установки данных после адреса до 3 тактов присохранении двухтактных циклов в процессоре. Вследствие внутреннего конвейерногоформирования адреса при исполнении команды, 80386, как правило, вычисляет адреси опре­деляет следующий магистральный цикл во время текущего магистрально­гоцикла. Узел конвейерного формирования адреса передает эту опере­жающуюинформацию в подсистему памяти, позволяя, тем самым, одному банку памятидешифрировать следующий магистральный цикл, в то время как другой банкреагирует на текущий магистральный цикл.

3.7. Процессор 80486.

В 1989 г. Intel представила первого представителясемей­ства 80х86, содержащего более миллиона (а точнее, 1,2 миллиона) транзисторов в чипе. Этот чип во многом сходен с 80386. Он на 100% программносовместим с микроп­роцессорами 386(ТМ) DX & SX. Один миллион транзисторовобъединенной кэш-памяти (сверхбыстрой оперативной памяти), вместе с аппаратуройдля выполнения операций с плавающей запятой и управлением памяти на одноймикросхеме, тем не менее поддерживают программную совмести­мость с предыдущимичленами семейства процессоров архитектуры 86. Часто используемые операции выполняютсяза один цикл, что сравнимо со скоростью выполнения RISC-команд.Восьмикилобайтный унифицирован­ный кэш для кода и данных, соединенный с шинойпакетного обмена дан­ными со скоростью 80/106 Мбайт/сек при частоте 25/33 Мгерцгаранти­руют высокую производительность системы даже с недорогими дисками(DRAM). Новые возможности расширяют многозадачность систем. Новые операцииувеличивают скорость работы с семафорами в памяти. Оборудо­вание на микросхемегарантирует непротиворечивость кэш-памяти и под­держивает средства дляреализации многоуровневого кэширования. Встроенная система тестированияпроверяет микросхемную логику, кэш-память и микросхемное постраничноепреобразование адресов памя­ти. Возможности отладки включают в себя установкуловушек кон­трольных точек в выполненяемом коде и при доступе к данным. Процес­сорi486 имеет встроенный в микросхему внутренний кэш для хранения 8Кбайт команд иданных. Кэш увеличивает быстродействие системы, от­вечая на внутренние запросычтения быстрее, чем при выполнении цик­ла чтения оперативной памяти по шине.Это средство уменьшает также использование процессором внешней шины. Внутреннийкэш прозрачен для работающих программ. Процессор i486 может использоватьвнешний кэш второго уровня вне микросхемы процессора. Обычно внешний кэш позво­ляетувеличить быстродействие и уменьшить полосу пропускания шины, требуемуюпроцессором i486.

3.7.1.Процессор i486SX

Появлениенового микропроцессора i486SX фирмы Intel  вполне можно считать одним изважнейших событий 1991 года. Уже

предварительныеиспытания показали, что компьютеры на базе i486SX с тактовой частотой   20 МГцработают быстрее (примерно на 40%) компьютеров, основанных на i80386DX стактовой частотой 33 МГц. Микропроцессор i486SX, подобно оригинальному i486DX,содержит на кристалле и кэш-память, а вот математический сопроцессор у негозаблокирован. Значительная экономия (благодаря исключению затрат натестирование сопроцессора) позволила фирме Intel существенно снизить цены нановый микропроцессор. Надо сказать, что если микропроцессор i486DX былориентирован на применение в сетевых серверах  и рабочих станциях, тоi486SX послужил отправной точкой для создания мощных настольных компьютеров.Вообще говоря, в семействе микропроцессоров i486 предусматривается несколько новыхвозможностей для построения мультипроцессорных систем: соответствующие командыподдерживают механизм семафоров памяти, аппаратно — реализованное выявлениенедостоверности строки кэш-памяти обеспечивает согласованность междунесколькими модулями кэш-памяти и т.д. Для микропроцессоров семейства i486допускается адресация физической памяти размером 64 Тбайт

3.8. Intel OverDrive процессор.

Возможностьпостоянного совершенствования. Пользователи пер­сональных компьютеров все чащесталкиваются с этим по мере все воз­растающих требований к микропроцессорам состороны аппаратного и программного обеспечения. Фирма Intel уверена: лучшаястратегия со­вершенствования — первоначально заложенная в систему возможностьмо­дернизации, модернизации согласно вашим нуждам. Впервые в мире та­каявозможность предоставляется нашим потребителям. Фирма Intel приступила квыпуску Intel OverDrive процессора, открывающего новую категорию мощныхсопроцессоров. После простой установки этого сопро­цессора на плату резковырастет скорость работы всей системы и прик­ладных программ в MS-DOS, Windows,OS/2, Windows'95 и UNIX.

С помощью этойодной-единственной микросхемы Вы сразу же сможете воспользоватьсяпреимуществами новой стратегии фирмы Intel, заложенной в нашей продукции. Когданастанет неотвратимый момент, когда Вам потребуется производительность большая,чем у Вашего ком­пьютера, то все, что Вам будет нужно — это вставить OverDriveпро­цессор в Вашу систему — и пользоваться преимуществами, которые даст Вамновая микропроцессорная технология фирмы Intel. Более чем прос­то модернизация,OverDrive процессор — это стратегия защиты Ваших настоящих и будущих вкладов вперсональные компьютеры.

Intel OverDriveпроцессор гарантирует Вам отвечающую стан­дартам и экономичную модернизацию.Всего лишь одна микросхема увели­чит вычислительную мощь Вашего компьютера дотребований самого сов­ременного программного обеспечения и даже тех программ,которые еще не написаны, в MS-DOS, в Windows, в PS/2, в UNIX, от AutoCAD — доWordPerfect.

Итак, наш первый микропроцессорв серии Single Chip Upgrade (Качественное улучшение — одной микросхемой) — этоOverDrive процес­сор для систем на основе Intel i486SX. Установленный вOverDrive – разъем, этот процессор позволяет системе i486SX использо­ватьновейшую технологию «удвоения скорости», используемую в процес­сореi486DX2, и дающую общее увеличение производительности до 70%. OverDriveпроцессор для систем i486SX содержит модуль операций над целыми числами, модульопераций над числами с плавающей точкой, мо­дуль управления памятью и 8Ккэш-памяти на одном кристалле, работаю­щем на частоте, в два раза превышающейтактовую частоту системной шины. Это уникальное свойство позволяет Вам удвоитьтактовую часто­ту Вашей системы, не тратясь на покупку и установку другихдополни­тельных компонентов. OverDrive процессор удвоит, например, внутрен­нюючастоту МП i486SX 25 МГц до 50 МГц.

Хотя Intel OverDrive- это совершенно новая технология ка­чественной модернизации, в нем узнаются ифамильные черты Intel. Изготовленный и испытанный в соответствии с жесткимистандартами Intel, OverDrive отличается зарекомендовавшими себя свойствами про­дукцииIntel: качеством и надежностью. OverDrive обеспечен постоян­ной гарантией ипривычным сервисом и поддержкой во всем мире. OverDrive полностью совместимболее чем с 50000 прикладных программ. OverDrive процессор для i486SX — толькопервый из наших новых про­цессоров. Во втором полугодии 1992 года мы выпустимOverDrive про­цессор для систем i486DX2, самих по себе представляющих новоепоко­ление технологии МП. Мощный и доступный, OverDrive процессор проло­жит дляВас непрерывный путь к качественно новым уровням производи­тельностиперсональных компьютеров.

Hекоторые результатылабораторных испытаний Intel OverDrive процессора:

1. Работа сMicrosoft Word for Windows 6.1 в среде Windows

3.0, популярным текстовым процессором.

Тест исполнялся насистеме с i486SX 20 МГц с файлом 330 КВ. WordPerfect, преобразованном в форматWindows Word, было выполнено 648 контекстных поисков и замен, проверкаправописания во всем фай­ле, затем файл был сохранен.

Время исполнения:

i486SX без OverDrive =107 с

----------------------------                  ВЫИГРЫШ= 57%

i486SX сOverDrive = 68 с

2. Работа с Lotus1-2-3 Release 3.0, электронной таблице, приближающейся по возможностям кинтегрированной среде, обладающей широким выбором аналитических, экономическихи статистических фун­кций.

Тест исполнялся наi486SX 20 МГц с таблицей объемом 433К на 10000 ячеек, которая была загружена ипересчитана. Кроме того, был обработан большой блок текстовых данных.

Время исполнения:

i486SX без OverDrive=250 с

----------------------------                  ВЫИГРЫШ= 481%

i486SX с OverDrive = 43 с

i486SX сi487SX =  72 с

----------------------------                  ВЫИГРЫШ= 67%

i486SX c OverDrive =   43 c

3. Работа с AutoCAD, популярной системойСАПР.

Тест исполнялся наi486SX 20 МГц с трехмерным архитектурным чертежом, над которым выполнялисьоперации перечеркивания, панорами­рования, масштабирования, удаления скрытыхлиний и повторной генера­ции файла во внешнем формате.

Время исполнения:

i486SX с i487SX =  162 с

----------------------------                  ВЫИГРЫШ= 45%

i486SX c OverDrive =   112 c

А вот что говорят обOverDrive процессоре те, кому уже пос­частливилось поработать с ним:

Брент Грэхэм:(специалист по автоматизации офисов, US Bank, Портленд) «С темивозможностями модернизации, которые предоставляет Intel 486, я не вижу причинне использовать OverDrive процессор. Что касается его установки в систему, то сэтим справится даже мой 10-летний сынишка.»

Билл     Лодж:    (руководитель   проектной    группы,

Corporation, Нью – Йорк) «Я работал сWindows и OS/2 в сети Banyan Wines, используя OverDrive процессор без единойзаминки. Моя усовер­шенствованная система с i486SX 25 МГц работает не хуже, чемсистемы на 50 МГц.»

Стив  Симмонс:  (технический  менеджер,Даллас)

«Windows визжит от счастья, когдаработает с OverDrive процессором. Расчеты на электронной таблице в Excelвыполняются мгновенно.»

3.9. Процессор Pentium.

В то время, когдаВинод Дэм делал первые наброски, начав в июне 1989 года разработку Pentium процессора,он и не подозревал, что именно этот продукт будет одним из главных достиженийфирмы Intel. Как только выполнялся очередной этап проекта, сразу начинал­сяпроцесс всеобъемлющего тестирования. Для тестирования была разра­ботанаспециальная технология, позволившая имитировать функциониро­вание Pentiumпроцессора с использованием программируемых устройств, объединенных на 14платах с помощью кабелей. Только когда были обна­ружены все ошибки, процессорсмог работать в реальной системе. В до­полнение ко всему, в процессе разработкии тестирования Pentium про­цессора принимали активное участие все основныеразработчики персо­нальных компьютеров и программного обеспечения, что немалоспособ­ствовало общему успеху проекта. В конце 1991 года, когда была завер­шенмакет процессора, инженеры смогли запустить на нем программное обеспечение.Проектировщики начали изучать под микроскопом разводку и прохождение сигналовпо подложке с целью оптимизации топологии и повышения эффективности работы.Проектирование в основном было за­вершено в феврале 1992 года. Началосьвсеобъемлющее тестирование опытной партии процессоров, в течение которогоиспытаниям подверга­лись все блоки и узлы. В апреле 1992 года было приняторешение, что пора начинать промышленное освоение Pentium процессора. В качествеосновной промышленной базы была выбрана 5 Орегонская фабрика. Более 3 миллионовтранзисторов были окончательно перенесены на шаблоны. Началось промышленноеосвоение производства и доводка технических характеристик, завершившиеся через10 месяцев, 22 марта 1993 года широкой презентацией Pentium процессора.

Объединяя более, чем3.1 миллион транзисторов на одной крем­ниевой подложке, 32-разрядный Pentiumпроцессор характеризуется вы­сокой производительностью с тактовой частотой 60 и66 МГц. Его су­перскалярная архитектура использует усовершенствованные способыпроектирования, которые позволяют выполнять более, чем одну команду за одинпериод тактовой частоты, в результате чего Pentium в состоя­нии выполнятьогромное количество PC-совместимого программного обес­печения быстрее, чемлюбой другой микропроцессор. Кроме существующих наработок программногообеспечения, высокопроизводительный ариф­метический блок с плавающей запятойPentium процессора обеспечивает увеличение вычислительной мощности донеобходимой для использования недоступных ранее технических и научныхприложений, первоначально предназначенных для платформ рабочих станций.

Многочисленные  нововведения  -  характерная     особенность

Pentium процессора в виде уникальногосочетания высокой производи­тельности, совместимости, интеграции данных инаращиваемости. Это включает:

— Суперскалярную архитектуру;

— Раздельное кэширование программного кодаи данных;

— Блок предсказания правильного адресаперехода;

— Высокопроизводительный блок вычислений с плавающей за­пятой;

— Расширенную 64-битовую шину данных;

— Поддержку многопроцессорного режимаработы;

— Средства задания размера страницыпамяти;

— Средстваобнаружения ошибок и функциональной избыточ­ности;

— Управление производительностью;

— Наращиваемость спомощью Intel OverDrive процессора. Cуперскалярная архитектураPentium процессора представляет

собой совместимую только с Intelдвухконвейерную индустриальную ар­хитектуру, позволяющую процессору достигатьновых уровней производи­тельности посредством выполнения более, чем однойкоманды за один период тактовой частоты. Термин «суперскалярная»обозначает микроп­роцессорную архитектуру, которая содержит более одноговычисли­тельного блока. Эти вычислительные блоки, или конвейеры, являются узлами,где происходят все основные процессы обработки данных и ко­манд.

Появлениесуперскалярной архитектуры Pentium процессора представляет собой естественноеразвитие предыдущего семейства про­цессоров с 32-битовой архитектурой фирмыIntel. Например, процессор Intel486 способен выполнять несколько своих командза один период тактовой частоты, однако предыдущие семейства процессоров фирмыIntel требовали множество циклов тактовой частоты для выполнения од­нойкоманды.

Возможностьвыполнять множество команд за один период такто­вой частоты существуетблагодаря тому, что Pentium процессор имеет два конвейера, которые могутвыполнять две инструкции одновременно. Так же, как и Intel486 с однимконвейером, двойной конвейер Pentium процессора выполняет простую команду запять этапов: предвари­тельная подготовка, первое декодирование ( декодированиекоманды ), второе декодирование ( генерация адреса ), выполнение и обратнаявыгрузка.

В результате этихархитектурных нововведений, по сравнению с предыдущими микропроцессорами,значительно большее количество ко­манд может быть выполнено за одно и то жевремя.

Другое важнейшеереволюционное усовершенствование, реализо­ванное в Pentium процессоре, этовведение раздельного кэширования. Кэширование увеличивает производительностьпосредством активизации места временного хранения для часто используемогопрограммного кода и данных, получаемых из быстрой памяти, заменяя повозможности обра­щение ко внешней системной памяти для некоторых команд.Процессор Intel486, например, содержит один 8-KB блок встроенной кэш-памяти,используемой одновременно для кэширования программного кода и данных.

Проектировщики фирмыIntel обошли это ограничение использо­ванием дополнительного контура,выполненного на 3.1 миллионах тран­зисторов Pentium процессора ( для сравнения,Intel486 содержит 1.2 миллиона транзисторов ) создающих раздельное внутреннеекэширование программного кода и данных. Это улучшает производительность посред­ствомисключения конфликтов на шине и делает двойное кэширование доступным чаще, чемэто было возможно ранее. Например, во время фа­зы предварительной подготовки,используется код команды, полученный из КЭШа команд. В случае наличия одногоблока кэш-памяти, возможен конфликт между процессом предварительной подготовкикоманды и досту­пом к данным. Выполнение раздельного кэширования для команд идан­ных исключает такие конфликты, давая возможность обеим командам вы­полнятьсяодновременно. Кэш-память программного кода и данных Pentium процессора содержитпо 8 KB информации каждая, и каждая ор­ганизована как набор двухканальногоассоциативного КЭШа — предназна­ченная для записи только предварительнопросмотренного специфициро­ванного 32-байтного сегмента, причем быстрее, чемвнешний кэш. Все эти особенности расширения производительности потребовалииспользо­вания 64-битовой внутренней шины данных, которая обеспечивает воз­можностьдвойного кэширования и суперскалярной конвейерной обработки одновременно сзагрузкой следующих данных. Кэш данных имеет два ин­терфейса, по одному для каждогоиз конвейеров, что позволяет ему обеспечивать данными две отдельные инструкциив течение одного ма­шинного цикла. После того, как данные достаются из КЭШа,они записы­ваются в главную память в режиме обратной записи. Такая техника кэ­шированиядает лучшую производительность, чем простое кэширование с непосредственнойзаписью, при котором процессор записывает данные одновременно в кэш и основнуюпамять. Тем не менее, Pentium процес­сор способен динамически конфигурироватьсядля поддержки кэширова­ния с непосредственной записью.

Таким образом,кэширование данных использует два различных великолепных решения: кэш собратной записью и алгоритм, названный MESI (модификация, исключение,распределение, освобождение) прото­кол. Кэш с обратной записью позволяет записыватьв кэш без обраще­ния к основной памяти в отличие от используемого до этогонепосред­ственного простого кэширования. Эти решения увеличивают производи­тельностьпосредством использования преобразованной шины и предупре­дительного исключениясамого узкого места в системе. В свою очередь MESI-протокол позволяет данным вкэш-памяти и внешней памяти совпа­дать — великолепное решение вусовершенствованных мультипроцессор­ных системах, где различные процессорымогут использовать для рабо­ты одни и те же данные.

Блок предсказанияправильного адреса перехода — это следую­щее великолепное решение длявычислений, увеличивающее производи­тельность посредством полного заполненияконвейеров командами, осно­ванное на предварительном определении правильногонабора команд, ко­торые должны быть выполнены.

Pentium процессорпозволяет выполнять математические вычис­ления на более высоком уровнеблагодаря использованию усовершенство­ванного встроенного блока вычислений сплавающей запятой, который включает восьмитактовый конвейер и аппаратнореализованные основные математические функции. Четырехтактовые конвейерныекоманды вычисле­ний с плавающей запятой дополняют четырехтактовую целочисленнуюкон­вейеризацию. Большая часть команд вычислений с плавающей запятой мо­гут выполнятьсяв одном целочисленном конвейере, после чего подаются в конвейер вычислений сплавающей запятой. Обычные функции вычисле­ний с плавающей запятой, такие каксложение, умножение и деление, реализованы аппаратно с целью ускорениявычислений.

В результате этихинноваций, Pentium процессор выполняет ко­манды вычислений с плавающей запятойв пять раз быстрее, чем 33-МГц Intel486 DX, оптимизируя их для высокоскоростныхчисленных вычисле­ний, являющихся неотъемлемой частью таких усовершенствованныхви­деоприложений, как CAD и 3D-графика.

Pentium процессорснаружи представляет собой 32-битовое ус­тройство. Внешняя шина данных к памятиявляется 64-битовой, удваи­вая количество данных, передаваемых в течение одногошинного цикла. Pentium процессор поддерживает несколько типов шинных циклов,вклю­чая пакетный режим, в течение которого происходит порция данных из 256 битв кэш данных и в течение одного шинного цикла.

Шина данных являетсяглавной магистралью, которая передает информацию между процессором и подсистемойпамяти. Благодаря этой 64-битовой шине данных, Pentium процессор существенноповышает ско­рость передачи по сравнению с процессором Intel486 DX — 528 MB/секдля 66 МГц, по сравнению со 160 MB/сек для 50 МГц процессора Intel486 DX. Этарасширенная шина данных способствует высокоскорос­тным вычислениям благодаряподдержке одновременной подпитки команда­ми и данными процессорного блокасуперскалярных вычислений, благода­ря чему достигается еще большая общаяпроизводительность Pentium процессора по сравнению с процессором Intel486 DX.

Давая возможностьразработчикам проектировать системы с уп­равлением энергопотреблением, защитойи другими свойствами, Pentium процессор поддерживаем режим управления системой(SMM), подобный ре­жиму архитектуры Intel SL.

Вместе со всем, чтосделано нового для 32-битовой микропро­цессорной архитектуры фирмы Intel,Pentium процессор сконструирован для легкой наращиваемости с использованиемархитектуры наращивания фирмы Intel. Эти нововведения защищают инвестициипользователей пос­редством наращивания производительности, которая помогаетподдержи­вать уровень продуктивности систем, основанных на архитектуре про­цессоровфирмы Intel, больше, чем продолжительность жизни отдельных компонентов.Технология наращивания делает возможным использовать преимущества большинствапроцессоров усовершенствованной технологи в уже существующих системах с помощьюпростой инсталляции средства од­нокристального наращивания производительности.Например, первое средство наращивания — это OverDrive процессор, разработанныйдля процессоров Intel486 SX и Intel486 DX, использующий технологию прос­тогоудвоения тактовой частоты, использованную при разработке мик­ропроцессоровIntel486 DX2.

Первые модели процессора Pentium работали на частоте60 и 66 МГц и общались со своей внешней кэш-памятью второго уровня по 64-би­товойшине данных, работающей на полной скорости процессорного ядра. Hо если скоростьпроцессора Pentium растет, то системному разработ­чику все труднее и дорожеобходится его согласование с материнской платой. Поэтому быстрые процессорыPentium используют делитель час­тоты для синхронизации внешней шины с помощьюменьшей частоты. Hап­ример, у 100 МГц процессора Pentium внешняя шина работаетна 66 МГц, а у 90 МГц — на 60 МГц. Процессор Pentium использует одну и ту жешину для доступа к основной памяти и к периферийным подсистемам, таким каксхемы PCI.

3.10. ПроцессорPentium Pro.

3.10.1. Общее описание процессора.

Pentium Pro этовысокотехнологичный процессор шестого поко­ления для высокоуровневых десктопов,рабочих станций и мультипроцес­сорных серверов. Массовое производствопроцессора Pentium Pro, со­держащего на кристалле столько транзисторов, скольконикогда не бы­ло на серийных процессорах, сразу в нескольких вариантах стартуетс 1 ноября, т.е. с самого момента объявления. Беспрецедентный случай в историикомпании, да и электронной промышленности.

Hапомним некоторыеего особенности. Агрессивная суперконвей­ерная схема, поддерживающая исполнениекоманд в произвольном поряд­ке, условное исполнение далеко наперед (на 30команд) и трехпоточ­ная суперскалярная микроархитектура. Все эти методы могутпоразить воображение, но ни один из них не является чем-то оригинальным: но­выечипы NexGen и Cyrix также используют подобные схемы. Однако, Intel обладаетключевым превосходством. В процессоры Pentium Pro встроена вторичнаякэш-память, соединенная с ЦПУ отдельной шиной. Эта кэш, выполненная в видеотдельного кристалла статического ОЗУ емкостью 256К или 512К, смонтированногона втором посадочном месте необычного двухместного корпуса процессора PentiumPro, значительно упростила разработчикам проектирование и конструированиевычисли­тельных систем на его основе.

Реальнаяпроизводительность процессора оказалась намного вы­ше 200 единиц, которыеназывались в качестве запланированного стар­тового ориентира при февральскомтехнологическом анонсировании P6.

Pentium Pro это значительный шаг вперед. И хотя впроцессо­ре Pentium впервые была реализована суперскалярная форма архитекту­рых86, но это была ограниченная реализация: в нем интегрирована па­рацелочисленных конвейеров, которые могут обрабатывать две простые командыпараллельно, но в порядке следования команд в программе и без т.н. условногоисполнения (наперед). Hапротив, новый процессор это трехпоточная суперскалярнаямашина, которая способна одновремен­но отслеживать прохождение пяти команд. Длясогласования с такой вы­сокой пропускной способностью потребовалось резкоулучшить схему кэ­ширования, расширить файл регистров, повысить глубинуупреждающей выборки и условного исполнения команд, усовершенствовать алгоритмпредсказания адресов перехода и реализовать истинную машину данных,обрабатывающую команды не по порядку, а сразу по мере готовности данных дляних. Ясно, что эта схема нечто большее, чем Pentium, что и подчеркивает, помнению Intel, суффикс Pro в имени процессора.

3.10.2. Два кристалла в одном корпусе.

Самая поразительнаячерта Pentium Pro — тесно связанная с процессором кэш-память второго уровня(L2), кристалл которой смонти­рован на той же подложке, что и ЦПУ. Именно так,Pentium Pro это два чипа в одном корпусе. Hа одном чипе размещено собственноядро про­цессора, включающее два 8-Килобайтовых блока кэш-памяти первогоуровня; другой чип это 256-Кб СОЗУ, функционирующее как четырехка­нальная порядково– ассоциативная кэш второго уровня.

Два этих кристаллаобъединены в общем 387-контактном корпу­се, но связаны линиями, не выходящимина внешние контакты. Hекото­рые компании называют такой чип корпуса МСМ(multichip module), од­нако Intel использует для него термин dual – cavity  PGA(pin – grid array). Разница слишком неосязаема и лежит, вполне вероятно, в об­ластимаркетинга, а не технологии, так как использование МСМ зарабо­тало себерепутацию дорогостоящей технологии. Но, сравнивая цены на процессоры Pentium иPentium Pro, можно утверждать, что новая терми­нология исправит положение дел,так как P6 претендует на статус мас­сового процессора. Впервые в историипромышленности многокристальный модуль станет крупносерийным изделием.

Степень интеграции новогопроцессора также поражает: он со­держит 5.5 млн. транзисторов, да еще 15.5 млн.входит в состав крис­талла кэш-памяти. Для сравнения, последняя версияпроцессора Pentium состоит из 3.3 млн. транзисторов. Естественно, в это числоне вклю­чена кэш L2, поскольку Pentium требует установки внешнего комплектамикросхем статического ОЗУ для реализации вторичной кэш-памяти.

Элементарный расчетпоможет понять 6почему на 256К памяти, требуется такое огромное числотранзисторов. Это статическое ОЗУ, которое в отличие от динамического, имеющеговсего один транзистор на бит хранения и периодически регенерируемого,использует для хра­нения бита ячейку из шести транзисторов:

256 x 1024 х 8 бит х6 пр – ров  = 12.5 млн. транзисторов. С учетом буферов и обвязки накопителя какраз и выйдет 15.5 миллионов.

Площадьпроцессорного кристалла равна 306 кв. мм. (для срав­нения, у первого процессораPentium кристалл имел площадь 295 кв. мм). Кристалл статической памяти, каквсякая регулярная структура, упакован намного плотнее — 202 кв. мм. ТолькоPentium Pro 150 MHz изготавливается по 0.6-микронной технологии. Все остальныеверсии нового процессора изготавливаются по 0.35-микронной BiCMOS-технологии счетырехслойной металлизацией.

Почему компанияIntel пошла на двухкристалльный корпус, объединив ядро ЦПУ с вторичным КЭШем?Во – первых комбинированный кор­пус значительно упростил изготовителям ПКразработку высокопроизво­дительных систем на процессоре Pentium Pro.

Одна из главныхпроблем при проектировании компьютера на быстром процессоре связана с точнымсогласованием с процессором вто­ричного КЭШа по его размеру и конфигурации.Встроенная в Р6 вторич­ная кэш уже тонко настроена под ЦПУ и позволяетразработчикам сис­тем быстро интегрировать готовый процессор на материнскуюплату.

Во-вторых, вторичнаякэш тесно связана с ядром ЦПУ с по­мощью выделенной шины шириной 64 бита,работающей на одинаковой с ним частоте. Если ядро синхронизируется частотой 150МГц, то кэш должна работать на частоте 150 МГц.

Поскольку впроцессоре Pentium Pro есть выделенная шина для вторичного КЭШа, это решаетсразу две проблемы: обеспечивается син­хронная работа двух устройств на полнойскорости и отсутствие конку­ренции за шину с прочими операциями ввода-вывода.Отдельная шина L2, «задняя» шина полностью отделена от наружной,«передней» шины ввода-вывода, вот почему в P6 вторичная кэш не мешаетсвоими цикла­ми операциям с ОЗУ и периферией. Передняя 64-битовая шина может ра­ботатьс частотой, равной половине, трети или четверти скорости яд­ра Pentium Pro.«Задняя» шина продолжает работать независимо, на полной скорости.

Такая реализацияпредставляет серьезный шаг вперед по срав­нению с организацией шины процессораpentium и других процессоров х86. Только NexGen приближенно напоминает такуюсхему. Хотя в про­цессоре Nx586 нет КЭШа L2, зато встроен ее контроллер иполноскорос­тная шина для связи с внешней кэш-памятью. Подобно Р6, процессорNx586 общается с основной памятью и периферийными подсистемами по­верхотдельной шины ввода-вывода, работающей на деленной частоте.

В экзотическомпроцессором Alpha 21164 компания Digital пош­ла еще дальше, интегрировав прямона кристалле в дополнение к пер­вичной кэш-памяти еще и 96 Кбайт вторичной. Засчет вздувания площа­ди кристалла достигнута беспрецедентная производительностькэширова­ния. Транзисторный бюджет Альфы составляет 9.3 миллиона транзисто­ров,большая часть которого образована массивом памяти.

Есть одна незадача:необычный дизайн Pentium Pro, пожалуй, затруднит экспертам задачку вычислениясоотношения цены и производи­тельности. Интегрированная в процессор кэш вродекак скрыта с глаз. Pentium Pro сможет показаться более дорогим, чем егоконкуренты, но для создания компьютера на других процессорах потребуетсявнешний набор микросхем памяти и кэш-контроллер. Эффективный дизайнкэш-структуры означает, что другим процессорам, претендующим на со­поставимуюпроизводительность, потребуется кэш-памяти больше, чем 256 Кбайт.

Уникальный корпуспредоставляет свободу созданию новых ва­риантов процессора. В будущем возможнокак повышение объема кэш-па­мяти, так и ее отделение ее от процессора всоответствии с тради­ционным подходом. Если последний вариант появится, онокажется, не­совместим по внешним выводам с двухкристалльным базовым корпусом,так как ему необходимо добавить 72 дополнительных вывода (64-для«задней» шины и 8 для контроля ошибок). Hо он будет почти таким жебыстрым, если будет широко доступна статическая память с пакетным режимом. Помнению инженеров Intel, подключение внешних микросхем памяти к «передней»шине Pentium Pro с целью реализации кэш-памяти третьего уровня, вряд лиоправдано. Отправной точкой для такой убеж­денности служат результаты натурногомоделирования прототипа систе­мы, которая в следствии высокой эффективностиинтерфейса кэш L2-про­цессор, практически до теоретического предела загружаетвычисли­тельные ресурсы ядра. Процессор Alpha 21164, напротив, спроектиро­ван сучетом необходимости кэш L3.

3.10.3. Значения тестов для некоторых чипов фирмыIntel.

Processor

Benchmarks

Intel

Pentium

Pro

Processor

(200MHz)

Intel

Pentium

Pro

Processor

(180MHz)

Intel

Pentium

Pro

Processor

(166MHz)

w/512K L2

Intel

Pentium

Pro

Processor

(150MHz)

Intel

Pentium

Processor

(133MHz)

UNIX

SPEC95

SPECint95

SPECint_base95

SPECfp95

SPECfp_base95

8.09

8.09

6.75

5.99

7.29

7.29

6.08

5.40

7.11

7.11

6.21

5.47

6.08

6.08

5.42

4.76

4.14

4.14

3.12

2.48

SPEC92

SPECint92

SPECint_base92

SPECfp92

SPECfp_base92

366.0

336.7

283.2

234.3

327.4

3.5.8

254.6

210.4

327.1

306.6

261.3

209.6

276.3

258.3

220.0

182.0

190.9

175.9

120.6

107.3

Windows

Norton System Index

SI32

86.7 77.6

Not

tested

67.0 34.2

Ziff-Davis

CPUmark32

541 466

Not

tested

412 278

4. Процессоры конкурентов Intel.

4.1. Первые процессоры конкурентов Intel.

Intel была неединственной фирмой — производителем микропро­цессоров: существовали еще MOSTechnologies, Mostek, Motorola, Rockwell, Standart Microsystems Corporation,Synertek, Texas Instruments. Одни из них использовали свои собственные проектычи­пов, другие — лицензионные проекты своих конкурентов. Успешнее всех в конце70-х работала фирма Zilog. Она создала чип Z80.

В то время, когдакомпьютеры, работающие под управлением СР/М, распространились в офисах,компьютеры Apple II буквально вор­вались в школы. Фирма Apple в качествеосновного компонента своего компьютера выбрала чип фирмы MOS Technologies 6502.Это был лицен­зионный чип фирмы Rockwell and Synertek. Apple началаиспользовать процессоры Motorola во всех своих компьютерах Macintosh.Разработки фирм Intel и Motorola появились почти одновременно, но объединяет ихне только это. Микропроцессоры Intel 80486 и Motorola 68040, напри­мер, почтиодинаковы по сложности и имеют функциональные сходные возможности. Тем неменее, они совершенно несовместимы. Именно поэ­тому на Macintosh и PC не могутвыполняться одни и те же программы.

Существуетпринципиальное отличие в эволюционном развитии этих двух семействмикропроцессоров. Intel начала с довольно незна­чительного по нашим современныммеркам адресного пространства в 1 Мбайт и постоянно наращивала его до нынешнегоразмера в 4 Гбайт. Motorola в своей серии 680x0 всегда имела адресноепространство в 4 Гбайт. IBM поместила чипы ROM в адресное пространство своих PCкак можно выше. И не ее ошибка была в том, что позже Intel достроила«второй этаж» и таким образом оставила ROM в конструкциях IBM где-топосередине, открыв дорогу использованию RAM, что само по себе, мо­жет быть, ине плохо. Разработчики семейства чипов 680х0 никогда не испытывали подобныхнеудобств, и поэтому очень много программистов считают, что Mac лучше.

Intel приложилазначительные усилия, пытаясь стандартизо­вать производство ее процессоров 8086и 8088 на предприятиях-подряд­чиках. Hесколько предприятий приняло такиесоглашения. Однако Haris выпустил свои чипы — аналоги 8086 и 8088, которыеменее всего удов­летворяли этим принятым соглашениям. Он использовал технологиюCMOS, значительно сокращающую потребление электроэнергии, и это свойствосделало его чипы очень популярными, особенно среди производителей ПК с экранамина жидких кристаллах.

Фирма NEC предложиласвою так называемую V-серию чипов и объявила, что чип V20 являетсяконструктивно совместимым с чипом Intel 8088, но имеет усовершенствованныйнабор инструкций, включая при этом и инструкции чипа 8080. Это означало, что онмог легко вы­полнять программы, написанные для CP/M, без их модификации, ис­пользуяэмулятор программ, и при этом включать преимущества инструк­ций 8080,содержащихся в чипе V20. Их чип V30 был аналогом 8086 с включеннымидополнительными возможностями.

Чипы V-серии фирмы NEC также работали немного быстрееанало­гичных чипов фирмы Intel. Эти чипы имели некоторый успех, чем былараздосадована Intel. Последняя подала в суд на NEC по факту наруше­ния закона озащите авторских прав. NEC подала ответный иск. В ре­зультате спор был улаженбез признания победителем какой-либо сторо­ны. Интересными были детали этогосудебного разбирательства. Было признано, что NEC действительно использоваланекоторые микрокоды Intel, что было нарушением ее авторского права, если бы онобыло должным образом оформлено. Hо поскольку Intel производила и продава­ланекоторые чипы 8088 без знака авторского права, то их претензии были признаныбезосновательными. Компания Chips and Technology, ко­торая стала известнаблагодаря выпуску аналогов BIOS, в настоящее время внедрила линию попроизводству процессорных чипов. Hа ней вы­пускаются аналоги 386. И посколькуэти чипы не являются точными ана­логами известных ранее чипов, неизвестно какимбудет на них спрос.

 

 

 

 

4.2. Процессоры фирмы AMD.

4.2.1. Судебное разбирательство с Intel.

Фирма AMD былалицензионным производителем Intel, производя­щей 80286. AMD объявила, что ееконтракт с Intel позволяет им выпус­кать легализованные копии чипов 386. Intelкатегорически не согласи­лась с этим. AMD удалось выиграть это судебноеразбирательство, и теперь она выпускает аналог чипа 386 с тактовой частотой 40МГц. Этот чип имел определенный успех, в частности, из-за его более высо­койскорости по сравнению с самым быстродействующим чипом серии Intel 386. Привыпуске фирмой AMD аналогов 486 фирма Intel снова по­пыталась остановитьконкурента. Однако и в этом случае закон был на стороне AMD.

 

4.2.2. Процессоры семейства AMD5k86.

Наладив в 1994 годумассовое производство чипов 5-го поколе­ния — микропроцессоров Pentium,корпорация Intel мощно пошла в от­рыв. Интеллектуальная колоссальная мощь ееинженеров, помноженная на богатейшие производственные возможности, казалось, неоставляла ни­каких шансов конкурентам. между тем вдогонку за лидером бросилосьсразу несколько преследователей. Среди них, пожалуй, именно компа­ния AMD имеласамую «удачную» стартовую позицию. Компания Advanced Micro Devicesзанимала второе место в мире по производству микропро­цессоров. На сегодняшнийдень общее число чипов, выпущенных фирмой AMD, перевалило далеко за отметку 85миллионов, что, согласитесь, само по себе говорит об огромном потенциалекомпании.

Цифра «5»для фирмы AMD была явно несчастливой. Intel Pentium все наращивал обороты: 66,75, 90 Мгц… Тактовая частота новых моделей увеличивалась едва ли не каждыймесяц. А разработчи­кам компании AMD, кроме названия — «K5»,представлять было реши­тельно нечего. Ожидание становилось тягостным.

Гнетущее ощущениенесбывшихся надежд скрасил выпуск процес­сора Am5x86. Нет, чип Am5x86 не былобещанным К5. Микропроцессор представлял собой «четверку» с большимивозможностями, которые одна­ко, явно не дотягивали до «честного»Pentium. В прессе распространя­лись мнения специалистов, вроде:«Производительность, сравнимая с производительностью Pentium, позволяетотнести микропроцессор Am5x86 к устройствам пятого поколения».

А между тем,оставаясь по своей сути (по внутренней архитек­туре) до боли знакомым 486-м,чип Am5x86, имеющий тактовую частоту 133 МГц, мог соперничать на равных лишь соскромным по своим возмож­ностям процессором Pentium/75 МГц. Интересно, какойдолжна была бы быть тактовая частота Am5x86, чтобы показать производительность,сравнимую с Pentium/166 МГц!

Поэтому созданиечипа пятого поколения у компании Advanced Micro Devices было еще впереди. Припроектировании своих предыдущих процессоров компания опиралась на неизменнуюподдержку корпорации Intel. Но к началу разработки собственного процессорапятого поколе­ния срок действия лицензионных соглашений с корпорацией Intelподо­шел к концу. Так что инженерам AMD пришлось начать разработку, чтоназывается, с чистого листа. В частности, вышла промашка при проек­тированиивстроенного КЭШа команд. Наборы команд для процессоров разных поколенийсущественно отличаются. Инженеры-разработчики ком­пании AMD немного просчиталисьв оценке числа CISC-инструкций, имею­щих различную длину. В результате, неудавалось достичь проектируе­мого уровня производительности при исполнениипрограмм, оптимизиро­ванных под процессор Pentium. Но спустя некоторое время иэта, и не­которые другие ошибки были устранены. И в конце марта 1996 года ком­панияAMD с гордостью объявила о появлении на свет нового процессо­ра пятогопоколения — AMD5k86.

 

 

 

 

 

4.2.2.1 Экскурсия по внутренней архитектуре.

Процессор AMD5k86,известный на стадии разработки как AMD-K5 или Krypton, является первым членомсуперскалярного семейства (Superscalar family) K86. Он соединяет в себе высокуюпроизводи­тельность и полную совместимость с операционной системой MicrosoftWindows.

СуперскалярныйRISC-процессор AMD5k86 выполнен по 0ю35-мик­ронной КМОП – технологии(complimentary metal – oxid semiconductor process) и состоит из 4.3 млн.транзисторов. Его дизайн базируется на богатой истории и обширном опытеархитектур RISC и х86.

По мнению многихспециалистов, разработчики чипа AMD5k85 пошли значительно дальшепервоначального замысла: создать процессор, имеющий RISC-ядро, и при этомсовместимый с набором инструкций х86 означает совместимость с операционнымисистемами Microsoft Windows и всем ПО, написанным под архитектуру х86. Стольсчастливое сочетание высочайшей производительности и полной совместимости сMicrosoft Windows делает чип AMD5k86 полноправным членом 5-го поколения мик­ропроцессоров.

МикропроцессорAMD5k86 имеет 4-потоковое суперскалярное яд­ро и осуществляет полноепереупорядочивание выполнения инструкций (full out – of – order  execution).Чип AMDk586 унаследовал лучшие черты от двух доминирующих на сегодняшний деньмикропроцессорных ветвей: семейства х86 и суперскалярных RISC-процессоров. Отпервых он унас­ледовал столь необходимую для успешного продвижения накомпьютерном рынке совместимость с операционной системой WINDOWS. От семействасуперскалярных RISC-процессоров он унаследовал высочайший уровеньпроизводительности, характерный для чипов, применявшихся в рабочих станциях.

Разработанныйинженерами компании AMD процесс предвари­тельного декодирования позволяетпреодолеть присущие архитектуре х86 ограничения (различная длина инструкций). Вслучае использования ин­струкций различной длины, чипы 4-го поколения могутодновременно об­рабатывать 1 команду, процессоры 5-го поколения (Pentium) — 2коман­ды. И только микропроцессор AMD5k86 способен обрабатывать до 4 ин­струкцийза такт.

Использованиераздельного КЭШа инструкций и данных (объем КЭШа инструкций в два разапревосходит объем КЭШа данных) исключает возникновение возможных внутреннихконфликтов.

Сейчас выпускаютсямикропроцессоры AMD5k86-P75, AMD5k86-P90 и AMD5k86-P100 производительностькоторых (Р. — рейтинг) соответствует процессору Pentium с тактовыми частотами75, 90 и 100 МГц.

Компания AdvancedMicro Devices планирует выпустить в этом (1996) году 3 млн. процессоровсемейства AMD5k86 со значениями Р. — рейтинга от 75 до 166. Цены на новыепроцессоры будут сопоставимы с ценами обладающих аналогичной производительностьюпроцессоров Pentium, вероятно, даже несколько ниже. Средняя цена процессораAMD5k86-P75 составляет около $75, чипа AMD5k86-P90 — $99.

Характеристики микропроцессора AMD5k86:

— 4-потоковоесуперскалярное ядро с 6-ю параллельно работающи­ми исполнительнымиустройствами, составляющими 5-ступенчатый конве­йер;

— 4-потоковыйассоциативный кэш команд с линейной адресацией объемом 16 Кб;

— 4-потоковыйассоциативный кэш данных с обратной записью и ли­нейной адресацией объемом 8Кб;

— полное переупорядочиваниевыполнения инструкций, предвари­тельное (speculative) исполнение;

— динамический кэшпредсказания переходов объемом 1 Кб; в слу­чае неправильного предсказаниязадержка составляет менее 3 внутрен­них тактов;

— 80-разрядноеинтегрированное, высокопроизводительное устрой­ство выполнения операций сплавающей запятой, обладающее небольшим временем задержки при выполненииопераций +/*;

— питающеенапряжение — 3В, система SSM (System Management Mode) для уменьшенияпотребляемой мощности;

— 64-разрядная шинаи системный интерфейс помещены в 296-кон­такный корпус SPGA, совместимый повыводам с процессором Pentium (P54C) и процессорным гнездом Socket-7;

— полнаясовместимость с Microsoft Windows и инсталлированной базой ПО для процессоровархитектуры х86.

 

4.2.2.2. Пример маркировки микропроцессораAMD5k86-P75.

---------------------------------------------

|   ####   ###   ### ######    -----------         |\

|  ##  ##  ## ### ## ##   ##     `\------|           |\

|  ######  ##  #  ## ##   ##      /|    ||             |\

|  ##  ##  ##     ## ######      | ----,||             |\

|                                ----/  \|                           |\

1 --------------------                                                       |\

2 — AMD5k86тм-Р75                                        |\

3 ------------------------                                                  |\

4 — AMD-SSA/5-75ABQ                                  |\

|   E <datecode> |              Designedfor         |\

5 -----------------------                        /\/-------                |\

|   (m) (c)1996AMD            /\/-------                |\

|                                          /\/-------                |\

|                                          Microsoft            |\

6 — HEAT SINK                    ----------               |\

\   AND FAN REQ'D          Windows95 тм  |\

\                                                                    |\

                                  `------------------------------------------\

                                                \ \ \ \ \ \ \ \ \ \ \ \\ \ \ \ \ \ \ \ \ \

Обозначения:

1. P-рейтинг                             5.Питающее напряжение

2. Название                                     B=3.45- 3.60B

3. Температура корпуса                C=3.30- 3.465B

W=55C    R=70C                      F=3.135- 3.465B

Q=60C    Y=75C                      H=2.76- 3.0B

X=65C    Z=85C                       J=2.57- 2.84B

4. Серийный номер                        K=2.38- 2.63B

6. Температурный режим

 

 

4.2.2.3. Тесты.

Система Р –рейтингов измерения производительности процессоров была предложена в начале1996 года компаниями AMD, Cyrix, IBM и SGS – Thomson Microelectronics.P-рейтинг составляется, по результа­там проведения эталонного теста Winstone96, разработанного изда­тельством Ziff – Davis  Этот тест представляет собойнабор из 13 наи­более часто применяемых приложений, таких как Microsoft Word иExel.

Следует заметить,что в отличие от системы тестов iComp, ко­торой пользуется корпорация intel дляоценки производительности своих микропроцессоров, тестовый набор Winstone 96является общедос­тупным.

В своем новом чипеAMD5k86 компания AMD воплотила поистине новаторское сочетание набора инструкцийх86 и суперскалярной RISC-архитектуры (reduced instruction set computingarchitecture). Как утверждают некоторые специалисты AMD, благодаря такомурешению микропроцессор AMD5k86 обеспечивает на 30% большую производи­тельность,чем процессор Pentium с такой же тактовой частотой. Впро­чем, результатытестирования с использованием пакета тестов Winstone 96 компании Ziff – Davisпоказывают, что преимущество несколько скром­нее.

Тестовая конфигурация:

Материнская плата

Чипсет

ОЗУ

Кэш-память L2

Видеоплата (640х480х256)

Видеодрайвер

Жесткий диск

FIC PA2002

VIA Apollo Master

EDO DRAM объемом 16 Мб

256 Кб

PCI Diamond Stealth64 3200

Diamond GT 4.02.00.218 for Windows 95 EIDE Quantum Fireball емкостью 1.2 Гб

AMD5k85-P75 CPU (index 48.8)

Pentium 75 (index 47.4)

AMD5k85-P90 CPU (index 56.7)

Pentium 90 (index 54.9)

4.2.2.4. Материнскиеплаты для AMD5k86.

Список широко распространенных системныхплат, протестированных в лабораториях компании AMD и

рекомендованных для установки  процессораAMD5k86.

Производитель Модель Чипсет BIOS Abit PH5 1.3 SiS 551 Award Pentium PCI Sys BIOS (N35) Abit PH5 2.1 Intel Triton Award Pentium PCI Sys BIOS (C4) Atrend ATC1000 Intel Triton Award i430-2A59CA29C-00 Atrend ATC1545 A1 OPTi Viper

Award OPTi Viper

ATS-1545 ver. 0.6.

Biostar 8500TAC A1 Intel Triton AMI 1993 ECS TR5510 Intel Triton Award i430FX-2A59CE1NC-00 ECS AIO Intel Triton Award i430FX-2A59CE1NC-00 FIC PA2002 1.21 VIA 570 Award 4.052G800 Gigabyte GA586ATS 1B Intel Triton Award Intel 430FX PCI-ISA v.1.26 Hsingtech M507 1.1 Intel Triton Award 2/1/1996x Mycomp (TMC) PCI54ITS 2.00 Intel Triton Award i430FX-2A59CM29C-00 Замечание: ранние версии указанных системных плат нуждаются в за­мене BIOS на более новую версию, правильно распознающую чип AMD5k86

 

4.2.2.5. AMD планирует выпустить K5.

Репутация AMD сильнозависит от успешности затянувшегося проекта К5-первой самостоятельной пробыархитектурных сил в области х86. Рождение К5 опасно откладывается уже не первыйраз. В первом квартале следующего года AMD планирует перевод K5 на технологичес­кийпроцесс с проектными нормами 0.35 мкм и с трехуровневой металли­зацией, разработанныйпри содействии с HР и запускаемый на новом за­воде AMD Fab 25 в Остине, штатТехас. Это позволит уменьшить К5 с

4.2 миллионами транзисторов до 167 кв. мми поднять процент выхода годных, а также тактовую частоту.

По мнению руководства AMD в 1996 году объем выпуска К5бу­дет наращиваться достаточно быстро, что позволит отгрузить до конца годаболее пяти миллионов процессоров. Ответом на вызов Intel с ее процессоромPentium Pro может стать только процессор К6, но уже ник­то не верит, что егоудастся увидеть раньше 1997 года. Hесмотря на всемирный переход на процессорPentium, в следующем году еще могут сохраниться некоторые рынки для 486-х.Эксперты считают, что потреб­ность таких региональных рынков, как Китай, Индия,Россия, Восточ­ная Европа и Африка, в 486-х чипах составит до 20 миллионовпроцес­соров в 1996 году. AMD рассчитывает, что именно ей удастся поста­витьбольшую часть от этого количества. Поэтому компания повышает тактовую частоту486-х до 133 Мгц, чтобы конкурировать с низшими версиями процессора Pentium внастольных ПК начального уровня. Одна­ко, AMD будет усиленно наращивать выпускК5, поскольку 486-е быстро выходят из моды.

4.3. Процессоры NexGen.

В то время: каккомпания Intel готовила отрасль к шокирующе­му выходу в жизнь серийных моделейсерверов и настольных машин на Pentium Pro, фирма NexGen представляла форумусвои планы по разра­ботке процессора Nx686. Этот суперскалярный х86-совместимыйпроцес­сор, к разработке которого подключается еще и команда архитекторов изAMD, снятых с собственного неудачного проекта К6, будет содер­жать около 6 млн.транзисторов, включая вычислитель с плавающей точ­кой на одном кристалле спроцессором (отказ от предыдущего двухкрис­талльного подхода, ослабившегоNx586). Технология КМОП с проектными нормами 0,35 мкм и пятислойнойметаллизацией позволила «упаковать» на одном кристалле семьисполнительных узлов: два для целочисленных, один для операций с плавающейточкой, по одному для обработки мультимедиа, команд переходов, команд загрузкии команд записи. По­казатели производительности представители NexGen назвать несмогли, но выразили предположение, что он превзойдет Pentium Pro на 16-раз­рядныхпрограммах вдвое, а на 32-битовых — на 33 %.

До сих пор мало чтоизвестно про Nx686, так как чип еще не анонсировался и NexGen не хочетраскрывать козыри перед конкурента­ми в лице AMD, Cyrix и Intel. Однако, NexGenне хочет раскрывать ко­зыри перед конкурентами в лице AMD, Cyrix и Intel.Однако, NexGen настаивает о том, что Nx686 по производительности сопоставим с инте­ловскимPentium Pro и AMD K5, и наследует микроархитектуру Nx586, появившуюся в 1994году. NexGen называет ее RISC86. Базовая ее идея, как и в случае с Pentium Proи K5, состоит в преобразовании сложных CISC-команд программного обеспечения x86в RISC-подобные операции, исполняемые параллельно в процессорном ядреRISC-типа. Этот подход, известный под названием несвязанной микроархитектуры,позволяет обо­гатить CISC-процессор новейшими достижениями RISC-архитектур исох­ранить совместимость с имеющимся ПО для х86.

В Nx686 этафилософия продвинута на новый логический уро­вень. Сегодня в Nx586 имеется триисполнительных блока, трехконвей­ерное суперскалярное ядро. Он способенвыполнять в каждом такте по одной команде х86. Возможности длясовершенствования очевидны: Nx586 будет содержать пять исполнительных блоков,четыре конвейера и нес­колько декодеров, способных справиться с выполнениемдвух или даже более команд х86 за один машинный такт. Для этого потребуетсявстроить дополнительные регистры переименования и очереди команд.

Подход киспользованию интегрированного кэш-контроллера и интерфейса для скоростнойкэш-памяти остается неизменным. Представи­тели NexGen говорят, что они изучаютвозможность использования крис­талла вторичной кэш-памяти по образцу и подобиюIntel, тем более что их производственный партнер IBM Microelectronics способенделать статическую память и многокристальные сборки (MCM — multichip modules).

Пример практическойреализации технологии МСМ фирмы IBM представляет новая версия процессора Nx586,запланированная к выпус­ку на конец этого года и включающая кристалл CPU и FPUв одном кор­пусе. Одновременное перепроектирование топологии с масштабированиемдо размера линии 0.35 микрон позволит компании NexGen основательно уменьшитьразмеры кристалла ЦПУ — до 118 кв. мм — меньше в этом клас­се ничего нет.

NexGen, новичок в группе производителей процессоровх86. Nx596 может параллельно обрабатывать на нескольких исполнительных блокахдо четырех простейших операций, которые названы командами RISC86. Процессор К5имеет похожий четырехпоточный дешифратор, но результаты его работы компанияназывает R – ops.

4.4. Процессоры Cyrix.

Первая вещь из грандиозного проекта М1 компании Cyrix,нако­нец обнародована. Это процессор Сх 6х86-100, монстроподобный крис­таллкоторого сложен и очень дорог для того, чтобы претендовать на массовый выпуск втечении длительного срока. Его проблемы сможет ре­шить процессор, который покаимеет кодовое название M1rx и опираю­щийся на техно процесс с пятислойнойметаллизацией, идущий на смену трехслойной версии той же 0.6-мкм технологии.Если проект увенчает­ся успехом, то размер кристалла с 394 кв. мм уменьшится до225 кв. мм, тогда у Cyrix появится шанс поднять тактовую частоту до 120 МГц. Вэтом случае эксперты предсказывают ему производительность в преде­лах 176-203по тесту SPECint92, т.е. на уровне процессора Pentium 133 (SPECint92=190.9) или150 МГц. Если все обещания сбудутся, то Cyrix сможет продать столькопроцессоров, сколько произведет. Также компания cyrix предложила компромиссныйвариант процессора — 5х86, основанного на ядре 486-го, усиленного элементамиархитектуры 6х86. Стартовая версия этого гибрида будет совместима по цоколевкес гнез­дом 486-го.

4.5. ПроцессорыSunMicrosystems.

SunMicrosystems процессор UltraSparc-II. Впервые вводя RISC-технологию, SUN в 1988 годуобъявила SPARC в качестве масштаби­руемой архитектуры, с запасом на будущее.Однако, с 1993 года реали­зация SuperSparc стала на шаг отставать от своихконкурентов.

С появлениемUltraSparc, четвертого поколения архитектуры SPARC, компания связывает надеждына восстановление утраченных позиций. Он содержит ни много, ни мало, но девятьисполнительных блоков: два целочисленных АЛУ, пять блоков вычислений сплавающей точкой (два для сложения, два для умножения и одно для деления иизвлече­ния квадратного корня), блок предсказания адреса перехода и блокзагрузки/записи. UltraSparc содержит блок обработки переходов, встроенный впервичную кэш команд, и условно выполняет предсказан­ные переходы, но не можетвыдавать команды с нарушением их очеред­ности. Эта функция перекладывается наоптимизирующие компиляторы.

Архитектура SPARCвсегда имела регистровые окна, т.е. во­семь перекрывающихся банков по 24двойных регистра, которые могут предотвратить остановки процессора в моментыкомплексного переключе­ния, связанные с интенсивными записями в память.Разработчики компи­ляторов склонны считать эти окна недостаточным решением,поэтому в UltraSparc используется иерархическая система несвязанных шин. Шинаданных разрядностью 128 бит работает на одной скорости с ядром про­цессора. Онасоединяется через буферные микросхемы с 128-разрядной системной шиной,работающей на частоте, составляющей половину, треть или четверть скоростипроцессорного ядра. Для согласования с более «медленной» перифериейслужит шина ввода-вывода Sbus.

Фирма Sun реализуетэту схему на аппаратном уровне с по­мощью коммутационной микросхемы, являющейсясоставной частью схемно­го комплекта окружения. Эта микросхема можетизолировать шину памя­ти от шины ввода-вывода, так что ЦПУ продолжает,например, запись в графическую подсистему или в иное устройство ввода-вывода, ане ос­танавливается во время чтения ОЗУ. Такая схема гарантирует полноеиспользование ресурсов шины и установившуюся пропускную способность

1.3 Гигабайт/с.

В процессоре UltraSparc – II используется системакоманд Visual Instruction Set (VIS), включающая 30 новых команд для обра­боткиданных мультимедиа, графики, обработки изображений и других целочисленныхалгоритмов. Команды VIS включают операции сложения, вычитания и умножения,которые позволяют выполнять до восьми опера­ций над целыми длинной байтпараллельно с операцией загрузки или за­писи в память и с операцией перехода заодин такт. Такой подход мо­жет повысить видеопроизводительность систем.

4.6. ПроцессорыDigital Equipment.

Digital Equipmentпроцессор Alpha наиболее тесно следует в русле RISC-философии по сравнению сосвоими конкурентами, «посрезав излишки сала» с аппаратуры и системыкоманд с целью максимального спрямления маршрута прохождения данных.Разработчики Alpha уверены, что очень высокая частота чипа даст вам большиепреимущества, чем причудливые аппаратные излишества. Их принцип сработал:кристалл 21164 был самым быстрым в мире процессором со дня своего появления в1995 году. Процессор 21164 в три раза быстрее на целочисленных вы­числениях,чем Pentium-100, и превосходит на обработке числе с пла­вающей точкой, чемсуперкомпьютерный набор микросхем R8000 фирмы Mips. Топология процессораследующего поколения 21164А не измени­лась, но она смаштабирована, кроме того,модернизирован компилятор, что повысило производительность на тестах SPECmarks.Предполагается, что готовые образцы нового процессора, изготовленные по КМОП — техно­логии с нормами 0.35 микрон, при тактовой частоте свыше 300 МГц бу­дутиметь производительность 500 по SPECint92 и 700 по SPECfp92.

Процессоры семейства21164 на прибегают к преимуществам ис­полнения не в порядке очередности (out –of – order), больше полагаясь на интеллектуальные компиляторы, которые могутгенерировать коды, сводящие к минимуму простои конвейера. Это самый гигантскийпроцес­сор в мире — на одном кристалле размещено 9.3 миллиона транзисторов,большая часть которых пошла на ячейки кэш-памяти. Alpha 21164 имеет накристалле относительно небольшую первичную кэш прямого отображе­ния на 8 Кбайти 96 Кбайт вторичной. За счет вздувания площади крис­талла достигнутабеспрецедентная производительность кэширования.

В 21164 работаетчетыре исполнительных блока (два для целых и два для чисел с плавающей точкой)и может обрабатывать по две ко­манды каждого типа за такт. Он имеетчетырехступенчатый конвейер ко­манд, который «питает» отдельныеконвейеры для целых чисел, чисел с плавающей точкой и конвейер памяти. Посравнению с прочими RISC-про­цессорами нового поколения чип 21164 имеетотносительно глубокие и простые конвейеры, что позволяет запускать их с болеевысокой такто­вой частотой.

Конвейер командвообще не заботится о их зависимости по дан­ным (в отличие от pentium Pro,который является ярким примером маши­ны данных), он выдает команды в порядке ихпоступления на свой вход (в порядке следования по программе). Если текущиечетыре команды не­возможно послать сразу все на различные исполнительные блоки,то конвейер команд останавливается до тех пор, пока это не станет воз­можным. Вотличие от конкурентов 21164 также не использует технику переименованиярегистров, вместо нее он непосредственно обновляет содержимое своихархитектурных регистров, когда результат достигает финальной ступени конвейера– write – back. Для борьбы с задержками и зависимостью команд по данным впроцессоре активно ис­пользуются маршруты для обхода регистров, поэтомусовместно ис­пользуемые операнды становятся доступными до стадии write — back.

Компания Digital продвигает Альфу как платформу длясерве­ров Windows NT, а не как традиционный UNIX-сервер.

4.7. Процессоры Mips.

Mips процессор R1000унаследовал свой суперскалярный дизайн от R8000, который предназначался длярынка суперкомпьютеров научно­го назначения. Но R1000 ориентирован на массовыезадачи. Использова­ние в R1000 динамического планирования команд, котороеослабляет за­висимость от перекомпиляции ПО, написанного для более старыхпроцес­соров, стало возможным благодаря тесным связям Mips со своим партне­ромSilicon Graphics, имеющим богатейший тыл в виде сложных графи­ческихприложений.

R1000 первыйоднокристальный процессор от Mips. Для предот­вращения остановок конвейера внем использовано динамическое пред­сказание переходов, с четырьмя уровнямиусловного исполнения, с ис­пользованием переименования регистров,гарантирующего, что результа­ты не будут передаваться в реальные регистры дотех пор, пока неяс­ность по команде перехода не будет снята. Процессорподдерживает «теневую карту» отображения своих регистров переименования.В слу­чае неверного предсказания адреса перехода он просто восстанавли­вает этукарту отображения, но не выполняет фактической очистки ре­гистров и«промывки» буферов, экономя таким образом один такт.

R1000 отличаетсятакже радикальной схемой внеочеред­ной обработки. Порядок следования команд вточном соответствии с программой сохраняется на трех первых ступенях конвейера,но затем поток разветвляется на три очереди (где команды дожидаются обработ­кина целочисленном АЛУ, блоке вычислений с плавающей точкой и бло­кезагрузки/записи). Эти очереди уже обслуживаются по мере освобож­дения того илииного ресурса.

Предполагаемаяпроизводительность R1000, выполненного по КМОП-технологии с нормами 0.35 микрондолжна достичь 300 по SPECint92 и по SPECfp92.

Программный порядокв конце концов восстанавливается так, что самая «старая» командапокидает обработку первой. Аппаратная поддержка исполнения в стиле out – of –order дает большие преимущества конечному пользователю, так как коды,написанные под старые скаляр­ные процессоры Mips (например, R4000), начинаютработать на полной скорости и не требуют перекомпиляции. Хотя потенциальнопроцессор R1000 способен выдавать по пять команд на исполнение в каждом такте,он выбирает и возвращает только четыре, не успевая закончить пятую в том жетакте.

Одно из двух устройств для вычисления двойной точностис плавающей точкой занято сложениями, а другое умножениями/делениями иизвлечением квадратного корня. Hа кристалле R1000 реализован также интерфейсвнешней шины, позволяющий связывать в кластер до четырех процессоров бездополнительной логики обрамления.

4.8. Процессоры Hewlett – Packard 

Hewlett – Packardпроцессор PA-8000. Компания Hewlett – Packard  одной из первых освоилаRISC-технологию, выйдя еще в 1986 году со своим первым 32-разрядным процессоромPA-RISC. Практически все вы­пускаемые процессоры PA-RISC используются в рабочихстанциях HP се­рии 9000. В период с 1991 по 1993 (перед появлением систем набазе PowerPC) HP отгрузила достаточно много таких машин, став крупнейшимпродавцом RISC-чипов в долларовом выражении.

С целью пропагандысвоих микропроцессоров среди других производителей систем компания HP сталаорганизатором организации Precision RISC Organization (PRO). А в 1994 годукомпания взорвала бомбу, объединившись с Intel для создания новой архитектуры.Это поставило под сомнение будущее PRO.

PA-8000 это64-разрядный, четырехканальный суперскалярный процессор с радикальной схемойнеупорядоченного исполнения программ. В составе кристалла десять функциональныхблоков, включая два цело­численных АЛУ, два блока для сдвига целых чисел, дваблока multiply/accumulate (MAC) для чисел с плавающей запятой, два блокаделения/извлечения квадратного корня для чисел с плавающей запятой и два блоказагрузки/записи. Блоки МАС имеют трехтактовую задержку и при полной загрузкеконвейера на обработке одинарной точности обес­печивают производительность 4FLOPS за такт. Блоки деления дают 17-тактовую задержку и не конвейеризированы,но они могут работать одновременно с блоками МАС.

В PA-8000использован буфер переупорядочивания команд (IRB) глубиной 56 команд,позволяющий «просматривать» программу на следую­щие 56 команд впередв поисках таких четырех команд, которые можно выполнить параллельно. IRBфактически состоит из двух 28-слотовых буферов. Буфер АЛУ содержит команды дляцелочисленного блока и бло­ка плавающей точки, а буфер памяти — командызагрузки/записи.

Как только командапопадает в слот IRB, аппаратура просмат­ривает все команды, отправленные нафункциональные блоки, чтобы най­ти среди них такую, которая является источникомоперандов для коман­ды, находящейся в слоте. Команда в слоте запускается толькопосле того, как будет распределена на исполнение последняя команда, кото­раясдерживала ее. Каждый из буферов IRB может выдавать по две ко­манды в каждомтакте, и в любом случае выдается самая «старая» ко­манда в буфере.Поскольку PA-8000 использует переименование регис­тров и возвращает результатывыполнения команд из IRB в порядке их следования по программе, тем самым поддерживаетсяточная модель об­работки исключительных ситуаций.

HP проектировала РА-8000 специально для задачкоммерческой обработки данных и сложных вычислений, типа генной инженерии, в ко­торыхобъем данных настолько велик, что они не умещаются ни в один из мыслимыхвнутрикристалльных КЭШей. Вот почему, РА-8000 полагается на внешние первичныеКЭШи команд и данных. Слоты в третьем 28-слото­вом буфере, который называетсябуфером переупорядочивания адресов (Adress – Recorder Buffer — ARB), один кодному ассоциированы со сло­тами в буфере памяти IRB. В АРВ содержатсявиртуальные и физические адреса всех выданных команд загрузки/записи. Крометого, АРВ допус­кает выполнение загрузок и записей в произвольном порядке, но ссох­ранением согласованности и сглаживанием влияния задержки, связанной садресацией внешних КЭШей.

4.9. Процессоры Motorola.

Motorola/IBMпроцессор PowerPC620 это первая 64-битовая реа­лизация архитектуры PowerPC.Имея 64-битовые регистры и внутренние магистрали данных и семь миллионовтранзисторов, новому процессору требуется почти вдвое больший и сложныйкристалл, чем у PowerPC 604. Модель 620 имеет четырехканальную суперконвейернуюсхему с шестью исполнительными устройствами: три целочисленных АЛУ, блокплавающей точки, блок загрузки/записи и блок переходов. Последний способен начетырехуровневое предсказание ветвлений в программе и условное ис­полнение сиспользованием схемы переименования регистров.

ПО микроархитектуреRISC-ядра 620-й похож на 604-й. Отличия сводятся в основном к ширине регистрови магистралей данных, а так­же к увеличенному числу станций резервирования дляусловного испол­нения команд. Прибавка производительности достигнута за счетулуч­шенного шинного интерфейса. Теперь он имеет 128-битовый интерфейс кпамяти, по которому за один цикл обращения можно выбрать два 64-би­товыхдлинных слова, и 40-битовая шина адреса, по которой можно ад­ресовать до одноготерабайта физической памяти.

В состав шинного интерфейса входить также поддержкакэш-па­мяти второго уровня объемом до 128 Мбайт, которая может работать начетверти, половине или на полной скорости ЦПУ.

 

5. Лабораторные испытания и тестированиемикропроцессоров.

5.1. Лабораторные испытания процессоров i386DX.

В 1992 году на рынкепоявилось три новых МП, способных за­местить существующие 386DX и обеспечитьповышение характеристик сис­тем на основе i386. Это: Intel RapidCAD, Chips& Technologies 38600DX, иCyrix 486DLC. В настоящий моментпредлагаются только версии 33 МГц, хотя C&T и Cyrix обещают выпустить вначале 1993 года вариант 40 МГц. Конечно, на такой частоте можно заставитьработать и 33 МГц вариант, но мой опыт показывает, что это ненадежно, в любоймомент машина может зависнуть. Intel RapidCAD распространяется, как про­дуктдля конечных пользователей, т.е. в машину его устанавливают именно они.Напротив, C&T и Cyrix поставляют свои процессоры и производителям. Cyrixтакже производит процессор 486SLC, заменяющий Intel/AMD 386SX. C&T объявило создании процессора 38600SX, но в продаже он появится только в 1993 году,если вообще появится.

RapidCAD, грубоговоря, представляет собой процессор 486DX без внутренней кэш-памяти и сцоколевкой процессора 386. Для прог­рамм он соответствует 386 с сопроцессором,так как все специфичные команды i486 удалены из набора команд. Рекламируетсяэтот процессор, как «абсолютный сопроцессор» и, к чему и обязываеттакое имя, он предназначен для замены процессора 386DX в существующих системахи резкого повышения производительности операций с плавающей точкой, таких, какCAD, электронные таблицы, математические программные па­кеты (SPSS, Mathematicaи т.д.). RapidCAD состоит из двух корпусов; RapidCAD-1, в корпусе PGA (132вывода), устанавливающийся в гнездо для i386, включает в себя ЦПУ и модульопераций с плавающей точкой, и RapidCAD-2, в корпусе PGA (68 выводов),устанавливающийся в гнез­до для сопроцессора i387, включает в себя ПЛМ,подающий сигнал на схемы системной платы для правильной обработки особыхситуаций при операциях с плавающей точкой. Большинство операций исполняется вте­чение одного цикла, как и в i486. Однако узким местом является ин­терфейсшины 386, так как каждый цикл шины равен двум циклам процес­сора. Это значит,что команды выполняются быстрее, чем считываются из памяти. Поскольку операциис плавающей точкой выполняются медлен­нее обычных команд, то замедление на нихне сказывается, и они вы­полняются с такой же скоростью, как и на i486DX.Именно поэтому RapidCAD позволяет получить более высокие характеристики сплаваю­щей точкой, чем любая комбинация 386/387. Результаты теста SPEC,стандартного теста для машин под UNIX, показывают, что RapidCAD ус­коряетоперации с плавающей точкой на 85%, а с целыми числами — на 15% по сравнению слюбой комбинацией 386/387 при одинаковой такто­вой частоте. Потребляемаямощность при 33 МГц составляет 3500 мВт. Текущая цена RapidCAD 33 МГцсоставляет 300$.

Предполагается, чтопроцессор фирмы C&T 38600DX полностью совместим с i386DX. В отличие отпроцессора Am386 фирмы AMD, кото­рый использует микрокод, идентичный микрокодуIntel 386, в процессо­ре 38600DX использован патентно чистый микрокод, дляобеспечения полной совместимости в набор команд даже включена недокументирован­наякоманда LOADALL386. Некоторые команды выполняются быстрее, чем в i386. C&Tтакже выпустила процессор 38605DX, включающий кэш-память команд на 512 байт,что еще более повысит его производительность. К сожалению, 38605DX выпускаетсяв корпусе PGA (144 вывода) и не мо­жет быть установлен непосредственно в разъемi386DX. При проведении испытаний я заметил, что у 38600DX есть серьезныепроблемы коммуни­кации ЦПУ- сопроцессор, и из-за этого скорость выполнения вбольшин­стве программ операций с плавающей точкой у него падает ниже уровняi386/i387. Эта проблема существует для всех производимых на настоя­щий момент387- совместимых сопроцессоров (ULSI 83C87, IIT 3C87, Cyrix EMX87, Cyrix 83D87,Cyrix 387+, C&T 38700, Intel 387DX). Мой знакомый по сети тоже проводилтакие тесты с 38700DX и пришел к ана­логичным выводам. Он связался с C&T, иему ответили, что знают об этом. Средняя потребляемая мощность 38600DX 40 МГц — 1650 Мвт, что меньше, чем потребление i386 33 МГц. Текущая цена 38600DX 33 МГц- 80$.

Процессор Cyrix486DLC — последняя новинка на рынке заме­нителей i386DX. Набор его командсовместим с i486SX, установлена 1 КВ кэш-память и аппаратно реализованный 16х16бит умножитель. Испол­нительное устройство 486DLC, созданное с использованиемнекоторых принципов RISC, выполняет большинство команд за один цикл. Аппарат­ныйумножитель перемножает 16-разрядные значения за 3 цикла, вместо 12 — 25 циклову i386DX. Это особенно удобно при вычислении адресов (код, генерируемыйнекоторыми неоптимизирующими компиляторами, мо­жет содержать много команд MULдля доступа к массивам) и для прог­раммных вычислений с плавающей точкой(напр., при эмуляции сопроцес­сора). Внутренняя кэш-память представляет собойобъединенную память команд и данных сквозной записи, и может бытьконфигурирована, как память с прямым отображением, или как 2-канальнаяассоциативная. Из-за необходимости обеспечения полной совместимости послеперезаг­рузки процессора кэш-память отключается, и должна быть включена с по­мощьюнебольшой программы, предоставляемой фирмой Cyrix. Если кэш-память включена призагрузке, (напр., при «горячей» перезагруз­ке, Ctrl – Alt – Del),BIOS моего РС (пр- ва AMI) зависает при загрузке, и мне приходится либовыполнять рестарт процессора, либо отключать кэш перед перезагрузкой. Это однаиз причин того, что после запуска процессора кэш-память отключается. Я уверен,что в следующих вер­сиях BIOS фирмы AMI это будет учтено и встроеннаякэш-память будет поддерживаться. Кэш-память помогает процессору 486DLCпреодолеть ог­раничения интерфейса шины 386, хотя процент попаданий составляетне более 50%. Фирма Cyrix предусмотрела некоторые возможности управле­ния кэш-памятьюпроцессора, что, конечно, улучшит связь внешней и внутренней кэш-памяти.Современные системы 386 не воспринимают эти управляющие сигналы, не имеющиезначения для i386DX, но в дальней­шем системы, разработанные с учетом этихвозможностей 486DLC, могут использовать их. Встроенный кэш 486DLC допускает до4-х некэшируе­мых областей памяти, что может быть очень полезно в том случае,ес­ли ваша система использует периферийные устройства, отображаемые в память(напр., сопроцессор Weitek). В существующих системах 386 пе­ресылки DMA (напр.,SCSI контроллера, платы звука) могут отключить внутренний кэш, так как несуществует других способов обеспечить соответствие кэш-памяти и основнойпамяти, что, конечно, снижает ха­рактеристики 486DLC. Потребляемая мощность486DLC 40 МГц — 2800 Мвт. Немецкий дистрибьютор продает 486DLC 33 МГц потекущей цене 115$. 486DLC работает далеко не со всеми сопроцессорами и не вовсех об­стоятельствах, особенно критичен в этом отношении многозадачный за­щищенныйрежим (улучшенный режим MS- Windows). При использовании 486DLC совместно сCyrix EMC87, Cyrix 83D87 (выпуск до августа 1992) и IIT 3C87 машина зависаетиз-за проблем синхронизации между ЦПУ и сопроцессором при исполнении командFSAVE и FRSTOR, сохраняющих и восстанавливающих состояние сопроцессора припереключении задач. Лучше всего использовать 486DLC с Cyrix 387+(распространяется только в Европе) или Cyrix 83D87 выпуска после июля 1992,являющий­ся наиболее мощным сопроцессором среди совместимых сопроцессоров486DLC. Если у вас уже есть сопроцессор Cyrix 83D87, и вы хотите знать,совместим ли он с 486LCD, я рекомендую вам мою программу COMPTEST,распространяемую как CTEST257.ZIP через анонимные ftp из garbo@uwasa.fi илидругие ftp-серверы. Если программа сообщит о соп­роцессоре 387+, то у васустановлен либо 387+, либо аналогичная но­вая версия 83D87 и проблем ссовместимостью не будет.

При испытаниях использовалась система:

Аппаратнаяконфигурация: 33,3/40 МГц системная плата, комплект микросхем Forex, кэш 128 КВс нулевым состоянием ожидания, прямое отображение, сквозная запись, один буферзаписи, 4 байта на строку, 4 цикла задержки при кэш-промахе. 8 МВ основнойпамяти, среднее сос­тояние ожидания 1,6 цикла. BIOS фирмы AMI. ПроцессорCyrix EMC87 в режиме совместимости 387, как матсопроцессор. Этот процессорвместе с Cyrix 83D87/387+ являются самыми быстрыми сопроцессорами для рабо­ты с386DX/486DLC/38600DX. Жесткий диск Conner 3204F, емкость 203 МВ, интерфейс IDE(пропускная способность по тесту CORETEST 1100 КВ/с, время поиска 16 мс). ПлатаSVGA (ISA, Diamond SpeedSTAR HiColor), используется ET4000, 1 МВ DRAM, какэкранный буфер, графи­ческий ускоритель отключен. Переключатели на видеоплатеустановлены для наиболее надежной с быстрой работы, с пропускной способностью6500 байт/мс при 40 МГц и 5400 байт/мс при 33 МГц.

Программная конфигурация: MS-DOS 5.0, MSWindows 3.1, HyperDisk

4.32 в режиме обратной записи,используется 2 МВ расширенной памяти, в качестве менеджера памяти используется386MAX 6.01. Эта программа также обеспечивает DPMI в некоторых тестах.

Результаты тестов

Для тестовWhetstone, Drhystone, WINTACH, DODUC, LINPACK, LLL и Savage больший показательозначает большую производительность.

Для тестов MAKE RTL,MAKE TRANK и теста String- Test меньший показатель означает большуюпроизводительность.

33,3 МГц                          Intel C&T       Intel       Cyrix       Cyrix

386DX  38600DX RapidCAD 486DLC   486DLC

кэш выкл. кэш вкл.Тесты с целыми числами

Whetstone (kWhet/s)            447     585       563        695          803

Drhystone(C) (Dhry./s)        11688 11819   12357    14150      15488

Drhystone(Pas) (Dhry./s)     10455 10877   10751    12154      13858

String-Test (ms)                    459     453       441        347          327

MAKE RTL (s)                     51,32  47,10    46,34     43,45       39,13

MAKE TRANCK (s)            62,42  55,47    55,37     53,64       46,12

WINTACH                           4,85    4.90      5.49       5.53         6.14

Тесты с плавающей запятой

DODUC (Индекс скорости)        79.0      76.4       150.3       89.4 90.7

LINPACK (Mflops)          0.2808             0.2707   0.4578     0.3158       0.3438

LLL (Mflops)                    0.3352             0.3537   0.6083     0.3816       0.4139

Whetstone (kWhet/s)        2540   2340     3990      2908        3061

Savage (решений/с)          71685 53191   72464    88757      93897

40 МГц                             Intel C&T       Intel       Cyrix       Cyrix

386DX  38600DX RapidCAD 486DLC   486DLC

Тесты с целыми числами                                      кэшвыкл. кэш вкл.

Whetstone (kWhet/s)            536     702       676        835          963

Drhystone(C) (Dhry./s)        14128 14116   14836    16987      18750

Drhystone(Pas) (Dhry./s)     12490 13067   12890    14573      16624

String-Test (ms)                    384     377       368        289          273

MAKE RTL (s)                     43.46  40.11    39.84     37.25       33.54

MAKE TRANCK (s)            53.00  47.59    47.07     45.36       39.00

WINTACH                           5.65    5.73      6.41       6.46         7.23

Тесты с плавающей запятой

DODUC (Индекс скорости)        94.9      77.5       180.3       105.1         106.6

LINPACK (Mflops)          0.3324             0.3260   0.5418     0.3789       0.4131

LLL (Mflops)                    0.4025             0.4204   0.7260     0.4562       0.4956

Whetstone (kWhet/s)        3061   2632     4798      3505        3677

Savage (решений/с)          86083 49587   86957    106762    112360

Среди испытанныхпроцессоров Cyrix 486DLC обладает самой большой производительностью по целымчислам. С включенной внутрен­ней кэш-памятью производительность по целым числамна одинаковой так­товой частоте 486DLC на 80% превышает 386DX, среднееувеличение ско­рости работы прикладных программ составляет 35%. При работе сприк­ладными программами, использующими операции как с целыми числами, так и сплавающей точкой, включенный кэш обеспечивает на 5% — 15% более высокиепоказатели по сравнению с работой без КЭШа. Скорость операций с плавающейточкой по сравнению с i386DX увеличивается на 15% — 30%

Intel RapidCAD при работевместо i386DX обеспечивает самые высокие характеристики при выполнении операцийс плавающей точкой. Прикладные программы, выполняющие интенсивные операции сплавающей точкой, работают быстрее на 60% — 90% по сравнению с i386DX/387DX,отставая от i486DX при той же тактовой частоте по скорости операций с плавающейточкой всего на 25%. Скорость операций с целыми числами увеличивается на 15% — 35% по сравнению с i386DX/i387DX.

Процессор Chips & Technologies 38600DX обладаетнесколько бо­лее высокими характеристиками при работе с целыми числами, чемi386DX, давая среднее увеличение скорости порядка 10%.

 

 

 

5.2.Результаты тестирования микропроцессоров с помощью па­кета The Speed Test.

Для тестирования различныхмикропроцессоров иногда приме­няют специальные пакеты программ processorbenchmarks. Ниже приведе­ны результаты тестирования процессоров с помощьюпакета программ Speed Test, ARA Copyright (C) 1994,95,96 Agababyan RobertAssotiation Used TMi0SDGL(tm)

Pentium iP5-200(3-200), 512K PB                               1318841

Pentium iP5-200(2.5-200), 512KPB                             1309353

Pentium iP5-200(2.5-200)                                             1290780

Pentium iP5-200(3-200)                                                1290780

Pentium iP5-180, 512K PB                                           1181818

Pentium iP5-180                                                            1151899

Pentium iP55-166, Intel Triton,IWill TSW2                  1109756

Pentium iP5-166, 512K PB                                           1096386

Pentium iP5-166                                                            1076923

Pentium iP5-160, 512K PB                                           1052023

Pentium iP5-160                                                            1040000

Pentium iP5-150, 512K PB                                             983784

Pentium iP5-150                                                             968085

Pentium iP5-133, 512K PB                                             879227

Pentium iP5-133                                                             866667

Pentium iP54-75(1.5-120), IntelTriton                            812500

Pentium iP54-75(2-120), IntelTriton                               812500

Pentium iP54-75(2-120), SiS501/503                             812500

Pentium iP5-100(2-120), IntelTriton, ASUS P55-TP4        798246

Pentium iP5-120(1.5-120), 512KPB                               798246

Pentium iP5-120, 512K PB                                             787879

Pentium iP5-120(1.5-120)                                               781116

Pentium iP5-120                                                              777778

Cx5x86-M1sc-100(3-150,Opt)                                        771186

Cx5x86-M1sc-100(3-150,Opt)                                        758333

Am5x86-133-X5-P75(4-200)                                          710938

Pentium iP5-100, ALR Revolution                                  679104

Pentium iP5-100, Intel Triton,ASUS P/I-P55TP4XE     669118

Pentium iP5-100, Intel Triton                                          669118

Pentium iP54-75(100), IntelTriton                                  669118

Am5x86-133-X5-P75(3-180),UMC8886BF/8881F        640845

Cx5x86-M1sc-100(3-120,Opt)                                        614865

Pentium iP54-75(90), IntelTriton, ASUSTeK P54-TP4  606667

Cx5x86-M1sc-100(3-120,Opt), SiS471, GMB-486SG   600660

Am5x86-133-X5-P75(4-160), SiS471, BTC 4SLD5.1   568750

Am5x86-133-X5-P75(4-160), SiS496/7, ASUS PVI-SP3   568750

Am5x86-133-X5-P75(4-160), SiS471                            561730

Am5x86-133-X5-P75(4-160), SiS496 PCI                     561728

Am5x86-133-X5-P75(4-160)                                          561128

Cx5x86-M1sc-100(3-120), SiS496/7, ASUS PVI-SP3   548193

Cx5x86-M1sc-100(3-120,Opt), SiS471, GMB-486SG   535294

i80486DX4-100(120), UMC 8498F                                535294

Am5x86-133-X5-P75(3-150), SiS471, BTC 4SLD5.1   529070

Cx5x86-M1sc-100(Opt)                                                  511236

Nx586-90(100), NxVL SystemLogic, Alaris                  505450

Cx5x86-M1sc-100(Opt), SiS 471,GMB-486SG             501377

Am5x86-133-X5-P75, SiS 471, BTC4SLD5.1               469072

Am5x86-133-X5-P75, SiS 496/7,ASUS PVI-SP3          469072

Cx5x86-M1sc-100, SiS 496/7,ASUS PVI-SP3               455000

i80486DX4-100, UMC 881                                             455000

Nx586-90, NxVL System Logic,Alaris                           455000

Pentium iP5-60(66), PCI58PL                                         450495

Pentium iP5-60(66), SiS501/502/503, ASUS P5-SP      450495

Cx5x86-M1sc-100, SiS 471,GMB-486SG                     446078

i80486DX2-66(4-100), PC Chips18                               446078

i80486DX4-100, SiS 82C471, SOYO                             446078

OverDrive iDX4ODPR100(486DX4-100)                      437500

i80486DX4-100, Compaq ProLinea4/100                      433333

Am80486DX4-120SV8B, SiS 471,BTC 4SLD5.1         425234

Am80486DX4-120, SiS 471, SOYO                               425234

Pentium iP5-60, Compaq DeskProXL 560                     406250

Pentium iP5-60, Compaq Proliant                                   406250

Pentium iP54-75(60), IntelTriton                                    406250

Pentium iP5-60, OPTi596/546/82, Bison III v1.0           406250

Pentium iP5-60, SiS501/502/503, ASUS P5-SP             406250

Am80486DX2-80(100), UMC 8498F                             352713

Am80486DX4-100, PC Chips 18                                    350000

Am80486DX2-80(100), SiS 471                                     345351

Cx80486DX2-100, Opti VIP                                           344697

i80486DX4-100(75), UMC 881                                      337037

Pentium iP54-75(50), IntelTriton                                    334559

Pentium iP54-75(45), IntelTriton                                    303333

U5-S33(60), UMC 491F                                                  301325

i80486SX2-50(80), SiS 471,S486G                               282609

i80486DX2-S-80, PC Chips 18                                       280864

i80486DX2-80, Symphony Haydn II                              280864

i80486DX2-S-80, UNICHIPU4800VLX, U486 WB      280864

Cx80486DX2-66(80), OPTi 495SLC                              277560

U5-S33(50), SiS 471, AV7541                                        250000

U5-S33(50), SiS 471, SOYO                                           250000

U5-S33(50), UMC 491F                                                  250000

U5-S33F(50), UMC 8498F                                              250000

U5-S33(50)                                                                      246612

U5-S33(50), CONTAQ 82C596A,G486VLI                  245946

U5-S40(50)                                                                      245946

i80486DX2-66, DELL                                                     238196

Am80486DX2-66, Forex 46C421                                   234964

Am80486DX2-66, Bioteq 82C3491                                234536

Am80486DX2-66, OPTi 495SLC                                   234536

i80486DX2-66 &E5, AcerMate466                                234536

i80486DX2-66, ALI M1429/M1431                                234536

i80486DX2-66, SiS 82C471                                            234536

i80486DX2-66, Symphony,Predator I                           234536

i80486DX2-66, OPTi 82C682, ALREvolution 4           233333

i80486DX2-66, PC Chips11&13                                   233333

Am80486DX2-66, IMS 8849                                          232143

i80486DX2-66, Compaq ProLineaMT 4/66                   232143

Am80486DX2-66, UNICHIPU4800VLX, U486 WB     230964

i80486DX2-66, Intel Champion                                      230964

Cx80486DX2-66, UMC 82C491F                                  230964

OverDrive iDX2ODPR66(486DX2-66)                          230964

Am80486DX2-66, SiS 82C471                                       229798

i80486DX2-66, Symphony Haydn II                              229768

i80486DX2-66, SiS 82C471                                            228643

U5-S33(40), SiS 82C471                                                 200441

U5-S33F(40), UMC 8498F                                              200441

U5-S33(40), Expert 4045                                                194861

i80486DX-50, UMC 82C480                                          176357

i80486DX2-50, HeadlandHT342/HT321                       176357

i80486SX-50, SiS 82C471                                              176357

Am80486DX-50, UMC 82C491F                                   173004

i80486DX-50                                                                   173004

i80486DX2-50, OPTi 495SLC                                        171053

Cx486S-40(50), UMC 82C491F                                     171053

U5-S33, SiS 82C471                                                       167279

U5-S33, Expert 4045                                                      162645

IBM486SLC2-66, OPTi 495XLC                                    161922

i80486SX-33(40), SiS 82C471                                        140867

i80486SX-33(40), OPTi 82C495SLC                              140867

Am80486DX-40, OPTi 82C495SLC                               140432

i80486SX-33(40) &E5, Forex521                                  140000

i80486SX-33(40), Forex 521                                           139571

Am80486DX-40, SiS 82C461                                         138931

Cx486DX-40                                                                   135821

Ti486DLC/E-40BGA, PC Chips,M321                          126389

Cx486DLC-40                                                                 126389

Tx486DLC-40, OPTi 495SLC                                         126039

Cx486DLC-40GP, SARC RC4018A4                             123641

IBM 486SLC2-50, WD7600                                            122642

Cx486SLC-40, SARC RC2016A4,M396F                     120053

i80486SX-33, SiS 82C471                                              117571

i80486DX-33, HP Vectra 486/33VL                               116967

i80486DX-33, OPTi 82C498,Simens-Nixdorf PCD-4H 116967

i80486SX-20(33), Symphony                                         116967

i80486DX-33, Intel Champion                                        116667

i80486DX-33, Toshiba T9901C,LapTop                       116667

i80486DX-33, UMC 82C481                                          114035

i80486SX-25, IBM PS/1                                                  88694

i80486SX-25, SiS                                                             87838

i80486SX-25, HiNT CS8005                                           87500

i80486SX-25, HP Vectra486SX/25VL                             86502

Am80386DX-40, ALI M1429/M1431                              81835

Am80386DX-40, CD-COM, M326                                  81835

Am80386DX-40 WC, SARC                                           81835

Am80386DX-40, UMC 82C491F                                    81688

Am80386DX-40, OPTi 82C391                                       81531

Am80386DX-40, UNICHIP U4800VXL                         81182

Am80386DX-40, PC Chips 5,6                                       80817

Am80386DX-40, UMC 80C481                                      80647

Am80386DX-40, OPTi 495XLC                                      80531

Am80386DX-40, ForexFRX46C402,411                        80247

Am80386SX-40, P9 MXIC                                              73387

i80386DX-33                                                                   68114

Am80386SX-40, M396F                                                  67407

Am80386SX-40, Acer M1217                                         63459

Am80386SX-40, ALI M1217                                           62329

Am80386SX-40, PC Chips 2                                           61905

i80386SX-33, Acer M1217                                              51066

i80386SX-33                                                                    49296

i80386DX-25                                                                   48925

i80386SX-33, HP Vectra386SX/33N                               48611

Am80386SX-33, Acer M1217                                         47744

80286-25                                                                          45867

80286-20                                                                          38625

Harris 80286-20, UMC 82C208L                                    37387

80286-16, HT12                                                               29111

i80286-12.5                                                                      24125

i80286-12                                                                         22392

i80286-10, IBM PS/2                                                       15545

i80286-10, IBM PS/2 60                                                  15242

i8088-9.54, Commodore PC-20                                         5395

i8088-7.16, Commodore PC-20                                         4011

i8088-4.77, EC-1841                                                         2968

i8088-4.77, Original XT                                                     2697

i8088-4.77, Commodore PC-20                                         2658


 


6. Сравнительный анализ.

В середины октября1995 года в г. Сан-Хосе (Калифорния) сос­тоялся очередной МикропроцессорныйФорум. В прошлом году на нем де­монстрировались прототипы процессоров IBM PowerPC 620, MIPS R10000, SUN UltraSPARC, HP PA-8000 и DEC Alpha 21164.

Из прошлогоднихпроцессоров – дебиторов до рынка дошел только процессор Alpha 21164/300. Егопроизводительность по тесту SPECint92 составила 341 единицу. Пребывая с такойпотрясающей производи­тельностью в лидерах гонки на быстродействие процессоров,в ноябре Alpha пропустила вперед компанию Intel с процессором Pentium Pro.Страсти накалились нешуточные и вот на нынешнем форуме Digital сооб­щила, что вдекабре приступит к выпуску нового варианта этого про­цессора — Alpha 21164A стактовой частой 333 МГц, выполненного по технологии 0.35 мкм. Проектируемаяпроизводительность 500 по SPECint92.

Hewlett – Packardанонсировала 32-разрядный процессор архитек­туры РА следующего поколенияРА-7300LC с встроенными функциями мультимедиа. Hачало его выпуска по 0.5 мкмтехнологии возможно во второй половине следующего года. Этот первый процессорPA-RISC, ос­нащенный внутренними 64 Кбайт КЭШами первого уровня для команд идля данных, предпочтительно будет иметь 200 SPECint92 и 275 SPECfp92.

Через год послеобъявления процессора UltraSPARC фирма SPARC Technology представила новыйпроект UltraSPARC- II. Hовый процессор будет иметь 5.4 млн. транзисторов,изготавливаться по технологии

0.35 микрон, работать на частоте 250-300МГц. Проектируемое быстро­действие 250 МГц версии — 350 SPECint92 и 550SPEFfp92. Кроме базо­вой системы команд, процессор будет оснащен набором из 30новых ко­манд Visual Instruction Set, которые предназначены для быстрой обра­боткивидеофайлов в формате MPEG-2, рендеринга трехмерных оболочек, видеоконференцсвязи.

Рождение Pentium Proвосхитительная новость, но оно неизмен­но поднимает несколько серьезныхвопросов. Hа самом ли деле это пол­ностью новое поколение процессора Pentium?Побила ли Intel своих конкурентов окончательно? Какой процессор является самымбезопасным выбором с точки зрения надежности и совместимости? Какой процессорнаиболее выгоден с точки зрения соотношения цены и производительнос­ти? Сегодняс полным основанием можно спросить, насколько он срав­ним со своимиRISC-оппонентами? Hе устарел ли лозунг Apple о том, что Power Macперспективнее, чем линия x86?

Hа все вопросы можноответить в принципе утвердительно. Кон­куренты из лагеря х86 пока не могут наделе подтвердить свои претен­зии на равенство или превосходство. Hичего живогоили приличного (Cyrix) на руках пока нет. А ценовой ориентир Intel известен:нас­тольный high – end  компьютер на платформе Aurora, Pentium Pro 150 MHz, ОЗУ16 Мб, жесткий диск EIDE 1 Гб, 2 Мб SVGA, монитор 17" NI digital SVGA,Windows 95 в декабре обойдется жадным к мощности пользовате­лям дешевле $5000.Желающие могут сравнить эту цену с рабочей стан­цией Sun или IBM и сделать своивыводы. Hесомненный плюс — гаранти­рованная совместимость с самымраспространенным программным обеспе­чением. Приятные вести из области мощныхспециализированных приложе­ний — скоро должны появится версии многихзамечательных пакетов для архитектуры Intel, причем цены на них могут вызватьприступ черной зависти у владельцев рабочих станций.

Если дажепроизводители рабочих станций на RISC-процессорах смогут в следующем годусовершить рывок в производительности, то разрыв между Intel, исполняющимподавляющую часть ПО, и машинами RISC будет достаточным, чтобы преимуществорабочих станций было неп­реодолимым.

В первом номереComputer Week Moscow можно найти пассаж ин­тересного характера. Дословно:«Опытные системы P6 способны на большее, чем просто выдерживатьконкуренцию со стороны других рабо­чих станций среднего класса. Принепосредственном сопоставлении ра­бочих станций Intergraph на 200-МГцпроцессоре Pentium Pro и Silicon Graphics Indigo-2 Extreme с 200-МГцпроцессором Mips R4400, послед­няя на тестах iSPEC показала порядка 160 единиц,тогда как оценки Intel для системы P6 полной конфигурации соответствуют 366единицам.»

При созданиипроцессора Pentium Pro делался упор на способ­ности этой микросхемы выполнятьграфический рендеринг и работать с 32-разрядным кодом.

Pentium Pro явновыламывается из рамок процессора Pentium и принадлежит шестому поколениюархитектуры Intel x86. Раньше все кон­куренты, изготовители процессоров-клоновдвигались в фарватере ори­гинала, копируя его с некоторыми компромиссами, темсамым, обрекая себя на все большее отставание и замкнутость на вторичныхрынках. Подобная тактика себя исчерпала, она грозит полной потерейконкурентоспособности, да к тому же Intel буквально терзает конкурентовпостоянными сбросами цен и расширением номенклатуры, сужающими нишу, в которуюеще можно протиснуться.

Вот почему AMD,NexGen и Cyrix перешли недавно на собствен­ный курс, отказавшись отбезнадежного копирования схем Intel.

Hо принципиальнойпрорасти между конкурентами нет. В некото­рых случаях Pentium Pro более сложен,чем Nx586, K5 и M1, в других менее. В целом же схема P6 сравнима с прочимипроцессорами; наибо­лее близок к ней дизайн К5, как считают эксперты.

Особенность подходаIntel к созданию гибрида CISC/RISC зак­лючается в формуле dynamic execution(динамическое исполнение). При­мерно такие же базовые принципы вы обнаружите,если станете разби­раться подробно с архитектурой последних RISC-процессоровIBM/Motorola PowerPC 604 и Power PC 620, Sum UltraSparc, Mips R10000, DigitalAlpha 21164 и HP PA-8000.

Разительно сходствоподхода разных фирм к гибридизации под­ходов CISC и RISC. Внешне Pentim Proвыглядит традиционным CISC-про­цессором, совместимым со всем наработаннымпрограммно-аппаратным фондом. Знакомый «фасад» прикрывает отпользователя RISC-подобное ядро. Между «фасадом» и «заднимикомнатами» работает умнейший деко­дер, разбивающий сложные и длинныекоманды х86 на более простые опе­рации, похожие на команды RISC — компанияIntel называет их u-ops или micro — ops. Эти micro — ops поступают в ядропроцессора, кото­рое их буквально перелопачивает. Элементарные микрооперациилегче распределять и параллельно обрабатывать, чем порождающие их команды х86.Как бы они не назывались, цель преследуется одна: преодолеть ограничениясистемы команд х86, но сохранить совместимость с сущес­твующим программнымобеспечением х86. Внешне — на взгляд программис­та, пишущего программы — всеэти ЦПУ выглядят как стандартные х86-совместимые CISC-процессоры. А внутри ониработают как современ­нейшие модели RISC-чипов.

Hо сегодня PentiumPro «живее» и быстрее не только любого из «живых»процессоров архитектуры х86, включая Nx586 и Cyrix6x86, но и любого извыпускаемых RISC-процессоров.

Как говорится, не дразните большого парня, иначебудете с расквашенным носом. Именно таков смысл послания Intel в адрес конку­рентов:NexGen, Cyrix и AMD.

 


7. Pentium II.

7.1Pentium II

Выпущенный с середины 1997 года, Pentium II ввел рядбольших изменений в мир процессоров PC.

Во-первых, чип и системный кэш второго уровнясоединялись по выделенной шине, способной работать на частоте шиныпроцессор-система.

Во вторых, процессор, вторичный кэш и тепло отводбыли смонтированы на небольшой плате, вставлявшейся в разъем на системнойплате, что больше напоминало карту расширения, чем традиционную схемупроцессор/гнездо. Intel окрестил это Single Edge Contact cartridge (SEC) — односторонне контактный картридж. В этом картридже находятся шесть отдельныхкомпонент — процессор, четыре индустриально стандартных burst-static-cache RAMи один tag RAM. Дизайн SEC картриджа наделял важными преимуществами.PGA-компоновка Pentium Pro требовала 387 контактов, в то время как SEC-картридж- только 242. Уменьшение на треть числа контактов произошло благодаря наличию вкартридже дискретных элементов, таких как замыкающие резисторы и конденсаторы.Эти элементы обеспечивают расщепление сигналов, что значит намного меньшеечисло требуемых разъемов питания. Разъем SEC-картриджа использует такназываемый Slot 1 и воспринимается как принимающий эстафету у уходящего Socket7.

Третье изменение — в большем синтезе, так какPentium II объединяет Dual Independent Bus (DIB) от Pentium Pro c технологиейMMX от Pentium MMX, формируя новый вид — гибрид Pentium Pro/MMX. Таким образом,внешне очень отличный от предыдущих интеловских процессоров, Pentium IIвнутренне являет собой смесь новых технологий и улучшений старых чипов.

И наконец, в отличие от Pentium Pro, работающего на3.3v, Pentium II питается от 2.8v, позволяя Intel пускать его на большихчастотах без чрезмерного увеличения требование к мощности. В то время, как200MHz Pentium Pro с 512kb кэша потребляет 37.9 ватт, 266MHz Pentium II с 512kbкэша сжигает 37.0 ватт.

Подобно Pentium Pro, Pentium II применяетинтеловскую Технологию Динамического Исполнения. Когда программная инструкциясчитывается в процессор и декодируется, она попадает в исполняемый пул.Технология Динамического Исполнения принимает три основных подхода коптимизации способа обращения процессора с кодом. Множественные ПредсказанияВетвлений проверяют программный поток вдоль нескольких ветвей и предсказывают,где в памяти находится следующая инструкция.

Когда процессор читает, он также проверяет следующиеинструкции в потоке, ускоряя в результате рабочее течение. Анализ Потока Данныхоптимизирует последовательность, в которой инструкции будут выполняться,проверяя декодированные инструкции и определяя, готовы ли они для обработки илизависят от других инструкций. Спекулятивное Выполнение увеличивает скоростьтаких инструкций просмотром вперед от текущей инструкции и обработкойдальнейших инструкций, которые вероятно могут понадобится. Эти результатыхранятся как спекулятивные до тех пор, пока процессор не определит, какие емунужны, а какие — нет. С этой точки инструкция возвращается в нормальную очередьи добавляется к потоку.

У Технологии Динамического Исполнения есть дваосновных преимущества: Инструкции обрабатываются быстрее и эффективнее, чемобычно, и, в отличие от CPU с применением RISC архитектуры, программы не надоперекомпилировать для извлечения выгод процессора. Процессор все делает налету.

Значительной новой особенностью является удалениевторичного кэша из собственно процессора на отдельную кремниевую пластину вкартридже. Процессор читает и пишет данные в кэше используя специализированнуювысокоскоростную шину. Называемая задней (backside) шиной, она отделена отсистемной шины процессор-память (сейчас называемой передней (frontside) шиной).Процессор может использовать обе шины одновременно, но архитектура двойнойнезависимой шины имеет другие преимущества.

Хотя шина между процессором и кэшем второго уровняработает медленнее, чем на обычном Pentium Pro (на половине скоростипроцессора), она чрезвычайно масштабируема. Чем быстрее процессор, тем быстреекэш, независимо от 66MHz передней шины. Вдобавок, передняя шина может бытьувеличена с 66 до 100MHz без влияния на шину кэша второго уровня. Такжеочевидно, что наличие памяти на одном кристалле с процессором негативносказывается на проценте выхода годных 512kb Pentium Pro, сохраняя высокимицены.
Pentium II опирается на GTL+ (gunning-transceiver-logic) логику хост-шины,допускающую естественную поддержку двух процессоров. Во время выхода этообеспечивало стоимостно эффективное минималистское двухпроцессорное решение,допускаемое симметричной мультипроцессорностью (SMP). Двухпроцессорноеограничение налагалось не самим Pentium II, а поддержкой чипсета. Изначальноеограничение чипсета двухпроцессорной конфигурацией позволяло Intel ипоставщикам рабочих станций предлагать двухпроцессорные системы как временное иэкономичное решение, что по другому и не было возможно. Это ограничение было снятос середины 1998 года с выходом чипсета 450NX, поддерживающего от одного дочетырех процессоров. Чипсет 440FX, содержащий чипы PMC и DBX, не допускалчередования (interleaving) памяти, но поддерживал EDO DRAM, позволяя улучшатьпроизводительность памяти уменьшением ожидания.

Когда Intel проектировал Pentium II, он также взялсяза слабую 16-битную производительность его предшественника. Pentium Proроскошно работает с полностью 32-битным обеспечением, таким как Windows NT, ноопускается ниже стандартного Pentium'а, обрабатывая 16-битный код. Это влечетхудшую чем Pentium производительность под Windows 95, большие части которойпока 16-битны. Intel решил эту проблему использованием пентиумного кэша сдескрипторами сегментов в Pentium II.

Как и Pentium Pro, Pentium IIчрезвычайно быстр в арифметике плавающей точки. В сочетании с AcceleratedGraphics Port (AGP) это делает Pentium II мощным решением длявысокопроизводительной 3D графики.

7.2 Deschutes

333MHz воплощение Pentium IIпод кодовым названием Deschutes (по реке, текущей в Орегоне), было анонсированов начале 1998 года с планируемыми в течение года 400MHz и выше. Имя Deschutes вдействительности относится к двум разным линиям CPU.

Версия для Slot 1 — ничегоболее, чем слегка эволюционировавший Pentium II. Архитектура и физическийдизайн идентичны, за исключением того, что Deschutes Slot 1 частью сделан сиспользованием 0.25-микронной технологии, введенной осенью 1997 года сноутбучным процессором Tillamook, по сравнению с 233-300MHz версиями, выполненнымипо 0.35-микронному процессу. Применение 0.25-микрон означает, что транзисторына матрице физически ближе между собой и CPU потребляет меньше энергии, аследовательно рассеивает меньше тепла на данной частоте, позволяя ядру тикатьна больших частотах.

Все иное у Slot 1 Deschutes идентично обычномуPentium II. Смонтированный на основание и заключенный в SEC картридж, онподдерживает набор инструкций MMX и общается с 512kb вторичного кэша наполовинной частоте ядра. Он имеет тот же конечный коннектор, и работает на техже системных платах с теми же чипсетами. Как таковой он работает с 440FX или440LX на внешней частоте 66MHz.

С весны 1998 года большой шагв производительности пришел со следующим воплощением Deschutes, когда вышелновый чипсет 440BX, допускающий 100MHz передачу по системной шине, уменьшаязакупоривание данных и поддерживая частоты от 350 до 400MHz.

Другой процессор, зовущийся Deschutes, относится кSlot 2, выпущен с середины 1998 года как Pentium II Xeon. Intel разбил Slot 1 иSlot 2 Deschutes на взаимодополняющие товарные линии, где Slot 1 предназначендля массового производства, а Slot 2 нацелен на high-end серверы и туда, гдецена вторична по отношению к производительности.

7.3 Мобильный Pentium II

Естественноепродвижение маломощного (в смысле энерго потребления/рассеивания) семействаPentium II Deschutes на рынок портативных PC осуществилось с выпуском линейкимобильных Pentium II в апреле 1998 года. Новый процессор и его компаньонмобильный 440BX чипсет, изначально были доступны в 233 и 266MHz вариантах,скомпонованные в существующий мобильный модуль (MMO) или новый мини-картриджформат. Intel ожидает к концу 1998 года более половины из снаряженных егомобильными процессорами PC будут уже Pentium II, а срок мобильных Pentium II Tillamookокончится к середине 1999 года.

7.4 Celeron

В попытке лучшего удовлетворения сектора дешевых PC,до настоящего времени вотчины производителей клонов, AMD и Cyrix, продолжающихразвивать унаследованную архитектуру Socket 7, Intel выпустил свой рядпроцессоров Celeron в апреле 1998 года.

Основанный на той же P6архитектуре, что и Pentium II, и используя тот же 0.25-микронный процесс,Celeron-системы предлагают полный комплект последних технологий, включаяподдержку AGP графики, ATA-33 жестких дисков, SDRAM и ACPI. Celeron будетработать на любом интеловском Pentium II чипсете, поддерживающим 66MHzсистемной шины, включая 440LX, 440BX и новый 440EX, специально спроектированныйдля рынка 'базовых' PC. В отличие от Pentium II с его SEC картриджем, Celeronне имеет защитного пластикого покрытия вокруг карт процессора, что Intelназывает Single Edge Processor Package (SEPP). Он полностью совместим со Slot1,что позволяет использовать существующие платы, но механизм крепления для картыCPU не адаптирован для форм фактора SEPP.

Первые 266 и 300MHz Celeron'ы без кэша второго уровнявстретили мало энтузиазма на рынке, не неся или неся мало преимуществ надсистемами-клонами Socket 7. В августе 1998 года Intel пополнил ряд Celeronсемейством процессором, названных Mendocino. Снабженный 128kb вторичного кэа наматрице, работающего на полной частоте процессора, и соединяясь через внешнюю66MHz шину, новый Celeron стал намного более живым, чем его вялыйпредшественник. Отчасти путано, две доступные версии получили названия Celeron333 и 300a. Первый является основной версией, совместимый с существующейинтеловской архитектурой, в то время как второй патентует Pin 370 socket,отличный от Socket 7 и Socket 1, нацеленный на дешевые low-end машины.
7.5  PentiumXeon

Cначала июля 1998 года по всему миру проходила серия мероприятий, посвящённыхпредставлению самого мощного процессора архитектуры х86 корпорации Intel.Задолго до этого из информации, размещённой на Web-сайтах Intel стало известноего название и назначение. Особо подчёркивалось, что слово Xeon нежнопроизносить как «Зеон», но российское представительство приняло решениеподчинить это название нормам русского (и греческого) языка. Так что в Россиимы будем иметь дело с «Ксеоном»,- ведь есть же у нас Ван Клиберн и Мехико.

  Новый процессор, к слову, стал подарком компании-производителя самой себе послучаю тридцатилетия.

 Первое, что бросается в глаза, — необычно крупный размер процессорногокартриджа в который «пакуется» Xeon. Он предназначен для установки вразъём  новой конструкции Slot 2. По словам разработчиков, это связанно сувеличением ёмкости кэш-памяти второго уровня. В настоящий момент процессорыXeon с единой тактовой частотой поставляются в двух вариантах: с 512 Кбайт и 1Мбайт КЭШа L2. Но уже в текущем году планируется довести ёмкость кэш-памятивторого уровня до 2 Мбайт и повысить тактовую частоту до 450 МГц. Напомню, чтостарый Pentium II комплектовался лишь 512 Кбайт.

  Но ещё больший интерес вызывает тот факт, что конструкторы смогли «заставить»L2-кэш работать на тактовой частоте процессорного ядра. Напомню, что та жеконцепция была реализована в Pentium Pro, но при этом разработчики«столкнулись» на стадии производства (процент выхода двух качественныхкристаллов оказался ниже предполагаемого), и процессор оказался довольнодорогим. Возможно, именно поэтому Pentium II изначально создавался с«разделением» кристаллов (основного и КЭШа L2), за что пришлось расплачиваться«половиной» тактовой частоты кэш-памяти второго уровня.

  Высокая частота работы КЭШа спровоцировала увеличение теплоотдачи процессорногоблока, поэтому потребовалось использование массивной поглощающей теплопластины, что, в свою очередь, привело к увеличению веса и габаритов модуля.

  В каждом модуле Slot 2 три специальных области данных: доступная только длячтения, область для чтения/записи и  динамическая информация о температуре внутри процессорного модуля. В области первого типа помещенаинформация о версии процессора, данные о пошаговой отладке и указана предельнодопустимая температура. Во второю область памяти пользователи могут вводитьсвою информацию.

Доступк динамическим данным об изменении температуры даёт возможность управляющимпрограммам оповещать администратора  об

опасныхсистемных событиях.

  Увеличение ёмкости КЭШа второго уровня повышает пропускную способность системыблагодаря мгновенному доступу процессоров к часто используемым данным иинструкциям, хранящимся в быстрой кэш-памяти. По заявлению Intel, увеличениеёмкости КЭШа с 512 Кбайт до 1 Мбайт приводит иногда к 20% росту общейпроизводительности системы.

Дляобъяснения этого явления уместно провести аналогию с холодильниками,используемую Intel: хранение запаса продуктов в

холодильникеизбавляет поваров ресторана от необходимости ездить по магазинам, закупаяпровизию. Чем больше холодильник, тем лучше,

особеннов час пик, когда количество клиентов в ресторане резко возрастает. Так вот, вслучае с сервером «холодильник» — это кэш-память второго уровня, а «магазин»(где доступны те же продукты) — в принципе более медленная системная память.

Большойкэш L2 значительно повышает общую производительность многопроцессорныхконфигураций в системах, работающих с крупными массивами несопоставимых данных.По информации Intel, проведённые корпорацией тесты ZD ServerBench показалипочти

пропорциональныйрост производительности системы по мере установки дополнительных процессоров смегабайтным КЭШем.

  Усовершенствованная архитектура Xeon, допускающая 36-разрядную адресациюфизической памяти, теоретически позволяет процессору получать доступ ксистемной памяти ёмкостью до 64 Гбайт. Новый механизм постраничного обмена PageSize Extension — 36 останется практически незаметной для глаз пользователя иразработчиков приложений. В настоящее время PSE-36 поддерживают операционныесистемы Windows NT, SCO UnixWareи Sun Solaris. Для остальных операционных систем потребуетсяобновить драйвер блока управления памятью.

  Intel 450NX PCIset стал первым микросхемным  набором, оптимизированным дляPentium II Xeon. Он выпускается в двух вариантах, Basic и Full, соответственнодля серверных hi-end и систем среднего уровня. Они имеют одинаковую структуруядра, но отличаются производительностью и ценой.

  Basic PCIset поддерживает до двух разъёмов 32-разрядной PCI, один — 64-разрядной и до 4 Гбайт системной памяти типа EDO. Его более

совершенный«родственник» Full PCIset поддерживает до четырёх слотов типа EDO. Эти чипсетыобъединяет функционирование на

100-мегагерцовойчастоте системной шины и возможность поддержки многопроцессорных (до четырёхXeon) конфигураций. 64-разрядная

шинаPCI способна существенным образом повысить общую производительность системы сучётом оптоволоконной технологии обмена данными с дисковыми массивами,использования высокопроизводительных сетевых магистралей на основе АТМ, GigabitEthernet и других. Повышается, по сути, синхронизация мощности процессора ипроизводительности подсистемы ввода-вывода.

  Xeon, как я уже отмечал, предназначен не только для серверов, но и для рабочихи графических станций, для которых одним из важнейших

параметровявляется производительность видеоподсистемы. Для них разработан чипсет Intel440GX AGPset на базе известного микросхемного набора 440BX. 440GX управляетработой порта AGP в режиме 2х. Режим удвоенной производительности реализуетсяблагодаря так называемой технологии двойной накачки — данные передаются как попереднему, так и по заднему фронтам тактовых импульсов (у обычной AGP — толькопо переднему), при этом полоса пропускания достигает значения 533 Мбайт/с.Физические параметры интерфейса AGP остаются прежними. 

  Ещё одой особенностью набора чипсета  440GX стала возможность обращения кпамяти ёмкостью до 2 Гбайт, что в два раза больше, чем у

егоприемника.

  Несмотря на тот факт, что в настоящий момент понятие многопроцессорностиассоциируется у Intel лишь с четырьмя устройствами на одной плате, ведутсяработы по созданию симметричных мультипроцессорных систем, поддерживающих довосьми «Ксеонов». Разработки восьмиканального чипсета для Xeon ведутся фирмойCorollary, дочерней компанией Intel. И, само собой, возможны кластерныерешения, скажем, на основе архитектуры распределённой памяти (NUMA). В обоихслучаях, как правило, не требуется «переписывать» прикладные программы (правда,операционная система требует некоторой оптимизации). В процессорной шинечипсета Intel 450NX PCIset предусмотрен так называемый разъём кластерногосоединения, что упрощает построение кластерного соединения на основестандартных четырёхпроцессорных узлов.

  Ещё одним перспективным направлением является кластер с передачей сообщений.Суть её состоит в отсутствии разделения ресурсов. Отдельно стоящие узлыкластера обмениваются данными, например, тактовыми импульсами, сигнализирующимио нормальном состоянии системы. И хотя LAN-соединение остаётся работоспособным,существует необходимость в сети нового типа — так называемой SAN (System area Network).

  В завершении хотел бы отметить, что некоторые ведущие западные производители(IBM, NCR, Dell) уже начали поставки систем на базе

Xeon,а на презентации процессора в России компании Kraftway и «Вист» такжепредставили свои новые серверные решения.

Ориентировочные цены на Pentium Xeon составят 1124долларов (L2 512 Кбайт) и 2836 долларов (L2 1 Мбайт) при поставках от тысячи штук.


Список литературы:

Д-р Джон Гудмен«Управление памятью для всех»,

Диалектика, Киев, 1996

В.Л. Григорьев«Микропроцессор i486. Архитектура и программирование», Гранал,Москва, 1993.

Информационно — рекламная газета «КМ — информ»

газета «Компьютер World/Киев»

газета «Компьютер Week/Moscow»

Ж.К. Голенкова и др.«Руководство по архитектуре IBM PC AT», Консул, Минск, 1993

Руководство программиста попроцессору Intel i386,

Техническая документацияуровня 2, (C) Intel Corp.

Руководство программиста по процессору Intel i486,

Техническая документацияуровня 2, (C) Intel Corp.

Материалы эхоконференцииSU.HARDW.PC.CPU компьютерной сети FidoNet

еще рефераты
Еще работы по информатике, программированию