Реферат: Процессор Pentium 4

Содержание:

Введение

1.<span Times New Roman"">    

Архитектура IntelNetBurst

2.<span Times New Roman"">    

Процессор

3.<span Times New Roman"">    

Чипсет и системная шина

4.<span Times New Roman"">    

Тестирование Pentium4

Заключение

Список используемых источников

Введение

Будучи выпущенным в 1995году, процессор Intel Pentium Pro стал первым CPU с архитектурой P6. С тех порпрошло уже достаточно много времени, сменилось несколько поколений процессоров,однако, по сути архитектура не менялась. Семейства Pentium II, Pentium III иCeleron имеют все то же строение ядра, отличаясь по сути только размером иорганизацией кеша второго уровня и наличием набора команд SSE, появившегося вPentium III. Естественно, рано или поздно архитектура P6 должна была устареть.И дело тут вовсе не в невозможности дальнейшего наращивания тактовых частот идаже не в обострившейся в последнее время конкуренцией с AMD. Конечно, нельзяотрицать тот факт, что достигнув частоты в 1 ГГц Intel столкнулся с проблемамив дальнейшем наращивании частоты своих процессоров: Pentium III 1.13 ГГц дажепришлось отзывать в связи с его нестабильностью. Однако, эту проблему легкоможно решить переходом на 0.13 мкм процесс – тем более, что его повсеместноевнедрение не за горами.

Настоящаяпричина необходимости новой архитектуры кроется глубже. К сожалению, дальнейшеенаращивание частоты существующих процессоров приводит все к меньшему росту ихпроизводительности. Проблема в том, что латентности, то есть задержки,возникающие при обращении к тем или иным узлам процессора, по нынешним меркам вP6 уже слишком велики. Именно это явилось основной причиной, по которой Intelзатеял разработку Pentium 4, которая выполнена с чистого листа. Таким образом,анонсированный сегодня Pentium 4 — совершенно новый процессор, ничего общего неимеющий со своими предшественниками. В его основе лежит архитектура, названнаяIntel NetBurst architecture. Этим названием Intel хотел подчеркнуть, чтоосновная цель нового процессора – ускорить выполнение задач потоковой обработкиданных, напрямую связанных с бурно развивающимся Internet.

1.<span Times New Roman""> 

АрхитектураIntel NetBurst

Первымделом, попробуем разобраться с особенностями новой архитектуры. АрхитектураNetBurst имеет в своей основе несколько инноваций, в комплексе и позволяющихдобиться конечной цели – гарантировать запас быстродействия и будущую наращиваемостьдля процессоров семейства Pentium 4. В число основных технологий входят:

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1025"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1026">Hyper Pipelined Technology. КонвейерPentium 4 имеет беспрецедентно большую глубину – 20 стадий.

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1027"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1028">Advanced Dynamic Execution. Улучшенноепредсказание переходов и исполнение команд с изменением порядка их следования(out of order execution).

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1029"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1030">

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1031"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1032">Rapid Execute Engine. ALU процессора Pentium 4работает на вдвое большей, чем сам процессор, частоте.

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1033"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1034">

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1035"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1036">400 MHz System Bus. Новая системная шина.

Рассмотримвсе нововведения по порядку.

1.1  HyperPipelined Technology

НазваниемHyper Pipelined Technology конвейерPentium 4 обязансвоейдлине– 20 стадий. Длясравнения – длина конвейера Pentium III составляет 10 стадий. Чего же достигIntel, так удлинив конвейер? Благодаря декомпозиции выполнения каждой команды наболее мелкие этапы, каждый из этих этапов теперь может выполняться быстрее, чтопозволяет беспрепятственно увеличивать частоту процессора. Так, если прииспользуемом сегодня технологическом процессе 0.18 мкм предельная частота дляPentium III составляет 1 ГГц (ну или, по более оптимистичным оценкам, 1.13ГГц), Pentium 4 сможет достигнуть частоты 2 ГГц.

Однако, учрезмерно длинного конвейера есть и свои недостатки. Первый недостаток очевиден– каждая команда теперь, проходя большее число стадий, выполняется дольше.Поэтому, чтобы младшие модели Pentium 4 превосходили по производительностистаршие модели Pentium III, частоты Pentium 4 начинаются с 1.4 ГГц. Если быIntel выпустил бы Pentium 4 1 ГГц, то этот процессор несомненно бы проиграл впроизводительности гигагерцовому Pentium III.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1037">

1.2  AdvancedDynamic Execution

Целью рядаухищрений в архитектуре Pentium 4, под общим названием Advanced DynamicExecution, как раз и является минимизация простоя процессора при неправильномпредсказании переходов и увеличение вероятности правильных предсказаний. Дляэтого Intel улучшил блок выборки инструкций для внеочередного выполнения иповысил правильность предсказания переходов. Правда, для этого алгоритмыпредсказания переходов были доработаны минимально, основным же средством длядостижения цели было выбрано увеличение размеров буферов, с которыми работаютсоответствующие блоки процессора.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1038">
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1039">

1.3  Trace Cache

Вместо обычногоL1 кеша, который в Pentium III был разделен на область инструкций и областьданных в Pentium 4 применен новый подход. Инструкции в L1 кэше не сохраняются,он предназначен теперь только для данных. Для кэширования инструкций теперьиспользуется Trace Cache, однако по сравнению с обычным L1-кешем он имеет многопреимуществ, направленных опять же на минимизацию простоев процессора привыполнении неправильных предсказаний переходов.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1040">

Второепреимущество Trace Cache заключается в том, что микрооперации в нем сохраняютсяименно в том порядке, в каком они выполняются. Правда, правильный порядокопределяется опять же на основании предсказания переходов, однако вероятностьтого, что переходы предсказываются неправильно, достаточно мала для того, чтобыотказаться от очевидного выигрыша, получаемого путем отказа от повторныхдекодирований и предсказаний переходов.

Intel нераскрывает размеров своего Trace Cache в килобайтах, однако, известно что в немможет быть сохранено до 12000 микроопераций.

1.4  RapidExecute Engine

Наиболеепростая часть современного процессора – это ALU (арифметико-логическоеустройство). Благодаря этому факту, Intel счел возможным увеличить его тактовуючастоту внутри Pentium 4 вдвое по отношению к самому процессору. Таким образом,например, в 1.4 ГГц Pentium 4 ALU работает на частоте 2.8 ГГц.

В ALUисполняются простые целочисленные инструкции, поэтому, производительностьнового процессора при операциях с целыми числами должна быть очень высокой.Однако, на производительности Pentium 4 при операциях с вещественными числами,MMX или SSE двукратное ускорение ALU никак не сказывается.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1041">

1.5  SSE2

Реализовавв своем процессоре Athlon новый конвейерный FPU, AMD очень сильно обогналаинтеловский Pentium III в производительности при операциях с вещественнымичислами. Однако, Intel в своем Pentium 4 не стал сосредотачиваться насовершенствовании своего FPU, а просто увеличил возможности блока SSE. Врезультате, в Pentium 4 имеет место расширенный набор команд SSE2, в котором кимеющемуся набору из 70 инструкций было добавлено еще 144. Такое решение –результат NetBurst идеологии, основной целью которой является увеличениескорости работы с потоками данных.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1042">

SSE2 жеоперирует с теми же самыми регистрами и обратно совместим с SSE процессораPentium III. А столь впечатляющее расширение набора команд вызвано тем, чтотеперь операции со 128-битными регистрами могут выполняться не только как счетверками вещественных чисел двойной точности, но и как с парами вещественныхчисел двойной точности, с шестнадцатью однобайтовыми целыми, с восемьюкороткими двухбайтовыми целыми, с четырьмя четырехбайтовыми целыми, с двумявосьмибайтовыми целыми или с 16 байтовыми целыми. То есть, теперь SSE2представляя собой симбиоз MMX и SSE и позволяет работать с любыми типамиданных, влезающими в 128-битные регистры.

<img src="/cache/referats/4011/image004.gif" v:shapes="_x0000_i1043">

Такимобразом, SSE2 гораздо более гибок, позволяя добиваться впечатляющего прироста впроизводительности. Однако, использование нового набора команд требуетспециальной оптимизации программ, поэтому ждать его внедрения сразу послевыхода нового процессора не стоит. Со временем же, SSE2 имеет достаточнобольшие перспективы. Поэтому, даже AMD собирается реализовать SSE2 в своемновом семействе процессоров Hammer.
Старые же программы, не использующие SSE2, а полагающиеся на обычныйарифметический сопроцессор, никакого прироста в производительности прииспользовании Pentium 4 не получат. Более того, несмотря на то, что что Intelговорит о том, что блок FPU в Pentium 4 был слегка усовершенствован, время,необходимое на выполнение обычных операций с вещественными числами возросло посравнению с Pentium III в среднем на 2 такта.

1.6.1  L1 кэш

Чтокасается кеша первого уровня в Pentium 4, то поскольку теперь команды хранятсяв Trace Cache, он предназначен только для хранения данных. Однако, его размер вPentium 4, основанном на ядре Willamette составляет всего 8 Кбайт. Это выглядитдостаточно небольшой цифрой даже на фоне 16-килобайтной области данных в L1кэше Pentium III. Однако, Intel был вынужден сократить объем кеша первогоуровня в Pentium 4, так как ядро этого процессора и без того получалось слишкомбольшим. Тем не менее, архитектура этого процессора может поддерживать L1-кеш ибольшего размера, поэтому, скорее всего, при переходе на технологическийпроцесс 0.13 мкм и новое ядро Northwood, этот кэш будет увеличен.

Однако, дляувеличения производительности, Intel применил для доступа к L1-кешу новыйалгоритм, чем уменьшил в Pentium 4 латентность этого кеша до двух процессорныхтактов вместо трех тактов в Pentium III. Таким образом, учитывая большуютактовую частоту Pentium 4, время реакции его L1 кеша составляет всего 1.4нсдля 1.4 ГГц модели против 3нс у L1 кеша Pentium III 1 ГГц.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1044">

1.6.2  L2Advanced Transfer Cache

Процессор Pentium4 обладает AdvancedTransferCacheвторогоуровня объемом 256 Кбайт. Также, как и в Pentium III, L2-кеш имеет широкую256-битную шину, благодаря которой процессоры от Intel имеют более высокуюпропускную способность кеша, чем их конкуренты от AMD, использующие 64-битнуюшину кеша. Однако, в отличие от Athlon, в Pentium 4 (впрочем, также как и вPentium III) L2 кэш не является эксклюзивным, то есть он дублирует данные,находящиеся в L1 кэше.

Так какPentium 4 рассчитан на обработку потоковых данных, скорость работы L2-кеша длянего является одним из ключевых моментов. Поэтому, Intel увеличил пропускнуюспособность кеша второго уровня в Pentium 4 в два раза. Это усовершенствованиебыло сделано благодаря передаче данных из L2-кеша на каждый процессорный такт,в то время, как данные из L2-кеша Pentium III передаются только на каждыйвторой такт. Таким образом, пропускная способность L2-кеша Pentium 4,работающего, например, с частотой 1.4 ГГц имеет теперь внушительную величину44.8 Гбайт/с. Для сравнения – пропускная способность Advanced Transfer Cache уPentium III 1 ГГц составляет 16 Гбайт/с.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1045">
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1046">

2.  Процессор

Итак, послекраткого знакомства с основными деталями NetBurst архитектуры, основного оружияPentium 4 взглянем на его формальную спецификацию:

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1047"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1048">

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1049"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1050">

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1051"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1052">

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1053"><img src="/cache/referats/4011/image005.gif" v:shapes="_x0000_i1054">

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1055"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1056">

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1057"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1058">

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1059"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1060">

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1061"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1062">

<img src="/cache/referats/4011/image002.gif" v:shapes="_x0000_i1063"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1064">

<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1065">

Из-забольшого ядра, тепловыделение новых кристаллов будет достаточно высоким. Вчастности, Pentium 4 1.4 ГГц, работающий на напряжении 1.7 В и потребляющийпримерно 32 A, будет рассеивать порядка 52 Вт тепла (1.5 ГГц Pentium 4рассеивает 55 Вт тепла). Поэтому, кулеры для Pentium 4 должны иметь достаточнобольшие размеры и площадь поверхности.

Стоимостьпроцессора при поставках партиями 1000 шт. составляет, соответственно, $819 и$644 для моделей с тактовыми частотами 1.5 ГГц и 1.4 ГГц. Pentium 4 1.3 ГГц,который появится 29 января 2001 года, будет стоить $409. Intel планируетдостаточно агрессивно снижать цены на Pentium 4, с тем, чтобы этот процессормог применяться в настольных компьютерах среднего уровня:

20 ноября

10 декабря

29 января

Pentium 4 1.5 Гц

819

819

644

Pentium 4 1.4 Гц

644

574

440

Pentium 4 1.3 Гц

-

-

409

3.  Чипсет и системная шина

ПосколькуPentium 4 имеет совершенно новую архитектуру, то ему потребовался и новыйчипсет. Так как Intel нацеливает свой новый процессор на приложения, работающийс потоками данных, то основной задачей такого чипсета должно являтьсяобеспечение высоких пропускных способностей основных шин: шины памяти исистемной шины, соединяющей процессор с северным мостом чипсета.

<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1066"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1067">
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1068">

Вкачестве южного моста в этом наборе логики используется уже знакомая нам почипсету i815E микросхема ICH2, а в качестве северного моста – новый MCH Intel82850, в числе ключевых особенностей которого следует отметить поддержку двухканалов Rambus, каждый из которых может функционировать с парой модулей RIMM,поддержку 400-мегагерцовой системной шины и AGP 4x.

3.1  Материнские платы

Ввиду дороговизны самогочипсета i850, который стоит $75, а также ввиду того, что платы под Pentium 4должны иметь шестислойную PCB, производить их достаточно сложно и дорого.Поэтому, только ограниченное число производителей системных плат высказаложелание ввязаться в производство плат под Socket 423. В ближайшее время платыпод Pentium 4 будут выпускаться только восемью производителями. Спецификациинекоторых таких плат уже известны:

Плата

Чипсет

Форм-фактор

RIMM

AGP

PCI

CNR

Примечания

Aopen AX4T

i850

ATX

4

AGP Pro

5

1

ASUS P4T

i850

ATX

4

AGP Pro

5

Возможности для разгона CPU

Gigabyte GA-8TX

i850

ATX

4

AGP Pro

5

1

Интегрированный Creative CT5880

Intel D850GB

i850

ATX

4

AGP Pro

5

1

MSI MS-6339

i850

ATX

4

1

5

1

Какможно видеть из таблицы, все платы под Pentium 4 похожи друг на друга: всеимеют по четыре слота для RIMM и по пять слотов PCI. Большинство плат будетоборудоваться слотом AGP Pro, позволяющим использовать профессиональныеграфические карты с повышенным энергопотреблением.

3.2  ATX 2.03

Помимоновых системных плат и новых кулеров, как это парадоксально не звучит, новыйпроцессор будет требовать и новый корпус, совместимый со спецификацией ATX2.03. И вызвано это двумя причинами.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1069">

<img src="/cache/referats/4011/image006.gif" align=«left» hspace=«12» v:shapes="_x0000_s1026">                  

Дополнительныйплюс, который дает использование ретеншн-механизма для кулера, это уменьшениеэлектромагнитного влияния процессора, работающего на сверхвысоких частотах, надругие компоненты системной платы.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1070">                                                                     способ крепления                                     напряжениями12 и 5 В.

Дополнительноепитание необходимо для процессора Pentium 4, отличающегося чрезмерно большимэнергопотреблением.

4. Тестирование Pentium4

Для тестирования былособрано три системы со следующими конфигурациями:

Pentium 4

PentiumIII

Athlon

Процессор

IntelPentium 4 1.4 Гц

Intel Pentium III 1ГГц

AMD Athlon 1.2 ГГц

Системная плата

IntelD850GB(i850)

ASUS CUSL2 (i815)

ABIT KT7 (VIA T133)

Память

256 МбайтPC800 RDRAM

256 МбайтPC133 SDRAM

Видеокарта

ASUS V7700 32MB (NVIDIA GeForce2 GTS)

Жесткий диск

IBM DTLA 307015

ПроизводительностьPentium 4 сравнивалась с самыми быстрыми на сегодня процессорами другихсемейств: Intel Pentium III 1 ГГц и AMD Athlon 1.2 ГГц.

  Тестирование проводилось под управлением операционной системы MicrosoftWindows2000 SP1 с установленным DirectX 8.

4.1  Результаты тестов

<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1071">

   Поскольку процессорPentium 4 имеет совершенно новую архитектуру,

анализ производительности этого процессора будетсостоять из двух частей. В первой для измерения быстродействия мы воспользуемсясинтетическими тестами, а во второй протестируем процессоры, принимающие участиев тестировании, реальными приложениями.

CPUmark 99

<img src="/cache/referats/4011/image007.gif" v:shapes="_x0000_i1072">

Этот тест показывает производительность целочисленной частипроцессора и скорость работы с данными. Казалось бы, поскольку ALU Pentium 4работает на удвоенной частоте процессора, то по результатам этого теста впередидолжен быть Pentium 4. Однако этого не происходит. Разгадка медлительностиPentium 4 в данном тесте кроется в недостаточно большом L1 кэше, в который непомещаются все необходимые для его работы данные. Athlon же, с областью данныхв L1-кеше размером 64 Кбайта, а это в 8 раз больше, чем кеш данных Pentium 4,значительно превосходит всех своих соперников.

FPUWinMark

<img src="/cache/referats/4011/image008.gif" v:shapes="_x0000_i1073">

Этот бенчмарк показывает «чистую» скорость работыарифметического сопроцессора благодаря тому что все данные, необходимые для егоработы умещаются в L1 кэше процессора. Результаты еще раз подтверждают, чтоблок FPU у Athlon очень хороший. Кроме того, ясно видно, что из-за возросшейлатентности FPU в Pentium 4, его показатели в этом тесте выглядят даже хуже,чем у Pentium III.

3DMark2000CPUmarks

<img src="/cache/referats/4011/image009.gif" v:shapes="_x0000_i1074">

Этот бенчмарк, входящий в состав 3DMark2000 демонстрируеттеоретическую скорость работы процессора по обработке типовых игровых 3D-сценпри активном использовании наборов SIMD-команд SSE и 3DNow!.. К сожалению,тестов, позволяющих оценить выигрыш, получаемый от использования новых SSE2инструкций Pentium 4 пока нет, поэтому сегодня мы довольствуемся толькоиспользованием базового набора инструкций SSE. Тем не менее, даже в этом случаеPentium 4 оказывается на высоте, обходя ближайшего конкурента, процессор AMDAthlon 1.2 ГГц на 12%. Таким образом, логично ожидать, что в играх, особенноподдерживающих SSE, Pentium 4 будет показывать достойные результаты.

Так как процессор Pentium 4 работает на совершенно отличнойплатформе, использующей двухканальную RDRAM, посмотрим на то, какую скоростьопераций с памятью может обеспечить эта система в сравнении с соответствующимирезультатами, полученными на остальной паре платформ:

MemorySpeed — Read

<img src="/cache/referats/4011/image010.gif" v:shapes="_x0000_i1075">

MemorySpeed — Write

<img src="/cache/referats/4011/image011.gif" v:shapes="_x0000_i1076">

По графикамсовершенно очевидно, что действительно скорость работы L1 и L2 кэшей в Pentium4 по сравнению с Pentium III возросла. Однако, AMD Athlon обладает гораздобольшим по размеру L1 кэшем, что в ряде случаев обуславливает егопревосходство. Естественно, также на графике ясно видно, что пропускнаяспособность двухканальной RDRAM гораздо выше, чем используемой в системах наAthlon и Pentium III PC133 SDRAM. Также, результаты этого теста позволяютоценить, что L2 кеш процессора Athlon действительно работает медленнее чем L2кеш даже Pentium III, из-за более узкой шины. И достаточно любопытным являетсятот факт, что влияние L1-кеша совершенно не сказывается в системе с Pentium 4при записи в память.

Перейдемтеперь к тестам в реальных приложениях.

Content Creation Winstone 2000

<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1077"><img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1078">  <img src="/cache/referats/4011/image012.gif" v:shapes="_x0000_i1079">

Этот тест основывается на измерении скорости системы внескольких приложениях для создания контента. Как можно видеть,производительность системы с Pentium 4 тут однозначно выше, чем скоростьсистемы на Pentium III 1 ГГц и приближается к производительности системы сAthlon 1.2 ГГц. Получается, AMD была права не став выпускать процессоры с болеевысокой, чем 1.2 ГГц частотой. Athlon 1.2 ГГц может конкурировать с Pentium 4вполне успешно.

Sysmark2000

<img src="/cache/referats/4011/image013.gif" v:shapes="_x0000_i1080">

Еще один тест, использующий для измерения производительностиофисные приложения. Однако, тут упор делается на приложения более широкогопрофиля, чем в предыдущем тесте, в результате чего показатели Athlon здесьвыше. Однако, архитектуры Pentium III, Athlon и Pentium 4 отличаются слишкомсильно, поэтому, соотношения производительностей этих процессоров можетизменяться от приложения к приложению. Поэтому, посмотрим на скоростииспытуемых процессоров в конкретных приложениях.

Sysmark2000

<img src="/cache/referats/4011/image015.jpg" v:shapes="_x0000_i1081">

Нетрудно заметить, что тут однозначного лидера выделитьтяжело. Однако, в семи из двенадцати приложений лидирует AMD Athlon 1.2 ГГц, вто время как Pentium 4 показывает большую скорость только в трех задачах:системе распознавания речи Dragon Naturally Speaking Preferred 4.0, графическомредакторе Adobe Photoshop 5.5 и в утилите для кодирования видеопотока MicrosoftWindows Media Encoder 4.0. Таким образом, вся полезность Pentium 4 раскрываетсядействительно только в задачах потоковой обработки данных. И то, часть заслугиза высокую производительность этого процессора лежит на подсистеме памяти сгораздо более высокой пропускной способностью, чем у конкурирующих платформ.

3DStudioMAXR3 (чем меньше – тем лучше)

<img src="/cache/referats/4011/image016.gif" v:shapes="_x0000_i1082">

Для оценки производительностей систем в этом 3D-пакете, мызасекли время рендеринга сцены Anisotropic Wheel, входящей в дистрибутив.Соответственно, меньшее время соответствует лучшему результату. Удивительно, нотут производительность Pentium 4 1.4 ГГц в точности повторяетпроизводительность Pentium III 1 ГГц. Это говорит о том, что FPU в Pentium 4действительно работает медленнее, чем в Pentium III. Athlon 1.2 ГГц, обладаялучшим блоком FPU легко обошел обоих конкурентов, построив сцену на 40%быстрее.

WinZIP(чемменьше – тем лучше)

<img src="/cache/referats/4011/image017.gif" v:shapes="_x0000_i1083">

Тестирование в архиваторах позволяет увидеть целочисленнуюпроизводительность процессоров при оперировании с небольшими объемами данных. Вархиваторе WinZip лучшую скорость (на диаграмме меньшее значение соответствуетлучшему результату) продемонстрировал Athlon 1.2 ГГц. По всей видимости,сказывается большой кеш первого уровня у этого процессора.

WinRar(чемменьше – тем лучше)

<img src="/cache/referats/4011/image018.gif" v:shapes="_x0000_i1084">

Как можно увидеть из диаграммы (на ней меньшее значение сновасоответствует лучшему результату), Pentium 4 1.4 ГГц с ALU, работающим начастоте 2.8 ГГц здесь равных нет. Влияние объемного кеша первого уровня Athlonв WinRAR сводится на нет достаточно большим объемом словаря, используемого вэтом архиваторе.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1085">

Quake3Arena (demo001) — 640x480x16

<img src="/cache/referats/4011/image019.gif" v:shapes="_x0000_i1086">

В Quake3 Pentium 4 1.4 ГГц показывает себя с лучшей стороны,показывая на 30% более высокое быстродействие, чем Athlon 1.2 ГГц, не говоряуже о Pentium III. Это объясняется как тем, что ALU протестированного Pentium 4работает на частоте 2.8 ГГц, так и тем, что Quake3 использует SSE инструкции,которые, как мы показали выше, исполняются на Pentium 4 очень быстро.

Quake3Arena (demo001) — 1024x768x32

<img src="/cache/referats/4011/image020.gif" v:shapes="_x0000_i1087">

С одной стороны, число fps в высоких разрешениях в Quake3зависит в основном от пропускной способности шин, связывающих различныекомпоненты системы, однако с другой – ограничивается скоростью заполненияиспользуемой в системе видеокарты. Именно поэтому, тут разброс результатов нетак велик, как в предыдущем случае. Однако, благодаря Quad Pumped bus Pentium 4остается в лидерах. Однако, Athlon, с 200-мегагерцовой шиной EV6 дышитпрактически ему в затылок.

UnrealTournament – 640x480x16

<img src="/cache/referats/4011/image021.gif" v:shapes="_x0000_i1088">

Тут лидирующую позицию удерживает Athlon, имеющий самыйпроизводительный среди всех участвующих в тесте процессоров блок FPU.

UnrealTournament – 1024x768x32

<img src="/cache/referats/4011/image022.gif" v:shapes="_x0000_i1089">

Однако, при возрастании нагрузки на шины передачи данных всистеме, которое влечет за собой увеличение разрешения, вперед выходит Pentium4. Что ж, с 400-мегагерцовой шиной и памятью с пропускной способностью 3.2Гбайт/с поспорить тяжело.

Expendable- 640x480x16

<img src="/cache/referats/4011/image023.gif" v:shapes="_x0000_i1090">

Expendable — игра, производящая во время своей работыинтенсивные операции с небольшими объемами данных. Поэтому, система на Pentium4 с RDRAM, имеющей большую латентность оказывается медленнее обоих своихконкурентов. Причем, отставание Pentium 4 1.4 ГГц от Athlon 1.2 ГГц оказываетсянемаленьким – более 30%.

Expendable- 1024x768x32

<img src="/cache/referats/4011/image024.gif" v:shapes="_x0000_i1091">

Результаты практически полностью повторяют предыдущий случай.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1092">

Заключение

Итак, сделать однозначный вывод относительно процессораPentium 4 нельзя. Безусловно, его архитектура имеет массу достоинств, основнымиз которых следует признать возможность легкого наращивания тактовых частот.Однако, производительность нового процессора в ряде приложений все же не таквысока как хотелось бы: достаточно часто она оказывается меньшепроизводительности старшего процессора семейства Athlon. Виной этому – сверхдлинный20-стадийный конвейер и недостаточно большой кеш данных первого уровня.Поэтому, в ближайшее время Pentium 4 обогнать по быстродействию конкурента отAMD, Athlon, который также имеет пути для наращивания скорости посредствомперехода на новое ядро Palomino и использования DDR SDRAM, не сможет.

 В то же время, усистем на Pentium 4 есть и более существенные недостатки, главный из которых –цена. Поскольку стоимость RDRAM, необходимой для Pentium 4, а также системныхплат для него достаточно высока, Athlon-платформы обладают сегодня гораздолучшим соотношением цена-производительность.
<img src="/cache/referats/4011/image003.gif" v:shapes="_x0000_i1093">     Тем не менее, Pentium 4 все же имеет отдаленныеперспективы. С переводом технологического процесса на 0.13 мкм и с выпускомчипсетов, поддерживающих более дешевые чем RDRAM типы памяти, Pentium 4 можетстать массовым процессором. Пока же его удел – высокопроизводительные рабочиестанции.

Список использованных источников:

1.<span Times New Roman"">    

Компьютерный еженедельник “Компьютерра”, № 24 2000 г.

2.<span Times New Roman"">    

Журнал “Страна игр”, №22 2000 г.

3.<span Times New Roman"">    

Журнал “Мир ПК”, №12 2000 г.

4.<span Times New Roman"">    

www.ixbt.ru

5.<span Times New Roman"">    

www.computerra.ru

6.<span Times New Roman"">    

www.zdnet.ru
еще рефераты
Еще работы по компьютерам и переферийным устройствам