Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Технологические новшества, применяемые в микропроцессорах Penryn






Cущественно ускорены операции деления. Модифицированный блок деления получил название Fast Raxid-16 (у семейства Core аналогичный блок назывался Radix-4). В результате за один проход новый блок обрабатывает 4 бита вместо 2-х. Программисты традиционно избегают операции деления, как относительно медленные, заменяя их операциями умножения. То же самое делают различные компиляторы. В любом случае, ускорение операции деления повышает общую производительность процессора.

Семейство процессоров Penryn поддерживают новый набор дополнительных инструкций SSE4.1 (47 новых инструкций), нацеленных на повышение производительности при работе с мультимедийными приложениями. Это могут быть задачи видео и аудио, научные задачи и 3-мерная графика.

Наибольшие изменения произошли в блоке перестановок, который осуществляет битовые перестановки в 128-битных регистрах. Теперь такие операции, как упаковка, распаковка, сдвиг упакованных значений, вставка выполняются в соответствующем регистре всего за один такт. Блок перестановок получил название Shuffle Engine, его использование даёт почти 2-кратный прирост производительности при исполнении потоковых инструкций. Кэш у Penryn стал медленнее, чем у Conroe, но этот недостаток частично компенсирован функцией Split Load Cache Enhancement.

В Penryn, в отличии от Conroe, в качестве подзатворного диэлектрика использует не двуокись кремния, а диэлектрики с большой диэлектрической постоянной (high-k). Это позволяет избавиться от затворов их поликристаллического кремния и использовать металлический. Это шаг позволяет увеличить скорость переключения транзистора на 20%. Соответственно увеличивается производительность транзисторов, более чем в 5 раз уменьшается утечка тока от истока к стоку, т.е. снижается энергопотребление транзистора. Материал, используемый в качестве high-k диэлектрика, содержит гафний. Больше о нём ничего не известно. Толщина слоя подзатворного диэлектрика сохраняется прежней- 1.2 нм.

Penryn лучше предшественников не только за счёт архитектурных усовершенствований, но и за счёт 45-нм техпроцесса. Стало меньше напряжение ядра, уменьшилось тепловыделение, вырос потенциал повышения тактовой частоты.

Обычный " домашний" пользователь никакой разницы в скорости между Core и Penryn не ощущает. В обычном, неоптимизированном программном обеспечении прирост производительности составляет всего несколько процентов. В оптимизированном программном обеспечении прирост производительности у Penryn значительный:

· оптимизация под многоядерность для 4-ядерного Penryn по сравнению с условным 1-ядерным (работающим на той же частоте и имеющим ту же архитектуру) может дать прирост производительности на 200-400%;

· оптимизация под использование набора инструкций SSE4.1 обеспечивает преимущество Penryn над Core на 30% при одной и той же частоте.

Уже имеется программное обеспечение, оптимизированное для выполнения на компьютерах с микропроцессорами Penryn: разнообразные графические редакторы (3DMax, POV-ray, Photoshop CS), программы обработки видео (DivX, Microsoft Media Encoder). DivX6.7 уже поддерживает SSE4.1. Существенный выигрыш в быстродействии от использования Penryn будет в программах архивирования (WinRAR).






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.