Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Порівняльна характеристика чіпів AMD VLIW4 та GF 110






 

Архітектура і чіп VLIW4 були представлені зовсім недавно, і на їх основі була побудована лише одна лінійка відеокарт.

Проблеми VLIW4: перш за все, через проблеми з 40-нм техпроцесом. Справа дійшла до того, що в VLIW4 не працювали деякі функціональні блоки. Тому перед інженерами AMD під час розробки нового ядра ставилися завдання прискорення роботи за рахунок збільшення кількості цих блоків і підвищення частот, зменшення енергоспоживання та загальної оптимізації роботи чіпа.

NVIDIA GF110, так само як і його попередник, виконаний відповідно до 40 нм нормами і складається з чотирьох кластерів обробки графіки GPC (Graphics Ргосеssiпg Clusters), які містять 4 потокових мультипроцесора (Slreaming Multiprocessors) і один движок растеризації.

Кожен з мультипроцесорів має у своєму складі 32 потокових процесора, по-іншому званих СUDА-ядрами. Крім того, він містить один движок Polymorph, що відповідає за вибірку вершин і тесселяцию. NVIDIA GF110 має шість 64-бітових контролера пам'яті, які в сумі утворюють 384-бітну шину. Кожен з контролерів з'єднаний з кеш-пам'яттю другого рівня об'ємом 768 Кбайт і має 8 блоками ROP, загальне число яких дорівнює 48. Що стосується кеш-пам'яті першого рівня та загальної пам'яті, то їх сумарний обсяг становить 64 Кбайт, причому ділиться він у співвідношенні 16 Кбайт до 48 Кбайт, або ж навпаки. Деякий час в Мережі ходили чутки про збільшеній кількості текстурних блоків у NVIDIA GF110 в порівнянні з VLIW4, проте вони не підтвердилися: у новому ядрі їх як і раніше 48. Тим не менш, архітектура цих блоків піддалася досить значних змін. Тепер вони можуть обробляти текстурні дані всіх типів, включаючи FP16, за один такт (включаючи білінійну фільтрацію).

Дане нововведення вже було випробувано в чіпі NVIDIA GF104, але відсутнє в ядрі VLIW4, яке працювало з текстурами FP16 в два такту. У теорії продуктивність текстурних блоків зростає в два рази.

Відчуття приросту швидкості можна буде в переважно в більшості сучасних ігор. Що стосується додаткових змін, то вони торкнулися також і движка растеризації, який отримав поліпшений блок відбракування невидимих ​ ​ поверхонь Z-cull. Знову-таки, згадуючи AMD VLIW4, можна сказати, що в деяких випадках проізводітельнасть блоку падала. У NVIDIA GF110 були введені допрацьовані алгоритми у функціонал блоку Z-cull, що, крім усього іншого, дозволяє більш ефективно використовувати шину пам'яті.

Чіп NVIDIA GF110 не відзначався за показниками продуктивності, тому зниження енергоспоживання було однією з першочергових завдань при розробці ядра. Комбінування швидких транзисторів з високим рівнем струмів витоків і повільних з малими струмами витоків дозволило знизити тепловий пакет NVIDIA GF110. У порівнянні зі своїм попередником, новий чіп в окремих випадках споживає до 30-40 Вт енергії менше.

NVIDIA GF110, так само як і AMD VLIW4, показує високу швидкість тесселяції, не просідаючи при цьому в режимах з розбивкою на велику кількість трикутників.

До речі, чіпи NVIDIA переважають у цьому компоненті над графічними процесорами AMD - перш за все, за рахунок розпаралелювання робіт між 1 червня системою PolyMorph.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.