Аналіз показує, чому графічні чіпи NVIDIA є енергозберігаючими звірами продуктивності - Обчислення - 2019

Anonim

Нещодавній доповідь Девіда Кантера від "Реальних світових технологій" досліджує, чому графічні чіпи, надані компанією Nvidia - а саме ті, що базуються на архітектурах Maxwell та Pascal - працюють краще, ніж їх теоретичні цифри, і чому вони більш ефективні, ніж конкуруючі графічні мікросхеми. У двох словах, виведення пікселів на відеокарти Nvidia буферизуються тим, що називають растеризаторами швидкого режиму на основі плитки, що є швидким та енергозберігаючим. Графічні мікросхеми конкурента покладаються на більш повільні, звичайні повноекранні растеризатори швидкого режиму.

За словами Кантера, растеризація на основі черепичного складу була з 1990-х років, спочатку з'явилася в архітектурі PowerVR і була прийнята ARM і Qualcomm у своїх GPU мобільних процесорів. Поки компанія Nvidia представила цю систему у своїй архітектурі Maxwell GM20x, растеризація на основі черепиці не була успішно впроваджена в настільні графічні мікросхеми.

Розшифровка на основі черепиці по суті означає, що кожна трикутна тривимірна сцена розділена на плитки, і кожна черепиця розбита (растеризована) на пікселі на самому графічному мікросхемі, яка буде "надрукована" на двовимірному екрані. На відміну від цього, растеризатори швидкого режиму на повноекранному режимі використовують більше пам'яті та більше енергії, розбиваючи всю сцену на пікселі за один прохід (або сканування).

"Використання областей з черепицею та буферизація даних растеризатора в режимі on-die зменшує пропускну здатність пам'яті для рендеринга, підвищення продуктивності та енергоефективності", пояснює Кантер. "Згідно з цією гіпотезою, наше тестування показує, що графічні процесори Nvidia змінюють розмір плитки, щоб забезпечити, щоб вихід пікселя з растеризації містився у фіксованому розмірі вбудованого буфера або кеш-пам'яті".

Кантер пояснює, що мобільні графічні процесори, подібні до Apple та інших виробників пристроїв, використовують метод відкладеного рендеринга на основі черепиці, де геометрія та робота на основі пікселів виконуються в двох окремих пропусках. Сцена поділяється на плитки, трикутники обробляються для кожної плитки одночасно, після чого піксельна затінка для кожної плитки відбувається після цього.

Тим не менш, Nvidia, як повідомляється, використовує технологію "негайного" на основі плитки у своїх настільних графічних процесорах, що розділяє екран на плитки, а потім растеризує невеликі партії трикутників всередині плитки. За його словами, трикутники, як правило, буферизуються або кешуються, що, в свою чергу, підвищує продуктивність та заощаджує енергію.

У демонстрації використовується інструмент "Трикутники". HLSL, що працює на графічному процесорі AMD Radeon HD 6670 та Windows 10, показує, як графічний чіп AMD на екрані відображає дванадцять ідентичних плоских об'єктів, що рухаються справа наліво та лінію по рядку, доки вони не відтворюються один за одним з вершини на екрані внизу, переписуючи один одного. Він відкрив цю техніку, перемістивши повзунок, який встановлює кількість пікселів, які можуть бути відображені на екрані. Уявіть собі, що невидимий принтер, що йде назад і вперед по екрану швидше, ніж людське око, може повністю виявити.

Після виявлення поточної технології AMD демонстрація переміщається в іншу систему, використовуючи той же інструмент, Windows 10 і відеокарту Nvidia GeForce GTX 970. Тут ви помітите, що коли процес рендеринга призупинено, дванадцять об'єктів, що складаються, виводяться одночасно, з двома завершеними черепицями зліва та ще п'ятьма черепицями, що з'являються в різних станах у шаблоні справа. В цілому, шлях растеризації знаходиться зліва направо та зверху вниз.

Все це говорить, що Nvidia повністю растеризує одну плитку, яка містить частину всіх об'єктів, перш ніж переходити до наступної плитки. AMD, з іншого боку, растеризує кожен об'єкт у вигляді принтера спочатку зверху вниз перш, перш ніж повернутися до початку і зробити наступний об'єкт. Щось стає ще цікавішим, коли GeForce GTX 970 від Nvidia встановлюється в тестовий майданчик, виявляючи ще більші плитки з іншою схемою.

Щоб перевірити це останнє розслідування, не забудьте натиснути відео, вставлене вище, на повну демонстрацію 19:45.