Нові картки Tesla від Nvidia відповідають потребам зростаючого потенціалу послуг AI - Обчислення - 2019

Anonim

Тепер, коли Nvidia звернувся до споживчого ринку з використанням своїх останніх відеокарт на базі архітектури "Pascal", наступні рішення в процесі розробки компанії "Паскаль" спрямовані на поглиблення ринку глибоких нейронних мереж з метою прискорення машинного навчання. Ці рішення поставляються у формі нових карт Nvidia Tesla P4 та Tesla P40 для прискорення роботи, спрямованої на прискорення виробничих навантажень, пов'язаних із вказівками, що виконуються службами, які використовують штучний інтелект.

Існують, по суті, два типи прискорювальних карт для глибоких нейронних мереж: навчання та висновки. Перші повинні говорити самі за себе, прискорюючи підготовку глибокої нейронної мережі, перш ніж він буде розгорнуто на місцях. Втім, висновок - це процес надання вхідної інформації в глибинну нейронну мережу та отримання даних на основі цього входу. Це включає в себе переклад мови в реальному часі та локалізацію обличчя в зображеннях.

За даними Nvidia, нові картки Tesla P4 та Tesla P40 призначені для врахування та включають спеціалізовані вказівки щодо виводу на основі 8-бітних операцій, що робить їх у 45 разів швидшим за часом відповіді, ніж процесор Intel Xeon E5-2690v4. Вони також забезпечують 4-кратне вдосконалення над попередніми поколіннями карт "Тесла" "Максвелла", M40 та M4.

Компанія заявила на цьому тижні під час своєї конференції GTC Beijing 2016, що Tesla P4 спорту має невеликий форм-фактор, який ідеально підходить для центрів обробки даних. Це на 40x більше енергоефективних, ніж процесори, які використовуються для вказівки, і єдиний сервер Tesla P4 може замінити 13 серверів, що працюють лише на центральному процесорі, створених для завантаження відеоінференцій. Тим часом, Tesla P40 ідеально підходить для глибокого навчально-тренувального навантаження, при цьому сервер, який містить вісім з цих прискорювачів, здатний замінити більше 140 серверів на базі процесорів.

У порівнянні з попереднім Tesla M40, новий P40 містить більше ядер CUDA, більш високі тактові частоти, більш швидкий час пам'яті, вищу точність 12 TFLOPS та більше транзисторів у 12 мільярдів. Однак, потреба в енергії (термопаку) залишається однаковою, тому Nvidia зміг підвищити рівень продуктивності на ватт, не змусивши картку вимагати більшої потужності. Те ж саме стосується і повільної моделі Tesla P4, порівняно з попередньою карткою Tesla M4.

"Завдяки Tesla P100, а тепер і Tesla P4 і P40, NVIDIA пропонує єдину цільову глибоку платформу для навчання для центру обробки даних, що розблоковує величезну потужність AI для широкого кола галузей", - сказав Іан Бак, генеральний директор прискорення обчислень на Nvidia. "Вони перекочують час навчання з декількох годин на години. Вони дають змогу миттєво витягнути розуміння. І вони виробляють в режимі реального часу відповідь для споживачів послуг, що працюють на AI ".

Nvidia показала Tesla P100 під час своєї локальної конференції GTC 2016 п'ять місяців тому. Ця карта ідеально підходить для прискорення навчання нейронних мереж, забезпечуючи підвищення продуктивності більш ніж у 12 разів порівняно з попереднім поколінням на основі рішення Максвелла. Знову ж таки, перші навчальні нейрони треба пройти навчання, перш ніж вони будуть розгорнуті в полі, і нова картка Tesla прискорює процес, зменшуючи тренування AI з тижня до дня.

На додаток до двох нових карток Tesla, Nvidia також запустила TensorRT, бібліотеку для "оптимізації глибоких моделей навчання для розгортання виробництва". Компанія також представила SDK для Nvidia DeepStream для одночасного декодування та аналізу до 93 потоків відео високої чіткості. Однак короткий список деталей апаратного забезпечення для двох нових карток Tesla Nvidia тепер доступний:

Тесла P40Тесла П4
GPUGP102GP104
CUDA сердечники3, 8402, 560
Базовий годинник1, 303 МГц810 МГц
Boost Clock1, 531 МГц1, 063 МГц
Годинник пам'яті GDDR57, 2 Гбіт / с6 Гбіт / с
Ширина шини пам'яті384-бітний256-бітний
Сума GDDR524 Гб8 Гб
Одиночна точність12 TFLOPS5.5 TFLOPS
TDP250 ВтВід 50 до 75 ват