Софт-line:
Новорічні годинник 1.3 -- "Новорічні годинник - ці екранні годинник покаже Вам точний час, який ..." -- 08 грудня 2019
COVERT Pro 2.0.1.44 -- "COVERT Pro - надійний інструмент для захисту ПК від різних ..." -- 07 грудня 2019
EF Duplicate Files Manager 19.11 -- "EF Duplicate Files Manager - утиліта, яка дозволяє здійснювати пошук ..." -- 07 грудня 2019
WinBlack Pro 4.6 L1 -- "WinBlack Pro - многовалютная фінансова система для обліку та аналізу ..." -- 07 грудня 2019
EraVPN 1.00 -- "EraVPN - один з найбільш доступних і простих VPN сервісів з ..." -- 07 грудня 2019
Sketch Drawer 7.1 -- "Sketch Drawer - цікава програма для перетворення зображень в олівцеві ..." -- 07 грудня 2019
Atom 1.41.0 -- "Atom - функціональний безкоштовний текстовий редактор, який надає ..." -- 07 грудня 2019
Дизайн Календарів 14.0 -- "Дизайн Календарів - це доступна і зручна програма для створення ..." -- 07 грудня 2019
NeoSpy PRO 5.9 -- "NeoSpy - дозволяє вести прихований (програма не видно ні в треї, ні в ..." -- 04 грудня 2019
EF File Catalog 19.10 -- "EF File Catalog - проста у використанні програма, яка представляє ..." -- 04 грудня 2019


Як всім вже відомо, на конференції Hot Chips 31 компанія Huawei представила найпотужніший у світі ШІ-процесор Ascend 910. Процесори для ІІ кожен розробляє на що здатний, але всі розробники порівнюють свої творіння з ІІ-процесорами компанії NVIDIA (а NVIDIA з процесорами Intel Xeon). Така доля піонера. NVIDIA однією з перших широко почала просувати свої модифіковані графічні архітектури в якості прискорювачів для вирішення завдань з машинним навчанням.

Гнучкість GPU зіркою зійшла над відсталістю x86-сумісні архітектури, але під час появи нових підходів і методів тренування машинного навчання, де поки багато відкритих доріжок, вона ризикує стати однією з небагатьох. Компанія Huawei зі своїми платформами цілком здатна стати кращою альтернативою рішенням NVIDIA. Як мінімум, це відбудеться в Китаї, де Huawei готується випускати і сподівається знайти збут для мільйонів процесорів для машинного навчання.

Ми вже публікували анонс найбільш потужного прискорювача для ML чіпа Huawei Ascend 910. Зараз подивимося на це рішення трохи пильніше. Отже, Ascend 910 випускається компанією TSMC з використанням другого покоління 7-нм техпроцесу (7+ EUV). Це техпроцес характеризується використанням сканерів EUV для виготовлення декількох шарів чіпа. На конференції Huawei порівнювала Ascend 910 з ІІ-рішенням NVIDIA на архітектурі Volta, випущеному TSMC з використанням 12-нм FinFET техпроцесу. Вище на картинці наводяться дані для Ascend 910 і Volta, з нормалізацією до 12-нм техпроцесу. Площа рішення Huawei на кристалі в 2,5 рази більше, ніж у NVIDIA, але при цьому продуктивність Ascend 910 виявляється в 4,7 рази вище, ніж у архітектури Volta.

Також на схемі видно, що Huawei заявляє про вкрай високу масштабованості архітектури. Ядра DaVinci, що лежать в основі Ascend 910, можуть випускатися в конфігурації для оперування скалярними величинами (16), векторними (16 × 16) і матричними (16 × 16 × 16). Це означає, що архітектура і ядра DaVinci з'являться у всьому спектрі пристроїв від IoT і носимой електроніки до суперкомп'ютерів (від платформ з прийняттям рішень до машинного навчання). Чіп Ascend 910 несе матричні ядра, як призначений для найбільш інтенсивної роботи.

Ядро DaVinci в максимальній конфігурації (для Ascend 910) містить 4096 блоків Cube для обчислень з половинною точністю (FP16). Також в ядро входять спеціалізовані блоки для обробки скалярних (INT8) та векторних величин. Пікова продуктивність Ascend з 32 ядрами DaVinci досягає 256 терафлопс для FP16 і 512 терафлопс для цілочислових значень. Все це при споживанні до 350 Вт. Альтернатива від NVIDIA на тензорних ядрах здатна максимум на 125 терафлопс для FP16. Для вирішення завдань ML чіп Huawei виявляється в два рази продуктивніше.

Крім ядер DaVinci на кристалі Ascend 910 знаходяться кілька інших блоків, включаючи контролер пам'яті HBM2, 128-канальний фейдер для декодування відеопотоків. Потужний чіп для операцій вводу/виводу Nimbus V3 виконаний на окремому кристалі на тій же основі. Поруч з ним для механічної міцності всієї конструкції довелося розташувати два кристала-заглушки, кожен з яких має площу 110 мм2. З урахуванням болванок і чотирьох чипів HBM2 площа всіх кристалів досягає 1228 мм2.

Для зв'язку ядер і пам'яті на кристалі створена комірчаста мережу в конфігурації 6 рядків на 4 колонки зі швидкістю доступу 128 Гбайт/с на кожне ядро для одночасних операцій запису і читання. Для з'єднання з сусідніми чіпами передбачена шина зі швидкістю 720 Гбіт/с і два лінка RoCE зі швидкістю 100 Гбіт/с. До кеш-пам'яті L2 ядра можуть звертатися з продуктивністю до 4 Тбайт/с. Швидкість доступу до пам'яті HBM2 досягає 1,2 Тбайт/с.

У кожен поличний корпус входять по 8 процесорів Ascend 910 і блок з двома процесорами Intel Xeon Scalable. Специфікації полиці нижче на картинці. Рішення збираються в кластер з 2048 вузлів сумарною продуктивністю 512 петафлопс для операцій FP16. Кластери NVIDIA DGX Superpod обіцяють продуктивність до 9,4 петафлопс для збірки з 96 вузлів. У порівнянні з пропозицією Huawei це виглядає блідо, але створює стимул рватися вперед.

Головне на ПК-манія

У Китаї будуть сканувати особи всіх покупців ...

Китай робить черговий крок до тотального контролю за громадянами, пояснюючи це безпекою і ...

IT новини 2019-12-08 16:57:06

З'явилися перші рендери смартфона OnePlus 8 Lite

Ще в жовтні ми публікували рендери смартфонів OnePlus 8 і OnePlus 8 Pro, які, ймовірно, будуть ...

Hard новини 2019-12-08 16:51:49

Показаний RedmiBook 13, який поміститься на ...

Вже 10 грудня має відбутися анонс ноутбука RedmiBook 13 і інших пристроїв Redmi, а тим часом ...

Hard новини 2019-12-08 15:45:38

Відео дня

Живі додатки

Програмування

Adobe Dreamweaver CS6 / CS3

Adobe Dreamweaver - дозволяє легко і просто проектувати, створювати і обслуговувати веб-сайти та веб-додатки, від початку і до

Безпека

AutoKFD 2.6.5.2015.0

AutoKFD - програма для автоматичного видалення непотрібних файлів, сміття, тимчасових файлів і вірусів і шкідливого ПЗ з

  • Prev
  • software
Scroll to top