Софт-line:
Chris-PC Game Booster 5.06.30 -- "Chris-PC Game Booster - корисна утиліта для оптимізації ПК на ..." -- 01 липня 2020
Vidmore Player 1.0.6 -- "Vidmore Player - потужний мультимедійний програвач, за допомогою ..." -- 22 червня 2020
Dobble (Дуплет) - отличная игра на реакцию -- " Вспомните один из своих утренников в детском саду или начальной ..." -- 19 червня 2020
Java Runtime Environment 8.0.251 -- "Java Runtime Environment (JRE) - програмне забезпечення необхідне для ..." -- 19 червня 2020
Volume2 1.1.5.404 / 1.1.6.423 beta -- "Volume2 - дуже зручна програма, яка дає користувачеві можливість ..." -- 19 червня 2020
KDevelop 5.5.0 -- "KDevelop - потужна інтегрована середовище розробки для C, C++, ..." -- 19 червня 2020
Workrave 1.10.43 -- "Workrave - корисний додаток, призначене для збереження здоров'я ..." -- 04 червня 2020
LightBulb 2.1 -- "LightBulb - додаток, який знижує напругу очей, вироблене при погляді ..." -- 04 червня 2020
HandyCache RC4 1.0.0.885 -- "HandyCache - проксі-сервер для роздачі інтернету в локальній мережі ..." -- 30 травня 2020
Помічник дурня 3.7.7.3 -- "Помічник дурня - граючи в "дурня", ви зазначаєте карти, свої, чужі, ..." -- 29 травня 2020


Як всім вже відомо, на конференції Hot Chips 31 компанія Huawei представила найпотужніший у світі ШІ-процесор Ascend 910. Процесори для ІІ кожен розробляє на що здатний, але всі розробники порівнюють свої творіння з ІІ-процесорами компанії NVIDIA (а NVIDIA з процесорами Intel Xeon). Така доля піонера. NVIDIA однією з перших широко почала просувати свої модифіковані графічні архітектури в якості прискорювачів для вирішення завдань з машинним навчанням.

Гнучкість GPU зіркою зійшла над відсталістю x86-сумісні архітектури, але під час появи нових підходів і методів тренування машинного навчання, де поки багато відкритих доріжок, вона ризикує стати однією з небагатьох. Компанія Huawei зі своїми платформами цілком здатна стати кращою альтернативою рішенням NVIDIA. Як мінімум, це відбудеться в Китаї, де Huawei готується випускати і сподівається знайти збут для мільйонів процесорів для машинного навчання.

Ми вже публікували анонс найбільш потужного прискорювача для ML чіпа Huawei Ascend 910. Зараз подивимося на це рішення трохи пильніше. Отже, Ascend 910 випускається компанією TSMC з використанням другого покоління 7-нм техпроцесу (7+ EUV). Це техпроцес характеризується використанням сканерів EUV для виготовлення декількох шарів чіпа. На конференції Huawei порівнювала Ascend 910 з ІІ-рішенням NVIDIA на архітектурі Volta, випущеному TSMC з використанням 12-нм FinFET техпроцесу. Вище на картинці наводяться дані для Ascend 910 і Volta, з нормалізацією до 12-нм техпроцесу. Площа рішення Huawei на кристалі в 2,5 рази більше, ніж у NVIDIA, але при цьому продуктивність Ascend 910 виявляється в 4,7 рази вище, ніж у архітектури Volta.

Також на схемі видно, що Huawei заявляє про вкрай високу масштабованості архітектури. Ядра DaVinci, що лежать в основі Ascend 910, можуть випускатися в конфігурації для оперування скалярними величинами (16), векторними (16 × 16) і матричними (16 × 16 × 16). Це означає, що архітектура і ядра DaVinci з'являться у всьому спектрі пристроїв від IoT і носимой електроніки до суперкомп'ютерів (від платформ з прийняттям рішень до машинного навчання). Чіп Ascend 910 несе матричні ядра, як призначений для найбільш інтенсивної роботи.

Ядро DaVinci в максимальній конфігурації (для Ascend 910) містить 4096 блоків Cube для обчислень з половинною точністю (FP16). Також в ядро входять спеціалізовані блоки для обробки скалярних (INT8) та векторних величин. Пікова продуктивність Ascend з 32 ядрами DaVinci досягає 256 терафлопс для FP16 і 512 терафлопс для цілочислових значень. Все це при споживанні до 350 Вт. Альтернатива від NVIDIA на тензорних ядрах здатна максимум на 125 терафлопс для FP16. Для вирішення завдань ML чіп Huawei виявляється в два рази продуктивніше.

Крім ядер DaVinci на кристалі Ascend 910 знаходяться кілька інших блоків, включаючи контролер пам'яті HBM2, 128-канальний фейдер для декодування відеопотоків. Потужний чіп для операцій вводу/виводу Nimbus V3 виконаний на окремому кристалі на тій же основі. Поруч з ним для механічної міцності всієї конструкції довелося розташувати два кристала-заглушки, кожен з яких має площу 110 мм2. З урахуванням болванок і чотирьох чипів HBM2 площа всіх кристалів досягає 1228 мм2.

Для зв'язку ядер і пам'яті на кристалі створена комірчаста мережу в конфігурації 6 рядків на 4 колонки зі швидкістю доступу 128 Гбайт/с на кожне ядро для одночасних операцій запису і читання. Для з'єднання з сусідніми чіпами передбачена шина зі швидкістю 720 Гбіт/с і два лінка RoCE зі швидкістю 100 Гбіт/с. До кеш-пам'яті L2 ядра можуть звертатися з продуктивністю до 4 Тбайт/с. Швидкість доступу до пам'яті HBM2 досягає 1,2 Тбайт/с.

У кожен поличний корпус входять по 8 процесорів Ascend 910 і блок з двома процесорами Intel Xeon Scalable. Специфікації полиці нижче на картинці. Рішення збираються в кластер з 2048 вузлів сумарною продуктивністю 512 петафлопс для операцій FP16. Кластери NVIDIA DGX Superpod обіцяють продуктивність до 9,4 петафлопс для збірки з 96 вузлів. У порівнянні з пропозицією Huawei це виглядає блідо, але створює стимул рватися вперед.

Головне на ПК-манія

Штучний інтелект і технології перекладу

Було проведено опитування усіх постачальників технологій перекладу, які прийшли на думку: у яких ...

IT новини 2020-06-13 04:39:57

Роль R&D в інноваційному процесі програмного ...

Підхід, використаний компанією-розробником програмного забезпечення в процесі розробки програмного ...

Software новини 2020-05-02 19:00:22

Должность php разработчик

Наверное, большинство современных людей, особенно мальчишки, мечтают в будущем стать и овладеть IT ...

Software новини 2020-03-19 17:17:01

Відео дня

Живі додатки

Системні програми

Free Magic Christmas Screensaver 1.0

- Красивий і абсолютно безкоштовний скрінсейвер на різдвяну тему. Слайдшоу з красивих новорічних фотографій, гарний подарунок

Комп'ютерне навчання

Diabolical fingers 1.35

Diabolical fingers - програма для навчання набору тексту десятипальцевим "сліпим" методом. Має вигляд віртуальної клавіатури і

  • Prev
  • software
Scroll to top