Софт-line:
Virtual CloneDrive 5.5.1.0 -- "Virtual CloneDrive - утиліта, призначена для створення віртуальних ..." -- 26 лютого 2020
Sadovod 1.3.11_18 від 11.01.2020 -- "Додаток Sadovod створена на основі програми Cvetovod. Вона зберегла ..." -- 22 лютого 2020
LCircuit 1.3.1 -- "LCircuit - програма для моделювання роботи схем на основі булевої ..." -- 22 лютого 2020
Будильник 2.5.5.2 -- "Будильник - програма-годинник з безліччю корисних функцій.Дозволяє ..." -- 22 лютого 2020
fre:ac (BonkEnc) 1.0.33 -- "fre:ac (BonkEnc) - безкоштовний аудіо конвертер і CD ріппер з ..." -- 22 лютого 2020
PSPad 5.0.3 build 377 -- "PSPad - безкоштовний текстовий редактор для програмістів" -- 22 лютого 2020
EyeLeo 1.34 -- "EyeLeo - програма, яка допоможе вам піклуватися про своє здоров'я при ..." -- 22 лютого 2020
FlyingStars 1.1 -- "FlyingStar - програма для створення карти летючих зірок Феншуй, ..." -- 22 лютого 2020
Інтервальний таймер Табата Хікі 1.4 -- "Інтервальний таймер Табата Хікі - інтервальне тренування, ..." -- 22 лютого 2020
HelpNDoc 6.7.0.479 -- "HelpNDoc - потужна і зручна у використанні програма, за допомогою ..." -- 22 лютого 2020


Астрологи оголосили місяць AMD EPYC. Кількість матеріалів про Rome збільшилася вдвічі.

Про внутрішню будову нових ядер все чудово розписано в огляді мікроархітектури Zen2. На більш високому рівні будова теж принципово не відрізняється — мультичип процесора набирається з тих же CCD, тобто блоків з ядрами і L3-кешем. Виключно кількісне відмінність в тому, що в CCD може бути вісім ядер, тобто в сумі на один сокет доводиться до 64 ядер. Тобто у двох сокетах ми отримуємо до 128 ядер і до 256 потоків. Цікавий побічний ефект — Windows Server 2019 вимагає патчі для коректної роботи APIC. Без них для двухсокетных систем доведеться або штучно занижувати кількість ядер, або використовувати CPU з меншим їх числом — до 48.

Так чи інакше, обраний підхід дозволяє більш гнучко варіювати число ядер в процесорі і системі. Можливі конфігурації як з меншим числом CCD на процесор, так і з меншим числом активних ядер CCD. Бувають варіанти на 8, 6, 4 і 2 CCD. Орієнтуватися можна на обсяг L3-кеша, який може досягати обсягу 32 Мбайт на CCD: L3-блоки об'ємом 16 Мбайт виділяються на кожні чотири ядра. Якщо частина з цих чотирьох ядер відключена, то розмір L3 все одно не змінюється. Є навіть екзотичні варіанти: 8 ядер з максимальною серед усіх SKU базовою частотою + 128 Мбайт кеша. Склад I/O Die при цьому залишається єдиним для всіх варіантів: 128 ліній PCI-Express 4.0 + 8 каналів пам'яті DDR4-3200 ECC.

Підтримуються модулі (L)RDIMM і 3DS, аж до «восьмиранговых» (2S4R) ємністю 256 Гбайт (з 16 Гбіт чипами). З NVDIMM є лише підтримка типу N (по специфікації JEDEC), тобто таких модулів, у яких доступ ззовні є тільки до DRAM, а флеш-масив не видно. AMD рекомендує рівномірно заповнювати всі вісім каналів, не змішуючи при цьому тип і обсяг модулів. В принципі, запустити систему можна навіть з одним DIMM, але це дивна ідея сама по собі. При числі модулів менше восьми, а цей варіант оптимальний лише для CPU з 32 ядрами і менш, рекомендується розміщувати їх парами буквально навскоси один від одного щодо I/O Die.

Внутрішню топологію I/O Die розробник не розкриває, кажучи лише про те, що в середньому для всіх восьми каналів одного сокета затримка звернення до пам'яті складає близько 100 нс. Конкретні значення залежать від частот пам'яті і ядер, типу модулів і сценарію доступу. Формально всі канали рівні і забезпечують приблизно рівні затримки і пропускну здатність для всіх CCD, але вони все ж розбиті на умовні пари ("paired" internally) для оптимізації продуктивності PCI Express та інших компонентів. Окремо варто відзначити, що при використанні двох DIMM на канал максимальна швидкість падає з 3200 до 2933 MT/s, а при наборі 3DS-модулями 2S2R/2S4R — до 2666 MT/s. Втім, ті, кому дійсно потрібні великі обсяги, це може бути не так критично — для NUMA, наприклад, який теж покращився в Rome. До того ж контролер пам'яті досить розумний для того, щоб оптимальним чином розподіляти запити між різними рангами пам'яті.

Є й інший обмежувач продуктивності, навіть два. Але перший нудний, так як стосується сумісності між платформами EPYC першого і другого покоління. На папері все виглядає гладко — один і той же Socket P3, повне збіг по пинам. На практиці ставити новий процесор в стару плату не завжди має сенс, тому що PCI-E буде працювати в режимі 3.0, а швидкість пам'яті не підніметься вище 2667 MT/s. Більш того, «штраф» за установку двох DIMM на канал суворішим. В кращому випадку буде 2400 MT/s, в гіршому — 1866. Зворотна сумісність «наборот» — установка старих процесорів в нові плати — в більшості випадків вимагає зміни BIOS, а частина можливостей Rome може виявитися недоступною.

Другий і найбільш очевидний, обмежувач — це TDP. В таблиці явно не визначені, але, за словами інженерів, існують процесори з двома базовими рівнями тепловиділення. При меншому значенні відбувається відкат до вищезазначених характеристиках PCI-E і DDR4 першого покоління EPYC. Дані про TDP безпосередньо IO Die не наводяться, але ось цей самий відкат може «коштувати» і пару десятків Вт, хоча все дуже сильно залежить від параметрів усієї системи. Для всіх моделей вказана не просто стандартна величина TDP, а дан діапазон, який може тягнутися як у бік збільшення, так і зменшення. Налаштувати конкретний рівень можна з точністю до 1 Вт. Чим вище ліміт і чим краще відповідно охолодження, тим довше процесор зможе працювати на турбочастотах.

З PCI Express ситуація приблизно та ж, що й була. Так, у нас є 128 ліній PCI-E 4.0 для одного сокета. Так, у нас є 128 ліній PCI-E 4.0 для двох сокетів. Тому що по 64 лінії (xGMI) від кожного CPU забирає Infinity Fabric. Всі лінії процесора розбиті на вісім груп по x16. Кожна група підтримують бифуркацию аж до x1, але сумарна кількість слотів на групу не повинно бути більше 8. Половина груп також підтримує перемикання 8 ліній PCI-E у режим SATA3. У сумі виходить до 32 SATA - або NVMe-накопичувачів x4 на сокет. Чисто технічно є ще одна, так звана WAFL-лінія x1 для підключення BMC, але вона в будь-якому випадку зайнята. Як і раніше, AMD упирає на те, що EPYC це SoC, а не просто процесор, тому він може працювати без окремого чіпсету і ряду додаткових компонентів, що повинно позитивно позначатися на вартості платформи.

Фактично частина ліній все одно піде на базові адаптери та контролери, на що в свій час посилалась Intel, нагадуючи як мінімум про нормальному мережний контролер у власному чіпсеті і VROC (Virtual RAID on CPU). З приходом Xeon Scalable додався ще один аргумент, хоча і слабкий — підтримка Intel Optane DCPMM в DIMM-форматі. Проте в Rome все-таки повноцінний PCI-E 4.0, який хоч і вважається багатьма тимчасовим, перехідним стандартом, все одно дозволить вичавити більше навіть з меншого числа ліній. Так що для DCPMM цілком може знайтися альтернатива з швидких NVMe SSD укупі з технологіями ScaleMP. На брифінгу за Rome один з доповідачів побіжно згадав про варіанти з більшою, ніж 128, кількістю ліній PCI-E. Для двухсокетных систем дійсно є можливість отримати 192 лінії PCI-E. Однак у цьому разі частина ліній забирається у шини Infinity Fabric, що зв'язує процесори, тому її продуктивність буде гірше.

Ще одне важливе оновлення — як мінімум для віртуалізованих і хмарних середовищ — полягає в розширенні можливостей шифрування оперативної пам'яті за алгоритмом AES-128, вплив якого на продуктивність становить, як стверджується, менш 1%. В основі все той же AMD Secure Processor на базі ARM Cortex-A5, інтегрований безпосередньо в CPU. Ключова відмінність від минулого покоління — збільшення кількості ключів шифрування до 509.

Втім, це потрібно для захисту за допомогою Secure Encrypted Virtualization (SEV), а для простого повного шифрування всієї оперативної пам'яті, тобто функції Secure Memory Encryption (SME), достатньо одного ключа. SEV ж дозволяє ізолювати один від одного гіпервізор, віртуальні машини і контейнери або їх групи, а також окремі додатки. Однак в останньому випадку потрібна підтримка з боку ОС. Особливістю реалізації SEV є повна прозорість, тобто (де-)шифрування на льоту, для інших апаратних засобів, які звертаються до пам'яті за допомогою DMA. Крім іншого, є і інші оновлення стосуються безпеки і продуктивності: апаратні патчі проти Spectre, розширені управління та моніторинг пам'яті L3-кеша (аж до окремих CCD), а також деякі інші інструкції.

На рівні сумісність починається як мінімум з версії ядра Linux 4.19. Ключові дистрибутиви також підтримують нові процесори. Microsoft і VMWare повинні підтягнутися до виходу на ринок і поки дають бета-версії. З компіляторами ситуація трохи складніше. Ще в LLVM Clang 9.0 з'явилася первинна підтримка оптимізації для ядер Zen 2 (znver2). У GCC повноцінна оптимізація очікується у версії 10 і що-то вже портировано до 9.2, але в репозиторіях вони з'являться не відразу. Що стосується власного оптимізуючого компілятора AMD, то реліз AOCC 2.0, «заточений» під EPYC, намічений на момент офіційного анонсу.

На тестовій системі під кодовим ім'ям Daytona, яка для EPYC Rome проведена Quanta (оригінал посилання був спішно вилучений ще в минулому році), використовувалося по можливості найбільш загальнодоступна платформа: Ubuntu 19.04 з ядром 5.0.0-21-generic, компілятор GCC 8.3.0. ОС була встановлена на 2,5" SATA SSD Micron 1100 ємністю 256 Гбайт. Шість U. 2 NVMe-дисків Micron 9300 об'ємом 3,84 Тбайт кожен були зібрані в програмний md-масив RAID-10. На масиві була створена ФС xfs, змонтована з параметрами за замовчуванням (defaults), а на неї покладена директорія /var. У неї в свою чергу був встановлений Phoronix Test Suite (PTS) поточної стабільної версії 8.8.1, і всі тести працювали саме в ній.

У тестовій системі встановлено два процесора AMD EPYC Rome 7742: 64 ядра, 128 потоків, 2,25/3,2 ГГц, L3-кеш 128 Мбайт, TDP виставлений на базові 225 Вт. Параметр governor для тесту був переведений в режим performance. Авторозгін ядер хоч і не зовсім коректно детектировался в ОС, все ж працював — ті самі 3,2 ГГц на декількох ядрах можна було побачити. На кожен з 16 каналів пам'яті припадав один RDIMM-модуль Micron DDR4-3200 ECC ємністю 32 Гбайт, що в сумі дає 512 Гбайт RAM. Відстежувати енергоспоживання і температури під час тестування AMD не рекомендувалося, бо це радше тестова платформа. Перший показник для тестового стенда, мабуть, не дуже важливий, а другий потрібен для керування системою охолодження. Втім, у нашому випадку це все несуттєво, так як фізично сервер розташовувався в Мюнхені.

Що ж з усім цим добром робити? Милуватися, не інакше! Справа в тому, що конфігурація 2 × 64 ядра, м'яко кажучи, не середня. Вона ближче до сегменту HPC, а не корпоративних серверів. Порівнювати її просто не з чим. Якщо взяти ті ж публічно доступні Intel Xeon Platinum 8280(L), то це буде не порівняння, а наруга. Непублічні Cascade Lake AP серії 9200 Intel надати відмовилася, але з ними все одно порівняти ціни не вийшло б, так як вони доступні тільки у вигляді готових систем тих же HPC-платформ. Сама AMD надати систему 32-ядерними Rome поки що теж не змогла, так само як і систему з EPYC 7601 першого покоління.

Тому в якості тимчасового рішення наведено деякі порівняння результатів EPYC 7742 з публічно доступними тестами Xeon 8280 від Phoronix, які дають можливість приблизної оцінки співвідношення сил. Результати тестової платформи доступні тут. Зверніть увагу, що системи відрізняються по залізу і ПО. Втім, показники тестової системи практично ідентичні результатами внутрішніх бенчмарків самої AMD, які, на жаль, публікувати не можна. Та й співвідношення з конкурентами приблизно той же. Окремо варто відзначити, що, як завжди, багато чого залежить від оптимізації. Наприклад, той же Stream показує значно більш високі результати тільки завдяки «правильній» компілятору AOCC.

Так, EPYC 7742 часто виграє просто за рахунок числа ядер. І тим більше цікаво буде поглянути на 32-ядерні моделі. Прямо зараз є тільки одна, але дуже важлива невідома — ціна для партнерів компанії. Або AMD захоче все-таки непогано заробити на новинки, або продовжить тиск на конкурента. На це у неї, мабуть, є близько року-півтора. Трохи несподіваний анонс Cooper Lake може стримати виробників від намірів у бік конкурента просто тому, що серверний ринок досить інертний. Але повністю від них не позбавить. Основним фокусом повинно стати створення екосистеми ЗА його перенесення і адаптація до нової апаратної платформи. Фундамент для неї готовий, адже все-таки є щось невловимо приємне у повідомленні чергового бенчмарку про підозріло швидкому завершенні тесту: мовляв, не може ж такого бути. Може! Тепер може.

Продовження слідує...

P. S: якщо у вас є побажання щодо бенчмарками (консольних, для Linux), залишайте їх у коментарях.
P. P. S.: щоб не пропустити нові матеріали, підписуйтесь на нас в Я. Дзен, Telegram, Twitter і LinkedIn.

Головне на ПК-манія

Класичні настільні ігри: цікаві та веселі

Настільні ігри, або настолки – цікавий та веселий спосіб провести час з рідними, або друзями. ...

Hard новини 2020-02-21 07:57:16

Samsung Galaxy Fold 2 вийде з новим стилусом S ...

Після недавніх новин про Galaxy Fold 2 настав час ще трохи розповісти про його дизайні. Згідно ...

IT новини 2020-02-19 18:00:29

AMD представила EPYC 7H12: найшвидший процесор ...

Сьогодні в Римі компанія AMD провела європейську презентацію процесорів EPYC Rome (символічно, чи ...

Hard новини 2020-02-19 17:48:14

Відео дня

Живі додатки

Файли та диски

Orion File Recovery Software 1.11

Orion File Recovery Software - невелика і проста у використанні утиліта, за допомогою якої можна відновити вилучені файли або

Ігри та розваги

Новорічні пазли 1.0

Новорічні пазли - в цій головоломці, як і в класичній версії пазлів, вам належить збирати з розрізнених шматочків різноманітні

  • Prev
  • software
Scroll to top