Софт-line:
Рісовалка для дітей (Машинки) 1.0 -- "Рісовалка для дітей (Машинки) - програма яка однозначно сподобається ..." -- 06 квітня 2020
Універсальний облік 2.1.0.10 -- "Універсальний облік - це інформаційна платформа для створення та ..." -- 05 квітня 2020
Serv-U 15.1.7 -- "Serv-U - потужна і проста в управлінні утиліта, яка перетворює ..." -- 04 квітня 2020
DNS Jumper 2.2 -- "DNS Jumper - невелике безкоштовний додаток для швидкого перемикання ..." -- 03 квітня 2020
Web Proxy Checker 2.24 -- "Web Proxy Checker - програма для перевірки SOCKS4/SOCKS5/HTTP/HTTPS ..." -- 03 квітня 2020
Download Analyzer 1.8 -- "Download Analyzer - аналізатор лог файлів веб-серверів ..." -- 02 квітня 2020
DNSDataView 1.60 -- "DNSDataView - утиліта являє собою альтернативу для стандартного ..." -- 02 квітня 2020
ESEDatabaseView 1.63 -- "ESEDatabaseView - проста утиліта, яка сканує і відображає дані, що ..." -- 01 квітня 2020
Prostoysoft Таблиця 3.5 -- "Prostoysoft Tables - програма для створення систем обліку для ..." -- 01 квітня 2020
QuickSetDNS 1.30 -- "QuickSetDNS - невелика утиліта для зміни DNS-серверів для ..." -- 01 квітня 2020


Строго кажучи, мова піде не тільки про самих процесорах Xeon, які тепер неодмінно забезпечуються приставкою Scalable Processor, але і про платформі Intel Purley — вона включає поточні CPU Skylake-SP і прийдешні Cascade Lake, чіпсети Lweisburg, а також деякі прискорювачі, які, втім, здебільшого вже були подані раніше. Префікс Scalable невипадковий, тому що на цей раз Intel постаралася догодити мало не всім. Це стосується і архітектури платформи, і того розмаїття SKU, яке було представлено. Ось з цього, мабуть, і почнемо.

Найменування та серії

Кодові імена для нових серій Xeon були відомі вже давно: Platinum, Gold, Silver і Bronze. Можна було б подумати, що сучасних серій Intel Xeon всього чотири, але фактично їх шість, якщо рахувати ще й E3v6, які є лише модифікацією настільних моделей Intel Core Kaby Lake. Адже є ще і E3v5 на базі Skylake. Серія Gold розділена на дві нерівні половинки. Всі новинки розрізняються не тільки числом ядер і набором технологій. Варто відразу зазначити, що є моделі з новими індексами: F означає наявність вбудованого контролера Intel Omni-Path, M вказує на підтримку більшого об'єму ОПЕРАТИВНОЇ пам'яті (до 1,5 Тбайт на сокет замість стандартних 768 Гбайт), а літерою T позначаються спеціальні версії CPU, які «дружні» стандарту NEBS для роботи в екстремальних умовах — вони більш стійкі до температурних навантажень і мають більш тривалу гарантію працездатності (до 10 років).

Процесори Platinum орієнтовані на високонавантажених і критично важливі системи. Вони володіють максимально можливою кількістю ядер (до 28C/56T) і набором підсистем обміну даними (це стосується внутрішніх і зовнішніх шин). Разом з більшою частиною серії Gold 6xxx ці процесори можна в якомусь сенсі назвати аналогами минулих E7, хоча представник Intel заявив, що тільки Platinum є аналогами E7. Найбільше нових CPU можна умовно співвіднести з найпопулярнішою серією E5 — сюди входять кілька моделей Platinum, Gold 5xxx, Silver і Bronze (ці взагалі поки всього дві штуки). Всі Xeon Gold мають до 22 ядер (22С/44Т), а Silver — до 12C/24T. Процесори Bronze зовсім не підтримують Hyper-Threading і можуть мати до 8 ядер, тобто фактично вже заходять на територію Xeon E3. Ах так, 32-ядерних моделей не буде.

На цьому відмінності не закінчуються. Intel Xeon Platinum дозволяють об'єднати до 8 процесорів і мають три лінії шини UPI (про неї трохи пізніше), підтримують пам'ять DDR4-2666, AVX-512 і можливість одночасного виконання двох 512 біт FMA-інструкцій. Xeon Gold 6xxx мають все те ж саме, але дозволяють об'єднати до 4 процесорів. Процесори Xeon Gold 5xxx, Silver і Bronze мають вже 2 лінії UPI і виконують лише по одній 512 біт FMA за раз. Intel Xeon Silver і Bronze можна використовувати лише в двухсокетных конфігураціях, а Bronze до того ж офіційно вміє працювати тільки з пам'яттю DDR4-2133. Дві останні серії призначені для малих і помірних навантажень. Втім, сама Intel поділяє новинки на дві великі частини: з максимальною потужністю (у всіх сенсах) і з оптимізованої продуктивності на ват.

Мікроархітектура Intel Xeon Skylake-SP

Базова структура кожного ядра Xeon Skylake-SP залишилася рівною тій же, що і у звичайних Skylake. Однак сама Intel в презентації відзначає кілька змін. По-перше, обсяг L2-кеша досягає 1 Мбайт шляхом збільшення 768 Кбайт, які фактично знаходяться не в самому ядрі, а поруч. L3-кеш має «некруглый» обсяг 1,375 Мбайт на ядро. Кеш неинклюзивный – L2 заповнюється безпосередньо з RAM, і лише потім непотрібні лінії витісняються в L3. Загальні для декількох ядер дані зберігаються в L3. При цьому є один неявний нюанс — об'єм L3 залежить не тільки від кількості ядер. У деяких моделей є окрема згадка про його розмірі. Наприклад, L3-кешем на 24,75 Мбайт можуть оснащуватися моделі з 8 і 12 ядрами. Ще більш істотний розрив видно в варіантів на 6 і 12 ядер, які, тим не менше, мають кеш на 19,25 Мбайт. Але в загальному і цілому, основний упор зроблений саме на роботу з кешем L2. А набортная eDRAM і зовсім зникла. Така організація вигідніше у всіх сенсах: і в плані простоти реалізації, і в плані зниження частоти промахів L2 приблизно при тому ж рівні промахів L3, як стверджує сама Intel. В цілому ж структура Skylake-SP аналогічна такий у настільних Skylake-X.

По-друге, до ядра додатково «приліплений» блок AVX-512. Власне, Port0 і 1 на пару можуть виконувати одну таку інструкцію, плюс Port5 сам по собі вміє працювати з однією AVX-512/FMA. ВМ теж можуть використовувати їх. І так, мабуть, згадана вище можливість виконання однієї або двох FMA-інструкцій має виключно маркетинговий характер. Крім того, базова і турбочастота кожного ядра різниться і залежить від того, який тип інструкцій виконується — з важкими AVX2/AVX-512 або без оних. Формально з приходом 512-бітних інструкцій продуктивність збільшується в два рази в порівнянні з минулим поколінням, тобто до 32 flops на такт при подвійної точності. Це в порівнянні з минулим поколінням, але за фактом середній цикл життя CPU в дата-центрах становить мінімум 3-4 роки, так що на тлі старих процесорів приріст ще значніше. Правда, тут є певне лукавство — AVX-512 потрібні далеко не всім додаткам. А, оптимізоване для Broadwell, без перекомпіляції в середньому отримає +10% швидкості на ядрах Skylake-SP. Як тут не згадати заповітні +5% на покоління, якими не перший рік докоряють настільні CPU Intel.

На практиці заявлений середній приріст чистої продуктивності при оптимізації під Skylake-SP ще вище — в середньому в 2,2-2,3 рази. Додаткові відсотки забезпечує зміна топології і будови шин. Головне, звичайно, — це зміна внутрішньої шини з кільцевого типу на mesh-сітку. Тепер у кожного ядра є власний блок, який включає системний агент, L3-кеш і фільтр снупинга (конкретний алгоритм реалізації когерентності не уточнюється). При зверненні до інших вузлів мережі запит йде спочатку за, умовно кажучи, осі ординат, а потім по осі абсцис. Аналогічна схема використовується в Xeon Phi KNL. Потенційно така топологія укупі з новими кешами дозволяє помітно збільшити ефективність межъядерного взаємодії та роботи з пам'яттю, особливо для ВМ і важких розрахунків. Крім того, при такій схемі з одного CPU легко виходять два NUMA-вузла (КП теж два), які потрібні для ряду HPC-завдань. У цьому випадку і трафік усередині mesh-мережі знижується, і затримка зростає трохи повільніше.

В кремнії, як зазвичай, буде три варіанти кристалів: XCC, (ШАБЛОН) і LCC, тобто eXtreme, High і Low Core Count. Однак поділ є сенс робити не тільки по числу ядер, але і за можливостями uncore-частини. Так, наприклад, серед CPU серії Platinum є 4-ядерні моделі з повним набором можливостей платформи. З частотами і TDP все складно і просто одночасно. З одного боку, звично спостерігається баланс між числом ядер і базовою частотою. З іншого боку, з ходу розібратися в цьому достатку SKU важко. У будь-якому випадку максимальна базова частота не перевищує 3,6 ГГц, а TDP досягає 205 Вт. Так, Intel недвозначно натякає, що ера повітряного охолодження закінчується. Про турбочастоты детальної інформації поки немає, але якщо вже говорити про енергоспоживання в цілому, то технологія SpeedShift нікуди не поділася.

Контролерів пам'яті (КП) тут два, це триканальні DDR-2133/2400/2666 з підтримкою якогось нового алгоритму виявлення і корекції помилок (adaptive double device data correction, ADDDC), який уміє усувати збої ECC-пам'яті. Розташовані вони по краях сітки, навпроти один одного. При промаху L2 паралельно ініціалізується звернення до пам'яті і L3-кешу. Крім того, КП на основі історії звернень намагається заздалегідь передбачити, які блоки пам'яті будуть затребувані в подальшому. На жаль, жодних деталей про маршрутизацію і роботу системних агентів не наводиться. КП, як і раніше, підтримує роботу з модулями пам'яті RDIMM, LRDIMM, 3DSLRDIMM — до двох модулів на канал, об'ємом до 128 Гбайт кожен. Тобто максимальний обсяг становить 1,5 Тбайт на сокет, проте, як говорилося на самому початку, більшість SKU підтримує тільки 768 Гб.

Uncore-частина

Всі контролери зовнішніх по відношенню до самого CPU шин зведені в одну лінію вгорі сітки. Їх тут небагато: один або два блоки UPI (x2 є завжди, ще один x1 є у деяких моделей CPU), два блоки PCI-E x16 (у вигляді x16, 2x8, 1x8 + 2x4 або 4x4) і ще один комбінований блок з таким же набором інтерфейсів PCI-E x16 + DMI x4. У процесорах з інтегрованим контролером Omni-Path є ще один «прихований» PCI-E x16 для підключення самого інтерконекту. Крім того, для зв'язку з чіпсетом крім шини DMI можна задіяти додатково лінію PCI-E x16, скоротивши таким чином і так не те щоб зовсім вже численні лінії PCI-E 3.0 до двох x16. На зміну шині Quick Path Interconnect прийшла шина UPI — Ultra Path Interconnect. Швидкість передачі даних зросла незначно, з 9,6 до 10,4 GT/s. Проте в моделях Silver і Bronze вона залишилася колишньою. Основний акцент зроблений не на зростання швидкості, а на збільшення ефективності корекції помилок передачі даних і кешування і енергоефективність.

Набагато більш цікаве і корисне нововведення — це Intel Volume Management Device (VMD). VMD є подконтроллером PCI-E, який об'єднує і абстрагує NVMe-накопичувачі від CPU і ОЗ, служачи свого роду мостом або проксі. Тобто можна встановити більшу кількість накопичувачів. Крім того, він же здійснює моніторинг стану SSD і управляє гарячою заміною дисків. У VMD для платформи Purley доступно до 72 SSD на кожен процесор з використанням світчів PCI-E, а от без них число накопичувачів не може бути більше 12 (на кожен CPU, звичайно). Сама Intel справедливо зазначає, що VMD є основою для створення програмно-визначаються сховищ (SDS, Software Defined Storage).

У поєднанні з інтегрованим в CPU інтерконектом Omni-Path з'являється можливість, «не відходячи від каси», задіяти технологію NVMe-over-fabric для більшої гнучкості при роботі з накопичувачами: «Фактично на кожному вузлі можна відмовитися від локального сховища і працювати тільки з віддаленими накопичувачами». Ну, точніше кажучи, NVMe-over-OPA, тому що в чіпсеті теж є мережевий контролер. З іншого боку, CPU став справжньою SoC — теоретично Skylake-SP може працювати і без PCH. Так, інтеграція все більшого числа компонентів під кришку CPU стала нормою.

Ще один компонент в Skylake-SP називається Virtual RAID on CPU (Intel VROC). Так, це вбудований RAID-контролер, який підтримує рівні 0/1/5/10 і можливість завантаження з масиву (не у всіх комбінаціях, правда). Основне завдання — збільшення швидкості доступу і зниження затримки при зверненні до NVMe-накопичувачів (через VMD теж), плюс економія електроенергії шляхом відмови від зовнішнього контролера. Деталі будови знову-таки не наводяться, але кажуть, що для роботи VROC можна «відрізати» одне-два ядра CPU, які й будуть обслуговувати масив. Явного обмеження на тип SSD (в тому числі на марку) немає. Ця опція, швидше за все, буде необов'язковою і за неї доведеться доплачувати.

Чіпсет Intel Lewisburg С620

Серія чіпсетів C620 включає 7 моделей, які розрізняються в першу чергу мережевими можливостями — набором Ethernet-портів і функцій Intel QuickAssist Technology (QAT). Всі вони мають підтримку до 14 портів SATA3 і USB 2.0, до 10 портів USB 3.0 і до 20 PCI-E x8 і/або x16 (конкретна розбивка не уточнюється). Підтримки SATA Express немає, але є NVMe і Intel Rapid Storage Technology enterprise (RSTe). Також чіпсет тепер вміє працювати з модулями TPM 2.0. Серед інших нововведень – нова низькошвидкісна шина eSPI і більш висока енергоефективність чіпсета в цілому. Крім того, є підтримка Node Manager 4.0, який займається моніторингом і управляє харчуванням, енергоспоживанням і продуктивністю платформи в цілому. Всі чіпсети Lewisburg будуть проводитися протягом семи років.

Звичайно, найважливіше зміна стосується роботи з Мережею. У C620 з'явився новий мережний контролер Intel X722, який пропонує до чотирьох 10-гігабітних з'єднань. В чіпсеті знаходиться MAC-рівень, а конкретні фізичні порти вибираються вже виробником плати (поки є тільки мідь). X722 підтримує різні варіанти розвантаження (offload) для систем віртуалізації, а також RDMA-протокол iWARP. Вибір останнього зумовлене, за словами Intel, тим, що для його використання не потрібно додаткових вкладень у поточну мережну інфраструктуру.

Intel QuickAssist Technology (QAT) — це прискорювач для роботи з компресією і криптографією. Апаратно підтримується цілий набір алгоритмів шифрування і хешування. Раніше він був доступний у вигляді окремих чіпів і плат, а тепер перебрався в чіпсет. Розробники обіцяють наступний рівень продуктивності: шифрування на льоту AES-256 — до 150 Гбіт/с; розшифровка ключами RSA-2048 – до 100 тисяч операцій в секунду; одночасні стиснення і розпаковування LZ77 — до 100 Гбіт/с; обробка TLS і IPSec — до 150 і 100 Гбіт/с відповідно. Але взагалі кажучи, QAT потрібен не тільки і не стільки для обробки мережевого трафіку, тому що його можливості можна утилізувати і при роботі з захищеними додатками, і з системами зберігання даних, які також отримають приріст продуктивності за рахунок розвантаження деяких функцій.

Для розробників Intel надає набір Data Plane Development Kit (DPDK), який дозволяє найбільш повно задіяти всі можливості по роботі з даними на новій платформі. Доповнює його Intelligent Storage Acceleration Library (ISA-L). Як би це дивно не звучало для обивателя, але для РФ саме вони вельми і вельми актуальні із-за необхідності проходження різних процедур у ФСБ у зв'язку з використанням стійкого шифрування. Тобто в деяких структурах використання Intel QAT може бути заборонено. Строго кажучи, російські розробники і так масово перейшли на DPDK при створенні різних security-продуктів.

Втім, оновлення серверної платформи спричинило за собою значне оновлення програмних компонентів, про які і окремо-то можна написати ще два-три матеріалу, так що ми на них зупинятися в цьому тексті не будемо. Краще повернемося до чіпсету і згадаємо ще одну технологію — Innovation Engine (IE). Модуль Intel IE за своїми завданнями та можливостями аналогічний давно використовується Management Engine (ME), але тільки для розробників платформ. IE не нова, поки з цікавого варто відзначити поступовий перехід від IPMI до протоколу Redfish. Апаратна основа для всіх ME/IE одна: окремий процесор Intel Quark + трохи SRAM.

Нові технології та розширення

У цій частині коротко пробіжимося по деяких ключових технологій, які вперше з'явилися в Intel Xeon Scalable Processor або які вже були раніше, але були доповнені новими функціями. Прикладом останньої є Intel TXT (Trusted Execution) — вона обзавелася функцією One Touch Activation (TXT-OTA), яка, по суті, дозволяє віддалено включити і налаштувати TXT. Це важливо при адмініструванні та переконфігуруванні великого числа вузлів. Системи Intel Platform Trust Technology (PTT) і BootGuard нікуди не поділися, як звичні TSX або блочки для AES/SHA. Технології Intel QAT укупі з НІГ у разі платформи Purley пропонують додаткову опцію Intel Key Protection Technology (KTP). Суть її зводиться до захищених зберігання і передачі усередині платформи ключів шифрування. Доступ до ключів та управління ними здійснюється тільки власником, що необхідно, наприклад, при розміщенні серверів в сторонньому дата-центрі.

У системи віртуалізації VT-x з'явилося кілька розширень. Mode-Based Execution Control (MBE) відповідає за перевірку виконуваного коду ядра ОС. Timestamp Counter Scaling (TSC) допомагає при живої міграції віртуальних машин з одного CPU на інший при різних базових частотах процесора. MPX (Memory Protection Extension) запобігає стандартні атаки на переповнення буфера при роботі з пам'яттю. Page Protection Keys (PPK) підвищує ізоляцію сторінок пам'яті одне від одного. Нарешті, в серверних Skylake з'явилася функція LMCE (Local machine check exception) — при збої прийде повідомлення для конкретного потоку (vCPU), а не для всіх. Частина згаданих вище технологій це відноситься і до RAS-платформі Intel Run Sure, яка раніше була доступна тільки для процесорів Intel Xeon E7. Тепер же Intel вирішила «виправитися» і пропонує функції RAS в тому чи іншому вигляді майже для всіх CPU. Природно, поділ за класами залишилося — тільки серія Platinum як наступник Xeon E7 отримає максимум функцій.

Як це все виглядає

У московському офісі попередньо показали кілька варіантів машин на новій платформі, плюс фото серверних «тушок» можна знайти в новинах з ISC 2017. CPU тепер мають сокет LGA3647 (Socket P). Фізично точно такий же роз'єм використовується в Xeon Phi Knights Landing, але електрично вони між собою несумісні.

Моделі з індексом F, тобто з вбудованим стогигабитным адаптером Intel Omni-Path мають на вузькій стороні «відросток» з висновками. До нього підключається кабель, що йде в конвертер, а вже з нього виходять коннектори для одного з стандартних роз'ємів (буде і «мідь», і «оптика»). Варіанти з одним і двома портами Omni-Path трохи розрізняються.

Два представлених типу двухсокетных плат мають кодові імена SpreadCore і ShadowCore. Перша – це звичайна плата на всю ширину стійки, Intel S2600WF (WolfPass). З цікавого, мабуть, можна відзначити хіба що OCuLink — підключення дискової кошики з SSD. Друга плата Intel S2600BP (Buchannan Pass) — більше підходить для «лезового» виконання. У разі останній трохи відрізняється матеріал радіаторів: близький до кулерів зроблений з алюмінію, а дальній з міді.

Конкуренти

Строго кажучи, судити про ефективність конкуренції між AMD EPYC і Intel Xeon Scalable Processor, а тим більше у відриві від кінцевої ціни різних рішень, поки рано. Так, Intel у презентаціях показує різні приклади її зростання — всі вони зведені в окрему галерею нижче. Але деякі моменти розглянути все ж можна. Зрозуміло, що багато чого залежить від конкретних завдань і програм. Ті ж інструкції AVX-512 потрібні не всім, а в EPYC якраз є тільки AVX2. Те ж саме стосується і структури кристалів. Якщо є багато незалежних потоків, то для обох процесорів немає особливої різниці. Але якщо справа стосується, наприклад, віртуалізації, то вже не все так однозначно. Із-за особливостей будови EPYC виникають затримки при залученні більше чотирьох ядер, тобто при виході за межі CCX-комплексу всередині окремого кристала або за межі кристала взагалі. Ще у EPYC є одна цікава опція — наскрізне шифрування пам'яті. Однак, про що вже йшлося вище, її, на жаль, не завжди можна задіяти через необхідність сертифікації для деяких секторів ринку.

З IO ситуація теж неоднозначна. AMD робить упор на те, що в EPYC є 128 ліній PCI-E x16. Це так, і в односокетном варіанті можна отримати дуже і дуже цікаві рішення, що і було зазначено в огляді цієї платформи. Однак у двухсокетном варіанті, який найчастіше використовується вже не все так гладко (про 4P EPYC поки не особливо чути). Лінків все так же 128 (по 64 з кожної сторони йде на зв'язок між CPU). Тобто на кожному сокеті у EPYC всього на одну PCI-E x16 більше в порівнянні з новими Xeon, але не варто забувати, що і на інтерконнект їх доведеться витратити, і, можливо, на зв'язок з зовнішніми чіпсетами. Так що в цьому плані тут спостерігається паритет, але в Intel, правда, є варіанти CPU c вбудованим Omni-Path. Природно, все це теж потрібно не для всіх, а, приміром, для HPC, де непогано було б підключати прискорювачі і інтерконнект безпосередньо до CPU, але не через мости.

Висновок

Для платформи Purley сама Intel вважає основними чотири галузі: HPC (суперкомпьютинг), корпорації, телекомунікації і хмари. Сюди ж можна сміливо додати машинне навчання (ІІ), яке фактично і так зростає у всіх цих областях. Природно, тільки ними справа не обмежується – спочатку анонсований набір рішень і сам по собі досить великий і різноманітний, і далі буде тільки рости. Крім того, Intel, на відміну від конкурента, має в портфоліо і інші технології: прискорювачі, накопичувачі, FPGA, інтерконнект. Залишилося додати хіба що RAM і... ні, не буде монополія, а скоріше високий ризик vendor-lock'а. Хоча подивимося ще, що там буде з NVDIMM на Optane. І ось весь цей набір, а не тільки нові Xeon Scalable Processor, допоможе Intel «розширити і поглибити» присутність на ринку серверів і дата-центрів. А цей ринок змінюється, і змінюється дуже швидко. Все частіше говорять про гиперконвергенции (про неї трохи розказано тут) не як про щось абстрактне. Все більше систем глибше занурюються в віртуалізацію і контейнеризацію. Все менше залишається «залізних» продуктів, які можна було б перевести на програмно-визначаються (software-defined) платформи. Але про це ми поговоримо наступного разу.

Головне на ПК-манія

Должность php разработчик

Наверное, большинство современных людей, особенно мальчишки, мечтают в будущем стать и овладеть IT ...

Software новини 2020-03-19 17:17:01

Класичні настільні ігри: цікаві та веселі

Настільні ігри, або настолки – цікавий та веселий спосіб провести час з рідними, або друзями. ...

Hard новини 2020-02-21 07:57:16

Samsung Galaxy Fold 2 вийде з новим стилусом S ...

Після недавніх новин про Galaxy Fold 2 настав час ще трохи розповісти про його дизайні. Згідно ...

IT новини 2020-02-19 18:00:29

Відео дня

Живі додатки

Системні програми

Panel 1.1.1

Panel - ця програма створює додаткову допоміжну панель інструментів з набором кнопок, для кожної з яких призначається певна

Комп'ютерне навчання

Навколишній світ. 1 клас 2.0

Навколишній світ. 1 клас - інтерактивний тренажер, який охоплює весь обсяг курсу знайомства з природою для першого

  • Prev
  • software
Scroll to top