Intel сообщила о достижениях в развитии архитектур на Architecture Day 2021
На мероприятии Intel Architecture Day 2021 Раджа Кодури и ведущие инженеры компании Intel рассказали о двух новых микроархитектурах x86-ядер, первой производительной гибридной архитектуре Intel под кодовым названием Alder Lake с интеллектуальным планировщиком рабочих нагрузок Intel Thread Director, а также о процессорах Intel Xeon Scalable следующего поколения для дата-центров с кодовым названием Sapphire Rapids. В ходе встречи были представлены инфраструктурные процессоры (Infrastructure Processing Units, IPU) и новые архитектуры графических процессоров Xe HPG и Xe HPC.
Ядро Gracemont (E-core)
В основу новых энергоэффективных ядер Intel легла микроархитектура Gracemont. Новые ядра оптимизированы для энергоэффективной производительности и предназначены для решения фоновых задач в современных системах, где выполняется множество различных приложений. E-core способны работать в широком частотном диапазоне, понижая напряжение питания до минимальных значений и быстро наращивать частоту при необходимости под более тяжелыми нагрузками.
Множество архитектурных улучшений позволяет E-core в однопоточном режиме обеспечивать на 40% большую производительность при том же уровне энергопотребления, или сравнимую производительность при снижении энергопотребления на 40%. Четыре новых физических ядра обеспечивают на 80% большую производительности при меньшем энергопотреблении, нежели четыре потока двух физических ядер Skylake, или такую же производительность при энергопотреблении, уменьшенном на 80%.
Разница впечатляющая, но, к сожалению, на сколько увеличилась производительность новых ядер по сравнению с предыдущей архитектурой Tremont не сообщается.
Ядро Golden Cove (P-core)
Куда более понятные, производительные ядра построены на микроархитектуре ядра Golden Cove. Новые P-core значительно повышают общую производительность и обеспечивает лучшую поддержку приложений с большим объемом кода и это самые производительные процессорные ядра из когда-либо созданных Intel.
Благодаря новой архитектуре достигается в среднем прирост производительности на 19% по сравнению с архитектурой Cypress Cove при сравнимой тактовой частоте. Напомню, что при переходе от архитектуры Skylake до Cypress Cove был аналогичный прирост производительности. Intel явно набирает упущенное.
Процессоры Alder Lake
Процессоры Intel Core следующего поколения, под кодовым название Alder Lake, станут первыми высокопроизводительными гибридными процессорами Intel. В прошлом году были представлены гибридные процессоры Lakefield, но они имеют параметр с TDP 7 Вт и ориентированы только на ультрамобильные устройства.
Процессоры Alder Lake производятся по технологическому процессу Intel 7 и ими будут оснащаться как ультрапортативные ноутбуки, так и настольные ПК.
Процессоры для настольных ПК в сокетном исполнении получат до 16 ядер/24 потоков (8 P-core/8 E-core), до 30 МБ кэш-памяти L3, поддержку 16ти линий PCIe 5.0 и 4ех линий PCIe 4.0. А оперативная память будет поддерживаться вплоть до DDR5-4800. К сожалению, особенности работы контроллера памяти не были озвучены.
Так же будет два BGA-корпуса мобильных процессоров, отличающихся количеством ядер и реализацией портов ввода-вывода. Первый побольше до 14 ядер (6 P-core/8 E-core) и четырьмя Thunderbolt 4, а второй поменьше до 10 ядер (2 P-core/8 E-core) и двумя Thunderbolt 4. Мобильные процессоры Alder Lake получат более производительное графическое ядро до 96 исполнительных блоков на базе архитектуры Xe LP. Вероятно, если и будет прирост производительности графики относительно Tiger Lake, то он будет достигнут только за счет поддержки оперативной памяти нового поколения. Еще общего у мобильных решений – блок IPU, который служит для обработки на лету изображений с камеры.
Аппаратный планировщик Intel Thread Director
Технология Intel Thread Director должна развеять все сомнения по поводу эффективности гибридной компоновки Alder Lake, которая вызывает споры практически под каждой новостью о данных процессорах. Встроенная непосредственно в сам процессор, технология Intel Thread Director отслеживает низкоуровневую телеметрию о состоянии ядра и сочетании инструкций вычислительного потока, позволяя операционной системе размещать нужный поток в нужном ядре в нужное время. Технология Intel Thread Director является динамической и адаптивной, она подсказывает, что делать планировщику в реальном времени в соответствии с вычислительными нуждами, в отличие от статичной привязки потоков к ядрам по заданным правилам.
Это принципиально новых подход к планировщику нагрузки, ведь ранее распределением нагрузки по ядрам занимался планировщик ОС. Сейчас же, благодаря детализированной телеметрии микроархитектуры, процессор сам понимает как лучше распределить нагрузку. Однако уточнялось, что из-за оптимизаций в Windows 11 достигается лучшая производительность.
Дискртеная графика Alchemist
За два дня до Architecture Day 2021 компания Intel объявила, что кодовым названием ее новой дискретной графики станет Alchemist, а видеокарты будут выходить под брендом Arc. Сегодня же нам поведали особенности новой графики. К счастью, архитектура Xe HPG значительно отличается от Xe LP, а видеокарты не станут просто масштабированными версиями интегрированной графики.
Ядра Xe-core имею 16 векторных и 16 матричных движков (называемыми XMX – Xe Matrix eXtensions), блоком трассировки лучей, кэшем и общей локальной памятью. Новая архитектура и технологический процесс принесли увеличение частоты в 1,5 раза и соотношения производительности на ватт в 1,5 раза по сравнению с микроархитектурой Xe LP. Кстати, производиться микрочипы графики будут на TSMC 6N (улучшенная версия 7нм технологического процесса).
Новая графика полностью совместима с DirectX 12 Ultimate, а так же имеет поддержку DirectX Raytracing (DXR) и Vulkan Ray Tracing. Вишенкой во время показа архитектуры новой графики стала технология XeSS суперсэмплинг на базе ИИ. Вероятно, что технология по своей реализации гораздо ближе к DLSS, чем к FSR.
Первые графические ускорители под кодовым названием Alchemist появятся на рынке в первом квартале 2022 года.
Процессоры Intel Xeon Scalable нового поколения
Процессоры Sapphire Rapids станут большим обновлением серверной платформы, ведь принесут новую архитектуру, новые технологии корпусировки и новые интерфейсы ввода-вывода в серверный сегмент. Sapphire Rapids оптимизированы для высокой производительности рабочих нагрузок с такими концепциями эластичных вычислений как облако, микросервисы и ИИ.
В основе Sapphire Rapids заложена модульная архитектура из четырех кристаллов, которые соединены при помощи технологии EMIB и сохраняют преимущества монолитного кристалла. Интересно, что каждый вычислительный поток имеет полный доступ ко всем ресурсам всех модулей, включая кэши, память и ввод-вывод. Так достигаются стабильно низкие задержки и высокая пропускная способность между всеми модулями микросхемы. Если Intel решились на EMIB в серверном сегменте, где крайне важны минимальные задержки и высокая скорость межсоединения, то интерфейс, действительно, должен быть быстрым.
Новые процессоры поддерживают передовые интерфейсы и технологии, например PCIe 5.0, CXL 1.1, DDR5 и HBM, а на уровне архитектуры реализована поддержка инструкций Intel®Advanced Matrix Extensions (AMX). Тестирование ранних образцов Sapphire Rapids показало, что оптимизированные внутренние микротесты матричного умножения работают в 7 раз быстрее с использованием новых инструкций набора Intel AMX по сравнению с использованием инструкций Intel AVX-512 VNNI, обеспечивая существенный прирост производительности при выполнении ИИ-задач обучения и вывода.
Процессор Sapphire Rapids производится по технологическому процессу Intel 7 и станет доступен в первой половине 2022 года.
Ponte Vecchio
Вершиной всего мероприятия и, я бы сказал вершиной инженерной мысли, стал ускоритель Ponte Vecchio на базе архитектуры Xe HPC. Иначе, как SiP (System in a Package) это не назвать.
Ponte Vecchio ориентирована на вычисления и данный продукт степпинга A0 обеспечивает производительность более 45 TFLOPS FP32, пропускную способность интерфейса памяти более 5 терабайт в секунду и пропускную способность подключения более 2 терабайт в секунду. Intel также продемонстрировала производительность инференса ResNet на уровне более 43 тысяч изображений в секунду и обучения ResNet на уровне более 3400 изображений в секунду. Оба показателя являются заявкой на ведущие позиции по производительности.
Данный ускоритель имеет невероятно сложную технологию корпусировки, ведь он состоит из 47 кристаллов и для их соединения применены технологии EMIB и Foveros. Более того, для производства тайлов Ponte Vecchio используются разные технологические процессоры и используются мощности как Intel, так и TSMC.
Ponte Vecchio проходит стадию валидации и уже поставляется в ограниченных пробных количествах заказчикам, а выпущен будет в 2022 году для рынков HPC и ИИ.
В финале мероприятия показали невероятно красивый блейд, из множества которых будет собран суперкомпьютер экзафлопсного уровня Aurora.
Итоги Architecture Day 2021
С каждым новым мероприятием в этом году Intel удивляет. В начале года была представлена стратегия IDM 2.0 и уже сейчас мы можем видеть ее плоды в виде рабочих экземпляров Ponte Vecchio, которые имеют невероятно сложную структуру и включают тайлы, произведенные на TSMC. При этом, Intel не отказывается от своего производства и таким путем идет к реализации такого масштабного проекта как Ponte Vecchio. На недавнем мероприятии была показана стратегия разработки новых технологических процессов. Сейчас показаны новые архитектуры основных продуктов Intel и, что приятно, озвученное соответствует ранее поставленным планам на предыдущем Architecture Day. Intel становится более открытой, амбициозной технологической компанией и это не может не радовать.