НОВОСТИ 

Intel комментирует планы на будущее

В понедельник 17-го марта 2008 Pat Gelsinger, старший вице-президент и генеральный менеджер Digital Enterprise Group, ознакомил прессу и аналитиков с грядущими изменениями в процессорах Intel, которые ожидаются в ближайшие годы. Главными темами были Tukwila, Dunnington, Nehalem, "Visual Computing" и Larrabee. Более подробные детали должны появиться на форуме разработчиков Intel (Intel Developer Forum - IDF) в ближайшие недели.

Гелсингер был краток, говоря о Tukwila - четырехъядерном чипе Itanium, который должен выйти в конце этого года. Новый процессор обладает суммарной кэш-памятью в 30 МБ, новым интерконнектом (QuickPath Interconnect - QPI) и сдвоенными встроенными контроллерами памяти. Intel считает, что новый процессор удвоит производительность поколения Itanium 9100. Хоть SGI и, в меньшей мере, HP и NEC используют Itanium для традиционных задач HPC, процессор на данный момент ориентируется на особо важные задачи, где недопустимы сбои. Гелсингер заметил, что серверы на базе Itanium продолжают вытеснять машины на базе процессоров Sparc и POWER.

Остальная часть брифинга фокусировалась на линейке процессоров Intel x86.

Dunnington, шестиядерный процессор Xeon, который должен появиться во второй половине 2008 года, является 45-nm последователем четырехъядерного процессора Tigerton. Как и его предшественник, Dunnington предназначен для многопроцессорных систем, т.е. содержащих четыре и более процессоров, и совместим по разъёму с платформой Caneland. По словам Гелсингера, шестиядерная конфигурация является компромиссом между стоимостью и производительностью, так как, по мнению создателей процессора, шесть ядер и большой кэш третьего уровня (16 МБ) позволяют достигнуть правильного баланса.

Наиболее примечательным из процессоров, которые Intel планирует представить в этом году, будет Nehalem, новая архитектура, которая введёт использование встроенных контроллеров памяти (IMCs) и интерконнекта QuickPath Interconnect в семейство x86. Это позволит Intel избавиться от устаревшего чипа Northbridge и шины front-side bus. Каждый процессор поддерживает две связи QPI на сокет, каждая из которых обеспечивает пропускную способность до 25.6 ГБ/сек. Nehalem поставит Intel на один уровень с AMD, и впервые позволит процессорам Xeon достигнуть уровня масштабируемости и продуктивности работы с памятью, который ассоциировался с их конкурентами, процессорами Opteron.

В Nehalem расположенный на чипе контроллер памяти DDR3 поддерживает до трёх DIMM на канал для каждого процессора. Согласно Intel, это увеличит скорость обмена с памятью в четыре раза и сократит приблизительно вдвое её латентность по сравнению с Penryn.

Процессоры Nehalem будут содержать от 2 до 8 ядер и будут модульными. Идея состоит в том, чтобы иметь возможность набирать по необходимости базовые элементы (ядра х86, кэш, интегрированные контроллеры памяти, интерконнект и встроенные графические элементы), что даёт больше гибкости в построении различных конфигураций процессоров для различных рынков. Nehalem также предусматривает постоянный мультитрединг (2 нити на ядро), включает в себя разделяемый кэш третьего уровня, использует динамичной управление питанием и использует новейшие обновления набора инструкций SSE. На уровне железа разработчики увеличили число микроопераций, которые могут производиться "на лету" на 33 процента, улучшили алгоритмы кэширования для более быстрого выборочного доступа, ускорили примитивы синхронизации, улучшили предсказание ветвления и добавили двухуровневую иерархию TLB.

Принимая это все во внимание, очевидно, Nehalem представляет собой самое большое архитектурное изменение, произведённое компанией в истории линейки х86. Первый продукт Nehalem, четырехъядерный процессор, должен быть представлен к концу этого года. В 2009, говорит Гелсингер, мы увидим версии с интегрированной графикой, большим числом ядер и различными конфигурациями памяти.

В конце 2009 компания планирует представить Westmere, 32-nm версию Nehalem. В 2010 году новая архитектура Sandy Bridge будет введена в технологии 32 nm. Она включит векторное расширение (Advanced Vector Extension - AVX) - 256-битное векторное расширение набора инструкций SSE для приложений с большим числом операций с плавающей точкой. Удваивая ширину вектора с нынешней 128-битной реализации SSE, Intel рассчитывает удвоить пиковую производительность на опреациях с плавающей точкой. Новыее примитивы работы с данными позволят таким операциям как, например, вычисление разреженных матриц, выполняться проще. Также был добавлен неразбиваемый синтаксис инструкций с тремя операндами для упрощения генерации кода и обеспечения больших возможностей компилятору для параллельной загрузки и вычислений. Новые инструкции нацелены на ускорение обработки мультимедийных данных и высокопроизводительный счёт технических вычислительных приложений. Гелсингер охарактеризовал технологию AVX как "SSE на стероидах".

Даже до того, как Sandy Bridge станет реальностью, Intel планирует выпустить Larrabee, семейство дискретных графических процессоров. Многоядерная архитектура позволит достичь терафлопов производительности - не так уж и много, учитывая, что последние GPU от AMD и NVidia уже достигли половины терафлопа на обычной точности. Первые демонстрации Larrabee планируются ближе к концу этого года, появление самих продуктов - в 2009-2010 годах.

Larrabee должна стать платформой для новой парадигмы Visual Computing Intel - модели для вычислений на GPU, сочетающей традиционную графическую функциональность с параллельной обработкой данных общего назначения.

Производитель позиционирует Larrabee как конкурента процессору IBM Cell и дискретным GPU платформам от AMD(ATI) и NVIDIA. Последние же уже разработали программируемые GPU, которые выполняют как традиционную графическую роль, так и способны выполнять вычисления более общего характера. За последний год обе компании разработали продукты для вычислений на базе GPU, которые ощутимо отличаются от их традиционных графических решений.

Intel приходится играть роль догоняющего, но заявляется, что у него есть уникальное преимущество. Larrabee будет базироваться на IA-ядрах, используя огромное количество готовых наработок для х86. Но Larrabee не будет чистым воплощением IA. Будет добавлен новый набор векторных инструкций, включающий векторные операции с памятью, условную и целочисленную арифметику, а также арифметику с плавающей точкой для того, чтобы предоставить приложениям доступ к SIMD-параллелизму. Гелсингер не прокомментировал связь между инструкциями AVX Sandy Bridge и векторными инструкциями Larrabee, однако, очевидно, нет особого смысла поддерживать две несвязанные векторные архитектуры.

Компания также планирует представить компиляторы Visual Computing, библиотеки и другие средства разработки для поддержки Larrabee. Стандартная поддержка графических API, DirectX и OpenGL также будет включена.

Развитием IA в GPU Intel решил обойти проблему поддержки сторонними разработчиками инструментария ещё одного совершенно нового набора инструкций, как было в случае с процессором Itanium. Будет ли проект Larrabee успешным или нет, неизвестно, но, по словам Гелсингера, за почти тридцать лет в этом бизнесе у него не было ни одной программы, которая бы вызывала больший энтузиазм у независимых поставщиков ПО.


© Лаборатория Параллельных информационных технологий НИВЦ МГУ