Суперкомпьютеры примеры. Самый мощный компьютер в мире. Список самых мощных компьютеров в мире

Время прочтения: 2 мин.

До сих пор человечество так и не достигло терриконов Марса, не изобрело эликсир молодости, авто еще не могут взмыть над землей, но есть несколько сфер, в которых мы все таки преуспели. Создание мощных суперкомпьютеров – именно такая сфера. Чтобы оценить мощность компьютера, нужно определить какой ключевой параметр отвечает за эту характеристику. Этим параметром является флопс — величина, которая показывает, сколько операций может выполнить ПК за одну секунду. Именно, на основании этой величины, наш журнал Большой Рейтинг и расставил самые мощные компьютеры в мире на 2017 год.

Мощность суперкомпьютера — 8,1 Пфлоп/сек

Этот компьютер хранит данные, которые отвечают за безопасность военной структуры Соединенных Штатов, также он отвечает за состояние готовности ядерной атаки, в случае необходимости. Два года назад эта машина была одной из самых мощных и дорогих в мире, но на сегодня Trinity вытеснили более новые аппараты. Система, на которой работает этот суперкомпьютер — Cray XC40, благодаря ей, аппарат и может «выдавать» такое количество операций в секунду.

Mira

Мощность суперкомпьютера – 8,6 Пфлоп/сек

Компания Cray выпустила еще один суперкомпьютер – Mira. Министерство энергетики США заказало выпуск этой машины, для координации своей работы. Сфера, в которой работает Mira – промышленность и развитие научно-исследовательского потенциала. В секунду этот суперкомпьютер может рассчитать 8,6 петафлопс.

Мощность суперкомпьютера – 10,5 Пфлоп/сек

Название этого аппарата сразу описывает мощность, японское слово «кей» (К) означает десять квадриллионов. Эта цифра почти точно описывать его производительную мощность – 10,5 петафлопс. «Фишкой» этого суперкомпьютера является его система охлаждения. Используют водное охлаждение, которое снижает потребление энергетических запасов и снижает показатели скорости компоновки.

Мощность суперкомпьютера – 13,6 Пфлоп/сек

Fujitsu – компания из страны Восходящего Солнца, не остановилась в работе, выпустив суперкомпьютер K Computer, они сразу же принялись за новый проект. Этим проектом стал суперкомпьютер Oakforest-Pacs, который относят к машинам нового поколения (поколение Knights landing). Его разработку заказали Токийский и Цукубский университеты. По первоначальному плану, память аппарата должна была быть 900 Тбайт, а производительность Oakforest-Pacs составляла бы 25 квадраллионов операций в секунду. Но при нехватке финансирования, не было доработано множество аспектов, поэтому мощность суперкомпьютера составила 13,6 петафлопс в секунду.

Cori

Мощность суперкомпьютера – 14 Пфлоп/сек

Еще в прошлом году Cori был на шестой строчке в списке самых мощных суперкомпьютеров в мире, но при сумасшедшей скорости развития технологий, он уступил одну позицию. Этот суперкомпьютер находится в Соединенных Штатах, в Национальной лаборатории имени Лоуренса и Беркли. Ученые из Швейцарии, с помощью Cori смогли разработать 45-кубитную квантовую вычислительную машину. Производственная мощность этого суперкомпьютера – 14 петафлопс в секунду.

Мощность суперкомпьютера – 17,2 Пфлоп/сек

Ученые со всего мира долго время сходились во мнении, что Sequoia – самый быстрый суперкомпьютер на планете. И это не просто так, ведь он способен произвести арифметические расчеты, на которые бы людям в количестве 6,7 млрд. понадобилось бы 320 лет, за одну секунду. Поистине, поражают размеры машины – она занимает более чем 390 квадратных метра и в ее состав входит 96 стоек. Шестнадцать тысяч триллионов операций или другими словами 17,2 петафлопс – производственная мощность этого суперкомпьютера.

Titan

Мощность суперкомпьютера – 17,6 Пфлоп/сек

Кроме того, что этот суперкомпьютер один из самых быстрых на планете, он еще и очень энергоэффективен. Показатель энергоэффективности составляет 2142,77 мегафлопс на Ватт энергии, необходимой для потребления. Причиной такой низкой энергопотребляемости является ускоритель Nvidia, который обеспечивает до 90% мощности, необходимой для вычислений. Кроме этого, ускоритель Nvidia значительно сократил площадь, которую занимал этот суперкомпьютер, теперь ему нужно всего лишь 404 квадратных метра.

Мощность суперкомпьютера – 19,6 Пфлоп/сек

Первый запуск этого аппарата состоялся в 2013 году, в Швейцарии, в городе Лугано. Сейчас геолокация этого суперкомпьютера – Швейцарский национальный центр суперкомпьютеров. Piz Daint – это сочетание всех лучших характеристик вышеперечисленных машин, у него очень высокий показатель энергоэффективности и он очень быстр в вычислениях. Только одна характеристика оставляет желать лучшего – габариты этого суперкомпьютера, он занимает 28 огромных стоек. Piz Daint способен работать с вычислительной мощностью 19,6 петафлопс в секунду.

Мощность суперкомпьютера – 33,9 Пфлоп/сек

Этот аппарат имеет романтическое название Tianhe, что с китайского, в переводе, значит «Млечный Путь». Tianhe-2 был самым быстрым компьютером в списке 500-ти самых быстрых и мощных суперкомпьютеров. Он может рассчитать 2507 арифметических операций, что в переводе на петафлопсы составит 33,9 Пфлоп/сек. Специализация, в которой используют этот компьютер – строительство, он рассчитывает операции связанные с застройкой и прокладкой дорог. Еще с первого запуска в 2013 году, этот компьютер не теряет свои позиции в списках, что доказывает, что это одна из лучших машин в мире.

Мощность суперкомпьютера – 93 Пфлоп/сек

Sunway TaihuLight – самый быстрый суперкомпьютер в мире, кроме своей огромной скорости вычислений, он славится еще и своими огромными габаритами – он занимает площадь более 1000 квадратных метров. Международная конференция 2016 года, которая проходила в Германии, признала этот суперкомпьютер самым быстрым в мире и он до сих пор не имеет серьезного конкурента в этом плане. Его скорость в три раза превышает показатели Tianhe-2, ближайший к нему суперкомпьютер в этом плане!

Технический прогресс не стоит на месте, он развивается с космической скоростью, влияет на множество аспектов человеческой жизни, имеет множество как позитивных, так и негативных сторон. Для человека сейчас доступной стала техника самых разных типов: компьютеры, роботы и приборы. Но главной целью любой аппаратуры является упрощение жизни человека, техника не должна стать бессмысленным развлечением, которое будет только тратить ваше время.

Суперкомпьютер Titan

На Марс люди так и не летают, рак еще не вылечили, от нефтяной зависимости не избавились. И все же существуют области, где человечество достигло невероятного прогресса за последние десятилетия. Вычислительная мощь компьютеров – как раз одна из них.

Два раза в год специалисты из Национальной лаборатории имени Лоуренса в Беркли и Университета Теннесси публикуют Top-500, в котором предлагают список самых производительных суперкомпьютеров мира.

Немного забегая вперед, предлагаем вам заранее попробовать на вкус эти цифры: производительность представителей первого десятка топа измеряется десятками квадриллионов флопс. Для сравнения: ЭНИАК, первый компьютер в истории, обладал мощностью в 500 флопс; сейчас средний персональный компьютер имеет мощность в сотни гигафлопс (миллиардов флопс), iPhone 6 обладает производительностью приблизительно в 172 гигафлопса, а игровая приставка PS4 – в 1,84 терафлопса (триллиона флопс).

Вооружившись последним «Топ-500» от ноября 2014 года, редакция Naked Science решила разобраться, что из себя представляют 10 самых мощных суперкомпьютеров мира, и для решения каких задач требуется столь грандиозная вычислительная мощь.

Местоположение: США
Производительность: 3,57 петафлопс
Теоретический максимум производительности: 6,13 петафлопс
Мощность: 1,4 МВт

Как и практически все современные суперкомпьютеры, включая каждый из представленных в данной статье, CS-Storm состоит из множества процессоров, объединенных в единую вычислительную сеть по принципу массово-параллельной архитектуры. В реальности эта система представляет собой множество стоек («шкафов») с электроникой (узлами, состоящими из многоядерных процессоров), которые образуют целые коридоры.

Cray CS-Storm – это целая серия суперкомпьютерных кластеров, однако один из них все же выделяется на фоне остальных. В частности, это загадочный CS-Storm, который использует правительство США для неизвестных целей и в неизвестном месте.

Известно лишь то, что американские чиновники купили крайне эффективный с точки зрения потребления энергии (2386 мегафлопс на 1 Ватт) CS-Storm с общим количеством ядер почти в 79 тысяч у американской компании Cray.

На сайте производителя, впрочем, сказано, что кластеры CS-Storm подходят для высокопроизводительных вычислений в области кибербезопасности, геопространственной разведки, распознавания образов, обработки сейсмических данных, рендеринга и машинного обучения. Где-то в этом ряду, вероятно, и обосновалось применение правительственного CS-Storm.

CRAY CS-STORM

9. Vulcan – Blue Gene/Q

Местоположение: США
Производительность: 4,29 петафлопс
Теоретический максимум производительности: 5,03 петафлопс
Мощность: 1,9 МВт

«Вулкан» разработан американской компанией IBM, относится к семейству Blue Gene и находится в Ливерморской национальной лаборатории имени Э. Лоуренса. Принадлежащий Министерству энергетики США суперкомпьютер состоит из 24 стоек. Функционировать кластер начал в 2013 году.

В отличие уже упомянутого CS-Storm, сфера применения «Вулкана» хорошо известна – это различные научные исследования, в том числе в области энергетики, вроде моделирования природных явлений и анализа большого количества данных.

Различные научные группы и компании могут получить доступ к суперкомпьютеру по заявке, которую нужно отправить в Центр инноваций в области высокопроизводительных вычислений (HPC Innovation Centre), базирующийся в той же Ливерморской национальной лаборатории.

Суперкомпьютер Vulcan

8. Juqueen – Blue Gene/Q

Местоположение: Германия
Производительность: 5 петафлопс
Теоретический максимум производительности: 5,87 петафлопс
Мощность: 2,3 МВт

С момента запуска в 2012 году Juqueen является вторым по мощности суперкомпьютером в Европе и первым – в Германии. Как и «Вулкан», этот суперкомпьютерный кластер разработан компанией IBM в рамках проекта Blue Gene, причем относится к тому же поколению Q.

Находится суперкомпьютер в одном из крупнейших исследовательских центров Европы в Юлихе. Используется соответственно – для высокопроизводительных вычислений в различных научных исследованиях.

Суперкомпьютер Juqueen

7. Stampede – PowerEdge C8220

Местоположение: США
Производительность: 5,16 петафлопс
Теоретический максимум производительности: 8,52 петафлопс
Мощность: 4,5 МВт

Находящийся в Техасе Stampede является единственным в первой десятке Top-500 кластером, который был разработан американской компанией Dell. Суперкомпьютер состоит из 160 стоек.

Этот суперкомпьютер является мощнейшим в мире среди тех, которые применяются исключительно в исследовательских целях. Доступ к мощностям Stampede открыт научным группам. Используется кластер в самом широком спектре научных областей – от точнейшей томографии человеческого мозга и предсказания землетрясений до выявления паттернов в музыке и языковых конструкциях.

Суперкомпьютер Stampede

6. Piz Daint – Cray XC30

Местоположение: Швейцария
Производительность: 6,27 петафлопс
Теоретический максимум производительности: 7,78 петафлопс
Мощность: 2,3 МВт

Швейцарский национальный суперкомпьютерный центр (CSCS) может похвастаться мощнейшим суперкомпьютером в Европе. Piz Daint, названный так в честь альпийской горы, был разработан компанией Cray и принадлежит к семейству XC30, в рамках которого является наиболее производительным.

Piz Daint применяется для различных исследовательских целей, вроде компьютерного моделирования в области физики высоких энергий.

Суперкомпьютер Piz Daint

5. Mira – Blue Gene/Q

Местоположение: США
Производительность: 8,56 петафлопс
Теоретический максимум производительности: 10,06 петафлопс
Мощность: 3,9 МВт

Суперкомпьютер «Мира» был разработан компанией IBM в рамках проекта Blue Gene в 2012 году. Отделение высокопроизводительных вычислений Аргонской национальной лаборатории, в котором располагается кластер, было создано при помощи государственного финансирования. Считается, что рост интереса к суперкомпьютерным технологиям со стороны Вашингтона в конце 2000-х и начале 2010-х годов объясняется соперничеством в этой области с Китаем.

Расположенный на 48 стойках Mira используется в научных целях. К примеру, суперкомпьютер применяется для климатического и сейсмического моделирования, что позволяет получать более точные данные по предсказанию землетрясений и изменений климата.

Суперкомпьютер Mira

4. K Computer

Местоположение: Япония
Производительность: 10,51 петафлопс
Теоретический максимум производительности: 11,28 петафлопс
Мощность: 12,6 МВт

Разработанный компанией Fujitsu и расположенный в Институте физико-химических исследований в городе Кобе, K Сomputer является единственным японским суперкомпьютером, присутствующим в первой десятке Top-500.

В свое время (июнь 2011) этот кластер занял в рейтинге первую позицию, на один год став самым производительным компьютером в мире. А в ноябре 2011 года K Computer стал первым в истории, которому удалось достичь мощности выше 10 петафлопс.

Суперкомпьютер используется в ряде исследовательских задач. К примеру, для прогнозирования природных бедствий (что актуально для Японии из-за повышенной сейсмической активности региона и высокой уязвимости страны в случае цунами) и компьютерного моделирования в области медицины.

Суперкомпьютер K

3. Sequoia – Blue Gene/Q

Местоположение: США
Производительность: 17,17 петафлопс
Теоретический максимум производительности: 20,13 петафлопс
Мощность: 7,8 МВт

Мощнейший из четверки суперкомпьютеров семейства Blue Gene/Q, попавших в первую десятку рейтинга, расположен в США в Ливерморской национальной лаборатории. IBM разработали Sequoia для Национальной администрации ядерной безопасности (NNSA), которой требовался высокопроизводительный компьютер для вполне конкретной цели – моделирования ядерных взрывов.

Стоит упомянуть, что реальные ядерные испытания запрещены еще с 1963 года, и компьютерная симуляция является одним из наиболее приемлемых вариантов для продолжения исследований в этой области.

Однако мощности суперкомпьютера использовались для решения и других, куда более благородных задач. К примеру, кластеру удалось поставить рекорды производительности в космологическом моделировании, а также при создании электрофизиологической модели человеческого сердца.

Суперкомпьютер Sequoia

2. Titan – Cray XK7

Местоположение: США
Производительность: 17,59 петафлопс
Теоретический максимум производительности: 27,11 петафлопс
Мощность: 8,2 МВт

Наиболее производительный из когда-либо созданных на Западе суперкомпьютеров, а также самый мощный компьютерный кластер под маркой компании Cray, находится в США в Национальной лаборатории Оук-Ридж. Несмотря на то, что находящийся в распоряжении американского Министерства энергетики суперкомпьютер официально доступен для любых научных исследований, в октябре 2012 года, когда Titan был запущен, количество заявок превысило всякие пределы.

Из-за этого в Оукриджской лаборатории была созвана специальная комиссия, которая из 50 заявок отобрала лишь 6 наиболее «передовых» проектов. Среди них, к примеру, моделирование поведения нейтронов в самом сердце ядерного реактора, а также прогнозирование глобальных климатических изменений на ближайшие 1-5 лет.

Несмотря на свою вычислительную мощь и впечатляющие габариты (404 квадратных метра), Titan недолго продержался на пьедестале. Уже через полгода после триумфа в ноябре 2012 года гордость американцев в области высокопроизводительных вычислений неожиданно потеснил выходец с Востока, беспрецедентно обогнав предыдущих лидеров рейтинга.

Суперкомпьютер Titan

1. Tianhe-2 / Млечный путь-2

Местоположение: Китай
Производительность: 33,86 петафлопс
Теоретический максимум производительности: 54,9 петафлопс
Мощность: 17,6 МВт

С момента своего первого запуска «Тяньхэ-2», или «Млечный-путь-2», вот уже около двух лет является лидером Top-500. Этот монстр почти в два раза превосходит по производительности №2 в рейтинге – суперкомпьютер TITAN.

Разработанный Оборонным научно-техническим университетом Народно-освободительной армии КНР и компанией Inspur, «Тяньхэ-2» состоит из 16 тысяч узлов с общим количеством ядер в 3,12 миллиона. Оперативная память всей это колоссальной конструкции, занимающей 720 квадратных метров, составляет 1,4 петабайт, а запоминающего устройства – 12,4 петабайт.

«Млечный путь-2» был сконструирован по инициативе китайского правительства, поэтому нет ничего удивительного в том, что его беспрецедентная мощь служит, судя по всему, нуждам государства. Официально было заявлено, что суперкомпьютер занимается различными моделированиями, анализом огромного количества данных, а также обеспечением государственной безопасности Китая.

Учитывая секретность, свойственную военным проектам КНР, остается лишь догадываться, какое именно применение время от времени получает «Млечный путь-2» в руках китайской армии.

Суперкомпьютер Tianhe-2

Суперкомпютер (англ. supercomput er, СуперЭВМ) вычислительная машина, значительно превосходящая по своим техническим параметрам большинство существующих компьютеров. Как правило, современные суперкомпьютеры представляют собой большое число высокопроизводительных серверных компьютеров, соединённых друг с другом локальной высокоскоростной магистралью для достижения максимальной производительности в рамках подхода распараллеливания вычислительной задачи.. Супер-ЭВМ в Мюнхенском техническом университете. Супер- ЭВМ второго поколения,находящийся в ВНИИЭФ

1. Максимальная арифметическая производительность процессора; 2. эффективность работы операционной системы и удобство общения с ней для программиста; 3. Эффективность трансляции с языков высокого уровня и исключение написания программ на автокоде; 4. Эффективность распараллеливания алгоритмов для параллельных архитектур; 5. Повышение надежности.

Параллельная обработка. Если некое устройство выполняет одну операцию за единицу времени, то тысячу операций оно выполнит за тысячу единиц. Если предположить, что есть пять таких же независимых устройств, способных работать одновременно, то ту же тысячу операций система из пяти устройств может выполнить уже не за тысячу, а за двести единиц времени. Конвейерная обработка. Целое множество мелких операций таких, как сравнение порядков, выравнивание порядков, сложение мантисс, нормализация и т.п. Процессоры первых компьютеров выполняли все эти "микрооперации" для каждой пары аргументов последовательно одна за одной до тех пор, пока не доходили до окончательного результата, и лишь после этого переходили к обработке следующей пары слагаемых. Все самые первые компьютеры (EDSAC, EDVAC, UNIVAC) имели разрядно- последовательную память, из которой слова считывались последовательно бит за битом. Иерархия памяти. Иерархия памяти прямого отношения к параллелизму не имеет, однако, безусловно, относится к тем особенностям архитектуры компьютеров, которые имеет огромное значение для повышения их производительности (сглаживание разницы между скоростью работы процессора и временем выборки из памяти). Основные уровни: регистры, кэш- память, оперативная память, дисковая память. Время выборки по уровням памяти от дисковой памяти к регистрам уменьшается, стоимость в пересчете на 1 слово (байт) растет. В настоящее время, подобная иерархия поддерживается даже на персональных компьютерах.

Наиболее распространёнными программными средствами суперкомпьютеров, также как и параллельных или распределённых компьютерных систем являются интерфейс программирования приложений (API) на основе MPI и PVM, и решения на базе открытого программного обеспечения, наподобие Beowulf и openMosix, позволяющего создавать виртуальные суперкомпьютеры даже на базе обыкновенных рабочих станций и персональных компьютеров. Для быстрого подключения новых вычислительных узлов в состав узкоспециализированных кластеров применяются технологии наподобие ZeroConf. Примером может служить реализация рендеринга в программном обеспечении Shake, распространяемом компанией Apple. Для объединения ресурсов компьютеров, выполняющих программу Shake, достаточно разместить их в общем сегменте локальной вычислительной сети. В настоящее время границы между суперкомпьютерным и общеупотребимым программным обеспечением сильно размыты и продолжают размываться ещё более вместе с проникновением технологий параллелизации и многоядерности в процессорные устройства персональных компьютеров и рабочих станций. Исключительно суперкомпьютерным программным обеспечением сегодня можно назвать лишь специализированные программные средства для управления и мониторинга конкретных типов компьютеров, а также уникальные программные среды, создаваемые в вычислительных центрах под «собственные», уникальные конфигурации суперкомпьютерных систем

К первому классу (последовательные компьютеры фон Неймана) принадлежат обычные скалярные однопроцессорные системы: одиночный поток команд - одиночный поток данных (SISD). Персональный компьютер имеет архитектуру SISD, причем не важно, используются ли в ПК конвейеры для ускорения выполнения операций. Второй класс характеризуется наличием одиночного потока команд, но множественного потока данных (SIMD). К этому архитектурному классу принадлежат однопроцессорные векторные или, точнее говоря, векторно-конвейерные суперкомпьютеры. Они также имеют векторные команды и реализуют векторную обработку, но не посредством конвейеров, как в векторных суперкомпьютерах, а с помощью матриц процессоров. К третьему классу - MIMD - относятся системы, имеющие множественный поток команд и множественный поток данных. К нему принадлежат не только многопроцессорные векторные суперЭВМ, но и вообще все многопроцессорные компьютеры. Подавляющее большинство современных суперЭВМ имеют архитектуру MIMD. Четвертый класс в систематике Флинна, MISD, не представляет практического интереса. В последнее время в литературе часто используется также термин SPMD (одна программа - множественные данные). Он относится не к архитектуре компьютеров, а к модели распараллеливания программ и не является расширением систематики Флинна. SPMD обычно относится к MPP (т.е. MIMD) - системам и означает, что несколько копий одной программы.

Андрей Борзенко

Суперкомпьютерами называют самые быстрые компьютеры. Их основное отличие от мэйнфреймов состоит в следующем: все ресурсы такого компьютера обычно направлены на то, чтобы решить одну или в крайнем случае несколько задач насколько возможно быстро, тогда как мэйнфреймы, как правило, выполняют довольно большое число задач, конкурирующих друг с другом. Бурное развитие компьютерной индустрии определяет относительность базового понятия - то, что десять лет назад можно было назвать суперкомпьютером, сегодня под это определение уже не подпадает. Существует и такое шутливое определение суперкомпьютера - это устройство, сводящее проблему вычислений к проблеме ввода-вывода. Впрочем, и в нем есть доля истины: часто единственным узким местом в быстродействующей системе остаются именно устройства ввода-вывода. Узнать, какие суперкомпьютеры в настоящее время имеют максимальную производительность, можно из официального списка пятисот самых мощных систем мира - Top500 (http://www.top500.org), который публикуется два раза в год.

В любом компьютере все основные параметры тесно связаны. Трудно себе представить универсальный компьютер, имеющий высокое быстродействие и мизерную оперативную память либо огромную оперативную память и небольшой объем дисков. По этой причине и суперкомпьютеры характеризуются в настоящее время не только максимальной производительностью, но и максимальным объемом оперативной и дисковой памяти. Обеспечение таких технических характеристик обходится довольно дорого - стоимость суперкомпьютеров чрезвычайно высока. Какие же задачи настолько важны, что требуют систем стоимостью в десятки и сотни миллионов долларов? Как правило, это фундаментальные научные или инженерные вычислительные задачи с широкой областью применения, эффективное решение которых возможно только при наличии мощных вычислительных ресурсов. Вот лишь некоторые области, где возникают задачи подобного рода:

предсказания погоды, климата и глобальных изменений в атмосфере;
науки о материалах;·
построение полупроводниковых приборов;
сверхпроводимость;
структурная биология;
разработка фармацевтических препаратов;
генетика человека;
квантовая хромодинамика;
астрономия;
автомобилестроение;
транспортные задачи;
гидро- и газодинамика;
управляемый термоядерный синтез;
эффективность систем сгорания топлива;
разведка нефти и газа;
вычислительные задачи в науках о Мировом океане;
распознавание и синтез речи;
распознавание изображений.

Суперкомпьютеры считают очень быстро благодаря не только использованию самой современной элементной базы, но и новым решениям в архитектуре систем. Основное место здесь занимает принцип параллельной обработки данных, воплощающий идею одновременного (параллельного) выполнения нескольких действий. Параллельная обработка имеет две разновидности: конвейерность и собственно параллельность. Суть конвейерной обработки заключается в том, чтобы выделить отдельные этапы выполнения общей операции, причем каждый этап, выполнив свою работу, передает результат следующему, одновременно принимая новую порцию входных данных. Очевидный выигрыш в скорости обработки получается за счет совмещения прежде разнесенных во времени операций.

Если некое устройство выполняет одну операцию за единицу времени, то тысячу операций оно выполнит за тысячу единиц. Если имеется пять таких же независимых устройств, способных работать одновременно, то ту же тысячу операций система из пяти устройств может выполнить уже не за тысячу, а за двести единиц времени. Аналогично система из N устройств ту же работу выполнит за 1000/N единиц времени.

Конечно, сегодня параллелизмом в архитектуре компьютеров уже мало кого удивишь. Все современные микропроцессоры используют тот или иной вид параллельной обработки даже в рамках одного кристалла. Вместе с тем сами эти идеи появились очень давно. Изначально они внедрялись в самых передовых, а потому единичных компьютерах своего времени. Здесь особая заслуга принадлежит компаниям IBM и Control Data Corporation (CDC). Речь идет о таких нововведениях, как разрядно-параллельная память, разрядно-параллельная арифметика, независимые процессоры ввода-вывода, конвейер команд, конвейерные независимые функциональные устройства и т. д.

Обычно слово "суперкомпьютер" ассоциируется с компьютерами марки Cray, хотя сегодня это уже далеко не так. Разработчиком и главным конструктором первого суперкомпьютера был Сеймур Крэй - один из самых легендарных личностей в компьютерной отрасли. В 1972 г. он уходит из компании CDC и основывает собственную компанию Cray Research. Первый суперкомпьютер CRAY-1 был разработан через четыре года (в 1976 г.) и имел векторно-конвейерную архитектуру с 12 конвейерными функциональными устройствами. Пиковая производительность Cray-1 составляла 160 млн операций/с (время такта 12,5 нс), а цикл 64-разрядной оперативной памяти (которая могла расширяться до 8 Мбайт) занимал 50 нс. Главным новшеством было, конечно, введение векторных команд, работающих с целыми массивами независимых данных и позволяющих эффективно использовать конвейерные функциональные устройства.

На протяжении 60-80-х годов внимание мировых лидеров по производству суперкомпьютеров было сосредоточено на изготовлении вычислительных систем, хорошо справляющихся с решением задач на большие объемы вычислений с плавающей точкой. Недостатка в таких задачах не ощущалось - почти все они были связаны с ядерными исследованиями и аэрокосмическим моделированием и велись в интересах военных. Стремление достичь максимальной производительности в самые сжатые сроки означало, что критерием оценки качества системы была не ее цена, а быстродействие. Например, суперкомпьютер Cray-1 стоил тогда от 4 до 11 млн долл. в зависимости от комплектации.

В процессе настройки системы.

На рубеже 80-90-х гг. закончилась "холодная" война и на смену военным заказам пришли коммерческие. К тому времени промышленность достигла больших успехов в производстве серийных процессоров. Они обладали примерно той же вычислительной мощностью, что и заказные, но были значительно дешевле. Использование стандартных комплектующих и изменяемое количество процессоров позволило решить проблему масштабируемости. Теперь с увеличением вычислительной нагрузки можно было повышать производительность суперкомпьютера и его периферийных устройств, добавляя новые процессоры и устройства ввода-вывода. Так, в 1990 г. появился суперкомпьютер Intel iPSC/860 с числом процессоров, равным 128, который показал на тесте LINPACK производительность 2,6 Гфлопс.

В ноябре прошлого года была опубликована 18-я редакция списка 500 мощнейших компьютеров мира - Top500. Лидером списка по-прежнему остается корпорация IBM (http://www.ibm.com), которой принадлежит 32% установленных систем и 37% от общей производительности. Интересной новостью стало появление Hewlett-Packard на втором месте по количеству систем (30%). При этом, поскольку все эти системы относительно невелики, то их суммарная производительность составляет всего 15% от всего списка. Ожидается, что после слияния с Compaq обновленная компания займет доминирующее положение в этом списке. Далее по количеству компьютеров в списке идут SGI, Cray и Sun Microsystems.

Самым мощным суперкомпьютером мира оставалась по-прежнему система ASCI White (к ней мы еще вернемся), установленная в Ливерморской лаборатории (США) и показавшая производительность 7,2 Тфлопс на тесте LINPACK (58% от пиковой производительности). На втором месте стояла система Compaq AlphaServer SC, установленная в Питтсбургском суперкомпьютерном центре с производительностью в 4 Тфлопс. Замыкает список система Cray T3E с производительностью на LINPACK в 94 Гфлопс.

Стоит отметить, что список включал уже 16 систем с производительностью более 1 Тфлопс, половина из которых установлены IBM. Стабильно увеличивается число систем, представляющих собой кластеры из небольших SMP-блоков, - сейчас в списке уже 43 такие системы. Однако большинство в списке по-прежнему за массивно-параллельными системами (50%), за которыми идут кластеры, состоящие из больших SMP-систем (29%).

Типы архитектур

Основной параметр классификации параллельных компьютеров - наличие общей или распределенной памяти. Нечто среднее представляют собой архитектуры, где память физически распределена, но логически общедоступна. С аппаратной точки зрения для реализации параллельных систем напрашиваются две основные схемы. Первая - несколько отдельных систем, с локальной памятью и процессорами, взаимодействующих в какой-либо среде посредством посылки сообщений. Вторая - системы, взаимодействующие через разделяемую память. Не вдаваясь пока в технические детали, скажем несколько слов о типах архитектур современных суперкомпьютеров.

Идея массивно-параллельных систем с распределенной памятью (Massively Parallel Processing, MPP) довольно проста. Для этой цели берутся обычные микропроцессоры, каждый из которых снабжают своей локальной памятью и соединяют посредством некоей коммутационной среды. Достоинств у такой архитектуры много. Если нужна высокая производительность, то можно добавить еще процессоров, а если ограничены финансы или заранее известна требуемая вычислительная мощность, то легко подобрать оптимальную конфигурацию. Однако у MPP есть и недостатки. Дело в том, что взаимодействие между процессорами идет намного медленнее, чем обработка данных самими процессорами.

У параллельных компьютеров с общей памятью вся оперативная память разделяется между несколькими одинаковыми процессорами. Это снимает проблемы предыдущего класса, но добавляет новые. Дело в том, что число процессоров, имеющих доступ к общей памяти, по чисто техническим причинам нельзя сделать большим.

Основные особенности векторно-конвейерных компьютеров - это, конечно, конвейерные функциональные устройства и набор векторных команд. В отличие от традиционного подхода векторные команды оперируют целыми массивами независимых данных, что позволяет эффективно загружать доступные конвейеры.

Последнее направление, строго говоря, не является самостоятельным, а скорее представляет собой комбинации предыдущих трех. Из нескольких процессоров (традиционных или векторно-конвейерных) и общей для них памяти формируется вычислительный узел. Если полученной вычислительной мощности недостаточно, то объединяют несколько узлов высокоскоростными каналами. Как известно, подобную архитектуру называют кластерной.

MPP-системы

Массово-параллельные масштабируемые системы предназначены для решения прикладных задач, требующих большого объема вычислений и обработки данных. Рассмотрим их подробнее. Как правило, они состоят из однородных вычислительных узлов, включающих:

один или несколько центральных процессоров;
локальную память (прямой доступ к памяти других узлов невозможен);
коммуникационный процессор или сетевой адаптер;
иногда накопители на жестких дисках и/или другие устройства ввода-вывода.

Кроме того, в систему могут быть добавлены специальные узлы ввода-вывода и управляющие узлы. Все они связаны через некоторую коммуникационную среду (высокоскоростная сеть, коммутатор и т. п.). Что касается ОС, то здесь есть два варианта. В первом случае полноценная ОС работает только на управляющей машине, тогда как на каждом узле работает сильно урезанный вариант ОС, обеспечивающий только работу расположенной в нем ветви параллельного приложения. В другом случае на каждом узле работает полноценная UNIX-подобная ОС.

Число процессоров в системах с распределенной памятью теоретически ничем не ограничено. С помощью подобных архитектур можно строить масштабируемые системы, производительность которых растет линейно с увеличением числа процессоров. Кстати, сам термин "массивно-параллельные системы" применяется обычно для обозначения таких масштабируемых компьютеров с большим числом (десятки и сотни) узлов. Масштабируемость вычислительной системы необходима для пропорционального ускорения вычислений, но ее, увы, недостаточно. Чтобы получить адекватный выигрыш при решении задачи, требуется еще и масштабируемый алгоритм, способный загрузить полезными вычислениями все процессоры суперкомпьютера.

Напомним, что существуют две модели выполнения программ на многопроцессорных системах: SIMD (single instruction stream - multiple data streams) и MIMD (multiple instructions streams - multiple data streams). Первая предполагает, что все процессоры выполняют одну и ту же команду, но каждый над своими данными. Во второй каждый процессор обрабатывает свой поток команд.

В системах с распределенной памятью для пересылки информации от процессора к процессору необходим механизм передачи сообщений по сети, связывающей вычислительные узлы. Чтобы абстрагироваться от подробностей функционирования коммуникационной аппаратуры и программировать на высоком уровне, обычно пользуются библиотеками передачи сообщений.

Суперкомпьютеры Intel

Корпорация Intel (http://www.intel.com) хорошо известна в мире суперкомпьютеров. Ее многопроцессорные компьютеры Paragon с распределенной памятью стали такой же классикой, как векторно-конвейерные компьютеры от Cray Research.

Intel Paragon использует в одном узле пять процессоров i860 ХР с тактовой частотой 50 МГц. Иногда в один узел помещают процессоры разных типов: скалярный, векторный и коммуникационный. Последний служит для того, чтобы разгрузить основной процессор от выполнения операций, связанных с передачей сообщений.

Самая существенная характеристика новой параллельной архитектуры - тип коммуникационного оборудования. Именно от него зависят два наиболее важных показателя работы суперкомпьютера - скорость передачи данных между процессорами и накладные расходы на передачу одного сообщения.

Межсоединение сконструировано таким образом, чтобы обеспечить высокую скорость обмена сообщениями при минимальной задержке. Оно обеспечивает соединение более тысячи гетерогенных узлов по топологии двухмерной прямоугольной решетки. Однако при разработке большинства приложений можно считать, что любой узел непосредственно связан со всеми другими узлами. Межсоединение масштабируемо: его пропускная способность возрастает с увеличением числа узлов. При конструировании разработчики стремились минимизировать участие в передаче сообщений тех процессоров, которые выполняют пользовательские процессы. С этой целью введены специальные процессоры обработки сообщений, которые располагаются на плате узла и отвечают за отработку протокола обмена сообщениями. В результате основные процессоры узлов не отвлекаются от решения задачи. В частности, не происходит достаточно дорогостоящего переключения с задачи на задачу, а решение прикладных задач идет параллельно с обменом сообщениями.

Собственно передача сообщений осуществляется системой маршрутизации, основанной на компонентах маршрутизатора узлов сети (Mesh Router Components, MRC). Для доступа MRC данного узла к его памяти в узле имеется еще специальный интерфейсный сетевой контроллер, который представляет собой заказную СБИС, обеспечивающую одновременную передачу в память узла и обратно, а также отслеживающую ошибки при передаче сообщений.

Модульное строение Intel Paragon способствует не только поддержанию масштабируемости. Оно позволяет рассчитывать на то, что данная архитектура послужит основой для новых компьютеров, базирующихся на иных микропроцессорах или использующих новые технологии обмена сообщениями. Масштабируемость опирается также на сбалансированность различных блоков суперкомпьютера на самых разных уровнях; в противном случае с ростом числа узлов где-либо в системе может появиться узкое место. Так, скорость и емкость памяти узлов балансируются с пропускной способностью и задержками межсоединения, а производительность процессоров внутри узлов - с пропускной способностью кэш-памяти и оперативной памяти и т. д.

До недавнего времени одним из самых быстродействующих компьютеров был Intel ASCI Red - детище ускоренной стратегической компьютерной инициативы ASCI (Accelerated Strategic Computing Initiative). В этой программе участвуют три крупнейшие национальные лаборатории США (Ливерморская, Лос-Аламосская и Sandia). Построенный по заказу Министерства энергетики США в 1997 г., ASCI Red объединяет 9152 процессора Pentium Pro, имеет 600 Гбайт суммарной оперативной памяти и общую производительность 1800 млрд операций в секунду.

Суперкомпьютеры IBM

Когда на компьютерном рынке появились универсальные системы с масштабируемой параллельной архитектурой SP (Scalable POWER parallel) корпорации IBM (http://www.ibm.com), они достаточно быстро завоевали популярность. Сегодня подобные системы работают в различных прикладных областях - таких, как вычислительная химия, анализ аварий, проектирование электронных схем, сейсмический анализ, моделирование водохранилищ, поддержка систем принятия решений, анализ данных и оперативная обработка транзакций. Успех систем SP определяется прежде всего их универсальностью, а также гибкостью архитектуры, базирующейся на модели распределенной памяти с передачей сообщений.

Вообще говоря, суперкомпьютер SP - это масштабируемая массивно-параллельная вычислительная система общего назначения, представляющая собой набор базовых станций RS/6000, соединенных высокопроизводительным коммутатором. Действительно, кому не известен, например, суперкомпьютер Deep Blue, который сумел обыграть в шахматы Гарри Каспарова? А ведь одна из его модификаций состоит из 32 узлов (IBM RS/6000 SP), базирующихся на 256 процессорах P2SC (Power Two Super Chip).

Семейство RS/6000 - это второе поколение компьютеров IBM, основанное на архитектуре с ограниченным набором команд (RISC), разработанной корпорацией в конце 70-х годов. Благодаря этой концепции для выполнения всей работы в компьютерной системе используется очень простой набор команд. Поскольку команды просты, они могут исполняться с очень высокой скоростью а также обеспечивают более эффективную реализацию исполняемой программы. Семейство RS/6000 основано на архитектуре POWER (архитектура с производительностью, оптимизированной за счет применения модернизированного RISC) и ее производных - PowerPC, P2SC, POWER3 и т. д. Поскольку архитектура POWER сочетает концепции архитектуры RISC с некоторыми более традиционными концепциями, в результате получается система с оптимальной общей производительностью.

Система RS/6000 SP предоставляет мощность нескольких процессоров для решения самых сложных вычислительных задач. Система коммутации SP - это новейшая разработка IBM в области широкополосной межпроцессорной связи без задержек для эффективных параллельных вычислений. Несколько разновидностей узлов процессора, изменяемые размеры фрейма (стойки) и разнообразные дополнительные возможности ввода-вывода обеспечивают подбор наиболее подходящей конфигурации системы. SP поддерживается лидирующими производителями ПО в таких областях, как параллельные базы данных и обработка транзакций в реальном времени, а также основными производителями технического ПО в таких областях, как обработка сейсмических данных и инженерное конструирование.

IBM RS/6000 SP расширяет возможности приложений благодаря параллельной обработке. Система снимает ограничения по производительности, помогает избежать проблем, связанных с масштабированием и присутствием неделимых, отдельно выполняемых фрагментов. Установленные по всему миру более чем у тысячи клиентов, SP предлагают решения для сложных и объемных технических и коммерческих приложений.

Основной блок SP - это процессорный узел, который имеет архитектуру рабочих станций RS/6000. Существует несколько типов SP-узлов: Thin, Wide, High, отличающихся рядом технических параметров. Так, например, High-узлы на базе POWER3-II включают до 16 процессоров и до 64 Гбайт памяти, а вот Thin-узлы допускают не более 4 процессоров и 16 Гбайт памяти.

Система масштабируется до 512 узлов, при этом возможно совмещение узлов различных типов. Узлы устанавливаются в стойки (до 16 узлов в каждой). SP может практически линейно масштабировать диски вместе с процессорами и памятью, что позволяет получать реальный доступ к терабайтам памяти. Такое увеличение мощности упрощает наращивание и расширение системы.

Узлы связаны между собой высокопроизводительным коммутатором (IBM high-performance switch), который имеет многостадийную структуру и работает с коммутацией пакетов.

Каждый узел SP работает под управлением полноценной ОС AIX, благодаря чему можно использовать тысячи уже существующих приложений для этой ОС. Кроме того, узлы системы можно объединять в группы. К примеру, несколько узлов могут выполнять роль серверов Lotus Notes, в то время как все остальные - обрабатывать параллельную базу данных.

Управление большими системами - это всегда сложная задача. SP использует для этих целей одну графическую консоль, на которой отображаются состояния аппаратного и программного обеспечения, выполняемые задачи и информация о пользователях. Системный администратор при помощи такой консоли (управляющей рабочей станции) и прилагаемого к SP программного продукта PSSP (Parallel Systems Support Programs) решает задачи управления, в том числе управления защитой паролями и полномочиями пользователей, учета выполняемых задач, управления печатью, системного мониторинга, запуска и выключения системы.

Самые-самые

Как уже отмечалось, согласно Top500 (таблица), самый мощный суперкомпьютер современности - ASCI White, занимающий площадь размером в две баскетбольные площадки и установленный в Ливерморской национальной лаборатории. Он включает 512 SMP-узлов на базе 64-разрядных процессоров POWER3-II (в общей сложности 8192 процессора) и использует новую коммуникационную технологию Colony с пропускной способностью около 500 Мбайт/с, что почти в четыре раза быстрее коммутатора SP high-performance switch.

Суперкомпьютер ASCI White.

Первая десятка Top500 (18-я редакция)

Позиция	Производитель	Компьютер	Где установлен	Страна	Год	Число процес-соров
1	IBM	ASCI White		США	2000	8192
2	Compaq	AlphaServer SC	Питтсбургский суперкомпью-терный центр	США	2001	3024
3	IBM	SP Power3	Институт исследований в области энергетики NERSC	США	2001	3328
4	Intel	ASCI Red	Национальная лаборатория Sandia	США	1999	9632
5	IBM	ASCI Blue Pacific	Ливерморская национальная лаборатория	США	1999	5808
6	Compaq	AlphaServer SC		США	2001	1536
7	Hitachi	SR8000/MPP	Токийский университет	Япония	2001	1152
8	SGI	ASCI Blue Mountain	Лос-Аламосская национальная лаборатория	США	1998	6144
9	IBM	SP Power3	Океанографи-ческий центр NAVOCEANO	США	2000	1336
10	IBM	SP Power3	Немецкая служба погоды	Германия	2001	1280

Архитектура нового суперкомпьютера основана на зарекомендовавшей себя массивно-параллельной архитектуре RS/6000 и обеспечивает производительность в 12,3 Тфлопс (триллионов операций в секунду). Система включает в общей сложности 8 Тбайт оперативной памяти, распределенной по 16-процессорным SMP-узлам, и 160 Тбайт дисковой памяти. Доставка системы из лабораторий IBM в штате Нью-Йорк в Ливермор (Калифорния) потребовалось 28 грузовиков-трейлеров.

Все узлы системы работают под управлением ОС AIX. Суперкомпьютер используется учеными Министерства энергетики США для расчета сложных трехмерных моделей с целью поддержания ядерного оружия в безопасном состоянии. Собственно ASCI White - это третий шаг в пятиступенчатой программе ASCI, которая планирует создание нового суперкомпьютера в 2004 г. Вообще говоря, ASCI White состоит из трех отдельных систем, среди которых самой большой является White (512 узлов, 8192 процессора), а есть еще Ice (28 узлов, 448 процессоров) и Frost (68 узлов, 1088 процессоров).

Предшественником ASCI White был суперкомпьютер Blue Pacific (другое название ASCI Blue), включающий 1464 четырехпроцессорных узла на базе кристаллов PowerPC 604e/332 МГц. Узлы связаны в единую систему с помощью кабелей общей длиной почти в пять миль, а площадь машинного зала составляет 8 тыс. квадратных футов. Система ASCI Blue состоит в общей сложности из 5856 процессоров и обеспечивает пиковую производительность в 3,88 Тфлопс. Суммарный объем оперативной памяти составляет 2,6 Тбайт.

Американский национальный центр по исследованию атмосферы (NCAR) выбрал IBM в качестве поставщика самого мощного в мире суперкомпьютера, предназначенного для прогнозирования климатических изменений. Система, известная под именем Blue Sky ("Синее небо"), после окончательного ввода в эксплуатацию в этом году на порядок увеличит возможности NCAR в области моделирования климата. Ядром Blue Sky станут суперкомпьютер IBM SP и системы IBM eServer p690, применение которых позволит добиться пиковой производительности почти в 7 Тфлопс при объеме дисковой подсистемы IBM SSA в 31,5 Тбайт.

Суперкомпьютер, получивший название "Синий шторм" (Blue Storm), создается по заказу Европейского центра среднесрочных прогнозов погоды (European Centre for Medium-Range Weather Forecasts - ECMWF). Blue Storm будет в два раза мощнее ASCI White. Для его создания необходимо 100 серверов IBM eServer p690, также известных как Regatta. Каждый системный блок размером с холодильник содержит более тысячи процессоров. В 2004 г. "Синий шторм" будет оснащен серверами нового поколения p960, которые сделают его еще в два раза мощнее. Суперкомпьютер будет работать под управлением ОС AIX. Первоначально общая емкость накопителей Blue Storm составит 1,5 петабайт, вычислительная мощь - около 23 Тфлопс. Система будет весить 130 т, а по мощи будет в 1700 раз превосходить шахматный суперкомпьютер Deep Blue.

Исследователи IBM совместно с Ливерморской национальной лабораторией ведут работы над компьютерами Blue Gene/L и Blue Gene/C. Эти компьютеры - часть начатого еще в 1999 г. с целью изучения белков 5-летнего проекта Blue Gene, в который было вложено 100 млн долл. Создание нового суперкомпьютера Blue Gene/L (200 Тфлоп) будет завершено в 2004 г. - на полгода-год раньше, чем ожидается завершение работ над более мощным компьютером Blue Gene/C (1000 Тфлоп). Проектная производительность Blue Gene/L будет, таким образом, превышать суммарную производительность 500 самых мощных компьютеров в мире. При этом новый суперкомпьютер занимает площадь, равную всего половине теннисного корта. Инженеры IBM поработали и над снижением потребления энергии - его удалось уменьшить в 15 раз.

Earth Simulator

По мнению журнала New Scientist, в новой, 19-й версии списка суперкомпьютеров Top500 на первое место выйдет суперкомпьютерная система для проекта Earth Simulator корпорации NEC. Она установлена в японском Институте наук о Земле (Yokohama Institute for Earth Sciences) в г. Канагава, префектура Йокогама. Разработчики утверждают, что ее пиковая производительность может достигать 40 Тфлопс.

Суперкомпьютер Earth Simulator предназначен для моделирования климатических изменений на основе данных, которые поступают со спутников. По утверждению представителей NEC, высокая производительность компьютера достигнута за счет использования специально разработанных векторных процессоров. Система базируется на 5120 таких процессорах, объединенных в 640 узлов SX-6 (по 8 процессоров в каждом). Суперкомпьютер работает под управлением ОС SUPER-UX. В числе средств разработки установлены компиляторы языков C/C++, Fortran 90 и HPF, а также средства автоматической векторизации, реализация интерфейса MPI-2 и математическая библиотека ASL/ES. Вся машина занимает площадь трех теннисных кортов (50x65 м) и использует несколько километров кабеля.

Пятый раз подряд китайский Tianhe-2 (Млечный путь 2) становиться самым быстрым суперкомпьютером в мире с производительностью 33.86 петафлопс или квадриллион операций с плавающей запятой в секунду. Таков вердикт списка самых мощных суперкомпьютеров TOP500, который выпускается дважды в год.

Несмотря на ожидаемый результат, в последнем издании все же есть немного интересной информации. Соединенные Штаты по-прежнему имеют больше систем в списке, чем любая другая страна - 233 машины (для сравнения полгода назад было 231, а год назад 265). Второе и третье места занимают системы из США, в то время как 141 машина из списка, размещена в Европе. Примечательно, что три новых компьютера принадлежат китайской компании Lenovo, хотя сам Китай представлен всего 37 суперкомпьютерами, по сравнению с 61 в прошлом году.
Средняя производительность TOP500 значительно выросла за последние 6 месяцев. Суммарная мощность всех 500 суперкомпьютеров составила 363 петафлопс/c, что заметно больше, чем 309 в прошлом ноябре и 274 год назад. 98% систем используют процессоры с шестью ядрами и более, в то время как, по крайней мере, 88,2%, имеют 8 ядер на процессор. Восемьдесят восемь из пятисот систем использовали ускорители / сопроцессоры, среди которых Nvidia (52), ATI Radeon (4), и Intel Xeon Phi (33). Четыре системы используют комбинацию процессоров Xeon и Nvidia.
Топ-10 состоит из машин, запущенных в 2011 и 2012 году, за исключением нового участника из Саудовской Аравии под номером 7. Вот как выглядят список 10 наиболее мощных суперкомпьютеров мира.

Tianhe-2: Кластер TH-IVB-FEP; Национальный суперкомпьютерный центр в Гуанчжоу, Китай; 3.12 миллиона ядер (33.86 Пфлопс/с).
Titan: Система Cray XK7, Национальная лаборатория Оук-Ридж, США. 560 640 ядер (17.59 Пфлопс/с).
Sequoia: Система IBM BlueGene/Q, Ливерморская национальная Лаборатория 1.57 миллиона ядер, (17.2 Пфлопс/с).
K Computer: Система SPARC64 с 705 024 ядрами в RIKEN Институт передовой вычислительной науки в Институте физико-химических исследований (RIKEN), Япония. (10.5 Пфлопс/с).
Mira: IBM BlueGene/Q; DOE/SC/ Аргоннская национальная лаборатория, США; 786 000 ядер IBM. (8.59 Пфлопс/с).
Piz Daint: Cray XC30 с 116 000 ядер от Xeon и Nvidia; located at the Швейцарский национальный вычислительный центр. (6.27 Пфлопс/с).
Shaheen II: Система Cray XC40. Университет науки и технологий Короля Абдуллы в Саудовской Аравии. (5.536 Пфлопс/с).
Stampede: Система Dell PowerEdge C8220 с 462 462 ядрами Xeon Phi в Университете Техаса (5.17 Пфлопс/с).
JUQUEEN: BlueGene/Q, 458 752 ядра IBM. Юлихский исследовательский центр, Германия. (5 Пфлопс/с).
Vulcan: BlueGene/Q, 393 216 ядер IBM, Департамент Энергетики США.

Нужно помнить, что расклады могут резко измениться, если кто-то создаст настоящий квантовый компьютер. IBM пошли на рекорд, собираясь создать компьютер на 50 кубитов (с текущим максимумом в 4), который может стать мощнее, чем любая система в этом списке.
Тем временем Департамент Энергетики США заказал две системы IBM/Nvidia в сделке на $ 425 млн. Поставка машин запланирована на 2017 и 2018 год, а пиковая мощность может составить 150 петафлопс.