Компьютерра
08.08.2011 - 14.08.2011
Статьи
Blue Waters: петафлопсовая матрёшка
Суперкомпьютеры в мире вычислительных систем сродни олигархам в человеческом обществе. Вот вроде бы такие же люди, та же анатомия и физиология, ан нет — попасть в их тусовку, периодически обновляемую журналом Forbes, простому обывателю нереально. Так же и у компьютеров: докажи, что ты крут в плане вычислительных способностей — и пожалуй в рейтинг Top 500 Supercomputers, своеобразный компьютерный Forbes.
Разработать приличный суперкомпьютер с замашками вычислительного олигарха непросто технически и недёшево экономически. А уж заполучить его мощь в своё распоряжение для решения высоконаучных и вполне насущных задач и того сложнее.
Владельцы супервычислителей не для того их создавали, чтобы заниматься благотворительностью. Будь любезен, ознакомься с прайсом (оплата почасовая), прокалькулируй свой бюджет, сформулируй получше задачу и пользуйся на здоровье, пока деньги есть. Хорошо, если задачи твои актуальны и правительство твоей страны заинтересовано в их решении. К примеру, правительство Японии после могучего землетрясения 11 марта не поскупится на бюджетные отчисления для моделирования последствий подобных (тьфу-тьфу) катастроф в будущем.
А как же быть вузам, начинающим учёным и исследователям интересных, но не злободневных задач, бюджет которых если и позволяет арендовать суперкомпьютер, то не самый мощный и ненадолго? Придётся решать свои задачи, как дядюшка Тыква в известной сказке Джанни Родари строил свой дом: по кирпичику и очень медленно? Не обязательно.
Благодаря дружбе, которая, как известно, позволяет делать настоящие чудеса, в распоряжении студентов и аспирантов (пока что, правда, только американских) появился могучий вычислитель мощностью более одного петафлопса (1015 FLOPS). Руку дружбы будущему поколению учёных и инженеров протянули: Университет штата Иллинойс Urbana-Champaign, Национальный центр суперкомпьютерных вычислений США (NCSA — National Center for Supercomputing Applications), компания IBM и консорциум Great Lakes for Petascale Computation. Объединив свои усилия, возможности, финансы и инженерную мощь, эти организации разработали проект Blue Waters — масштабируемую суперкомпьютерную систему, выдающую петафлопсовую производительность.
Уникальность проекта Blue Waters — в его открытости для начинающих свой путь исследователей, которая отражается в программе выделения вычислительных ресурсов PRAC (Petascale Computing Resource Allocations). А ещё — в совершенно особенной архитектуре-матрёшке, которую разработала для проекта компания IBM.
Как же устроена система, способная «разогнаться» свыше одного петафлопса и готовая увеличить эту далеко не маленькую мощь?
Таблица ниже демонстрирует возможности Blue Waters в сравнении с возможностями типового кластера NCSA Abe на базе шестидесятичетырёхразрядных процессоров Intel Xeon и высокопроизводительной компьютерной системы TACC из техасского центра суперкомпьютерных вычислений, построенной на процессорах AMD.
Кластер NCSA Abe
TACC
Blue Waters
Внушительно, не правда ли? И в плане производительности, и в плане «железной» составляющей Blue Waters. А ведь именно эта, базирующаяся на процессорной системе IBM Power 7, составляющая и даёт петафлопсовую мощь.
Разрабатывая архитектуру Blue Waters, компания IBM не просто масштабно применила свою новую разработку — процессор Power 7. Она создала вложенную модульную структуру, все элементы которой связаны между собой высокоскоростными шинами данных. Каждый из модулей этой структуры может использоваться независимо (если большая вычислительная мощность не требуется) или практически неограниченно масштабироваться, создавая системы с необходимыми характеристиками.
Мельчайший кирпичик в пирамиде Blue Waters — ядро процессора Power 7 (Power 7 Core), коих у процессора IBM целых восемь. Само по себе ядро Power 7 является самостоятельным вычислителем с двумя модулями вычислений с фиксированной запятой, четырьмя модулями вычислений двойной точности с плавающей запятой, модулями векторной и десятичной математики, 64 килобайтами кэш-памяти первого уровня и 256 килобайтами кэш-памяти второго уровня.
На одном кремниевом чипе процессора Power 7 таких ядер восемь. Кроме них на этом же чипе расположены: кэш-память третьего уровня (по четыре мегабайта на ядро), два контроллера оперативной памяти, позволяющие подключить к одному процессору до 128 гигабайт быстродействующей DDR3 памяти Dual SuperNova, четыре шины данных для межядерного взаимодействия и связи с другими процессорами Power 7.
Схема процессора IBM Power 7
Связь эта позволяет объединить четыре Power 7 в сборку, именуемую Multi Chip или Quad Chip Module (QCM). Обладая тридцатью двумя взаимодействующими между собой ядрами Power 7 Core, сборка QCM способна работать с 512 гигабайтами оперативной памяти. Ещё одной её особенностью является наличие коммуникационного узла (On-Board Hub), позволяющего связывать QCM с себе подобными по высокоскоростной медной шине данных и имеющего оптический выход шины данных L Remote.
Связанные через свои хабы, восемь узлов QCM составляют так называемый Drawer — законченный функциональный модуль с собственной системой питания и охлаждения. 256 ядер Power 7 Core в составе модуля Drawer поддерживают более терабайта оперативной памяти и два коммуникационных уровня. На первом из них с помощью оптической шины L Remote Drawer соединяется с тремя себе подобными, образуя ещё один законченный функциональный блок, именуемый Super Node.
Второй уровень коммуникаций обеспечивается оптической шиной D-Link. Она связывает несколько Super Node между собой. Итого четыре модуля Drawer дают Super Node 1024 ядра Power 7 Core и поддержку свыше четырёх терабайт оперативной памяти. Технически, глядя на таблицу выше, можно сказать, что один Super Node является практически полноценным суперкомпьютером начального уровня.
Но матрёшка Blue Waters ещё масштабнее модуля Super Node. Три «суперузла», установленные в стойку с независимым источником бесперебойного питания и восьмиканальной системой водяного охлаждения, образуют предпоследний слой системы, именуемый Rack.
У «ящика» Blue Waters Rack есть источник бесперебойного питания и система водяного охлаждения
Чтобы узлы Super Node в составе модуля Rack могли связаться между собой, с другими Super Node в других Rack и с массой периферии, в состав Rack входит мощный коммуникационный узел Power 7 Torrent. Благодаря нему 3073 ядра Rack могут подключиться к 192 шестнадцатискоростным и 12 восьмискоростным шинам PCI Express. Теоретически же узел Power 7 Torrent позволяет объединить в Rack 512 модулей Super Node.
Вычислительная мощность одного модуля Rack составляет примерно 100 терафлопс. Для получения вожделенного петафлопса между собой были связаны 100 модулей Rack, установленных в специальном помещении университета Иллинойса, именуемом Национальная фабрика петафлопсовых вычислений (National Petascale Computing Facility).
Что же за продукты выходят с конвейера этой фабрики? Blue Waters — молодая (запущена в эксплуатацию в июне 2010 года) суперкомпьютерная система, но уже сейчас она может похвастаться несколькими мощными проектами независимых исследователей. К ним относятся актуальная нынче модель землетрясений, моделирование пандемий и модель формирования галактик. Кроме этих проектов Blue Waters активно используется в компьютерной поддержке электронной микроскопии, которая активно применяется для исследования ДНК и, что примечательно, для разработки новых наноразмерных технологий для следующих версий компьютерных чипов.
В ближайших планах IBM — замена медной шины, соединяющей QCM-модули Power 7, на оптическую магистраль
Воспользоваться мощностью Blue Waters могут любая исследовательская лаборатория или независимый исследователь. Для этого достаточно стать членом команды PRAC и обосновать актуальность своего исследования.
Вот так, благодаря матрёшке IBM Power 7, в руках нынешних и будущих учёных появился уникальный и вполне демократичный вычислитель мощностью в один петафлопс. И это, как видно из масштабируемой архитектуры Blue Waters, далеко не предел.
Колумнисты
Кафедра Ваннаха: Парадоксы сжатого мира
В наиновейшую историю вошел очередной «чёрный четверг» — падение бирж Старого и Нового Света, состоявшееся 4 августа 2011 года, падение самое большое с 2008 года. Единомоментно игроки потеряли два с половиной что ли терабакса; точные цифры тут вряд ли возможны. Вон звёздно-полосатый минфин и масса примкнувших к нему государственных мужей янки упрекают респектабельнейшее рейтинговое агентство Standard & Poor’s в ошибке в подсчётах на пару триллионов долларов США (повод для упрёков был серьёзный: впервые начиная с 1917 года это агентство понизило рейтинг Америки). Почему же разразились эти события, и почему они непременно будут иметь продолжение? Можно ли разобраться в них, не вникая в чёрную магию финансов?
Давайте начнём с самих Соединённых Штатов — самой что ни на есть мощной державы и самой что ни на есть богатой экономики мира. Раз держава оказалась у нас на первом месте, воспользуемся словами того, кто ею рулит, а именно президента Барака Обамы. В интервью, посвящённом его юбилею, он отметил важнейшую роль информационных технологий в современном мире и, в частности, отметил, что интернет сжал современный мир. Вот это высказывание и возьмём за отправную точку, описывая процессы в информационной эре.
Конечно, не будем забывать и транспорт — прошлую инфраструктуру, созданную индустриальной эпохой. Не забудем супертанкеры и контейнеровозы, терминалы для них, автострады и железные дороги, мосты и путепроводы, седельные тягачи-локомотивы, пассажирские и транспортные аэропланы с бетонными полями аэродромов. Без всего этого информационные технологии оказались бы нервной системой организма, лишённого конечностей.
Главная особенность нынешних информационных технологий — их пропускная способность. Какие-то сведения из Китая попадали ещё в Ойкумену классической античности (во всяком случае, там знали, что есть страна Sina). Схоласты же Тёмных Веков любили спорить, какого роста китайский император. В его бытии они не сомневались — желающие могут оценить пропускную способность такого канала в битах/тысячелетие...
В Новое Время, во времена Ост-Индских компаний, в Юго-Восточную Азию стало возможным отправить письмо. Корабль шёл с ним вокруг Африки, пропускная способность канала — килобайты в год. Затем, в позапрошлом веке, планету опутали телеграфные линии и подводные кабели, их пропускная способность — уже боды (о соотношении бодов и битов в секунду дискутировала бумажная Компьютерра середины девяностых). Каналы связи эволюционировали (коаксиальные кабели, витые пары, волоконная оптика), и в какой-то момент количественный рост перешёл в новое качество.
Скорость передачи информации устремилась к световой, а стоимость информационной транзакции — в область бесконечно малых чисел. Это повлекло за собой качественные изменения не только для мира информационных технологий, но и для всей глобальной Мир-экономики (опять Валлерстайн).
Теперь возьмём и посмотрим на Старый Свет, на Европу, объединившуюся в ЕС. Наиболее развитая экономика этого конгломерата — германская. ФРГ сочетает развитую науку и индустрию с очень высокой социальной солидарностью. Какие же процессы идут в ней в последнее десятилетие? Надо сказать, очень поучительные.
Начиная с 2000 года экономика росла и крупные состояния увеличивались. Но, по оценкам эксперта Немецкого института экономических исследований (DIW) Маркуса Грабки (Markus Grabka), зарплаты, особенно низкооплачиваемых работников, в этот период серьёзно упали. С учётом инфляции зарплаты всех наёмных работников в Германии понизились с 2000 по 2010 год на 2,5 процента, но это в среднем. В то же время в низкооплачиваемом секторе рынка труда уменьшение зарплат достигало 22 процентов!
Про семисотевровое поколение европейцев автор рассказывал. В Германии дела получше, чем на юге Европы, но всё равно зарплаты тех немцев, кто получает после уплаты налогов жалование в диапазоне от 700 до 1300 евро, упали весьма заметно. И самое страшное — новые рабочие места возникают вновь преимущественно в низкооплачиваемом, семисотевровом, секторе... Экономика растёт, а зарплаты падают. Почему?
Теперь обратимся к дебатам, которые протекали между демократами и республиканцами в Конгрессе США во время баталий по увеличению лимита госдолга. Там снова и снова всплывала тема защиты американских рабочих от экспорта. Тяжело им конкурировать с индонезийцами, работающими за пару баксов в день. Но почему? И встарь в Азии работники получали гроши. Но в 1950-е рабочие Первого мира процветали, а сейчас... Левые, конечно, могут попытаться объяснить сей феномен тем, что тогда был СССР и капиталисты были вынуждены делиться с работниками прибылями. Мы же попытаемся найти ответ в технологиях.
Перенести в 1950-м производство в ЮВА было невозможно по информационным причинам. Промышленная техника того времени требовала большого объёма знаний от рабочего. Его нужно было долго учить в общеобразовательной «машине Коменского», формировать производственные навыки. Современная же техника массовых технологий имеет весьма дружественный интерфейс. От работника требуется дисциплина и усидчивость, и минимум знаний.
А технологическая документация? То, для чего после конструктора был нужен чертёжник, светокопировка, рабочий, умеющий работать «с листа». Теперь вся информация улетает с какого-нибудь AutoCAD прямо в другую часть света, где минимальные издержки (кстати, нужна будет пресс-форма какая — не связывайтесь с местными заводами с их дикими издержками, ищите китайца, будет быстрее и дешевле, хоть фрезеруется всё за морем, где телушка — полушка).
Все в Первом мире так же и поступают. У товара два конкурентных преимущества — новизна и дешевизна. С теми, кто обеспечивает новизну, с учёными и инженерами всё в порядке. Дешевле их труд не купишь — они получают в Первом мире нормально. А бывшие пролетарии, найм которых в Первом мире отягощён кучей социальных страховок? Кто же покупает дороже то, что можно взять дешевле... Поэтому производство уходит в ЮВА, несмотря на все прыжки и ужимки профсоюзов и левых партий. Несмотря на знаменитую, с Бисмарка ещё, национальную солидарность германской Sozialmarktwirtschaft, социально рыночной экономики.
Но бывшие пролетарии остаются в своих странах, и избирательное право имеют, да и опасность социальных волнений (как в Афинах) никто не отменял. К тому же рыночной экономике нужны платежеспособные потребители, и национальная солидарность имеет место. Поэтому любое правительство продолжает экономически неэффективных подкармливать, наращивая госзаказы, платя соцстраховки. В результате — расходы, чтобы их покрыть, доходов не хватает, а значит, растут долги.
Стоило Конгрессу разрешить Обаме занять ещё 400 миллиардов долларов, увеличив лимит долга до 14,694 триллиона, сразу же госдолг США в один день возрос на 239 миллиардов, до 14,532 триллиона, поглотив 60 процентов выделенной суммы. Ведь нью-йоркский заворачиватель гамбургеров по-прежнему получает в день больше, чем индонезийский рабочий за месяц, и деньги эти должны откуда-то браться.
В Европе дела не лучше. Если в 2007 году суммарный долг стран Евросоюза составлял 7,3 триллиона евро, или 59 процентов от общеевропейского ВВП, то уже в 2010 году он вырос до 9,8 триллиона евро, или 80 процентов. Государственный долг Германии тогда превысил 83 процента ВВП.
Рост долгов самых благополучных стран показывает парадоксальную вещь. В противоречие пришли законы устройства глобализованного мира с рыночной экономикой (свободное движение товаров и капиталов, минимум таможенных барьеров, покупаем или новое, или дешёвое) и задачи национальных государств по поддержанию высокого уровня потребления большинства граждан (welfare state). До поры противоречие разрешалось жизнью в долг, но теперь долги становятся запредельно высоки, и расти им особенно некуда... Как это противоречие разрешится в длительной перспективе, не знает никто.
Кивино гнездо: Лица дополненной реальности
В Бразилии, где уже вовсю идёт подготовка к проведению футбольного Чемпионата мира 2014, компетентные инстанции, отвечающие за безопасность мероприятия, заняты испытаниями специальных футуристических очков для полиции. В оправу этих очков встроена миникамера, а полицейский, оснащённый таким гаджетом, может одним лишь поворотом головы в нужную сторону делать снимки множества лиц в толпе людей.
Эти фотографии тут же передаются в центральную базу данных, где система распознавания лиц в реальном времени сравнивает их с содержимым большой базы данных об известных преступниках и людях, разыскиваемых полицией. Если при сравнении обнаруживается совпадение, то на маленьком экранчике, встроенном в очки, возле соответствующего лица загорается красный сигнал тревоги, предупреждающий полицейского о необходимости задержания или других подобающих ситуации действиях.
Такого рода техника уже проходит в Бразилии тестирование на спортивных матчах, концертах и других массовых зрелищах. Если всё пойдёт как задумано, то спецочки, устанавливающие личность человека по лицу, станут немаловажным инструментом полиции при обеспечении безопасности на следующем чемпионате мира по футболу.
Если оценивать данную технологию по существу, то ничего принципиально нового и прежде невиданного в ней, строго говоря, нет. Нечто подобное в США и других наиболее озабоченных технической безопасностью государствах пытались внедрять уже около десятка лет тому назад. Ничего путного, правда, из этого тогда не получилось — из-за общей незрелости технологии, несовершенства алгоритмов распознавания и, как следствие, гигантского количества ложных опознаний, делающих систему бесполезной в практическом применении.
Несмотря на первые неудачи, никто, впрочем, особо не сомневался, что с течением времени алгоритмы будут становиться всё лучше и лучше, производительность вычислительных ресурсов достигнет нужного уровня, а в целом метод непременно покажет свою мощь и эффективность. Так что теперь, насколько можно судить по происходящему, мы понемногу входим именно в эту эпоху.
Сейчас быстрое опознание человека по лицу становится реальностью не только для преступников (которые в общем-то давно уже к этому должны были привыкнуть), но и для совершенно обыкновенных людей, никаких проблем с законом не имеющих. Существенно, что мощные технологии распознавания лиц уже практически доступны не только правоохранительным органам, но и по сути дела всем желающим. Чем это всё грозит в ближайшем будущем, обществу ещё только предстоит разобраться.
Массу содержательной информации для размышлений на данную тему предоставляет исследовательский доклад "Лица из Фэйсбука", только что сделанный на хакерской конференции Black Hat USA в Лас-Вегасе. Авторы этого исследования — Алессандро Акуисти, Ральф Гросс и Фред Стацман, все из американского Университета Карнеги-Меллона — решили на практике проверить, а не могут ли такого рода «полицейские» технологии уже сегодня применяться вообще кем угодно. Иначе говоря, возможно ли быстро идентифицировать по лицу случайно выбранного в толпе или в сети человека, просто собирая о нём персональную информацию из общедоступных баз данных?
Для ответа на этот вопрос исследователи провели несколько экспериментов, опираясь на три популярных инфотехнологии. Одна из них, естественно, — это программа распознавания лиц, последнее время в технологическом отношении характеризующаяся очень заметным прогрессом. Кроме того, учёные использовали сервисы «облачных вычислений», предоставляющие массу дешёвых вычислительных мощностей. И, наконец, в качестве основного источника информации они использовали социальные сети вроде Facebook и LinkedIn, где большинство пользователей помещает свои реальные имена и собственные фотографии.
Лидер этого исследовательского проекта, Алессандро Акуисти, по основному образованию является экономистом, специализирующимся на поведенческой экономике приватности. По его словам, данное исследование стало естественным продолжением их предыдущей работы 2009 года. Тогда было продемонстрировано, что публично доступная информация из профилей пользователей в сети Facebook может быть использована злоумышленниками для точного вычисления их SSN, то есть номера социального страхования.
Тут стоит пояснить, что в условиях США уникальный номер SSN является главным идентификатором человека во всех базах данных, то есть аналогом номера паспорта для россиян. Одного лишь знания имени-фамилии и такого вот идентификатора мошенникам бывает достаточно для кражи личности с весьма тяжкими порой последствиями для обокраденных и подставленных.
Вслед за впечатляющими результатами предыдущего исследования, Акуисти и его коллеги решили расширить цель эксперимента и теперь посмотреть на то, как программа распознавания лиц, социальные сети и технологии статистической идентификации могут быть использованы для «дополнения реальности», то есть синтеза онлайновой и офлайновой информации на основе перекрёстных обращений в общедоступные хранилища данных (вроде социальных сетей). Упрощённо формулируя цель задачи, учёные решили посмотреть, а возможно ли просто от незнакомого лица, попавшегося на улице, прийти к номеру социального страхования этого человека?
Для ответа на этот и близко к нему относящиеся вопросы было придумано и проведено несколько экспериментов.
В первом из экспериментов этой серии исследователи воспользовались открыто доступными для всех фотографиями из Facebook для того, чтобы «переидентифицировать» анонимных, как правило, пользователей в других, более деликатных социальных сетях, таких, как сайты знакомств.
Для этого на одном из наиболее популярных в США сайте знакомств были отобраны около 6 000 фотографий из профилей тех людей, которые проживают в одном конкретном городе. Подавляющее большинство посетителей такого рода сайтов предпочитает использовать псевдонимы. Отобранные фотографии прогнали через общедоступную программу распознавания лиц, которая сравнивала их с базой из 280 000 снимков, автоматически найденных и собранных поисковой машиной, перед которой ставилась задача выявить на сайте Facebook профили тех людей, что проживают в том же самом городе.
Даже при таком, лобовом и совершенно примитивном, подходе исследователи тут же установили личности чуть более одной десятой среди тех людей, что посещают сайт знакомств. На первый взгляд, такая цифра не выглядит особо впечатляющей. Однако можно отметить, что это был чисто пассивный, без «выхода в офлайн», сбор информации из сетевых баз данных. Кроме того, можно уверенно прогнозировать, что число успехов в подобных изысканиях будет неуклонно расти по мере дальнейшего улучшения программ распознавания лиц и по мере того, как всё больше фотографий выкладывается людьми в сеть.