Карта сайта

ВЫЧИСЛИТЕЛЬНЫЙ КЛАСТЕР ПНЦ РАН

Параллельная вычислительная система (кластер) ПНЦ РАН была создана в 2000 году на базе Института математических проблем РАН.

Необходимость ее появления диктовалась потребностью решения многих ресурсоемких вычислительных задач, поставленных научно-исследовательскими и образовательными коллективами ПНЦ РАН.

Возможность создания кластера обеспечивалась тем, что производительность персональных компьютеров в последние годы значительно выросла. Одновременно стала приобретать все большую популярность ОС Linux - бесплатно распространяемая версия UNIX. Так возникла идея создания кластера из рабочих станций на базе Intel и недорогих Ethernet-сетей, устанавливая на эти компьютеры Linux и одну из бесплатно распространяемых коммуникационных библиотек (PVM, а затем MPI).

Вычислительный кластер ПНЦ РАН был создан на средства ФЦП "Интеграция" (номер проекта В0018) и грантов РФФИ (номера проектов 00-01-05000 и 01-07-90317).

В апреле 2004 года ИМПБ РАН вошел в консорциум RDIG (Russian Data Intensive GRID). В рамках этой организации объединили свои вычислительные мощности Объединенный институт ядерных исследований (ОИЯИ) в Дубне и семь российских научно-исследовательских институтов:

Благодаря организации этой грид-инфраструктуры, которая развивается в рамках финансируемого ЕС проекта EGEE (Enabling Grids for E-science in Europe), для всего научного сообщества стали доступными не имеющие себе равных вычислительные мощности и объёмы информации.

Поддержка кластера осуществляется Межинститутским отделом вычислительных и информационных ресурсов (МОВИР)
e-mail: movir@psn.ru
Ответственный администратор кластера - Зайцев Александр Юрьевич
142290, г.Пущино, ул.Институтская, д.4, ИМПБ РАН, к.451
тел: 73-06-83*451
e-mail: sasha-z@psn.ru

Технические характеристики кластера

Узлы кластера

Первоначальная конфигурация кластера включала в себя 17 однопроцессорных узлов на базе Intel Pentium III 800 МГц, для связи которых использовался Fast Ethernet через 24-портовый коммутатор D-Link. Один из узлов использовался в качестве сервера для связи с внешним миром и управления заданиями пользователей. Программное обеспечение строилось на базе свободно распространяемой OS Linux (GNU/Debian).

Недостаточная пропускная способность и скорость сети Fast Ethernet сильно ограничивали класс решаемых задач современной компьютерной биологии и биоинформатики. Необходимость модернизации также оправдывалась окончательной разработкой стандарта Gigabit Ethernet и значительным снижением цен на соответствующее этому стандарту оборудование. Модернизация кластера началась в 2002 году.

Первый этап модернизации проводился в двух направлениях. Увеличение вычислительной мощности достигнуто за счет увеличения количества вычислительных узлов. Всего было добавлено 8 двухпроцессорных узлов на базе процессора Athlon 1200 MP. Произведен частичный перевод внутренней сети кластера на Gigabit Ethernet. Все новые узлы были связаны между собой через 12-портовый коммутатор производства 3Com.

Результаты проведенного тестирования показали резкое увеличение производительности кластера. Вместе с тем было необходимо продолжить модернизацию по причине увеличения числа отказов старого оборудования. В 2003 году в кластер были добавлены еще два двухпроцессорных узла на базе Athlon2000 MP. Это позволило увеличить производительность вычислительного кластера до 21 ГФлопс (по данным теста High Performance Computing Linpack).

В 2004 году первый этап модернизации полностью закончен. В настоящее время все однопроцессорные узлы кластера заменены на двухпроцессорные. Также полностью завершен перевод узлов на Gigabit Ethernet. В настоящее время вычислительный кластер имеет следующую конфигурацию:

  • Три сервера на базе Intel P4 HT служат точкой доступа к кластеру, хранилищем данных и сервером управления вычислительными ресурсами. Емкость хранилища составляет 200G.
  • 24 процессора различной мощности (от 1.2ГГц и выше) составляют вычислительную базу кластера.
  • Однопроцессорный сервер Intel PIII занимается мониторингом ресурсов и сбором статистики использования ресурсов.

Общий объем оперативной памяти вычислительных узлов составил 12G. Все узлы связаны посредством 24-портового коммутатора Gigabit Ethernet производства D-Link. В процессе модернизации произведен переход на другую операционную систему. Сейчас кластер работает под управлением Scientific Linux 3 (SL3).

Программное обеспечение

Программное обеспечение строится на базе свободно распространяемой OS Linux (Scientific Linux 3). В качестве основного программного средства организации параллельных вычислений используется MPICH/MPI - реализация MPI и среда разработки MPI-программ для гетерогенных кластеров из UNIX-машин.

 

Copyright 2001- © Институт математических проблем биологии РАН