Суперкомьютер из 8 GPU заменил кластер из трехсот ПК

01.06.2008 06:57 (MSK)

Исследователи из Антверпенского университета (Бельгия) создали суперкомпьютер на базе четырех видеокарт NVIDIA GeForce 9800 GX2 (в сумме 8 GPU), по производительности равный кластеру из 300 ПК с Intel Core 2 Duo 2.4GHz.

Проект используется в лаборатории, занимающеяся расчетами связанными с томографией, в частности разработкой алгоритмов восстановления внутренней структуры объекта по проекционным данным. На классическом ПК на тестовые расчеты было затрачено несколько недель, в то время как кластер на базе 8 GPU произвел все необходимые вычисления за несколько часов.

исправить +/–

Лицензия: CC BY 3.0

Короткая ссылка: https://opennet.ru/16228-gpu

Ключевые слова: gpu, cluster, nvidia, math

При перепечатке указание ссылки на opennet.ru обязательно

Обсуждение (51)

1.1, Michael (??), 07:55, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Это у интела FPU такое дерьмо или как?

2.10, Юзер (??), 11:25, 01/06/2008 [^] [^^] [^^^] [ответить]

+/–

А вы, таки не знали :-) ?
И никакие SSE4 уже давно не помогут.

Думаю, что GPU nVidia (а затем и др производителей) эволюционируют в MPU (media processor unit) - навороченный аналог DSP. Будут CPU и MPU. Первый всё может сам, но плохо считает, а второй отлично считает, но ничего сам не может. MPU, скорее всего, будет выделять свои ресурсы задачам для обработки видео, криптографии и звука. Возможно, что и для физики.

Это, конечно, моё личное мнение :-)

2.14, FSA (??), 13:56, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
Просто графические чипы затачиваются под определённые виды расчётов. В данном случае это даёт огромный открыв от классических процессоров.

2.49, Аноним (-), 17:35, 02/06/2008 [^] [^^] [^^^] [ответить]	+/–
> Это у интела FPU такое дерьмо или как? Скорее, это GPU такие крутые ... в определенных видах рассчетов.

1.2, Alrond (??), 09:20, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]	+/–
нвидии уже пора выходить на процессорный рынок, вот интел то "возрадуется"

2.9, User (??), 11:11, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
nVidia Tegra

1.3, Аноним (-), 09:30, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]	+/–
у intel fpu по производительности примерно такой же как и у amd (если читать TFA то там есть сравнение с amdшным кластером). а на gpu считать можно только если не нужен double precision и ieee 754.

1.4, Роман (??), 09:45, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Там еще можно винду заменить - еще быстрее выйдет, имхо! :)

2.18, dRiZd (?), 14:15, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
Вряд ли, сравнивал кодирование под fedora 8 x64 и под Win XP x64 SP2 (использовались ОС со всеми заплатками на тот момент, правда в винде еще каспер работал), использовал lame и xvid/x264 (компилил gcc, intel c - на обоих платформах) с mencoder. Под виндой процесс кодирования в среднем заканчивался на ~5-17 сек быстрее, что, как я полагаю, находиться в пределах погрешности. Так что, по моим замерам преимуществ у обоих ОС друг перед другом нет - примерно одинаковые.

3.20, Logo (ok), 15:34, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
>"...на ~5-17 сек..." А в процентах? Приоритет процесса кодировщика под федорой был по умолчанию?

4.24, dRiZd (?), 19:02, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
Я специально вопрос полировки не затрагивал (приоритет...), чтобы уравнять шансы. Запуск происходил на "коробочных" настройках. Ведь и в винде можно было бы поднять приоритет - но это все филосовские темы которые мало имеют общего с реалиями. Обычный юзер не будет себя заморачивать полировкой, а в большинстве своем даже и не представляет что это такое и с чем это едят.

5.25, вжюх (?), 19:12, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
У винды с коробочными настройками активное окно получает +2 к базовому приоритету.

3.28, alexxy (?), 20:52, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
Нет такой архитектуры x64 это все бредни мелкософта и санкоф =) Есть либо x86_64 что тоже не совсем верно более правильно ia32_64 то бишь это 64 бита амд и интелы типа коре2 либо ia64 что есть Itanium Ну нет никаких архитектур x64 =) ЗЫ а по теме: вычисления на GPU очень специализированы и требуют специальным образо написанный код. Да GPU быстрее чем обычный PC архитектуры типа ia32 или ia32_64 но GPU процессор векторный и специализированный. Он быстр тока в single-precision. при попытке считать на нем double все будет очень и очень медленно. Производительность упадет тогда где то на 1-2 порядка.

4.30, dRiZd (?), 22:48, 01/06/2008 [^] [^^] [^^^] [ответить]	+1 +/–
а ни кто и не говорил что x64 это архитектура. Но дабы не вносить путаницу в стан читающих, я указал конкретные редакции ОС. А Windows XP Professional x86_64 и fedora ia32_64... (в вашем написании) таких редакций не существует. Так что Ваш коммент не по существу.

1.5, Аноним (5), 10:15, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]	+/–
По-моему, чушь какая-то: 600 полноценных ядер против 8 урезанных gpu на видюхах. Значит один gpu чуть ли ни быстрее сотни нормальных ядер! Конечно, может быть у кластера узкое место - каналы передачи, но при чём тут вообще процессоры тогда.

2.6, 3pleX (?), 10:50, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
А что вы хотите - узкоспециализированный процессор _всегда_ будет быстрее универсального. Чудес тут не бывает. Та же самая ситуация - с криптоускорителями.

2.8, Аноним (-), 11:06, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
>По-моему, чушь какая-то: 600 полноценных ядер против 8 урезанных gpu на видюхах. >Значит один gpu чуть ли ни быстрее сотни нормальных ядер! На некоторых задачах таки быстрее. Потому что один gpu содержит внутри себя 128 ядер, вот и получается, что 1024 ядра быстрее 600.

1.7, Читатель (?), 10:50, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Например то что GPU имеют более высокую разрядность. Мне известны курсовые и дипломные работы по обсчету большых объемов данных сделаных на базе графических карт. И кстати взгляните на Tesla от NVidia довольно интересная вещь.

1.11, Аноним (5), 12:41, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]	+/–
что, неужели шустрее чем Cell получается?

1.12, Аноним (12), 12:43, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Во-первых, вычисления специфичны - явно 3D, чего тут удивляться. а Во-вторых, intel выходит наоборот - на рынок этого самого 3D - Larabee, слыхали? так что счет сравняется :)

2.13, Новичок (??), 13:21, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
Народ! А как я могу это использовать в трудовай жизни! Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav + postfix + spamassasin + mysql + sams + lighttpd.

3.15, Аноним (-), 14:00, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
Производительность высока лишь на параллельных вычислениях. Пишите себе кодеки на CUDA и возрадуетесь (однако, заюзаете вы в нем хоть один условный переход и скорость упадет стократно). Параллелизм, такой параллелизм..

3.17, dRiZd (?), 14:01, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
Никак! Да и вообще использование GPU в обычной жизни весьма спорное: ну может видео/mp3 пожать, архиватор прикрутить - больше пока перспектив не вижу. Я вот bzip2 (win32/x64) портировал на CUDA 1.1 - толку мало (ну стал он жать 600Мб tar не за 43 секунды, а за 36, и что? ). Все зависит от прикладного ПО/алгоритмов ну и самое главное - рук.

4.19, Кубик (?), 14:22, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
Интересно! А как ты думаешь если воткнуть 4 мощных карты, можно жать например за 10 сек ?

5.21, const (??), 15:38, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
> если воткнуть 4 мощных карты, можно жать например за 10 сек ? Порвать файл на четыре и жать отдельно. Но тогда четырёхъядерный CPU будет жать, скажем, 11 секунд и опять разницу не разглядишь. ;)

4.27, pavlinux (ok), 20:39, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
У Вас случаем не Nvidia Tesla ?

5.31, dRiZd (?), 22:56, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
2 штуки Tesla C870 и 2 Quadro FX 4700 X2 Все стоит на nForce 790i Ultra SLI

6.32, dRiZd (?), 23:05, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
Кстати комментом выше автор alexxy упомянул про single-precision и он абсолютно прав. По крайней мере в моей конфигурации. Не факт, что у ATI дела обстоят так же (с их аналогами не знаком).

6.34, pavlinux (ok), 23:17, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
>2 штуки Tesla C870 и 2 Quadro FX 4700 X2 >Все стоит на nForce 790i Ultra SLI Во сколько Tesla обшлась?

7.35, dRiZd (?), 23:25, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
Рабочая станция обошлась в 16000 евро

8.36, pavlinux (ok), 23:32, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
2 Квадры и две Теслы ... текст свёрнут, показать

9.38, dRiZd (?), 07:25, 02/06/2008 [^] [^^] [^^^] [ответить]	+/–
Да, именно так Но я правда не сказал, что корпус и периферия в промышленном исп... текст свёрнут, показать

8.37, pavlinux (ok), 03:51, 02/06/2008 [^] [^^] [^^^] [ответить]	+/–
Видел - http cuda ixbt com konkurs shtml Зашли им bzip2, может приз какой-н... текст свёрнут, показать

9.39, dRiZd (?), 07:31, 02/06/2008 [^] [^^] [^^^] [ответить]	+/–
К сожалению вряд-ли, см раздел судейство Сходу не пройду по пунктам оригин... текст свёрнут, показать

3.22, Michael Shigorin (ok), 17:44, 01/06/2008 [^] [^^] [^^^] [ответить]

+/–

>Народ! А как я могу это использовать в трудовай жизни!
>Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
>+ postfix + spamassasin + mysql + sams + lighttpd.

Постепенно приходите к мысли, что админить шлюз в эпоху сервисов неинтересно и неприбыльно, выкидываете фрю, ставите линукс, всё равно сваливаете и занимаетесь расчётными задачами (имея в резюме в т.ч. именно линуксовый экспириенс). Тогда в трудовой, получается.

А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2, но пригодится разве что для убивства времени...

4.26, pavlinux (ok), 20:34, 01/06/2008 [^] [^^] [^^^] [ответить]	+/–
> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2 PCI Express 2.0 нету для PIII чипсетов.

5.29, Michael Shigorin (ok), 22:27, 01/06/2008 [^] [^^] [^^^] [ответить]

+/–

>> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2
>PCI Express 2.0 нету для PIII чипсетов.

Покойный Борис Мостовой как-то выиграл спор, кажется, насчёт "поставить NT на Sun": поставил коробку с NT на коробку с железкой. Физически. :)

Поэтому "на" и "внутрь".

6.33, pavlinux (ok), 23:10, 01/06/2008 [^] [^^] [^^^] [ответить]

+/–

>>> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2
>>PCI Express 2.0 нету для PIII чипсетов.
>
>Покойный Борис Мостовой как-то выиграл спор, кажется, насчёт "поставить NT на Sun":
>поставил коробку с NT на коробку с железкой. Физически. :)
>
>
>Поэтому "на" и "внутрь".

Ну если это ускорит фильтрацию спама, рубилку вирусов, и squid - то флаг в руки.
Может как раз, этих 500 грамм и не хватает для большей производительности...

7.42, Phenom (?), 12:33, 02/06/2008 [^] [^^] [^^^] [ответить]	+/–
Простите, а можно узнать, какие приложения работают на рабочей станции стоимостью 16 000 Евро?

8.47, pavlinux (ok), 14:38, 02/06/2008 [^] [^^] [^^^] [ответить]	+/–
kernel glibc gcc и CUDA, ну хрень вская для моделирования и расчётов - бумажка и... текст свёрнут, показать

4.40, Аноним (5), 10:49, 02/06/2008 [^] [^^] [^^^] [ответить]	+/–
gt оверквотинг удален Я не понял, причем тут ФриБСД к GPU И чем Фря хуже Лину... большой текст свёрнут, показать

3.41, crick (?), 12:09, 02/06/2008 [^] [^^] [^^^] [ответить]	+/–
>Народ! А как я могу это использовать в трудовай жизни! >Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav >+ postfix + spamassasin + mysql + sams + lighttpd. А зачем? Разве Пень3 не справляется с таким объемом? Лично я делаю так. В нашей конторе периодически происходит обновление парка компьютерной техники. У меня в кабинете валяется куча стареньких, но рабочих пеньков (причем первых, а не третьих). Я просто разношу все в пространстве. Т.е. mysql на одной машине, squid на другой, postfix с обвесом (clamav, spamassasin и т.п.) на третьей и т.д. Если контора большая и жадная, то такой подход работает без проблем. А если контора маленькая, то непонятно почему Пень3 не справляется. Может на нем еще и Xorg крутится?

4.44, anonymous (??), 14:13, 02/06/2008 [^] [^^] [^^^] [ответить]	+/–
непонятно почему эта техника не на балансе и все такое...

3.53, igorsia (?), 09:35, 14/10/2010 [^] [^^] [^^^] [ответить]	+/–
> Народ! А как я могу это использовать в трудовай жизни! > Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav > + postfix + spamassasin + mysql + sams + lighttpd. если у тебя свой сайт или VPN с шифрованием можно возложить на GPU задачу сжатия и (или) шифрования данных.

1.43, Andrey Mitrofanov (?), 13:08, 02/06/2008 [ответить] [﹢﹢﹢] [ · · · ]

+/–

>Исследователи из Антверпенского университета (Бельгия) создали

Вот - по-русски и подробнее: http://www.ixbt.com/news/all/index.shtml?10/57/17

На обсчёте томограм они "побили" восьмью GPU в одной PC-системе за ~4000 евро кластер о 256 узлах на 2,4ГГц Оптеронах, три года тому купленный за 3.5 млн. евро...

---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"

2.46, pavlinux (ok), 14:26, 02/06/2008 [^] [^^] [^^^] [ответить]	+/–
>>Исследователи из Антверпенского университета (Бельгия) создали > >Вот - по-русски и подробнее: http://www.ixbt.com/news/all/index.shtml?10/57/17 > >На обсчёте томограм они "побили" восьмью GPU в одной PC-системе за ~4000 >евро кластер о 256 узлах на 2,4ГГц Оптеронах, три года тому >купленный за 3.5 млн. евро... > >---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!" > Разницу, 3500000-4000 конечно выплатили программистам в качестве премии.... :)

2.52, Andrey Mitrofanov (?), 14:14, 04/06/2008 [^] [^^] [^^^] [ответить]

+/–

Знаете ли вы, что Столман не любит ATi, а Дональд Кнут -- НВидию? %-))
https://www.opennet.ru/opennews/art.shtml?num=15763
https://www.opennet.ru/opennews/art.shtml?num=15568

>---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"

...Каждому покупателю Quadro -- собственнический видео-драйвер, томограф(*) и свинцовый кастюм БЕСПЛАТНО(**)!

(*)предложениеограниченоантверпеном(тм)
(**)*ме-е-елким-мелким шрифтом внизу-сбоку неконтрастным цветом* Свинец может быть опасен для, молоко за вредность в [бесплатный] комплект собственнических видео-драйверов не входит.

1.45, бедолага (?), 14:23, 02/06/2008 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Главное отличие Интеловского проча от НВидевкого то, что первый унифицированный процессор а второй векторный. То есть ни для кого не секрет, особенно для тех кто работает в области научного инженеринга что основная проблема там работа с матрицами, на интеловскоп процессоре возможно только линейные операции, то есть туже матрицу нужно преобразовать в линейный вид) для матриц размером меньше 5 большой проблемы нет а вот для больших требуется значительные усилия, в своё время графический процессор буть он Нвидиа или АТИ является векторным прочессором , что позволяет оперировать уже не линейным видом матрицы а а самой матрицой))) . Сам использовал данный метод для оптимизации расчетного модумя, но говорть о сравнениие тут неумесно)) . Так как это имхо разные вещи !

1.48, Аноним (12), 17:14, 02/06/2008 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Эх, вот если бы прикрутили что-то подобное к xine/mplayer и etc для декодирования НД-контента...

1.50, toivo (?), 13:57, 03/06/2008 [ответить] [﹢﹢﹢] [ · · · ]

+/–

Ну, прям, дети....

Специализированные ускорители применялись достаточно давно. И на ПЦ и на МАКе.
К несчастью мы идем путем тяжелого наследия архитектуры 8080, а не путем кульного PDP-11/VAX.

Работа на рынок потребления развращает разработчиков -- можно отложить самоочевидную вещь на потом и _продать_ ее, как мегафичу. Что и наблюдаем -- 3Д ускоритель появились лет 15 назад, а то что это быстрый спецпроцессор дошло только сейчас.

Удачи.

2.51, dRiZd (?), 13:57, 04/06/2008 [^] [^^] [^^^] [ответить]	+/–
Про доп. ресурсы народ уже давно думал, тока не было спецификаций и прикладного ПО. Все же закрыто. Я до этого допер когда у меня появился первый 3Dfx Voodoo.

игнорирование участников | лог модерирования

Добавить комментарий

Текст: