The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Суперкомьютер из 8 GPU заменил кластер из трехсот ПК

01.06.2008 06:57

Исследователи из Антверпенского университета (Бельгия) создали суперкомпьютер на базе четырех видеокарт NVIDIA GeForce 9800 GX2 (в сумме 8 GPU), по производительности равный кластеру из 300 ПК с Intel Core 2 Duo 2.4GHz.

Проект используется в лаборатории, занимающеяся расчетами связанными с томографией, в частности разработкой алгоритмов восстановления внутренней структуры объекта по проекционным данным. На классическом ПК на тестовые расчеты было затрачено несколько недель, в то время как кластер на базе 8 GPU произвел все необходимые вычисления за несколько часов.

  1. Главная ссылка к новости (http://tech.slashdot.org/artic...)
  2. OpenNews: AMD выпускает Stream SDK для Linux
  3. OpenNews: Нестандартные методы использования вычислительной мощности графических карт
  4. OpenNews: Оптимизация процесса сортировки используя GPU графической платы
  5. OpenNews: Nvidia начинает выпуск CPU для мобильных устройств
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/16228-gpu
Ключевые слова: gpu, cluster, nvidia, math
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (51) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Michael (??), 07:55, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Это у интела FPU такое дерьмо или как?
     
     
  • 2.10, Юзер (??), 11:25, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    А вы, таки не знали :-) ?
    И никакие SSE4 уже давно не помогут.

    Думаю, что GPU nVidia (а затем и др производителей) эволюционируют в MPU (media processor unit) - навороченный аналог DSP. Будут CPU и MPU. Первый всё может сам, но плохо считает, а второй отлично считает, но ничего сам не может. MPU, скорее всего, будет выделять свои ресурсы задачам для обработки видео, криптографии и звука. Возможно, что и для физики.

    Это, конечно, моё личное мнение :-)

     
  • 2.14, FSA (??), 13:56, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Просто графические чипы затачиваются под определённые виды расчётов. В данном случае это даёт огромный открыв от классических процессоров.
     
  • 2.49, Аноним (-), 17:35, 02/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >  Это у интела FPU такое дерьмо или как?

    Скорее, это GPU такие крутые ... в определенных видах рассчетов.

     

  • 1.2, Alrond (??), 09:20, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    нвидии уже пора выходить на процессорный рынок, вот интел то "возрадуется"
     
     
  • 2.9, User (??), 11:11, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    nVidia Tegra
     

  • 1.3, Аноним (-), 09:30, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    у intel fpu по производительности примерно такой же как и у amd (если читать TFA то там есть сравнение с amdшным кластером). а на gpu считать можно только если не нужен double precision и ieee 754.
     
  • 1.4, Роман (??), 09:45, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Там еще можно винду заменить - еще быстрее выйдет, имхо! :)
     
     
  • 2.18, dRiZd (?), 14:15, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Вряд ли, сравнивал кодирование под fedora 8 x64  и под Win XP x64 SP2
    (использовались ОС со всеми заплатками на тот момент, правда в винде еще
    каспер работал), использовал lame и xvid/x264 (компилил gcc, intel c - на обоих платформах)
    с mencoder. Под виндой процесс кодирования в среднем заканчивался на ~5-17 сек
    быстрее, что, как я полагаю, находиться в пределах погрешности. Так что, по моим
    замерам преимуществ у обоих  ОС друг перед другом нет - примерно одинаковые.

     
     
  • 3.20, Logo (ok), 15:34, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >"...на ~5-17 сек..."

    А в процентах?
    Приоритет процесса кодировщика под федорой был по умолчанию?

     
     
  • 4.24, dRiZd (?), 19:02, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Я специально вопрос полировки не затрагивал (приоритет...), чтобы уравнять шансы.
    Запуск происходил на "коробочных" настройках.
    Ведь и в винде можно было бы поднять приоритет - но это все филосовские темы которые
    мало имеют общего с реалиями. Обычный юзер не будет себя заморачивать полировкой,
    а в большинстве своем даже и не представляет что это такое и с чем это едят.
     
     
  • 5.25, вжюх (?), 19:12, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    У винды с коробочными настройками активное окно получает +2 к базовому приоритету.
     
  • 3.28, alexxy (?), 20:52, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Нет такой архитектуры x64 это все бредни мелкософта и санкоф =)
    Есть либо x86_64 что тоже не совсем верно более правильно ia32_64 то бишь это 64 бита амд и интелы типа коре2
    либо ia64 что есть Itanium
    Ну нет никаких архитектур x64 =)

    ЗЫ а по теме: вычисления на GPU очень специализированы и требуют специальным образо написанный код. Да GPU быстрее чем обычный PC архитектуры типа ia32 или ia32_64 но GPU процессор векторный и специализированный. Он быстр тока в single-precision. при попытке считать на нем double все будет очень и очень медленно. Производительность упадет тогда где то на 1-2 порядка.

     
     
  • 4.30, dRiZd (?), 22:48, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +1 +/
    а ни кто и не говорил что x64 это архитектура.
    Но дабы не вносить путаницу в стан читающих,
    я указал конкретные редакции ОС.
    А Windows XP Professional x86_64 и fedora ia32_64...
    (в вашем написании) таких редакций не существует.
    Так что Ваш коммент не по существу.
     

  • 1.5, Аноним (5), 10:15, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    По-моему, чушь какая-то: 600 полноценных ядер против 8 урезанных gpu на видюхах. Значит один gpu чуть ли ни быстрее сотни нормальных ядер! Конечно, может быть у кластера узкое место - каналы передачи, но при чём тут вообще процессоры тогда.
     
     
  • 2.6, 3pleX (?), 10:50, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    А что вы хотите - узкоспециализированный процессор _всегда_ будет быстрее универсального. Чудес тут не бывает. Та же самая ситуация - с криптоускорителями.
     
  • 2.8, Аноним (-), 11:06, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >По-моему, чушь какая-то: 600 полноценных ядер против 8 урезанных gpu на видюхах.
    >Значит один gpu чуть ли ни быстрее сотни нормальных ядер!

    На некоторых задачах таки быстрее. Потому что один gpu содержит внутри себя 128 ядер, вот и получается, что 1024 ядра быстрее 600.

     

  • 1.7, Читатель (?), 10:50, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Например то что GPU имеют более высокую разрядность. Мне известны курсовые и дипломные работы по обсчету большых объемов данных сделаных на базе графических карт. И кстати взгляните на Tesla от NVidia довольно интересная вещь.
     
  • 1.11, Аноним (5), 12:41, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    что, неужели шустрее чем Cell получается?
     
  • 1.12, Аноним (12), 12:43, 01/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Во-первых, вычисления специфичны - явно 3D, чего тут удивляться.
    а Во-вторых, intel выходит наоборот - на рынок этого самого 3D - Larabee, слыхали? так что счет сравняется :)
     
     
  • 2.13, Новичок (??), 13:21, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Народ! А как я могу это использовать в трудовай жизни!
    Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav + postfix + spamassasin + mysql + sams + lighttpd.


     
     
  • 3.15, Аноним (-), 14:00, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Производительность высока лишь на параллельных вычислениях.
    Пишите себе кодеки на CUDA и возрадуетесь (однако, заюзаете вы в нем хоть один условный переход и скорость упадет стократно). Параллелизм, такой параллелизм..
     
  • 3.17, dRiZd (?), 14:01, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Никак! Да и вообще использование GPU в обычной жизни
    весьма спорное: ну может видео/mp3 пожать, архиватор прикрутить -
    больше пока перспектив не вижу. Я вот bzip2 (win32/x64) портировал
    на CUDA 1.1 - толку мало (ну стал он жать 600Мб tar не за 43 секунды,
    а за 36, и что? ). Все зависит от прикладного ПО/алгоритмов ну и
    самое главное - рук.
     
     
  • 4.19, Кубик (?), 14:22, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Интересно! А как ты думаешь если воткнуть 4 мощных карты, можно жать например за 10 сек ?
     
     
  • 5.21, const (??), 15:38, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    > если воткнуть 4 мощных карты, можно жать например за 10 сек ?

    Порвать файл на четыре и жать отдельно. Но тогда четырёхъядерный CPU будет жать, скажем, 11 секунд и опять разницу не разглядишь. ;)

     
  • 4.27, pavlinux (ok), 20:39, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    У Вас случаем не Nvidia Tesla ?
     
     
  • 5.31, dRiZd (?), 22:56, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    2 штуки Tesla C870 и 2 Quadro FX 4700 X2
    Все стоит на nForce 790i Ultra SLI
     
     
  • 6.32, dRiZd (?), 23:05, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Кстати комментом выше автор alexxy упомянул
    про single-precision  и он абсолютно прав.
    По крайней мере в моей конфигурации.
    Не факт, что у ATI дела обстоят так же
    (с их аналогами не знаком).
     
  • 6.34, pavlinux (ok), 23:17, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >2 штуки Tesla C870 и 2 Quadro FX 4700 X2
    >Все стоит на nForce 790i Ultra SLI

    Во сколько Tesla обшлась?

     
     
  • 7.35, dRiZd (?), 23:25, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Рабочая станция обошлась в 16000 евро
     
     
  • 8.36, pavlinux (ok), 23:32, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    2 Квадры и две Теслы ... текст свёрнут, показать
     
     
  • 9.38, dRiZd (?), 07:25, 02/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Да, именно так Но я правда не сказал, что корпус и периферия в промышленном исп... текст свёрнут, показать
     
  • 8.37, pavlinux (ok), 03:51, 02/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Видел - http cuda ixbt com konkurs shtml Зашли им bzip2, может приз какой-н... текст свёрнут, показать
     
     
  • 9.39, dRiZd (?), 07:31, 02/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    К сожалению вряд-ли, см раздел судейство Сходу не пройду по пунктам оригин... текст свёрнут, показать
     
  • 3.22, Michael Shigorin (ok), 17:44, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >Народ! А как я могу это использовать в трудовай жизни!
    >Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
    >+ postfix + spamassasin + mysql + sams + lighttpd.

    Постепенно приходите к мысли, что админить шлюз в эпоху сервисов неинтересно и неприбыльно, выкидываете фрю, ставите линукс, всё равно сваливаете и занимаетесь расчётными задачами (имея в резюме в т.ч. именно линуксовый экспириенс).  Тогда в трудовой, получается.

    А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2, но пригодится разве что для убивства времени...

     
     
  • 4.26, pavlinux (ok), 20:34, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    > А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2

    PCI Express 2.0 нету для PIII чипсетов.

     
     
  • 5.29, Michael Shigorin (ok), 22:27, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2
    >PCI Express 2.0 нету для PIII чипсетов.

    Покойный Борис Мостовой как-то выиграл спор, кажется, насчёт "поставить NT на Sun": поставил коробку с NT на коробку с железкой.  Физически. :)

    Поэтому "на" и "внутрь".

     
     
  • 6.33, pavlinux (ok), 23:10, 01/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >>> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2
    >>PCI Express 2.0 нету для PIII чипсетов.
    >
    >Покойный Борис Мостовой как-то выиграл спор, кажется, насчёт "поставить NT на Sun":
    >поставил коробку с NT на коробку с железкой.  Физически. :)
    >
    >
    >Поэтому "на" и "внутрь".

    Ну если это ускорит фильтрацию спама, рубилку вирусов, и squid - то флаг в руки.
    Может как раз, этих 500 грамм и не хватает для большей  производительности...


     
     
  • 7.42, Phenom (?), 12:33, 02/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Простите, а можно узнать, какие приложения работают на рабочей станции стоимостью 16 000 Евро?
     
     
  • 8.47, pavlinux (ok), 14:38, 02/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    kernel glibc gcc и CUDA, ну хрень вская для моделирования и расчётов - бумажка и... текст свёрнут, показать
     
  • 4.40, Аноним (5), 10:49, 02/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    gt оверквотинг удален Я не понял, причем тут ФриБСД к GPU И чем Фря хуже Лину... большой текст свёрнут, показать
     
  • 3.41, crick (?), 12:09, 02/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >Народ! А как я могу это использовать в трудовай жизни!
    >Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
    >+ postfix + spamassasin + mysql + sams + lighttpd.

    А зачем? Разве Пень3 не справляется с таким объемом? Лично я делаю так. В нашей конторе периодически происходит обновление парка компьютерной техники. У меня в кабинете валяется куча стареньких, но рабочих пеньков (причем первых, а не третьих). Я просто разношу все в пространстве. Т.е. mysql на одной машине, squid на другой, postfix с обвесом (clamav, spamassasin и т.п.) на третьей и т.д. Если контора большая и жадная, то такой подход работает без проблем. А если контора маленькая, то непонятно почему Пень3 не справляется. Может на нем еще и Xorg крутится?

     
     
  • 4.44, anonymous (??), 14:13, 02/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    непонятно почему эта техника не на балансе и все такое...
     
  • 3.53, igorsia (?), 09:35, 14/10/2010 [^] [^^] [^^^] [ответить]  
  • +/
    > Народ! А как я могу это использовать в трудовай жизни!
    > Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
    > + postfix + spamassasin + mysql + sams + lighttpd.

    если у тебя свой сайт или VPN с шифрованием можно возложить на GPU задачу сжатия и (или) шифрования данных.

     

  • 1.43, Andrey Mitrofanov (?), 13:08, 02/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    >Исследователи из Антверпенского университета (Бельгия) создали

    Вот - по-русски и подробнее: http://www.ixbt.com/news/all/index.shtml?10/57/17

    На обсчёте томограм они "побили" восьмью GPU в одной PC-системе за ~4000 евро кластер о 256 узлах на 2,4ГГц Оптеронах, три года тому купленный за 3.5 млн. евро...

    ---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"

     
     
  • 2.46, pavlinux (ok), 14:26, 02/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    >>Исследователи из Антверпенского университета (Бельгия) создали
    >
    >Вот - по-русски и подробнее: http://www.ixbt.com/news/all/index.shtml?10/57/17
    >
    >На обсчёте томограм они "побили" восьмью GPU в одной PC-системе за ~4000
    >евро кластер о 256 узлах на 2,4ГГц Оптеронах, три года тому
    >купленный за 3.5 млн. евро...
    >
    >---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"
    >

    Разницу, 3500000-4000 конечно выплатили программистам в качестве премии.... :)

     
  • 2.52, Andrey Mitrofanov (?), 14:14, 04/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Знаете ли вы, что Столман не любит ATi, а Дональд Кнут -- НВидию? %-))
    https://www.opennet.ru/opennews/art.shtml?num=15763
    https://www.opennet.ru/opennews/art.shtml?num=15568

    >---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"

    ...Каждому покупателю Quadro -- собственнический видео-драйвер, томограф(*) и свинцовый кастюм БЕСПЛАТНО(**)!

    (*)предложениеограниченоантверпеном(тм)
    (**)*ме-е-елким-мелким шрифтом внизу-сбоку неконтрастным цветом* Свинец может быть опасен для, молоко за вредность в [бесплатный] комплект собственнических видео-драйверов не входит.

     

  • 1.45, бедолага (?), 14:23, 02/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Главное отличие Интеловского проча от НВидевкого то, что первый унифицированный процессор а второй векторный. То есть ни для кого не секрет, особенно для тех кто работает в области научного инженеринга что основная проблема там работа с матрицами, на интеловскоп процессоре возможно только линейные операции, то есть туже матрицу нужно преобразовать в линейный вид) для матриц размером меньше 5 большой проблемы нет а вот для больших требуется значительные усилия, в своё время графический процессор буть он Нвидиа или АТИ является векторным прочессором , что позволяет оперировать уже не линейным видом матрицы а а самой матрицой))) . Сам использовал данный метод для оптимизации расчетного модумя, но говорть о сравнениие тут неумесно)) .  Так как это имхо разные вещи !
     
  • 1.48, Аноним (12), 17:14, 02/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Эх, вот если бы прикрутили что-то подобное к xine/mplayer и etc для декодирования НД-контента...
     
  • 1.50, toivo (?), 13:57, 03/06/2008 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Ну, прям, дети....

    Специализированные ускорители применялись достаточно давно. И на ПЦ и на МАКе.
    К несчастью мы идем путем тяжелого наследия архитектуры 8080, а не путем кульного PDP-11/VAX.

    Работа на рынок потребления развращает разработчиков -- можно отложить самоочевидную вещь на потом и _продать_ ее, как мегафичу. Что и наблюдаем -- 3Д ускоритель появились лет 15 назад, а то что это быстрый спецпроцессор дошло только сейчас.

    Удачи.

     
     
  • 2.51, dRiZd (?), 13:57, 04/06/2008 [^] [^^] [^^^] [ответить]  
  • +/
    Про доп. ресурсы народ уже давно думал, тока не было спецификаций и прикладного ПО.
    Все же закрыто.
    Я до этого допер когда у меня появился первый 3Dfx Voodoo.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру