Исследователи из Антверпенского университета (Бельгия) создали (http://www.dvhardware.net/article27538.html) суперкомпьютер на базе четырех видеокарт NVIDIA GeForce 9800 GX2 (в сумме 8 GPU), по производительности равный кластеру из 300 ПК с Intel Core 2 Duo 2.4GHz.Проект используется в лаборатории, занимающеяся расчетами связанными с томографией (http://ru.wikipedia.org/wiki/%D0%A2%D0%B... в частности разработкой
алгоритмов восстановления внутренней структуры объекта по проекционным данным. На классическом ПК на тестовые расчеты было затрачено несколько недель, в то время как кластер на базе 8 GPU произвел все необходимые вычисления за несколько часов.URL: http://tech.slashdot.org/article.pl?sid=08/05/31/1633214&fro...
Новость: https://www.opennet.ru/opennews/art.shtml?num=16228
Это у интела FPU такое дерьмо или как?
А вы, таки не знали :-) ?
И никакие SSE4 уже давно не помогут.Думаю, что GPU nVidia (а затем и др производителей) эволюционируют в MPU (media processor unit) - навороченный аналог DSP. Будут CPU и MPU. Первый всё может сам, но плохо считает, а второй отлично считает, но ничего сам не может. MPU, скорее всего, будет выделять свои ресурсы задачам для обработки видео, криптографии и звука. Возможно, что и для физики.
Это, конечно, моё личное мнение :-)
Просто графические чипы затачиваются под определённые виды расчётов. В данном случае это даёт огромный открыв от классических процессоров.
> Это у интела FPU такое дерьмо или как?Скорее, это GPU такие крутые ... в определенных видах рассчетов.
нвидии уже пора выходить на процессорный рынок, вот интел то "возрадуется"
nVidia Tegra
у intel fpu по производительности примерно такой же как и у amd (если читать TFA то там есть сравнение с amdшным кластером). а на gpu считать можно только если не нужен double precision и ieee 754.
Там еще можно винду заменить - еще быстрее выйдет, имхо! :)
Вряд ли, сравнивал кодирование под fedora 8 x64 и под Win XP x64 SP2
(использовались ОС со всеми заплатками на тот момент, правда в винде еще
каспер работал), использовал lame и xvid/x264 (компилил gcc, intel c - на обоих платформах)
с mencoder. Под виндой процесс кодирования в среднем заканчивался на ~5-17 сек
быстрее, что, как я полагаю, находиться в пределах погрешности. Так что, по моим
замерам преимуществ у обоих ОС друг перед другом нет - примерно одинаковые.
>"...на ~5-17 сек..."А в процентах?
Приоритет процесса кодировщика под федорой был по умолчанию?
Я специально вопрос полировки не затрагивал (приоритет...), чтобы уравнять шансы.
Запуск происходил на "коробочных" настройках.
Ведь и в винде можно было бы поднять приоритет - но это все филосовские темы которые
мало имеют общего с реалиями. Обычный юзер не будет себя заморачивать полировкой,
а в большинстве своем даже и не представляет что это такое и с чем это едят.
У винды с коробочными настройками активное окно получает +2 к базовому приоритету.
Нет такой архитектуры x64 это все бредни мелкософта и санкоф =)
Есть либо x86_64 что тоже не совсем верно более правильно ia32_64 то бишь это 64 бита амд и интелы типа коре2
либо ia64 что есть Itanium
Ну нет никаких архитектур x64 =)ЗЫ а по теме: вычисления на GPU очень специализированы и требуют специальным образо написанный код. Да GPU быстрее чем обычный PC архитектуры типа ia32 или ia32_64 но GPU процессор векторный и специализированный. Он быстр тока в single-precision. при попытке считать на нем double все будет очень и очень медленно. Производительность упадет тогда где то на 1-2 порядка.
а ни кто и не говорил что x64 это архитектура.
Но дабы не вносить путаницу в стан читающих,
я указал конкретные редакции ОС.
А Windows XP Professional x86_64 и fedora ia32_64...
(в вашем написании) таких редакций не существует.
Так что Ваш коммент не по существу.
По-моему, чушь какая-то: 600 полноценных ядер против 8 урезанных gpu на видюхах. Значит один gpu чуть ли ни быстрее сотни нормальных ядер! Конечно, может быть у кластера узкое место - каналы передачи, но при чём тут вообще процессоры тогда.
А что вы хотите - узкоспециализированный процессор _всегда_ будет быстрее универсального. Чудес тут не бывает. Та же самая ситуация - с криптоускорителями.
>По-моему, чушь какая-то: 600 полноценных ядер против 8 урезанных gpu на видюхах.
>Значит один gpu чуть ли ни быстрее сотни нормальных ядер!На некоторых задачах таки быстрее. Потому что один gpu содержит внутри себя 128 ядер, вот и получается, что 1024 ядра быстрее 600.
Например то что GPU имеют более высокую разрядность. Мне известны курсовые и дипломные работы по обсчету большых объемов данных сделаных на базе графических карт. И кстати взгляните на Tesla от NVidia довольно интересная вещь.
что, неужели шустрее чем Cell получается?
Во-первых, вычисления специфичны - явно 3D, чего тут удивляться.
а Во-вторых, intel выходит наоборот - на рынок этого самого 3D - Larabee, слыхали? так что счет сравняется :)
Народ! А как я могу это использовать в трудовай жизни!
Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav + postfix + spamassasin + mysql + sams + lighttpd.
Производительность высока лишь на параллельных вычислениях.
Пишите себе кодеки на CUDA и возрадуетесь (однако, заюзаете вы в нем хоть один условный переход и скорость упадет стократно). Параллелизм, такой параллелизм..
Никак! Да и вообще использование GPU в обычной жизни
весьма спорное: ну может видео/mp3 пожать, архиватор прикрутить -
больше пока перспектив не вижу. Я вот bzip2 (win32/x64) портировал
на CUDA 1.1 - толку мало (ну стал он жать 600Мб tar не за 43 секунды,
а за 36, и что? ). Все зависит от прикладного ПО/алгоритмов ну и
самое главное - рук.
Интересно! А как ты думаешь если воткнуть 4 мощных карты, можно жать например за 10 сек ?
> если воткнуть 4 мощных карты, можно жать например за 10 сек ?Порвать файл на четыре и жать отдельно. Но тогда четырёхъядерный CPU будет жать, скажем, 11 секунд и опять разницу не разглядишь. ;)
У Вас случаем не Nvidia Tesla ?
2 штуки Tesla C870 и 2 Quadro FX 4700 X2
Все стоит на nForce 790i Ultra SLI
Кстати комментом выше автор alexxy упомянул
про single-precision и он абсолютно прав.
По крайней мере в моей конфигурации.
Не факт, что у ATI дела обстоят так же
(с их аналогами не знаком).
>2 штуки Tesla C870 и 2 Quadro FX 4700 X2
>Все стоит на nForce 790i Ultra SLIВо сколько Tesla обшлась?
Рабочая станция обошлась в 16000 евро
>Рабочая станция обошлась в 16000 евро2 Квадры и две Теслы?
Да, именно так. Но я правда не сказал,
что корпус и периферия в промышленном
исполнении, класс защиты ip67
Видел?! -> http://cuda.ixbt.com/konkurs.shtml
Зашли им bzip2, может приз какой-нить выиграешь!
К сожалению вряд-ли, см. раздел "судейство" .
Сходу не пройду по пунктам "оригинальность" и "полезность"
Тем более, что не я автор bzip2
>Народ! А как я могу это использовать в трудовай жизни!
>Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
>+ postfix + spamassasin + mysql + sams + lighttpd.Постепенно приходите к мысли, что админить шлюз в эпоху сервисов неинтересно и неприбыльно, выкидываете фрю, ставите линукс, всё равно сваливаете и занимаетесь расчётными задачами (имея в резюме в т.ч. именно линуксовый экспириенс). Тогда в трудовой, получается.
А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2, но пригодится разве что для убивства времени...
> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2PCI Express 2.0 нету для PIII чипсетов.
>> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2
>PCI Express 2.0 нету для PIII чипсетов.Покойный Борис Мостовой как-то выиграл спор, кажется, насчёт "поставить NT на Sun": поставил коробку с NT на коробку с железкой. Физически. :)
Поэтому "на" и "внутрь".
>>> А так -- можете поставить коробку с 9800 на коробку с PIII, внутрь GF2
>>PCI Express 2.0 нету для PIII чипсетов.
>
>Покойный Борис Мостовой как-то выиграл спор, кажется, насчёт "поставить NT на Sun":
>поставил коробку с NT на коробку с железкой. Физически. :)
>
>
>Поэтому "на" и "внутрь".Ну если это ускорит фильтрацию спама, рубилку вирусов, и squid - то флаг в руки.
Может как раз, этих 500 грамм и не хватает для большей производительности...
Простите, а можно узнать, какие приложения работают на рабочей станции стоимостью 16 000 Евро?
>Простите, а можно узнать, какие приложения работают на рабочей станции стоимостью 16
>000 Евро?kernel glibc gcc и CUDA, ну хрень вская для моделирования и расчётов - бумажка и карандаш. :)
>[оверквотинг удален]
>>Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
>>+ postfix + spamassasin + mysql + sams + lighttpd.
>
>Постепенно приходите к мысли, что админить шлюз в эпоху сервисов неинтересно и
>неприбыльно, выкидываете фрю, ставите линукс, всё равно сваливаете и занимаетесь расчётными
>задачами (имея в резюме в т.ч. именно линуксовый экспириенс). Тогда
>в трудовой, получается.
>
>А так -- можете поставить коробку с 9800 на коробку с PIII,
>внутрь GF2, но пригодится разве что для убивства времени...Я не понял, причем тут ФриБСД к GPU?
И чем Фря хуже Линукса? Я раньше работал с ФриБСД, сейчас с Линуксом и лично на мой взгляд в большинстве случаев ФриБСД отлично подходит на роль роутера. Один из жирнейших плюсов - простота обновления (и возможность удалённого) и больший контроль над установленными приложениями с меньшими усилиями. Линукс, конечно, тоже неплох.
>Народ! А как я могу это использовать в трудовай жизни!
>Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
>+ postfix + spamassasin + mysql + sams + lighttpd.А зачем? Разве Пень3 не справляется с таким объемом? Лично я делаю так. В нашей конторе периодически происходит обновление парка компьютерной техники. У меня в кабинете валяется куча стареньких, но рабочих пеньков (причем первых, а не третьих). Я просто разношу все в пространстве. Т.е. mysql на одной машине, squid на другой, postfix с обвесом (clamav, spamassasin и т.п.) на третьей и т.д. Если контора большая и жадная, то такой подход работает без проблем. А если контора маленькая, то непонятно почему Пень3 не справляется. Может на нем еще и Xorg крутится?
непонятно почему эта техника не на балансе и все такое...
> Народ! А как я могу это использовать в трудовай жизни!
> Например старенький компьютер Пень3 используется как сервер: FreeBSD 7, SQUID + clamav
> + postfix + spamassasin + mysql + sams + lighttpd.если у тебя свой сайт или VPN с шифрованием можно возложить на GPU задачу сжатия и (или) шифрования данных.
>Исследователи из Антверпенского университета (Бельгия) создалиВот - по-русски и подробнее: http://www.ixbt.com/news/all/index.shtml?10/57/17
На обсчёте томограм они "побили" восьмью GPU в одной PC-системе за ~4000 евро кластер о 256 узлах на 2,4ГГц Оптеронах, три года тому купленный за 3.5 млн. евро...
---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"
>>Исследователи из Антверпенского университета (Бельгия) создали
>
>Вот - по-русски и подробнее: http://www.ixbt.com/news/all/index.shtml?10/57/17
>
>На обсчёте томограм они "побили" восьмью GPU в одной PC-системе за ~4000
>евро кластер о 256 узлах на 2,4ГГц Оптеронах, три года тому
>купленный за 3.5 млн. евро...
>
>---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"
>Разницу, 3500000-4000 конечно выплатили программистам в качестве премии.... :)
Знаете ли вы, что Столман не любит ATi, а Дональд Кнут -- НВидию? %-))
https://www.opennet.ru/opennews/art.shtml?num=15763
https://www.opennet.ru/opennews/art.shtml?num=15568>---"Огромный шаг для НВидии и томографо-строения, немного шума в новостях для человечества!"
...Каждому покупателю Quadro -- собственнический видео-драйвер, томограф(*) и свинцовый кастюм БЕСПЛАТНО(**)!
(*)предложениеограниченоантверпеном(тм)
(**)*ме-е-елким-мелким шрифтом внизу-сбоку неконтрастным цветом* Свинец может быть опасен для, молоко за вредность в [бесплатный] комплект собственнических видео-драйверов не входит.
Главное отличие Интеловского проча от НВидевкого то, что первый унифицированный процессор а второй векторный. То есть ни для кого не секрет, особенно для тех кто работает в области научного инженеринга что основная проблема там работа с матрицами, на интеловскоп процессоре возможно только линейные операции, то есть туже матрицу нужно преобразовать в линейный вид) для матриц размером меньше 5 большой проблемы нет а вот для больших требуется значительные усилия, в своё время графический процессор буть он Нвидиа или АТИ является векторным прочессором , что позволяет оперировать уже не линейным видом матрицы а а самой матрицой))) . Сам использовал данный метод для оптимизации расчетного модумя, но говорть о сравнениие тут неумесно)) . Так как это имхо разные вещи !
Эх, вот если бы прикрутили что-то подобное к xine/mplayer и etc для декодирования НД-контента...
Ну, прям, дети....Специализированные ускорители применялись достаточно давно. И на ПЦ и на МАКе.
К несчастью мы идем путем тяжелого наследия архитектуры 8080, а не путем кульного PDP-11/VAX.Работа на рынок потребления развращает разработчиков -- можно отложить самоочевидную вещь на потом и _продать_ ее, как мегафичу. Что и наблюдаем -- 3Д ускоритель появились лет 15 назад, а то что это быстрый спецпроцессор дошло только сейчас.
Удачи.
Про доп. ресурсы народ уже давно думал, тока не было спецификаций и прикладного ПО.
Все же закрыто.
Я до этого допер когда у меня появился первый 3Dfx Voodoo.