forum.opennet.ru

Составление сообщения

Исходное сообщение

"Berkeley DB переведён на лицензию AGPLv3, что привело к..."
Отправлено Аноним, 09-Июл-13 20:21

> вы точно уверены в своих словах?
Я уверен что я в состоянии прочитать dmesg и увидеть где самые забористые бенчи :)

[    3.803854] raid6: sse2x4   10175 MB/s
[    3.803876] raid6: using algorithm sse2x4 (10175 MB/s)
[    3.803880] raid6: using ssse3x2 recovery algorithm
[    3.804370] xor: automatically using best checksumming function:
[    3.844856]    avx       : 10181.000 MB/sec
>  AES/CRC32 и прочие подобные инструкции - не являются SSE subset -
Они, конечно, не являются, но упомянутый компилер и их собрать не сможет, так что в этом плане - однофигственно. И вон там выше и пример того как SSE-вариант победил в бенче опять же.
Подобные вещички без SSE и AVX почему-то в несколько раз тормознее. А этот код - совсем не то место где хотелось бы налететь на тормоза.
> это вполне себе отдельный кусок cpu.
Да какая с точки зрения програмеров и компилеров разница? Все-равно авно кастомный асм надо в парочке модулей заковырять как вставки. Что в случае SSE, что в случае AVX/AES/....
> И для детектирования используются cpuid флаги отнюдь не SSE. Вон ребята писали
> реализацию crc32/crc32c для интела - так что плавали знаем.
Да какая разница? С точки зрения програмера и компилера - индифферентно в нашем контексте поддержки таких выкрутасов со стороны компилера.
> на счет рейда - намного быстрее SSE бегает IO AT - вполне
> себе аппаратно считает checksum/PQ - только имеет свои проблемы и не
> очень рекомендовано к использованию. А так - 2.5GB/s через него прокачать
> можно - выше правда проблемно.
Ну вон выше был бенчмарк. С SSE и AVX оно на моем десктопе 10Гб в секунду могет. Понятно что это больше теоретические цифры, но без этих улучшайзеров скорость обваливается в несколько раз. Я туго себе представляю как можно обмолотить 10 гиг в секунду без оптимизнутого по самые уши ассемблера в критичных местах.
Вообще, стараниями интела и прочих - криптографию и тому подобные вещи в ядре очень сильно оптимизируют нынче и с новыми наборами инструкций оно реально выигрывает. Местами довольно сильно. Интелу то понятен интерес - так привлекательность новых чипов повышается. С другой стороны - странно если аппаратная фича есть а софт ей не пользуется. Вот теперь - и пользуется и выигрывает по полной программе.
> Если ты объяснишь зачем в KVM внутри рейд. И почему не расположить
> диски от KVM на рейде в host системе.
Ну так вот на хосте оно от SSE и выиграет, фигле. Я вообще нигде не говорил что в KVM виртуалке надо RAID. Это ваша больная фантазия разбушевалась, я тут не при чем :).

Исходное сообщение
"Berkeley DB переведён на лицензию AGPLv3, что привело к..." Отправлено Аноним, 09-Июл-13 20:21
> вы точно уверены в своих словах? Я уверен что я в состоянии прочитать dmesg и увидеть где самые забористые бенчи :) [ 3.803854] raid6: sse2x4 10175 MB/s [ 3.803876] raid6: using algorithm sse2x4 (10175 MB/s) [ 3.803880] raid6: using ssse3x2 recovery algorithm [ 3.804370] xor: automatically using best checksumming function: [ 3.844856] avx : 10181.000 MB/sec > AES/CRC32 и прочие подобные инструкции - не являются SSE subset - Они, конечно, не являются, но упомянутый компилер и их собрать не сможет, так что в этом плане - однофигственно. И вон там выше и пример того как SSE-вариант победил в бенче опять же. Подобные вещички без SSE и AVX почему-то в несколько раз тормознее. А этот код - совсем не то место где хотелось бы налететь на тормоза. > это вполне себе отдельный кусок cpu. Да какая с точки зрения програмеров и компилеров разница? Все-равно авно кастомный асм надо в парочке модулей заковырять как вставки. Что в случае SSE, что в случае AVX/AES/.... > И для детектирования используются cpuid флаги отнюдь не SSE. Вон ребята писали > реализацию crc32/crc32c для интела - так что плавали знаем. Да какая разница? С точки зрения програмера и компилера - индифферентно в нашем контексте поддержки таких выкрутасов со стороны компилера. > на счет рейда - намного быстрее SSE бегает IO AT - вполне > себе аппаратно считает checksum/PQ - только имеет свои проблемы и не > очень рекомендовано к использованию. А так - 2.5GB/s через него прокачать > можно - выше правда проблемно. Ну вон выше был бенчмарк. С SSE и AVX оно на моем десктопе 10Гб в секунду могет. Понятно что это больше теоретические цифры, но без этих улучшайзеров скорость обваливается в несколько раз. Я туго себе представляю как можно обмолотить 10 гиг в секунду без оптимизнутого по самые уши ассемблера в критичных местах. Вообще, стараниями интела и прочих - криптографию и тому подобные вещи в ядре очень сильно оптимизируют нынче и с новыми наборами инструкций оно реально выигрывает. Местами довольно сильно. Интелу то понятен интерес - так привлекательность новых чипов повышается. С другой стороны - странно если аппаратная фича есть а софт ей не пользуется. Вот теперь - и пользуется и выигрывает по полной программе. > Если ты объяснишь зачем в KVM внутри рейд. И почему не расположить > диски от KVM на рейде в host системе. Ну так вот на хосте оно от SSE и выиграет, фигле. Я вообще нигде не говорил что в KVM виртуалке надо RAID. Это ваша больная фантазия разбушевалась, я тут не при чем :).

Ваше сообщение
Имя*:
EMail:	Для отправки ответов на email укажите знак ! перед адресом, например, !user@host.ru (!! - не показывать email). Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:	>> вы точно уверены в своих словах? > Я уверен что я в состоянии прочитать dmesg и увидеть где самые > забористые бенчи :) > [code] > [ 3.803854] raid6: sse2x4 10175 MB/s > [ 3.803876] raid6: using algorithm sse2x4 (10175 MB/s) > [ 3.803880] raid6: using ssse3x2 recovery algorithm > [ 3.804370] xor: automatically using best checksumming function: > [ 3.844856] avx > : 10181.000 MB/sec > [/code] >> AES/CRC32 и прочие подобные инструкции - не являются SSE subset - > Они, конечно, не являются, но упомянутый компилер и их собрать не сможет, > так что в этом плане - однофигственно. И вон там выше > и пример того как SSE-вариант победил в бенче опять же. > Подобные вещички без SSE и AVX почему-то в несколько раз тормознее. А > этот код - совсем не то место где хотелось бы налететь > на тормоза. >> это вполне себе отдельный кусок cpu. > Да какая с точки зрения програмеров и компилеров разница? Все-равно авно кастомный > асм надо в парочке модулей заковырять как вставки. Что в случае > SSE, что в случае AVX/AES/.... >> И для детектирования используются cpuid флаги отнюдь не SSE. Вон ребята писали >> реализацию crc32/crc32c для интела - так что плавали знаем. > Да какая разница? С точки зрения програмера и компилера - индифферентно в > нашем контексте поддержки таких выкрутасов со стороны компилера. >> на счет рейда - намного быстрее SSE бегает IO AT - вполне >> себе аппаратно считает checksum/PQ - только имеет свои проблемы и не >> очень рекомендовано к использованию. А так - 2.5GB/s через него прокачать >> можно - выше правда проблемно. > Ну вон выше был бенчмарк. С SSE и AVX оно на моем > десктопе 10Гб в секунду могет. Понятно что это больше теоретические цифры, > но без этих улучшайзеров скорость обваливается в несколько раз. Я туго > себе представляю как можно обмолотить 10 гиг в секунду без оптимизнутого > по самые уши ассемблера в критичных местах. > Вообще, стараниями интела и прочих - криптографию и тому подобные вещи в > ядре очень сильно оптимизируют нынче и с новыми наборами инструкций оно > реально выигрывает. Местами довольно сильно. Интелу то понятен интерес - так > привлекательность новых чипов повышается. С другой стороны - странно если аппаратная > фича есть а софт ей не пользуется. Вот теперь - и > пользуется и выигрывает по полной программе. >> Если ты объяснишь зачем в KVM внутри рейд. И почему не расположить >> диски от KVM на рейде в host системе. > Ну так вот на хосте оно от SSE и выиграет, фигле. Я > вообще нигде не говорил что в KVM виртуалке надо RAID. Это > ваша больная фантазия разбушевалась, я тут не при чем :).
	Введите код, изображенный на картинке:

При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру