> вы точно уверены в своих словах?Я уверен что я в состоянии прочитать dmesg и увидеть где самые забористые бенчи :)
[ 3.803854] raid6: sse2x4 10175 MB/s
[ 3.803876] raid6: using algorithm sse2x4 (10175 MB/s)
[ 3.803880] raid6: using ssse3x2 recovery algorithm
[ 3.804370] xor: automatically using best checksumming function:
[ 3.844856] avx : 10181.000 MB/sec
> AES/CRC32 и прочие подобные инструкции - не являются SSE subset -
Они, конечно, не являются, но упомянутый компилер и их собрать не сможет, так что в этом плане - однофигственно. И вон там выше и пример того как SSE-вариант победил в бенче опять же.
Подобные вещички без SSE и AVX почему-то в несколько раз тормознее. А этот код - совсем не то место где хотелось бы налететь на тормоза.
> это вполне себе отдельный кусок cpu.
Да какая с точки зрения програмеров и компилеров разница? Все-равно авно кастомный асм надо в парочке модулей заковырять как вставки. Что в случае SSE, что в случае AVX/AES/....
> И для детектирования используются cpuid флаги отнюдь не SSE. Вон ребята писали
> реализацию crc32/crc32c для интела - так что плавали знаем.
Да какая разница? С точки зрения програмера и компилера - индифферентно в нашем контексте поддержки таких выкрутасов со стороны компилера.
> на счет рейда - намного быстрее SSE бегает IO AT - вполне
> себе аппаратно считает checksum/PQ - только имеет свои проблемы и не
> очень рекомендовано к использованию. А так - 2.5GB/s через него прокачать
> можно - выше правда проблемно.
Ну вон выше был бенчмарк. С SSE и AVX оно на моем десктопе 10Гб в секунду могет. Понятно что это больше теоретические цифры, но без этих улучшайзеров скорость обваливается в несколько раз. Я туго себе представляю как можно обмолотить 10 гиг в секунду без оптимизнутого по самые уши ассемблера в критичных местах.
Вообще, стараниями интела и прочих - криптографию и тому подобные вещи в ядре очень сильно оптимизируют нынче и с новыми наборами инструкций оно реально выигрывает. Местами довольно сильно. Интелу то понятен интерес - так привлекательность новых чипов повышается. С другой стороны - странно если аппаратная фича есть а софт ей не пользуется. Вот теперь - и пользуется и выигрывает по полной программе.
> Если ты объяснишь зачем в KVM внутри рейд. И почему не расположить
> диски от KVM на рейде в host системе.
Ну так вот на хосте оно от SSE и выиграет, фигле. Я вообще нигде не говорил что в KVM виртуалке надо RAID. Это ваша больная фантазия разбушевалась, я тут не при чем :).