> Да просто запустите Memtest86 или Memtest86+ на сутки.В этом случае такой хлам надо заменить. Если без ECC - ASAP к тому же, пока ФС и проч не развалилась нахрен и битрот не побил данные.
> Проблема есть, но биты вышибаются часто те, которые не принадлежат коду программ
> или они отвечают за часто одноразовый дисковый кэш,
Хороший способ убить себе ФС и файло так то. Файлухи с чексумами такое УГ еще и хайлайтят, так что у меня парочка мусорных процов и модулей оперативым образовались. Юзать такое гумно, тем более для сеья - может только истинный опеннетский эксперт.
> замечают. Данные в оперативки постоянно инвалидируются, а попасть на hot code
> не так легко, ибо его относительно мало.
Вообще-то все это счастье, включая и вон то - прекрасно детектится допустим ФС с чексумами. Или вот ошибками распаковки архивов. Или сбоем верификации хешей торентов. Порой надо прогрев еще, ибо margins при нагреве уменьшаются.
> Взять то же ядро - допустим у вас 64GB RAM, а ядро
> занимает дай бог 32MB. Т.е. bit flip в коде ядра может
> появиться с очень маленькой вероятностью
Ядро жрет гигабайты под дисковый буфер. И будет очень сильно не круто, когда вам его флипнутый запишут на диск. В лучшем случае в фс отвалится чексумма, если это там было, и вы узнаете что железо у вас мусор. В хучшем вы будете уверены что все ЗБС - но однажды например ФС резко и внезапно крякнет. Так бывает. Я парочке таких неудачников NTFS выковыривал. Все работало до тех пор пока он вообще не перестал маунтиться, унося винду в бсод при попытке это сделать.
> бинарник Chrome > 200MB (236 239 024 байт текущая стабильная версия),
> но там активен далеко не весь код, а дай бог ~10% от него.
Нормальную оперативу с ECC можно еще и scrub'ить чтобы ЗНАТЬ сколько и чего. Но экспертам опеннета про это не рассказывают видимо. И даже вон те доки по ссылке они явно не читали, только загуглили.
> теперь обязательно с ECC - только внутри, но это достаточно, чтобы
> исключить хотя бы ошибки хранения и чтения данных с оперативки.
Ну как бы ошибки передачи это не отменяет - и кроме того - а хост информируется об этом факте? End to end ECC - лучше, ниипет.