> ну, собственно, следующее же действие в этом случае - вырубать питание, может
> даже - без шатдауна, и разбираться, что повредили и чему тут
> на диске вообще доверять можно.Можно для начала readonly remount сделать, чтоли.
Я поэкспериментировал чуть дальше и в челом теорвер как-то неплохо сдвинулся в сторону окуня в живой воде. Относительно статичным данным типа системы пофиг, по логичной причине. Чтение чуть надежнее из-за перезапроса с второй копии вместо отгрузки битого "как есть", из-за теорвера дважды подряд все же не рушится при редких глюках. Ну то-есть кверху пузом вроде и может всплыть, но вообще - плавает. Но если данные нужны, так лучше не экспериментировать. И я не знаю не угрохает ли он себе так метаданные в конце концов, и если да - то через сколько.
> Проблема что этот error будет где-то в логах, которые не факт что
> заметишь в тот же месяц. Хотя бы - месяц.
Для себя я иногда посматриваю статистику девайсов. Там счетчик csum error'ов есть.
> Что там будет в логах event viewer - я хз, у меня
Изначально, наверное, ничего: NTFS же не хранит чексумы? Значит и не заметит ничего этакого с наскока. Когда-нибудь дестрой доберется и до метаданных, вот там уже возможны варианты. Но вариантом может быть и немоунтабельный том или bsod в ntfs.sys. Видал такое несколько раз. Очень ценные данные сторонними читалками бывает можно вынуть порой, но вот это уже не заслуга MS.
> настолько гнилой техники под виндой все же не бывало.
К счастью это не у меня :D но мне было любопытно подсунуть btrfs'у что-нибудь стремное.
> с уже испорченного блока (если мы про машину с битой памятью)
> - так она и при чтении совпадет.
Да, и поэтому постепенно данные могут загадиться если их перезаписывать. А по идее и метаданные. Так что это потрошеный окунь в живой воде. Но тут еще фокус в том что хеширование торента грело RAM, провоцируя глюки в более приличном количестве. Простая запись в этом плане намного менее "токсична".
> ну ок, будем считать, что хотя бы частично тест прошел.
Я думаю что постепенно метаданные могут и загадиться, но как это посмотреть за реалистичное время я не знаю. Если интенсифицировать глюки, системе начинает плохеть, это здорово мешает, да и любой юзер от этого взвоет и ему спецы это так или иначе починят или он купит новый комп.
> (для справок, существует образ zfs, который просто вызывает kernel panic. scrub'ом не
> лечится, а offline fsck у zfs нет.
Хе, прикольно. Я бы сказал так:
1) Если бы у меня был такой образ, я бы его разработчикам btrfs показал, если там нет ничего ужасного. Если невозможно/не вышло минимизировать - трейс кернельного факапа как минимум.
2) Снесенные суперы лично я возвращал btrfs rescue super-recover. Прикольно что они такие предусмотрительные в тулсах.
3) Если everything has failed, btrfs restore можно вычитать все что читается без монтирования. Потыкав в разные точки входа деревьев, если дело совсем тухляк. Это как те коммерческие офлайн читалки совем убитого ntfs для винды. Только сразу родным тулкитом ФС. По-моему круто придумано :)
4) Кстати, идея: цепануть образ к _виртуалке_ и дать разработчикам полазить в ее памяти/продебажить? Образ им для этого слать не надо. И даже если отдебажат в хлам - так тестовую виртуалку же, а не хоста. И много инфо не сопрут, особенно с упавшим ядром :D
IIRC, qemu умеет дебагсервер для gdb вывешивать. Живость ядра там до лампочки: gdb будет с qemu общаться, а тот живой. То-есть как-то так: qemu-system-x86_64 <whatever crap> -gdb tcp::1234 и пробросить девам TCP-порт 1234. При конекте на него их gdb прицепится к VM и сможет дебажить ее сколько влезет. Это правда подразумевает готовность засетапить нечто странное и желание девов поиграть в очень странную игру с драньем зубов по телефону. Но вроде так можно и почему это не будет работать - я не придумал. Так что это скорее вопрос желания сторон пободаться с проблемой в очень странном формате.
> нельзя, поскольку личная и коммерческая инфа, и размер недетский [по понятным
> причинам, он снят не zfs send], к сожалению.)
А как тебе вон тот способ подбить автомобилем вертолет? Никак не могу придумать почему бы это не сработало. И образ слать никуда не надо...