The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19, opennews (ok), 05-Дек-18, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


61. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  +/
Сообщение от plan8 (?), 05-Дек-18, 15:12 
С btrfs аналогично: https://bugzilla.kernel.org/show_bug.cgi?id=201685#c211
Ответить | Правка | Наверх | Cообщить модератору

82. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  –1 +/
Сообщение от OldFart (?), 05-Дек-18, 16:45 
После того как красная шапка отказалась продолжать супортить БТРФС, у кого то еще есть надежда что взлетит ?
Ответить | Правка | Наверх | Cообщить модератору

90. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  +2 +/
Сообщение от Аноним (90), 05-Дек-18, 18:13 
> еще есть надежда что взлетит ?

У шапки вообще дельных спецов по файлухам толком не осталось. Так что их благосклонность к той или иной ФС просто похрен. И их потуги сделать что-то в духе btrfs/zfs путем написания обвязки на пихтонрасте к xfs+lvm  - да это прикола кусок.

А btrfs ща обслуживает миллиарды хомяков у фэйсбука. Так что он взлетел, протестирован довольно злобно, отловили даже весьма довольно странные случаи когда на 20-м терабайте файла что-то может пойти не так. У большинства людей таких файлов то нет, но у фэйсбука много разной странной фигни и достаточно ресурсов чтобы тестировать самые странные вещи.

Ответить | Правка | Наверх | Cообщить модератору

99. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  +/
Сообщение от Аноним (99), 05-Дек-18, 19:41 
> У большинства людей таких файлов то нет, но у фэйсбука много разной странной фигни

Именно. Фейсбук тестирует то, что нужно ему, а не большинству людей.

Для большинства людей потеря домашнего пор^Wфотоархива является проблемой, а у фейсбука все задублировано настолько, что падения файловой системы отдельной машины никто особо и не заметит. Просто возьмут новый диск из очередной поставки и заменят им старый.

Ответить | Правка | Наверх | Cообщить модератору

119. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  +/
Сообщение от Аноним (-), 06-Дек-18, 05:54 
> Именно. Фейсбук тестирует то, что нужно ему, а не большинству людей.

И гугл. И редхат. И все остальные, в общем то.

Откуда мораль: чем больше народа наваливается на то или иное - тем лучше по багам. А точнее их отсутствию.

> Для большинства людей потеря домашнего пор^Wфотоархива является проблемой, а у фейсбука
> все задублировано настолько, что падения файловой системы отдельной машины никто особо и не заметит.

Однако даунтаймы и переходные процессы - нежелательны и для фэйсбука...

> Просто возьмут новый диск из очередной поставки и
> заменят им старый.

С другой стороны, обычная файлуха при например осыпающемся винче выдающем на гора труху - может довольно долго вообще не издавать ни звука. А когда дестрой наконец доберется и до метаданных, в объеме когда ФС это замечает - одному Ктулху известно что там с данными уже в этот момент.

Ну и так простой пример: btrfs налетев на BAD в метаданных на ноутбучном диске отругался на чексум еррор и просто достал метаданные с второй копии. Потому что по умолчанию он кладет на однодисковых конфигах метаданные дважды. А будь там ext4 какой - во там дестроища то было бы, когда блок метаданных вообще совсем не прочелся, недоступен, консистетность потеряна, и за дальнейшее никто вообще совсем не отвечает... а RAID это прекрасно, но куда ж его в ноуте упаковать? Вот btrfs с своей гибкостью аллокации для метаданных эрзац-RAID1 из 1 диска делает. А обычные ФС так конечно же не умеют. Особенно чтоб только для метаданных. Потому что зеркалить винч целиком сам на себя все же не очень полезно - он может и целиком загнуться и тогда с зеркала толку мало. Зеркало только метаданных - это такой очень разумный баланс, минимизирующий тормоза и повышающий надежность самых критичных областей файлухи, сбой в которых чреват очень большими разрушениями. Как бы бэд под файлом - портит только файл. Бэд под метаданными - может половину ФС развалить.

Ответить | Правка | Наверх | Cообщить модератору

136. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  –1 +/
Сообщение от пох (?), 06-Дек-18, 10:09 
>> все задублировано настолько, что падения файловой системы отдельной машины никто особо и не
>> заметит.
> Однако даунтаймы и переходные процессы - нежелательны и для фэйсбука...

если они окажутся трейдоффом с производительностью - пейсбук просто померяет, сколько нод ему потребуется добавить для относительно незаметной пользователю потери, а сколько - ради работы с менее эффективной fs, а если с ценой обслуживания грамотными специалистами - то сколько можно заменить макаками и сколько на сэкономленные зарплаты можно установить картонных серверов (или из чего они там у пейсбука, картонные были у гугля)

А вот редгада не поймут-с, если он данные клиентов превратит в тыкву, им индуса стимулировать придется.

> С другой стороны, обычная файлуха при например осыпающемся винче выдающем на гора труху

это можно долго не замечать только в сервере в шкафу со швабрами, все равно не нужен - на своей любимой домашней машине с котиками ты заметишь раньше, чем сработает оповещалка smart.

Правда, со времен "щелкающих" дятлов я подобных дисков не видал - сейчас, обычно, чпок - и все твои данные превращаются в тыкву без объявления войны и долгих предисловий, а признаком беды является медленная запись или чтение, когда рано или поздно прочитывается.

> Бэд под метаданными - может половину ФС развалить.

да нет, с чего это. Ключевые метаданные так или иначе дублируются в любой fs, начиная с ms fat (как, по-твоему, вообще работает fsck на тех fs где ее осилили написать?). Либо файл испортит, либо каталог, а файлы найдешь потом в lost+found.

Правда, современные (в смысле, после ext2) fs и дисковые драйверы еще и очень неадекватно работают (совсем я бы сказал не работают) с нечитаемыми секторами, который на современном винте получить - достаточно выключить питание в момент записи.

Ответить | Правка | Наверх | Cообщить модератору

150. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  +/
Сообщение от Аноним (-), 06-Дек-18, 12:00 
> сэкономленные зарплаты можно установить картонных серверов (или из чего они там
> у пейсбука, картонные были у гугля)

Для них зарплата нескольких файлушников - сущая фигня на фоне толпы админов, скриптомакак и прочего сброда. И если скриптомакак можно в случае чего новых нанять из очереди за забором, то вот с парнями занимающимися ФС и блочным уровнем это не работает. Достаточно посмотреть на пируэты RH с XFS-ом. Видимо там очереди за забором не нашлось и редхат выкручивается как умеет, пытаясь сделать какое-то подобие прямо из скриптомакак. Идея прикольная, конечно, но, ух, некоторым менеджерам видимо не сказали что идеальная взаимозаменимость сотрудников - это все же немного миф и желаемое состояние дел, а не действительное.

> А вот редгада не поймут-с, если он данные клиентов превратит в тыкву,
> им индуса стимулировать придется.

Ну так к особо крупным клиентам - может и первым самолетом кто-нибудь относительно вменяемый прилететь. Он таки сможет и в хексэдиторе посмотреть, по месту, и худо-бедно допинает до кондиции. Но на всех такого сервиса явно не хватит. Поэтому им будут наслаждаться только те в состоянии отвалить чемодан баксов. Остальные отфильтруются и пойдут в пень. А нагрузка на саппорт придет в норму как раз. Заодно и совсем отказаться от шляпного саппорта будет чревато. Для крупняка. А мелочь и их проблемы редхат мало интересуют, если кто не заметил. Это еще старина Ульрих прямым текстом глаголил :)

> все равно не нужен - на своей любимой домашней машине с
> котиками ты заметишь раньше, чем сработает оповещалка smart.

Да щас. Вон там юзери с глючным железом заметили что с нтфс что-то не то. К моменту когда они это заметили - половина файлов уже в состоянии трухи. Битые блоки в середине картинок, так что вот вам фото до пояса - а дальше decode error, сбойный блок. И кучка зипушников с CRC error. И сетапы которые не запускаются, падают или вопят про corrupt installer. Ну вот заметили. И обтекли. Потому что бывает поздняк метаться. При таком уровне дестроя пролюблено довольно много данных. С чексумами они бы это заметили гораааааздо раньше. Соьссно было бы достаточно запустить изредка тест на зипарях - он все скажет. Но это ж надо явно заморочиться. А тут и матюки в логах сами, про scrub слышали все кто минимально интересовался темой, и это все ж стандартная процедура, а не ее эрзац из самоличного теста зипов по всему диску.

> Правда, со времен "щелкающих" дятлов я подобных дисков не видал - сейчас,
> обычно, чпок - и все твои данные превращаются в тыкву без
> объявления войны и долгих предисловий,

Зато я видел предостаточно такого. В многих случаях винч начинает плавно осыпаться. А бывают глюки железа, ну там SATA кабель поганый например. Да что там, даже если по винчу #$%нули или уронили, он чаще всего скопытится не сразу. Пыль от head slap по гермозоне разлетаться, конечно, начнет, данные будут рушиться, если долетит до служебки и накроет все копии - "ойпи...ц". Потому что после этого винч даже стартануть не сможет, с точки зрения юзеря будет полным трупиком. Но ДО этого момента можно успеть вынуть многое, если руки и голова на правильных местах. Профи могут потрепыхаться и опосля, забутявив хард с внешнего интерфейса, если тот не может модули с блинов читануть.

> а признаком беды является медленная запись или чтение, когда рано или поздно прочитывается.

Smart к этому моменту скорее всего будет содержать уже полдюжины индикаторов проблем. Даже у дубовых и глючных фирмварин. И если уж кого признаки интересовали - в smart они обычно виднее. Хотя замер времени чтения вполне себе известный метод оценки общего состояния пациента. Есть специализированные проги которые это делают более-менее правильно.

> да нет, с чего это.

А с того что очень зависит что именно там грохнется и как на это среагирует код ФС. Это нестандартная ситуация и в целом там может быть все что угодно. Кормить софт нестандартными ситуациями - на редкость дерьмовая идея, если интересовал результат. Кроме случая когда ты тестированием занят и запустил AFL и прочие Syzkaller'ы конечно, так что тебе за дестрой еще и зарплату платят. А вот на своих данных что-то такое сделать - офигенный способ их резко и больно пролюбить, в случае если упомянутые именно вот так почему-то еще не попробовали.

> Ключевые метаданные так или иначе дублируются в любой fs, начиная с ms fat (как,
> по-твоему, вообще работает fsck на тех fs где ее осилили написать?).

Угу. И работает это зачастую так: вот тебе 75% от второй таблицы FAT, и более - нифига, даже партишна нетути. Потому что FAT по eraseblock-ам неудачно попал. По законам мерфи, потерли eraseblock, а записать взад не успели, питание чих-пых как раз. И отлетел весь первый FAT с партишном, и кус второго. На фабричной ФС такого пытались избежать, но умная клава отформатила флеху. И теперь неаккуратное выдергивание без размонтирования - это вот так. Спасибо если так. Потому что может и транслятор у контроллера развалиться - и тогда ты получишь своих котяток причудливо нарезанной зеброй. И хрен сам что сделаешь. Да и про могут многое но - не волшебники, и если транслятор совсем уж пролюбился - собрать из котлеты корову можно лишь какой-нибудь угадайкой, для пары самых нужных файлов.

> Либо файл испортит, либо каталог, а файлы найдешь потом в lost+found.

Угу, при том если порушится какое-нибудь описание размещения файла, по законам мерфи, самого ценного и нужного, конечно же (его поди часто телепают, если это БД какая, так что там много метаданных, их часто трогают, так что отклонения от идеала как раз где-то там и случатся) - искать его придется по всей площади диска. Без полноценной инфо о размещении файла. Очень увлекательно. И хранить вообще всего по, допустим, два - ну как бы можно но усложняет и замедляет ФС и так делают не все, не всегда и не везде. И как там Мерфи сложится в вот конкретно этом бэде вот конкретно здесь - проверять на своих данных не рекомендуется, если они нужны. Ну да, может быть дестрой будет и небольшой. А может и большой. Это будет очень экспериментальный запрыг на грабли с крайне негарантированным результатом.

А если там реально всего по два так что ФС тупо вынула копию блока из другой локации - вот тут метаданные не пострадали, как там будет крючиться в глюках парсер - мы таки к счастью не узнаем. И это таки очень полезно для сохранности данных.

> Правда, современные (в смысле, после ext2) fs и дисковые драйверы еще и
> очень неадекватно работают (совсем я бы сказал не работают) с нечитаемыми секторами,

Да как сказать? Если например инфо о размещении файла утрачено - как адекватная работа с файлом вообще может выглядеть, интересно? Ну если метаданные дублированы - логично попытаться починить проблемную копию из второй. Винч при записи ремапнет проблемный сектор (или не ремапнет, если тот запишется и прочтется) и дело с концом.

Самое умное - выпасть в ридонли да констатировать факап, чтобы сильнее все не испортить. Собственно большинство ФС что-то такое и предпочитают - и это очень хорошая и умная реакция на проблему. Ну и ядро обычно делает несколько попыток читануть сектор. Если тот за несколько попыток не того - вот честно, лучше оставить его в покое. Потому что если долбить проблемную область попытками чтения - есть шансы что механика или кто там сбоил - окончательно склеит ласты и тогда данные вынуть напрягутся даже эксперты по восстановлению. Поэтому если за несколько попыток не проканало - это лучше вытаскивать уже вообще совсем другим софтом. Специализированным. Реализующим весьма специфичные паттерны доступа, нацеленные на постепенную реконструкцию образа. Пхать ЭТО в логику обычного ФС-а ни к чему - это для махровых датареков, когда все уже плохо, рядовой юзерь с этим уже не справится и даже не оценит проблему адекватно. А потом пролюбит вообще все, резко и больно, и вот тогда это даже про уже не вынут.

> который на современном винте получить - достаточно выключить питание в момент записи.

Ну да, странная хня иногда случается. Многие типа-сбойные (UNC) сектора после перезаписи - вполне исправные оказываются. Особенно актуально для глючных питальников. Но вообще это чревато именно резкой кончиной девайса. Там еще и сервометки, видите ли, и если при глюках винч их вынесет - он потом вообще не будет знать где у него что. И вот просишь ты сектор - а тебе в ответ бабах - IDNF. Нет такой буквы в этом слове. Хотя запрошенное и было в верном диапазоне.

А случае с флешовыми штуками все хуже - они крупноблочные и апдейт любых структур, что ФС, что внутренней трансляции подразумевает RMW больших блоков. При этом они неизбежно висят в RAM накопителя на момент патчинга и если питание пролюбится... в лучшем случе механика сделает cow-like фокус и откатится на вариант до начала этого маневра. А в хучшем будет очень чудесатый трупик, отдающий очень чудесатые данные. Или ничего не отдающий - фирмварь может и не взлететь без критичных таблиц.

Ответить | Правка | Наверх | Cообщить модератору

165. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  –1 +/
Сообщение от пох (?), 06-Дек-18, 15:01 
> то вот с парнями занимающимися ФС и блочным уровнем это не работает.

именно по этой причине их лишней работой и не перегружают - для мордокниги нужна производительность, ее и пилите. А надежность - вон, у оракла много лишних денег, правда, он их никому не дает, потому и много...

> Ну так к особо крупным клиентам - может и первым самолетом кто-нибудь относительно вменяемый
> прилететь.

ну прилетит, а дальше-то что? Если разведет руками и скажет "ой, оно тут уже не чинится" - так я тоже умею.

> Smart к этому моменту скорее всего будет содержать уже полдюжины индикаторов проблем.

читайте гуглодоки, они рулез. Вообще не нашлось корреляции между состоянием смартовых индикаторов и вероятностью внезапного отказа на большой выборке, увы. Может с тех пор смарт и стал получше, но вряд ли что глобально изменилось.

> Если тот за несколько попыток не того - вот честно, лучше оставить его в покое.

а вот этого они как раз и не умеют. Поэтому вместо одного ненужного файла в tmp - получаем убитый диск. А бегать при любом мелком сбое за специализированным софтом и хардом мало кто может себе позволить. (да и толку, если это экзотическая система, а не fat)

В каком-нибудь 2004м в подобных случаях я переключал диск в pio (чтобы нормально работали таймауты, а не dma reset по всей роже), искал в логе сбойный блок, оно там обычно было, и добавлял его в badlist - те fs так умели. Хрен с ним, с тем файлом, он уже мертвенький - зато остальной сервер я не буду переустанавливать, а просто склонирую. Попробуйте повторить этот фокус с lvm, xfs или чем там модно? Даже если в файл попало, а не в чортов журнал.

> Ну да, странная хня иногда случается.

ничего странного - ibm запатентовала sector marks, [пере]записываемые вместе с данными, еще в 97м году. Нет метки - нет сектора, вообще нет его такого.

Ответить | Правка | Наверх | Cообщить модератору

193. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  +/
Сообщение от Аноним (193), 07-Дек-18, 15:29 
> именно по этой причине их лишней работой и не перегружают - для
> мордокниги нужна производительность, ее и пилите.

Для мордокниги надо все и сразу. Надежность снижает затраты на обслуживание. А производительность еще никому не мешала.

> А надежность - вон, у оракла много лишних денег, правда, он их никому не дает, потому и много...

Оракл не есть активные разработчики линукса. Судя по всему для линуксных разработчиков это за проклятое место считается. Репутация у фирмы в опенсорсной среде - не ахти.

> ну прилетит, а дальше-то что? Если разведет руками и скажет "ой, оно
> тут уже не чинится" - так я тоже умею.

Ну может он и соберет что-то и закатит солнце вручную. А может и не соберет. Откуда я знаю что редхат планирует делать? Это их бредовые идеи, кто на них купится тот и будет в саппорте редхата узнавать как они себе это представляют.

> и вероятностью внезапного отказа на большой выборке, увы.

На самом деле некая корреляция все же есть. Но специфичная по семействам винчей, фирмвари глючны в этом аспекте, поэтому в "формальных" попугаях зачастую как-то так: все збс, почти збс, ой, я "неожиданно" убился об стену! Ну вот как-то очень нелинейно smart обваливается, не знаю зачем так сделано.

Однако если смотреть RAW значения, зная повадки семейства можно прикинуть более реальное состояние дел. Но вот в автоматический мониторинг такое знание - сложно, да. И статстику набрать сложно. Там что-то типа AI надо, знающего заскоки семейств технологий.

Кроме того чтобы объективно узреть состояние поверхности, надо тест гонять. Это производительность просадит. Поэтому так делают не все и не всегда. А фирмвара соответственно сама по себе статистику может и не набрать адекватно. Потом при чтении со всей поверхности опа - а там ошибок оказывается уже. И тут read error rate фигась резко вверх! Особенно если повторять попытки чтения сбойных секторов.

> Может с тех пор смарт и стал получше, но вряд ли что глобально изменилось.

Он всегда вел себя очень специфично - и это не изменилось. И все же зная на то смотреть, можно не так уж плохо прикинуть чего от пациента ждать. Если он намерен скончаться на операционном столе, это к счастью зачастую заметно.

>> Если тот за несколько попыток не того - вот честно, лучше оставить его в покое.
> а вот этого они как раз и не умеют.

Неправда ваша, кернель как раз таки сделает 2-3 попытки прочесть, не прокатило - оставляет в покое, возвращает наверх read error и даже кеширует походу, так что повторные попытки мигом вызывают отлуп с read error совсем без насилия над девайсом вроде.

И тут тоже обоюдоострая штука. С 10-й попытки сектор мог бы и прочитаться. На этом эффекте читалки строящие образа правильно и работают. Сперва грубо вычитывают без залаза в сбойные области, а потом все и более настырно читают. В идеале могут вынуть вообще все - и тогда потерь данных нет. Хотя будучи диском компа где это просто смонтировано - выглядело ужасно.

> Поэтому вместо одного ненужного файла в tmp - получаем убитый диск.

Если диск собирался скопытиться - то уж собирался. Ну подложил бы он тебе свинью чуть позже, тебе сильно полегчало бы? Ты бы ошибочно думал еще пару месяцев что все ок. Сомнительная радость.

> А бегать при любом мелком сбое за специализированным софтом и хардом мало кто может
> себе позволить.

Если винч совсем сдох от хоть какой активности софта снаружи в пределах спеков ATA - мяч на стороне винча, как ни крути. Ему можно помочь сдохнуть немного раньше, но с точки зрения использования это ничего особо не даст, кроме некоторого времени пребывания в ложной уверенности что все ок. Это важно в основном при восстановлении данных - чтобы пациент если и скопытился, то после того как бэкапный образ хотя-бы приблизительно построен. Иначе датарек получит фигу вместо денег, просадив кучу времени, плюс недовольный клиент.

И таки при проблемах чтения стандартная логика ФС и кернела не расчитана на продвинутый рекавери с полудохлого носителя с минимизацией урона. Это специальная отдельная область, под это специально пишут программы для DR-ов. А в обычной логике ОС это явный перебор.

> (да и толку, если это экзотическая система, а не fat)

Ну я народу чаще всего EXTы выколупывал... хотя немного и FAT, конечно. И даже слегка нтфс-ы.

> В каком-нибудь 2004м в подобных случаях я переключал диск в pio (чтобы
> нормально работали таймауты, а не dma reset по всей роже),

Read dma multiple - хуже чем чтение единичных секторов. Но не сильно роялит. С правильным софтом один черт при начальном чтении скипается большой кус после налета на проблему, чтобы быстро выйти из порушеной области. А в следующих заходах можно и более активно долбить проблемные области, чем позднее итерация, тем агрессивнее. В удачном случае так даже может получиться lossless. Потому что с цатой попытки нестабильный сектор может взять и прочитаться. А может и винч вместо этого скопытиться. Фирвари нервно относятся к RAW ERROR RATE. Если все время просить проблемные сектора, можно случайно устроить накрутку, в какой-то момент фирмварь решит что устройство запредельно поломано. Уйдет в safe mode - и тогда ты точно пойдешь к профессионалам, если данные нужны. Потому что сектора то оно отдает, но даже на identify может не отвечать. И вот это для хомячка уже обломно - оно ни биосом, ни осью не детектится, а если и детектится то не подцепляется. Те как-то не готовы что 90% команд будет отлуплено/проигнорено, только read sector. Не multiple.

> искал в логе сбойный блок, оно там обычно было, и добавлял его в badlist - те fs так умели.

Современные винчи, да и SSD умеют remap. Фимрварь сама проблемные сектора переназначит, большинство фирмварей это даже достаточно сносно умеют. Если есть куда. А если уже некуда - прекратите насиловать труп. Или вы ждете пока служебка перестанет читаться? Вот тогда и останетесь без данных, резко и внезапно. Не выйдет на режим после очередного включения - и вы пролетаете.

> Хрен с ним, с тем файлом, он уже мертвенький - зато остальной сервер я не
> буду переустанавливать, а просто склонирую.

При попытке это сделать обычным софтом в обычном виде есть шанс что пациент в этом процессе откинет ласты окончательно. Иногда конечно может прокатить. Но вот это уже поиск проблем на свой окорок. Если оно реально надо - образ лучше софтом типа ddrescue/myrescue/whdd/... снимать за несколько итераций. И даже так - что он прочтется lossless не факт, поэтому безбашенно его влупить как есть куда-то еще чревато глюками или ВНЕЗАПНЫМ отвалом файлухи. Оно надо? Сэр очень талантлив в раскладывании грабель, теперь я понимаю почему у него линуксы так глючат.

> Попробуйте повторить этот фокус с lvm, xfs или чем там модно? Даже если в файл попало, а
> не в чортов журнал.

Журнал иной раз можно и аннигилировать к чертям, если проблема в нем, зачастую с маргинальными потерями. Но в этом случае речь не идет о flawless восстановлении и 100% сохранности данных. Это ок для аварийного восстановления, когда выбор нифига совсем, или хотя-бы это, вот так. А если ФС так будет в крейсерском режиме - юзер будет постепенно пролюбливать данные. Чем неполный журналинг и плох.

> ничего странного - ibm запатентовала sector marks, [пере]записываемые вместе с данными,
> еще в 97м году. Нет метки - нет сектора, вообще нет его такого.

Там все хитрее. У голосовой катушки нет треков. Она аналоговая, линейная, ей все-равно куда. Сервопривод по сервометкам понимает в какую сторону напряжение крутить, чтобы нужный трек найти. И даже вроде держит головы на дорожке, даже если та не идеально расположена, активно трекая размещение. И начала секторов помечены.

Если это все слетит, запросто и целой группы секторов не будет. Вот вам IDNF - и гудбай. Нет такого сектора на этом накопителе. При том возможности фирмвари по ремапу таких областей весьма лимитированы и когда они закончатся, фирмварь сдастся. Обычно это никто не перезаписывает, потому что себе дороже. Более того - наносят это на фабрике, прецизионным серворайтером, который таки может отмерять мелкие дорожки и нанести разметку, в отличие от винча. Сам винч это не может, поэтому фирмвара боится перспективы снести это как огня. По этой причине настоящий low level format технически невозможен без, хы-хы, серворайтера.

А вот глючное питание например может на раз помочь перезаписать сервометки. Фирварь прикладывает серьезные усилия чтобы это "should never happen", там много фокусов на тему. Вплоть до того что оставлен отступ от области данных, хоть это и пролюбливает место. Но если помочь - глючащая механика и электроника таки может сделать что-то не то.

Ответить | Правка | Наверх | Cообщить модератору

213. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  +/
Сообщение от пох (?), 10-Дек-18, 10:36 
>> Правда, со времен "щелкающих" дятлов я подобных дисков не видал - сейчас,
>> обычно, чпок - и все твои данные превращаются в тыкву без
>> объявления войны и долгих предисловий,

ну вот, кстати, верующим в смарт - добрался я таки до диска в своей безвременно сдохшей домашней помойке - он, к моему великому счастью, в принципе живой, детектится по минуте и с пары ресетов, но читается.

смарт _идеальнейший_, хоть сейчас на авито такой выставляй - ни ремапов, ни prefail состояний, даже ошибок мизер.

И только лог с записью о failed sector выдает советского разведчика ;-)


Ответить | Правка | К родителю #150 | Наверх | Cообщить модератору

215. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  +/
Сообщение от OldFart (?), 10-Дек-18, 17:07 
> смарт _идеальнейший_, хоть сейчас на авито такой выставляй - ни ремапов, ни
> prefail состояний, даже ошибок мизер.
> И только лог с записью о failed sector выдает советского разведчика ;-)

Чтобы СМАРТ обновлялся, надо переодически делать long test (делаю раз в неделю на всех серваках), а так, да, иногда диск явно сбоит, а смарт чистенький, но после лонг теста все встает на свои места


Ответить | Правка | Наверх | Cообщить модератору

219. "Выпущен патч, решающий проблему с ext4 в ядре Linux 4.19"  +/
Сообщение от Аноним (-), 11-Дек-18, 19:59 
> смарт _идеальнейший_, хоть сейчас на авито такой выставляй - ни ремапов, ни
> prefail состояний, даже ошибок мизер.

А ты запость выхлоп smartctl -a сюда, как есть... глядишь, несколько хинтов и найдется.

> И только лог с записью о failed sector выдает советского разведчика ;-)

КМК ты не понимаешь что такое идеальный смарт. Да, если ты будешь ждать пока проги начнут явно вопить - в половине случаев попль может быть за 5 минут до кончины, а еще в половине - воплей не будет потому что из винча не удалось прочитать SMART. Но если немного более проактивно смотреть на изменения параметров...

...возможно это дает идею почему smamontools'овский демон умеет мониторить изменения параметров и ругаться в лог по этому поводу.

Ответить | Правка | К родителю #213 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру