The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Выпущен патч для исправления ошибки в ext4, которая могла привести к повреждению ФС

02.11.2012 15:49

После дополнительного разбора полетов нашумевшей ошибки в файловой системе Ext4 удалось найти настоящую причину возникновения данной проблемы и исправить именно её. Ошибка проявлялась только при монтировании файловой системы с нестандартными опциями (должны быть включены опции journal_async_commit и/или journal_checksum) в ситуации когда файловая система не была корректно размонтирована.

Тем не менее, настоящая причина возникновения данной ошибки была связана с тем, что журналирование битовых карт инодов не работало корректно. В обычной ситуации это могло как максимум привести лишь к небольшому повреждению файловой системы, видимым проявлением которой является в основном то что fsck на 5-м проходе выдает сообщение, касающееся "inode allocation bitmap" после некорректного выключения системы под тяжелой нагрузкой. Однако при активации опций "journal_checksum" и/или "journal_async_commit" проблема усугублялась и приводила к заметному для пользователя разрушению файловой системы.

Патч с исправлением причины данной проблемы уже принят в git-репозиторий Торвальдса.

  1. Главная ссылка к новости (http://www.phoronix.com/scan.p...)
  2. OpenNews: Обновление ядра Linux: 3.0.49, 3.4.16 и 3.6.4. Исправление проблемы с Ext4 задерживается
  3. OpenNews: Теодор Тцо отказался от предложений по стабилизации ФС Ext4 через создание Ext5
  4. OpenNews: Появившаяся в ядре Linux 3.6.2 ошибка способна привести к повреждению данных в ФС Ext4
Автор новости: Аноним
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/35224-ext4
Ключевые слова: ext4, linux, kernel
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (50) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (-), 17:55, 02/11/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +6 +/
    Сидел на новых ядрах и все нормально и без патча было, но ведь какое-то мелкое нарушение это такая паника у пользователей! Думаю, теперь понятно почему линукс настолько хорош :)
     
     
  • 2.2, Аноним (-), 18:00, 02/11/2012 [^] [^^] [^^^] [ответить]  
  • +21 +/
    Дотошно докапываются до всего. В пределах считанных дней. В целом для отрасли это фееричное и фантастическое зрелище: у остальных такое годами может жить и пока оно не начнет массово гасить каждого третьего - никто и не почешется.
     
  • 2.3, Карбофос (ok), 18:28, 02/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    паники не было вроде. просто тролли всполошились.
     
     
  • 3.4, Аноним (-), 19:27, 02/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Ну разумеется, только тролли работают в жестких условиях, когда даже за несколько минут простоя при накатывании бэкапа могут вые*ать.
    А у админов локалхостов, действительно, причин для паники никаких.
     
     
  • 4.5, angra (ok), 19:55, 02/11/2012 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Спасибо, посмешил. Судя по высказыванию, ты не имеешь ни малейшего понятия ни о том что такое датацентры(ну или нормальная серверная), ни о взаимоотношениях с начальством, ни даже о времени уходящем на восстановление из бекапа. А не админ ли локалхоста ты часом? Тогда для тебя печальная новость, именно таким стоило беспокоится больше всего, так как именно у них чаще всего нет ни упса, ни стабильного электричества, ни бекапов, но есть желание экспериментировать с опциями ФС.
     
     
     
     
    Часть нити удалена модератором

  • 7.35, angra (ok), 22:33, 03/11/2012 [ответить]  
  • +/
    Не стоит публично проецировать свои морально-этические принципы на других. Ведь этим ты лишь показываешь всем собственную гнилую натуру и ничего больше.

     
  • 6.27, Аноним (-), 05:14, 03/11/2012 [ответить]  
  • +1 +/
    > Я как раз из числа начальников, которые платят за "работу" админобыдлу вроде
    > тебя. Any questions?

    Я бы на такого ушибленного начальника и его результаты жизнедеятельности полагаться не стал. Поэтому огласите плиз начальником какой именно шараги вы являетесь. Ну, чтобы не вляпаться случайно.

     
     
  • 7.29, ъ (?), 11:05, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • +2 +/

    > Поэтому огласите плиз начальником какой именно шараги вы являетесь. Ну,
    > чтобы не вляпаться случайно.

    Зассыт! Я на таких начальников насмотрелся.

     
  • 6.30, nagual (ok), 15:10, 03/11/2012 [ответить]  
  • +1 +/
    > Я как раз из числа начальников, которые платят за "работу" админобыдлу вроде
    > тебя. Any questions?

    Сначала быдланасяльника выберет систему и фс которые нахер ненужны в проекте но зато реклама с телками а потом админы разгребают. Не лезли бы вы туда где ничего не понимаете. И не нада на нехватку времени сетовать.

     
     
  • 7.43, arisu (ok), 17:49, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    а если бы у него была бсд и зфс, всё бы сложилось по-другому…
     
     
  • 8.49, nagual (ok), 22:02, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Без головы Наврятли ... текст свёрнут, показать
     
  • 4.6, Аноним (-), 20:15, 02/11/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Ну разумеется, только тролли работают в жестких условиях, когда даже за несколько
    > минут простоя при накатывании бэкапа могут вые*ать.

    Хотелось бы посмотреть на админа в жестких условиях который ставит такие опции ФС при том что они не так давно сделаны. Хотя если ж...а просии приключений и хочется тестануть фичу на крутейшем энтерпрайзе - это вариант!


     
     
  • 5.20, Аноним (-), 01:24, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Хотелось бы посмотреть на админа в жестких условиях который ставит такие опции
    > ФС при том что они не так давно сделаны. Хотя если
    > ж...а просии приключений и хочется тестануть фичу на крутейшем энтерпрайзе -
    > это вариант!

    Ну да, ну да. Настоящие админы энтерпайзных локалхостов юзают только ext2, потому что ext3 и ext4 "не так давно сделаны".

     
     
  • 6.24, Аноним (-), 05:08, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Не, можно и генту юзать, ввинтив все экспериментальные ключи компилера при сборк... большой текст свёрнут, показать
     
     
  • 7.44, arisu (ok), 17:51, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Example: опытный виндовый админ переходит на новую систему не раньше SP2. Угадаете
    > почему? :)

    потому остальное время, прошедшее с выхода «новой системы» он убеждает начальство, что без «вот этих инноваций мы никак жить не можем, давайте 100500 денег на модернизацию! нет, у нас ничего не работает, даже если вам кажется, что работает! но будет всё намного лучше!»

     
     
  • 8.50, nagual (ok), 22:05, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    В это время опытный админ ubuntu крестится сначала левой рукеой потом правой, по... текст свёрнут, показать
     
     
  • 9.53, Michael Shigorin (ok), 22:13, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Дочитывая это письмо, всерьёз забеспокоился на оборвавшейся строчке ... текст свёрнут, показать
     
     
  • 10.54, nagual (ok), 22:31, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Напрасно это случается не более двух раз в год ... текст свёрнут, показать
     
  • 9.55, arisu (ok), 02:45, 06/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    8230 втихую перезагружается в любимую винду shhh 8230 carrier lost ... текст свёрнут, показать
     
     
  • 10.57, nagual (ok), 02:52, 06/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    И запускает counter strike единственную программу которую он смог сам настроить ... текст свёрнут, показать
     
     
  • 11.58, arisu (ok), 02:54, 06/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    не смог, пять раз драйвера переставлял, и всё равно подглюкивает ... текст свёрнут, показать
     
  • 8.51, nagual (ok), 22:05, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    В это время опытный админ ubuntu крестится сначала левой рукеой потом правой, по... текст свёрнут, показать
     
     
  • 9.56, arisu (ok), 02:46, 06/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    8230 с другими опытными админами бсд и они жалуются друг другу, какие люди ог... текст свёрнут, показать
     
  • 6.31, nagual (ok), 15:11, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    >> Хотелось бы посмотреть на админа в жестких условиях который ставит такие опции
    >> ФС при том что они не так давно сделаны. Хотя если
    >> ж...а просии приключений и хочется тестануть фичу на крутейшем энтерпрайзе -
    >> это вариант!
    > Ну да, ну да. Настоящие админы энтерпайзных локалхостов юзают только ext2, потому
    > что ext3 и ext4 "не так давно сделаны".

    UFS2 наше фсё :))

     
  • 4.15, Карбофос (ok), 00:47, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    это суровые админы чуть что - сразу кидаются экспериментировать с опциями на серверах? или это распростараненно среди админов-теоретиков? хотя, да
    >Ну разумеется, только тролли работают в жестких условиях
     
     
  • 5.18, Аноним (-), 01:22, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • –2 +/
    > это суровые админы чуть что - сразу кидаются экспериментировать с опциями на
    > серверах?

    Какбэ эти опции не вчера появились. Было время погонять их в тестовом режиме.
    Но вот вероятность серьезного разрушения ФС - далеко не 100%, и не всегда можно отличить неполное разрушение от обычного гемора при грязном размонтировании.

     
     
  • 6.21, Карбофос (ok), 01:29, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    о, да. тут о мегакрутости ntfs еще рассказывали.
    перечитайте новость. это про опции, про условия. ну и крутые админы всегда используют опцию "lazy unmount". это ж как в штормовую погоду с парашютом прыгать. адреналин!
    ну и вдовес. по секрету скажу, что большинство админов не перешло до сих пор на ext4 в наиболее критичных к сбою накопителях.
     
     
  • 7.26, Аноним (-), 05:12, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > о, да. тут о мегакрутости ntfs еще рассказывали.

    Да, файловые системы при падении в бсод с винчом более 2 Тб убивались качественно :). Хотя вроде и было время протестировать, и баг вполне себе легко воспроизводится. :)

     
     
  • 8.32, nagual (ok), 15:13, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Да от бсода ни упс ни батарейка не спасут ... текст свёрнут, показать
     
  • 8.45, arisu (ok), 17:55, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    да ладно, я уже писал права гостя, возможность сделать один маленький батник на... текст свёрнут, показать
     
     
  • 9.52, nagual (ok), 22:07, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Виндовс сэр ... текст свёрнут, показать
     
  • 6.25, Аноним (-), 05:10, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > Какбэ эти опции не вчера появились. Было время погонять их в тестовом режиме.

    Ну так вы не погоняли же.

    > не всегда можно отличить неполное разрушение от обычного гемора при грязном размонтировании.

    Опять же - а вон перчики нашли. Так и запишем: квалификация тех субъектов повыше вашей.

     
  • 3.7, Аноним (-), 20:17, 02/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > паники не было вроде. просто тролли всполошились.

    Да с фига ли там паниковать если оно сколь-нибудь заметно сыпется только при тяжелой нагрузке и нестандартных опциях? Но баг все-таки имел место быть. Просто в обычных услових он никому не мешал, а с нестандартными опциями уже мог вызвать проблемы.

     
     
  • 4.8, Аноним (-), 20:29, 02/11/2012 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Честно говоря, даже теоретическая возможность такого факапа должна любого админа продакшена заставить откатываться и делать внеочередные бэкапы, если уж откатить нельзя.
     
     
  • 5.9, angra (ok), 20:49, 02/11/2012 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Еще один. Любой опытный админ знает, что абсолютно надежных ФС, железа и даже датацентров не бывает. Действия свои планирует, исходя из этого факта. Поэтому опытный админ на такие новости реагирует ровным счетом никак. Суетливо бэкапятся или откатываются только пионеры, впервые узнавшие, что ФС оказывается может умереть и данные могут похериться, а заодно не вкурившие в условия необходимые для проявления конкретно этого бага
     
  • 5.10, Аноним (-), 21:06, 02/11/2012 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > Честно говоря, даже теоретическая возможность такого факапа должна любого админа продакшена
    > заставить откатываться и делать внеочередные бэкапы, если уж откатить нельзя.

    Паникеров в военное время расстреливают без суда и следствия.

     
     
  • 6.11, iZEN (ok), 23:44, 02/11/2012 [^] [^^] [^^^] [ответить]  
  • –6 +/
    >> Честно говоря, даже теоретическая возможность такого факапа должна любого админа продакшена
    >> заставить откатываться и делать внеочередные бэкапы, если уж откатить нельзя.
    > Паникеров в военное время расстреливают без суда и следствия.

    А в невоенное время они гибли под натиском разбушевавшейся толпы. :)


     
  • 5.33, nagual (ok), 15:14, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > Честно говоря, даже теоретическая возможность такого факапа должна любого админа продакшена
    > заставить откатываться и делать внеочередные бэкапы, если уж откатить нельзя.

    Неоднократно сталкивался с ситуацией когда руководство не выделяет времени на бакапы ... им пох ..

     
     
  • 6.36, Michael Shigorin (ok), 03:41, 04/11/2012 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Неоднократно сталкивался с ситуацией когда руководство не выделяет времени на бакапы ...
    > им пох ..

    Лучше тогда уходить самому, если такое вот "начальство" не было очевидно сразу -- примерно как лучше с умным потерять, чем с дураком [временно] найти.

     
     
  • 7.39, nagual (ok), 11:58, 04/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    >> Неоднократно сталкивался с ситуацией когда руководство не выделяет времени на бакапы ...
    >> им пох ..
    > Лучше тогда уходить самому, если такое вот "начальство" не было очевидно сразу
    > -- примерно как лучше с умным потерять, чем с дураком [временно]
    > найти.

    В таких организациях не штрафуют за простои, так что солдат спит служба идет деньги капают.

     
  • 6.37, iCat (ok), 09:56, 04/11/2012 [^] [^^] [^^^] [ответить]  
  • +5 +/
    >Неоднократно сталкивался с ситуацией когда руководство не выделяет времени на бакапы ... им пох ..

    "Пох" бывают разные.
    1. "Пох, ибо хз" - элементарная неосведомлённость. Лечится информационной служебной запиской, в которой доступным образованному человеку-гуманитарию следует объяснить суть хранения данных.
    2. "Пох, ибо нах" - осознанный риск потери данных. Выясняется в личной беседе с ответственным лицом. Смириться или менять место работы.
    3. "Пох, ибо нех" - остервенелое нежелание организации нормальной работы организации. Не лечится. Не уйдёшь - будешь виноватым. Менять место работы.

     
  • 6.38, Карбофос (ok), 11:45, 04/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    >не выделяет времени на бакапы .

    в смысле? у нас в конторе бэкапы автоматом делаются, еженочно. на ленту - раз в месяц. в основном исходники и созданные установочные пакеты. виртуальные машины для тестирования бэкапить смысла особенно нет.

     
     
  • 7.46, arisu (ok), 18:00, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    >>не выделяет времени на бакапы .
    > в смысле?

    виндосерверы, видать. а в конторе сидят бедняги, прикованые к тяжёлым столам, и круглые сутки впахивают.

    поэтому одмин не может нормально виндосервер заскриптовать и не может его временно остановить. «вот такие вот традиции в китае» (ц)

     
  • 2.40, Аноним (-), 12:48, 04/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > какое-то мелкое нарушение это такая паника у пользователей!

    Цитирую:

    В обычной ситуации это могло как максимум привести лишь к небольшому повреждению файловой системы, однако при активации опций "journal_checksum" и/или "journal_async_commit" проблема усугублялась и приводила к заметному для пользователя разрушению файловой системы.

     
     
  • 3.41, Michael Shigorin (ok), 12:53, 04/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > однако при активации опций "journal_checksum" и/или "journal_async_commit"

    Это первый раз, когда довелось услышать об их использовании.

    См. тж. https://plus.google.com/117091380454742934025/posts/f5a1eHxUzSh

     

  • 1.23, alexpn (ok), 04:38, 03/11/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Господа не оскорбляйте друг друга.
    Ext4 не плохая FS хотя для БД с фиксированным нодом оказывается несколько медленней. И новые фичи мало кому нужны на боевых серверах. но это же не повод называть друг друга тролями или быдло !!!
     
     
  • 2.34, nagual (ok), 15:15, 03/11/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Господа не оскорбляйте друг друга.
    > Ext4 не плохая FS хотя для БД с фиксированным нодом оказывается несколько
    > медленней. И новые фичи мало кому нужны на боевых серверах. но
    > это же не повод называть друг друга тролями или быдло !!!

    zfs+raw ?

     
     
  • 3.42, alexpn (ok), 16:27, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    на Linux ?????
     
     
  • 4.48, nagual (ok), 21:59, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > на Linux ?????

    Низачто :)))

     
  • 2.47, arisu (ok), 18:01, 05/11/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > это же не повод называть друг друга тролями или быдло !!!

    для веселья любой повод сойдёт.

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру