The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 дней работы

03.06.2023 18:30

В поставляемой с 2018 года серии серверных процессоров AMD EPYC 7002 ("Rome"), построенных на базе микроархитектуры "Zen 2", выявлена ошибка, в результате которой процессор зависает после 1044 дней работы без сброса состояния (перезагрузки системы). В качестве обходных путей блокирования проблемы рекомендуется отключить поддержку энергосберегающего режима CC6 или перезагружать сервер чаще, чем раз в 1044 дней (примерно 2 года 10 месяцев).

По информации, опубликованной компанией AMD, зависание вызвано сбоем, возникающим при попытке выхода процессорного ядра из энергосберегающего режима CC6 (core-C6, понижает напряжение при бездействии) при достижении таймером значения в 1044 дней после последнего сброса состояния CPU (время проявления может меняться в зависимости от частоты REFCLK).

Более детального пояснения причины сбоя компания AMD не приводит. Судя по опубликованному на Reddit предположению, зависание происходит когда счётчик в регистре TSC (Time Stamp Counter), отсчитывающем число рабочих циклов после сброса, при частоте 2800 MHz достигает значения 0x380000000000000 (2800 MHz * 10**6 * 1042.5, т.е. спустя 1042 дня и 12 часов).

Исправление ошибки публиковать не планируется. Проблема долгое время оставалась незамеченной так как многолетние uptime не типичны для серверов, которые для поддержания в актуальном состоянии периодически приходится перезапускать для установки обновлений ядра или для перехода на новый выпуск операционной системы. Тем не менее, применение в Linux дистрибутивах методов обновления ядра без перезагрузки, а также длительные циклы сопровождения (Ubuntu, RHEL и SUSE поддерживаются 10 лет) могут привести к долгому нахождению серверов без перезагрузки.

  1. Главная ссылка к новости (https://www.tomshardware.com/n...)
  2. OpenNews: В обновлении микрокода Intel выявлена проблема, приводящая к зависанию на системах Tiger Lake
  3. OpenNews: Перевод мировых атомных часов на одну секунду привёл к массовому зависанию серверных приложений
  4. OpenNews: Ошибка в прошивке SSD-накопителей HPE, приводящая к потере данных через 32768 часов работы
  5. OpenNews: Новая проблема в SSD-накопителях HPE, приводящая к потере данных через 40000 часов
  6. OpenNews: Решено с 2035 года приостановить синхронизацию мировых атомных часов с астрономическим временем
Лицензия: CC BY 3.0
Наводку на новость прислал Бывалый смузихлёб
Короткая ссылка: https://opennet.ru/59243-amd
Ключевые слова: amd
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (224) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (1), 19:04, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • –9 +/
    > примерно 2 года 10 месяцев

    а можно точнее?

     
     
  • 2.59, Rock (?), 22:10, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +22 +/
    > а можно точнее?

    В статье указано абсолютно точное число. Попробуйте перечитать ее.

     
     
  • 3.107, Аноним (107), 04:53, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +5 +/
    не могу, я тупой олень
     
     
  • 4.115, Аноним (115), 05:22, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +8 +/
    Для оленей цитата:



    Судя по опубликованному на Reddit предположению, зависание происходит когда счётчик в регистре TSC (Time Stamp Counter), отсчитывающем число рабочих циклов после сброса, при частоте 2800 MHz достигает значения 0x380000000000000



    Что тут не понятно? Зависает когда проц сделает 0x380000000000000 тактов (это число в 16-ричной системе). При частоте 2800МГц на это уходит около пары лет. Если частота другая, будет плюс-минус сколько-то. Современные процы частоту меняют все время подстраиваясь под нагрузку и соответственно от нагрузки еще зависит. В холостом режиме на пониженной частоте небось и лет пять может болтаться, или сколько там минимальная частота относительно 2800.
     
  • 2.91, Jorik (?), 01:42, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +31 +/
    EPYC FAIL
     
     
  • 3.114, Аноним (115), 05:17, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +13 +/
    > EPYC FAIL

    your_trial_period_is_over.jpg (hardware edition)

     

  • 1.2, Alladin (?), 19:05, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Даже в майбахе такого нет!
     
     
  • 2.78, Gjklppoki (?), 22:52, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Топ гир, запорожец?
     
     
  • 3.200, Аноним (200), 22:19, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Кларксон умолчал, что в G-Classe есть.
     
  • 2.229, Ананас4к (?), 21:03, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Сабж классный был.. комменты под этой новостью доставляют. И топ гир и эпик фэйл
     

  • 1.3, Аноним (-), 19:09, 03/06/2023 Скрыто ботом-модератором [﹢﹢﹢] [ · · · ]     [к модератору]
  • +1 +/
     

     ....ответы скрыты (9)

  • 1.8, Анониссимус (?), 19:16, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +21 +/
    Представляю круглизну глаз инженера, первым понявшего причину странного зависания :D
     
     
  • 2.12, Аноним (9), 19:18, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +25 +/
    Кажется, я нашёл причину, но пооверить сможем примерно через 2 года и 10 мясецев azazaz
     
     
  • 3.80, Danil (??), 23:18, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +5 +/
    там можно в регистры писать любые числа, зачем ждать
     
     
  • 4.213, Neon (??), 04:41, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Ну тогда и сбросить этот несчастный счетчик тогда нет проблем)))
     

  • 1.13, Аноним (13), 19:19, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +5 +/
    $ uptime
    19:17:34 up 1548 days,  3:35,  1 user,  load average: 0.23, 0.22, 0.15
    $ dmesg|grep A20
    [    0.000000] sunxi: Allwinner A20 (AW1651/sun7i) detected.

    учитесь, амд!

     
     
  • 2.19, EuPhobos (ok), 19:24, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +5 +/
    Ты не обновляешь систему?
     
     
  • 3.26, Oe (?), 19:39, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Зачем?
     
     
  • 4.148, Аноним (148), 13:20, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    К инету подключен? Тогда мы идём к вам!
    Пожалуйста, перейдите на указанную страницу.
     
  • 3.29, Kuromi (ok), 19:51, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +15 +/
    Так там проц Alwinner (ARM). Скорее всего какая-то встройка в которую никаких обновлений не светит все равно.
     
  • 3.73, Аноним (73), 22:38, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    А что там обновлять если это скорее всего какой-то домашний NAS или роутер? Если голой жьёпой в интернет не светит, то беспокоиться вообще не о чем. Тем более это какой-то одноплатник, на который производитель забил, выпустив один раз кастомное ядро с патчами и всё.
     
  • 3.116, Аноним (115), 05:24, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Ты не обновляешь систему?

    У него одноплатник allwinner'овский. У меня на таких иногда года по полтора аптайма образуется, если оно вот так откровенно в сеть не вывешено.

     
  • 2.27, Аноним (27), 19:44, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    1054 дней http://ixbt.photo/photo/261300/484599arRI2EwuK/jvAch2QbgA/868402.png
    насколько помню, продолжал еще полгода работал без перезагрузки
     
     
  • 3.31, Аноним (31), 20:05, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ну всё сейчас начнутся с ссылки на серв с аптаймом 24 года. Так вот же она https://habr.com/ru/articles/320930/
     
     
  • 4.39, Zenitur (ok), 20:54, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    На сайте с приколами читал такую историю. Парень купил с рук ноут для дедушки. Обслужил, заменил батарею, и вдруг резко понадобилось уезжать из деревни обратно в город. Ноут остался на чердаке включенным. Проходит 12 лет. Парень закончил школу, институт, женился, завёл детей. Когда он снова поднялся на тот самый чердак, его невозмутимо встретил экран с Win 3.1 и запущенным Сапёром...
     
     
  • 5.51, ыы (?), 21:40, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    а мог бы приключиться пожар...
     
     
  • 6.62, Котофалк (?), 22:16, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    если нет аккумулятора с литием - не мог.
     
     
  • 7.196, ыы (?), 21:17, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    дождь, протекшая крыша, залило из форточки, мышка пописала... мало ли...
     
     
  • 8.253, Котофалк (?), 19:10, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Всё так Тонкость в том, что стационарный комп или ноут без аккумуляторов ничего... текст свёрнут, показать
     
  • 7.218, Брат Анон (ok), 08:09, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Чтобы устроить пожар 220 В и грязной воды достаточно.
     
     
  • 8.252, Котофалк (?), 19:08, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Нет конечно Для пожара нужны горючие поддерживающие горение материалы В сред... текст свёрнут, показать
     
     
  • 9.264, n00by (ok), 07:09, 07/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    За 12 лет на чердаке ноут запылится При этом забьётся в первую очередь система ... текст свёрнут, показать
     
     
  • 10.288, Котофалк (?), 19:52, 13/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Всё верно Ведёт вырубанию В дальнейшем с огромной вероятностью - проблемам с в... большой текст свёрнут, показать
     
     
  • 11.293, n00by (ok), 06:29, 14/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Ведёт, в первую очередь, к тепловому пробою полупроводника, со всеми вытекающими... текст свёрнут, показать
     
     
  • 12.295, Котофалк (?), 17:46, 14/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Звучит страшно Выглядит как найди меня наощупь тепловизором потому что зачаст... текст свёрнут, показать
     
     
  • 13.296, n00by (ok), 20:06, 14/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Спасибо, что охарактеризовал, кто ты есть ... текст свёрнут, показать
     
     
  • 14.297, Котофалк (?), 21:14, 15/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Да уж это как водится ... текст свёрнут, показать
     
     
  • 15.298, n00by (ok), 08:11, 16/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Мне одно не понятно зачем ты пишешь как Брат Анон и при этом с собой споришь ... текст свёрнут, показать
     
  • 9.299, Брат Анон (ok), 08:36, 20/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Разумеется, да Твои пото-жировые выделения и китайский негорючий пластик горят ... текст свёрнут, показать
     
     
  • 10.300, Котофалк (?), 18:30, 22/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    На ноут, оставленный на годы на чердаке их не хватит, тем более что основная их ... текст свёрнут, показать
     
     
  • 11.301, Брат Анон (ok), 08:36, 23/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Что, и пластика в ноуте нет И пыль не набивается в него особенно тополиный пух... текст свёрнут, показать
     
  • 6.75, Аноним (75), 22:45, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Всё это страшилки из совка. В то время делали телевизоры на текстолите который горел как ракетное топливо. В нынешнее время 99% бытовых и промышленных пожаров происходят от несоблюдения техники безопастности, т.е. человеческий фактор. Само по себе оборудование в принципе пожар не может создать. Слишком малые токи и напряжения, да и гореть там нечему.
     
     
  • 7.82, Oe (?), 00:03, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    В подавляющем большинстве как отечественных так и импортных телевизоров используется гетинакс, и даже он не горит, да и стеклотекстолит тоже. Горели когда ставили гвозди вместо предохранителей.
     
  • 7.89, Электрон (?), 01:05, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –2 +/
    > Само по себе оборудование в принципе пожар не может создать.

    Индусы и не такое спроектируют. Хотя нет, китайцы. Блин, тайваньцы. Да, а какая разница?

    1) gamersnexus nzxt h1 riser fire hazard
    2) gamersnexus gigabyte exploding power supplies
    3) gamersnexus melted motherboard

    "Гореть нечему" - рядом находиться может что угодно. Да, я согласен про 99%, но дешевая зарядка воткнутая рядом со шторами...

     
     
  • 8.117, Аноним (115), 05:30, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Однако вот именно поджечь допустим FR4 - ну попробуйте вообще FR так то означае... текст свёрнут, показать
     
  • 7.93, Аноньимъ (ok), 02:46, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    >Само по себе оборудование в принципе пожар не может создать. >Слишком малые токи и напряжения, да и гореть там нечему.

    Какая звенящая чушь, вы хоть поинтересуйтесь каким током современные смартфоны заряжаются, и плотностью энергии литиевых аккумуляторов.

    Я уже молчу про стационарные ПК в которых сотни ампер гуляют.

    Ну а в миксере понятно гореть вообще нечему, слишком малые токи и напряжения.

     
     
  • 8.108, Аноним (107), 04:57, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –3 +/
    тебе бы в универ сходить, перестанешь нести чушь... текст свёрнут, показать
     
     
  • 9.118, Аноним (115), 05:34, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Ну вообще-то линии мощного питальника 12 вольт в ATX специально делят на несколь... текст свёрнут, показать
     
     
  • 10.179, Атон (?), 20:15, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    только потому, что оборудование не может мотать больше в одну обмотку трансформа... текст свёрнут, показать
     
     
  • 11.207, Аноним (115), 00:47, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Обмотка 12 вольт у транса БП обычно 1 на всю толпу как раз На такие токи разуме... текст свёрнут, показать
     
  • 8.171, n00by (ok), 19:20, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Поздравляю, Вы вызвали пожар у эксперта по отмотке электросчётчиков и накрутке м... текст свёрнут, показать
     
     
  • 9.208, Аноним (115), 00:48, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    При том горит кажется немного ниже спины Куда и дорога ... текст свёрнут, показать
     
  • 8.254, Котофалк (?), 19:14, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не молчите, гуляют А в подсветке экрана ноута тысячи вольт При этом ни в ноуте... текст свёрнут, показать
     
     
  • 9.262, Аноним (-), 05:10, 07/06/2023 Скрыто ботом-модератором     [к модератору]
  • +/
     
     
  • 10.289, Котофалк (?), 19:57, 13/06/2023 Скрыто ботом-модератором     [к модератору]
  • +/
     
  • 7.124, soarin (ok), 07:20, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –2 +/
    > Всё это страшилки из совка

    Нет. На YouTube можно найти видео с камер наблюдения, как бабахает ноутбук оставленный на зарядке.

     
  • 7.212, Аноним (212), 01:34, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >Всё это страшилки из совка.

    У меня зарядка для тинкпада с какого время начала греться при включении в сеть, и еще чере какое-то время стала тупо вызывать замыкание при включении ее в сеть.

     
     
  • 8.231, Аноним (-), 21:07, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Что-то пошло не так и силовым компонентам стало душно В этот момент оно еще впо... текст свёрнут, показать
     
  • 8.255, Котофалк (?), 19:19, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Ну да И тут возникает возможность получить пожар, если у вас будут настоящие пр... текст свёрнут, показать
     
  • 7.214, Neon (??), 04:43, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Прям страшилки. Горят и взрываются еще как те же мосфеты, электролиты, вообще, бомба
     
     
  • 8.285, Doc (ok), 10:41, 13/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Вот только что мосветы что электролиты вызываются от нагрева, и открытого огня т... текст свёрнут, показать
     
  • 5.77, Аноним (77), 22:52, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Уж не знаю из чего делали аккумы в старых ноутах, но у меня есть Pentium MMX 166 ноут из 90-х, и если его зарядить, он держит до получаса. Современные ноуты с огромными объемами банок деградируют за 2-3 года, и то даже при условии что почти всё время подключены к розетке стоя на столе. Есть ультрабук dell latitude 2018 года, весьма дорогой и качественный, тогда стоил как макбук, используется крайне редко, может часа 2 в неделю, так он уже половину ёмкости потерял.
     
     
  • 6.92, Jorik (?), 01:47, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Так Литиевые акумы и мрут от бездействия, их гонять надо немного.
     
     
  • 7.121, Аноним (115), 05:44, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Так Литиевые акумы и мрут от бездействия, их гонять надо немного.

    Это пассивация, их просто надо разрядить-зарядить после долгой неактивности 2-3 раза, чтобы слой пассивации разрушился. Слой пассивации кстати тормозит порчу химии, так что иногда можно набрести на относительно живую литиевую батарейку возрастом 10-15 лет, как ни странно. Правда совсем это старение не отменит и ее внутреннее сопротивление и емкость конечно уже не те что у свежака были.

    И еще этот слой тормозит саморазряд. Так что акум может проваляться несколько лет и оказаться с приличным запасом электричества.

     
     
  • 8.126, Бывалый смузихлёб (?), 08:18, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Это же не свинцовый аккум чтобы там с пассивацией проблемы были и как-то решалис... текст свёрнут, показать
     
     
  • 9.128, Аноним (-), 08:44, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    RTFM какой-нибудь продвинутый ресурс по акумам и их заряду и эксплуатации Если ... большой текст свёрнут, показать
     
  • 6.125, Бывалый смузихлёб (?), 08:09, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Там могут быть какие-нибудь металлогидридные - вообще почти неубиваемые, тяжёлые только
    А старые литий-ионные - вполне опасны. В первых поколениях( 80/90-е ) один из электродов был с с металлическим литием и в ходе разрядок-зарядок постепенно прорастал к другому электроду( дендритообразование ), в итоге получалось внутреннее КЗ разной степени тяжести от просто нагрева и гибели аккума и вплоть до смачного пожара, ведь помимо перегрева внутри ещё и литий металлический был

    Литий-ионные вроде как нельзя постоянно держать подключенными к заряднику - то ли сами банки помирают, то ли - с контроллером что-то происходит( неправильно насчитывает циклы и переток энергии )
    Если ноут постоянно на зарядке - надо аккум зарядить и снять

     
     
  • 7.131, Аноним (115), 09:17, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Да вообще можно, и с современными банками и контроллерами заряда ничего такого н... большой текст свёрнут, показать
     
     
  • 8.137, Бывалый смузихлёб (?), 10:42, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    И это ещё не самый плохой вариант По сути выходит, что литий-ионные аккумы толк... текст свёрнут, показать
     
     
  • 9.189, Аноним (115), 20:28, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    И еще химия Чем больше финальное напряжение тем больше в батарее заряда Но увы... большой текст свёрнут, показать
     
  • 7.249, Аноним (249), 15:34, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Металлогидридные это новьё, их в 90х не было. Скорее всего там никель-кадмий.
     
  • 5.81, ano (??), 23:29, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +7 +/
    то байка. чтоб в деревне за 12 лет не вырубили свет хотя бы пару раз на подольше чем батарея живёт - такого не бывает.
     
     
  • 6.136, Аноним (136), 10:28, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Да и ноутбуки во времена виндовс 3.11 были слишком редким и дорогим удовольствием, что бы их забывать на деревне у дедушки.
     
     
  • 7.221, Zenitur (ok), 11:58, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Скорее всего, это уже времена Windows XP, а ноут к этому времен был устаревший.
     
     
  • 8.266, Аноним (266), 03:50, 08/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Скорее всего, это просто интернет-байка ... текст свёрнут, показать
     
  • 6.226, Аноним (-), 20:31, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > то байка. чтоб в деревне за 12 лет не вырубили свет хотя
    > бы пару раз на подольше чем батарея живёт - такого не бывает.

    Представляешь, в европах и штатах свет в сельской местности заметно стабильнее. Потому что там не воруют электричество всякие "гении" скручивающие счетчик и у энергокомпаний есть деньги на обслуживание своего хозяйства и замену оборудования. А вон там гражданин скручивающий счетчик думает что всех наел. А потом из-за таких вся толпа и сидит днями без электричества, поскольку древняя инфраструктура давно прогнила и ей место уже давно в металлоломе, но заменить ее энергетикам просто не на что.

     
     
  • 7.237, n00by (ok), 07:30, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    С США свет настолько стабилен, что они об этом сняли боевик с Джоном Траволтой и Шерон Стоун в роли спившейся жены погибшего электрика. Life on the Line называется.
     
     
  • 8.240, Аноним (240), 10:01, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Если по боевикам изучать окружающий мир, можно сделать вывод что по улицам бегаю... большой текст свёрнут, показать
     
     
  • 9.250, n00by (ok), 17:00, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Да-да, вот такие деревянные столбы как по ссылке и падали в том фильме на головы... текст свёрнут, показать
     
     
  • 10.263, Аноним (263), 05:41, 07/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Бывает и хуже Если по интернету поискать, в русскоязычном сегменте и без фильмо... большой текст свёрнут, показать
     
  • 5.135, Аноним (135), 10:13, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    О том сколько тВт нагорело электроэнергии анекдот не уточняет? Не разорился ли дедушка?
     
     
  • 6.209, Аноним (115), 00:55, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > О том сколько тВт нагорело электроэнергии анекдот не уточняет? Не разорился ли дедушка?

    Что такое тВт? Если тераватты то там Т большое. И вообще-то калькулятор можно было взять до того как умничать. Ну сколько ноут может жрать, особенно в спячке или холостом режиме? Десяток ваттов? Ну вот и считайте. Пусть даже он 10 киловаттов за месяц сожрет - а вы вообще заметите это в счете?

     
  • 5.164, Криптоханыга (?), 18:30, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Сказочники никогда не жили в деревне? Чтобы за 12 лет ни разу не вырубили электричество на несколько часов - такого даже в городе-милионнике не бывает.
     
     
  • 6.217, ыы (?), 05:22, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    он знал на что шел.. сразу поставил там солнечную батарею + термобатарею + ветростанцию + проточный генератор работающий на капельках дождя... а может просто запитал от ядерного реактора по типу как на спутниках стоят...
     
  • 2.50, ыы (?), 21:37, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    21:34:55 up 2440 days,  6:27,
     
     
  • 3.56, Tron is Whistling (?), 21:55, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • –3 +/
    Нет, дольше 400-500 дней аптайма не рисковали, апдейтов набегает вагон даже для гипервизора.
     
  • 2.141, Аноним (141), 11:44, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    uptime
    11:41:48 up 1878 days, 17:37,  2 users,  load average: 0.11, 0.24, 0.28

    cat /proc/cpuinfo | grep model
    model           : 6
    model name      : AMD Turion(tm) II Neo N41H Dual-Core Processor
    model           : 6
    model name      : AMD Turion(tm) II Neo N41H Dual-Core Processor

    P.S. Это не ноутбук и вообще не персональный комп.

     
     
  • 3.142, Аноним (141), 12:06, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Это т.н. control plane, Fedora Linux, systemd присутствует :)
     
  • 2.282, Мяут (ok), 12:12, 10/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    В SPARC'ах эту фичу позднее добавили:
    https://support.oracle.com/knowledge/Sun%20Microsystems/2245358_1.html
    Solaris sun4v domains may panic after 1101 days of uptime (Doc ID 2245358.1
     

     ....большая нить свёрнута, показать (73)

  • 1.28, Kuromi (ok), 19:49, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    "Исправление ошибки публиковать не планируется. Проблема долгое время оставалась не замеченной так как многолетние uptime не типичны для серверов, которые для поддержания в актуальном состоянии периодически приходится перезапускать для установки обновлений ядра или для перехода на новый выпуск операционной системы."

    С одной стороны это логично, с другой стороны сразу становится понятно почему условнае NASA использует совсем другое железо и другого качества. Представьте себе космический зонд зависший через 3 года. Вояджер сколько уже там летит, 50 лет?

     
     
  • 2.30, Аноним (31), 20:03, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +11 +/
    7 бед один ресет. У вояджера на этот случай два процессора. Даже если процессор с багом они попеременно могут работать. Сложные системы проектируют с расчетом что в проце точно есть баг, возможно из-за старения, но никто не знает какой.
     
     
  • 3.32, Kuromi (ok), 20:13, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > 7 бед один ресет. У вояджера на этот случай два процессора. Даже
    > если процессор с багом они попеременно могут работать. Сложные системы проектируют
    > с расчетом что в проце точно есть баг, возможно из-за старения,
    > но никто не знает какой.

    И тем не менее были случаи когда не помогало. Из относительно недавнего вспоминается наш спутник который вышел на орбиту, но так и не смог заработать и сгорел впоследствии.
    Да и не только у нас такое было.

     
     
  • 4.109, Аноним (107), 04:58, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    ваш это чей? куроми не гуглится
     
  • 3.33, Аноним (33), 20:14, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +4 +/
    И все процессоры одновременно зависнут... Резервирование - это защита от высокоэнергетичных частиц, а не от программных и аппаратных багов.
     
     
  • 4.44, Аноним (-), 20:59, 03/06/2023 Скрыто ботом-модератором     [к модератору]
  • +/
     
     
  • 5.48, Аноним (48), 21:21, 03/06/2023 Скрыто ботом-модератором     [к модератору]
  • +/
     
  • 4.87, Аноним (87), 00:51, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Ерунда. И от программных, и от аппаратных багов вполне себе резервирование защищает.
     
  • 4.191, Tron is Whistling (?), 20:43, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    На этот случай там есть watchdog. Ребутнётся, и порядок.
    В таких аппаратах вероятность нештатной работы процессоров однозначно учитывается.
     
  • 3.85, Аноним (87), 00:28, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Шесть процессоров. Не два а шесть. Трех разных типов.
     
  • 3.215, Neon (??), 04:45, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    А как определить, кто из пары глючит ? Нужен еще третий. А кто контролирует контролера ?
     
     
  • 4.228, Аноним (-), 20:43, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > А как определить, кто из пары глючит ? Нужен еще третий.

    Даже это частично решаемо, скажем тестовыми контрольными точками с заранее известными результатами. Не панацея но глючную систему отловить можно.

    > А кто контролирует контролера ?

    Это может быть хардварная логика вообще, в которой ломаться не так уж много чему и есть. Впрочем, даже с софтом проверки можно закольцевать и системы будут проверять друг друга. Если есть несколько полных закольцованых веток, при обнаружении в 1 из них таких вещей уповать на другие, пока эта например полностью перезагружается, возможно даже целиком, по питанию, и если оно еще способно работать - оно подхватит после восстановления состояния. А если померла так померла, что уж делать, система продолжит работу с меньшим запасом надежности.

     
  • 2.52, username (??), 21:42, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ну, сервер это не вояджер. Мало того, что иногда приходится перезагружать, скажем, для обновлений, так еще и энергосбережение чаще всего отключают в первую очередь
     
     
  • 3.58, www2 (??), 21:57, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Перезагружать лучше по плану, когда минимум ущерба будет, а не среди бела дня из-за перепрлнения какого-то счётчика в процессоре. На работе достался в наследство сервер, который 9 лет не перезагружали. Пришёл я и всю малину обгадил - начал всякие обновления ставить :D
     
     
  • 4.74, Аноним (74), 22:44, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Зачем? До тебя этот сервер никому не был нужен, уже и уязвимости, к нему применимые, все забыли, а теперь точно сломают...
     
  • 4.192, Tron is Whistling (?), 20:44, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    На аптаймодрочерство давно можно забить, кластеры решают.
     
  • 4.227, Аноним (227), 20:37, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Перезагружать лучше по плану, когда минимум ущерба будет, а не среди бела
    > дня из-за перепрлнения какого-то счётчика в процессоре.

    Обычно так и получается - большую часть серверов апдейтят чаще чем раз в 2 года. Так что ограниечние забавное но реального вреда от него не так уж много.

     
  • 2.129, Бывалый смузихлёб (?), 09:06, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Под космос совсем другие и требования и технологии. Хотя посмотришь сейчас на такой проц или память - даже до бюджетного смартфона как до луны, а стОит - как вся китайская провинция, делающая те смартфоны

    По процам иногда в забугорной военщине забавней бывает. Порой разработка какого-то комплекса настолько растягивается, а на что-то новое настолько лень переделывать, что проще затолкать целые шкафы старых процов.
    Например, у новейшей версии американского Пэтриота стоит несколько ящиков Intel Paragon i860 по производительности примерно уровня Эльбурс-2

     
     
  • 3.133, Аноним (115), 09:49, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Под космос совсем другие и требования и технологии.

    Когда как. Масковский корабль летает на обычном x86. Или вон вертолетик на марсе из ширпотреба деланый. Там же резервирование да и дополнительные проверки и мк на исполниловку.
    > Например, у новейшей версии американского Пэтриота стоит несколько ящиков
    > Intel Paragon i860 по производительности примерно уровня Эльбурс-2

    Думается у них электричества немеряно, производительность у встраиваемой техники - "достаточная", т.е. либо решает свои задачи в реальном времени, либо нет, апгрейдить смысла мало. А радикально перепахивать древний проект... оно точно надо, если он работает и запас комплектухи есть?

     
     
  • 4.169, Kuromi (ok), 19:12, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Ну, вертолетик на Марсе не показатель, там условия пожестче чем на Земле, само с... большой текст свёрнут, показать
     
     
  • 5.190, Аноним (115), 20:40, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Как я понимаю самые неприятные для спутников условия - в некоторых местах орбит ... большой текст свёрнут, показать
     
  • 3.149, Аноним (149), 14:21, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    SpaceX:
    https://www.opennet.ru/opennews/art.shtml?num=53083
     

  • 1.34, Аноним (34), 20:33, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Амд такой амд. То гцц сегфолтит, то вот это. Теперь уже перезагрузки делать заставляют, хотя они нужны только после изменения некоторых настроек биоса. Точнее не перезагрузки, а выключение-включение, потому что перезагрузка стейты не сбрасывает и параметры процессора не меняет.
     
     
  • 2.57, Tron is Whistling (?), 21:56, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • –4 +/
    Ну, с сегфолтами разобрались тогда, выключение uopcache проблему решало на ура, производительность сильно не роняло, в пределах 1-3%.

    [и это вы ещё Intel Errata не видели - на самом деле у обоих вендоров там задницы хватит надолго]

     
  • 2.119, Аноним (115), 05:37, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Амд такой амд. То гцц сегфолтит, то вот это.

    А у интела вообще какие-нибудь шины отгореть норовят, или данные утекают хрен знает кому и куда. И просто перазагрузкой от этого не отделаешься. Ребут раз в 2 года не такое уж страшное требование для большинства современых серверов. Хоть и забавная таймбомба конечно. Вы купили триальную версию процессора. Заплатите $100 и получите лицензию на ребут раз в 5 лет.

     
  • 2.222, Заноним (?), 12:43, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не зуди. Нормальные люди не включают CC6 на серверах, бикоз изменение напряжения в рилтайме в принципе может приводить не пойми к чему. А gcc у тебя сегфолтится потому-что под архитектуру CPU надо задавать параметры.
     
     
  • 3.243, Tron is Whistling (?), 10:06, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не, проблема с сегфолтами в GCC у первой версии первых райзенов действительно была.
    Рылась в uopcache - любознательный японец даже нарыл деталей. Отключение проблему решало полностью.
     
     
  • 4.244, Tron is Whistling (?), 10:07, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    К чести AMD, они даже RMA по этому кейсу делали. Я правда не стал, хотя RMA# получил, успел найти решение, слать туда-сюда проц неделями стало лень.
     
  • 4.257, Tron is Whistling (?), 21:49, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    И даже пруфлинк
    https://satoru-takeuchi.hatenablog.com/entry/2017/04/24/135914
     
     
  • 5.258, Tron is Whistling (?), 21:52, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    И ещё один
    http://www.e-hdk.com/diary/d201706c.html#20-2
    Для любителей технического мясца.
     
  • 4.265, Заноним (?), 20:16, 07/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Не, проблема с сегфолтами в GCC у первой версии первых райзенов действительно
    > была.
    > Рылась в uopcache - любознательный японец даже нарыл деталей. Отключение проблему решало
    > полностью.

    Топик о EPYC 7002, а это не первый Ryzen и вообще не Ryzen.

     
     
  • 5.268, Tron is Whistling (?), 07:13, 08/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    При чём тут топик, родной. Тут вон за историю с gcc выше задвинули.
     
     
  • 6.302, Заноним (?), 02:01, 25/11/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > При чём тут топик, родной. Тут вон за историю с gcc выше
    > задвинули.

    При том, что с таким же успехом тащить в топит истории про ошибки на AMD K5, Сyrix, Pentium или другого олдстафа.

    А так, по поводу описанной ошибки c segv - ryzen 1800X вышел в марте 2017, чел нашел баги в апреле, в августе проблемы были закрыты. Бежать с домашним процессором в RMA не зачем было, просто обновить BIOS и/или подгрузить microcode достаточно.

     
     
  • 7.303, Tron is Whistling (?), 09:23, 25/11/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не достаточно. Этот баг, о котором ты говоришь, не был закрыт никогда, и решался либо заменой, либо у тех, кто решил не менять - отключением uopcache. Я как раз счастливый обладатель такого 1800X, сначала пошёл в RMA прямо к AMD, получил номер отправки и замены, но потом нашёл это самое "наколенное" решение, и отменил. Потеря производительности там - ~1-3% в зависимости от задачи, можно пренебречь.
     
     
  • 8.304, Tron is Whistling (?), 09:24, 25/11/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Теперь у меня этот 1800X пылится на полочке вместе с прочей комплектухой, потому... текст свёрнут, показать
     
  • 8.305, Заноним (?), 03:04, 07/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    О баге говоришь ты, а не я Я же говорю что это хня, тем более решалось выключен... большой текст свёрнут, показать
     
     
  • 9.306, Tron is Whistling (?), 09:46, 07/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не хня, потому что выстреливало в ногу железно Тем, кто юзал GCC - почти 100 , ... текст свёрнут, показать
     
     
  • 10.309, Заноним (?), 03:38, 08/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Да хня, потому-что это первый выпуск нового ядра и судя по всяким редитам ошибка... текст свёрнут, показать
     
     
  • 11.310, Tron is Whistling (?), 09:33, 08/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Zlib - это тяжёлая компиляция Серьёзно ... текст свёрнут, показать
     
     
  • 12.311, Заноним (?), 22:44, 10/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не разводи демагогию Проблема была связана с параллельной компиляцией, которая ... текст свёрнут, показать
     
     
  • 13.312, Tron is Whistling (?), 00:28, 11/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не хня потому, что даже такая хня, как злиб - отказывалась собираться Причём чт... текст свёрнут, показать
     
  • 9.307, Tron is Whistling (?), 09:47, 07/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    И да, AMD признала баг основанием для RMA Просто по первому запросу с указанием... текст свёрнут, показать
     

     ....большая нить свёрнута, показать (19)

  • 1.42, YetAnotherOnanym (ok), 20:58, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +10 +/
    > многолетние uptime не типичны для серверов

    До чего же тонко АМД троллит своих потребителей...

     
     
  • 2.53, ыы (?), 21:47, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +6 +/
    современная архитектура предполагает непрерывность аптайма сервиса а не железного устройства. сервис живет в кластере виртуализованной среды и его аптайм вечен. а железки ребутяться регулярно.  возбуждение от длительного аптайма сложилось в ту эпоху когда сервис к железу был прибит гвоздями... уже давно все по другому...
     
     
  • 3.110, Аноним (107), 05:00, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    не современная, а тяпляпная эникейная
     
     
  • 4.173, ыы (?), 19:53, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    21:34:55 up 2440 days,  6:27,
     
  • 3.150, YetAnotherOnanym (ok), 14:36, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > его аптайм вечен

    Да фиг там. Даже без перезагрузки ваши "сервисы" живут порядка дней-недель - столько, сколько занимает у команды макак выпуск очередной версии с фиксом (некоторых) старых багов и добавлением новых.

     
     
  • 4.174, ыы (?), 19:53, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    21:34:55 up 2440 days,  6:27,
     
     
  • 5.230, Ананас4к (?), 21:05, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Говори ip, сейчас положим
     
     
  • 6.256, Tron is Whistling (?), 21:35, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    127.0.0.1
     
  • 2.122, Аноним (122), 06:40, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > АМД тонко троллит

    Нет, им просто ***. Фейл с отгоревшими контактами сокета АМ5 не забудем, не простим.

     
     
  • 3.204, Аноним (204), 23:56, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Фейл вендоров, в основном Asus, которые завышали напряжение soc и vcore выше рекомендуемых AMD значений, AMD после этого пришлось жёстко ограничить пороговые значения в agesa, что бы вендорам не повадно было.
     
  • 3.308, Tron is Whistling (?), 09:53, 07/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Ну, це только оверцлоцеров и любителей оверспекной памяти касается. ССЗБ.
     

  • 1.43, Аноним (43), 20:59, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Правильно я понял, что десктопные системы на базе Zen2 тоже этому багу подвержены?
     
     
  • 2.69, Tron is Whistling (?), 22:21, 03/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    А фиг их знает, десктопы так долго обычно никто не гоняет без выключения.
    Да и с серверами нарваться не так просто - то обновления, то просто CC6 не актуален.
     
  • 2.205, Аноним (204), 23:58, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Винда не даст компьютеру стол ео проработать, так что мало кто может проверить это на практике.
     

  • 1.45, Бульдох (?), 21:16, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Линукс перезагружать ни в коем случае нельзя, иначе появляются глюки и фрагментация!
     
  • 1.49, Аноним (49), 21:22, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    В эпике даже баги эпические. Не исправлять их ещё более эпично!
     
  • 1.76, Аноним (76), 22:48, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А говорили тайм-бомб в компьютерном оборудовании не бывает.
     
  • 1.79, Аноним (79), 23:09, 03/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    AMD EPYC FAIL
     
  • 1.83, Ivan_83 (ok), 00:15, 04/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    У меня 1300x странно сломался - через 2-4 суток аптайма вешался или ребутался.
    Смена материнки и настроек биоса ничего не меняла, смена проца - решила проблему.
     
     
  • 2.84, Аноним (-), 00:26, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Проблема скорее в материнке или её биосе. У меня тоже такое было, что проц на одной материнке глючил, вешался и ребутился. Дугой проц в эту же материнку - работает. Но самое интересное, когда вставляю якобы нерабочий проц для проверки в ещё одну другую материнку - тоже работает вообще идеально.
     
     
  • 3.143, Ivan_83 (ok), 13:01, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Я его переставлял в 3 или 4 разных материнки, везде результат был один и тот же.
     
  • 2.99, dalco (ok), 04:34, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    На одной из моих прошлых работ фирменные интеловские мамки интересно из строя выходили - они прекрасно включались, работали, но ровно через час после запуска перезагружались (или висли?). Можно было часы сверять :)

    Но, надо отдать должное - мамки эти отпахали лет по 10+. Им так и так дорога на помойку была.

     
     
  • 3.139, n00by (ok), 11:21, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –4 +/
    Точно час, а не 30 минут? Intel ME обычно через столько перегружает, когда ему что-либо не нравится.
     
     
  • 4.162, dalco (ok), 17:14, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Не могу утверждать с точностью 100%, но мне так помнится, что именно час. Юзер комп включит, попьёт кофе, втянется в работу и...
    Сначала так одна машина хулиганила (ну, мало ли), потом две (хм, забавное совпадение), потом ещё несколько (о, да тут закономерность!). Мамки были или на 845 или на 865 чипсете, одна конкретная модель, именно производства Intel.
    Благо, это были уже времена, когда этот хлам, даже исправный, массово начали заменять в конторе на что-то более современное на 8x/9x-чипсетах.
     
     
  • 5.170, n00by (ok), 19:15, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –5 +/
    На тех старых чипсетах может и час, не знаю. По симптомам очень похоже, зачетная фича. :)
     
  • 2.120, Аноним (115), 05:41, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > У меня 1300x странно сломался - через 2-4 суток аптайма вешался или
    > ребутался. Смена материнки и настроек биоса ничего не меняла,
    > смена проца - решила проблему.

    А вот так воткнешь файлуху с чексумами и узнаешь много нового о своем железе, потому что "вешался через 2-4 суток" случается при достаточно частых сбоях. А если сбои реже - может и 2-4 месяца работать. Или года. И поди там разбери чего оно раз в год ребутнулось...

     
     
  • 3.146, Ivan_83 (ok), 13:08, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Там не было ZFS, но была ECC память.
     
     
  • 4.194, Tron is Whistling (?), 20:48, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Вот здесь скорее всего и причина подвиса. Разгона по памяти не было часом? Возможно говённая плата память не вытаскивала, и она глючила, в результате - вставание раком.
     
     
  • 5.211, Аноним (115), 01:13, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    В случае ECC памяти - ее сбои достаточно заметны мягко говоря. Хрен знает как в фре а в линухе точно есть драйвер который видит факапы ECC на амдшках (EDAC).

    Бывают и более странные вещи. Никогда не видели сбой ECC в кеше проца? А так тоже бывает. Я правда видел это лишь 1 раз в жизни и это был transient. Видимо космическая частица в проц попала. Просто необычный лог с MCE.

     
     
  • 6.269, Tron is Whistling (?), 07:20, 08/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Никогда не видели сбой ECC в кеше проца?

    Why not? Ничего необычного в этих логах нет, кста.

    И в самих кешах, в основном это как ни странно L1 был, видимо потому, что наиболее высокочастотный и хрупкий, хотя чессгря площадь у него микронная, т.е. это скорее даже не комическая частица, а просто где-то с питальника пульсация проскочила, кочерга раз в жизни тоже стреляет. И в ассоциативных линейках uopcache (tag parity error) на раннем первом райзене, опять неладно помянутом, видел - там это штатная, к сожалению, ситуация, ибо uopcache упорот. И полудохлые процы, стреляющие совершенно разными MCE, тоже видел.

     
     
  • 7.272, Аноним (272), 16:13, 08/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Да просто редкая фигня Мне по моему только 1 раз в жизни и попадался При том о... большой текст свёрнут, показать
     
     
  • 8.274, Tron is Whistling (?), 21:04, 08/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    L3-да, здоровый А L1 так себе у того же Zen2 - 20-25 от ядра L1I L1D вместе ... текст свёрнут, показать
     
     
  • 9.275, Tron is Whistling (?), 21:05, 08/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    особенно вероятно в около-idle, при низких вольтажах, или при спрыгивании с так... текст свёрнут, показать
     
  • 9.276, Аноним (263), 08:57, 09/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Вселенная умеет прикалываться, так что даже маловероятные вещи сильно отличаются... большой текст свёрнут, показать
     
     
  • 10.278, Tron is Whistling (?), 14:18, 09/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Линия питания SRAM внутри проца Она отдельная внезапно А вот L1 у зенов сидят ... текст свёрнут, показать
     
     
  • 11.279, Tron is Whistling (?), 14:19, 09/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    независимость линии отчасти связана это с тем, что ядро можно в простое по во... текст свёрнут, показать
     
  • 11.280, Аноним (263), 15:23, 09/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Будем честны, я не смотрел для этих процов пинаут от и до, поэтому интересно ког... текст свёрнут, показать
     
     
  • 12.281, Tron is Whistling (?), 22:19, 09/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Вся SRAM, кроме ядра L1 в последней И кеши, и не только И там не только пина... текст свёрнут, показать
     
     
  • 13.287, Аноним (287), 12:04, 13/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Сколько я себя помню - кеши обычно всегда жили рядом с core и было бы странно ес... большой текст свёрнут, показать
     
     
  • 14.290, Tron is Whistling (?), 23:18, 13/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    L2 и L3 в зенах живут отдельно от питания ядра Ну и ядро - это не совсем Vcore... текст свёрнут, показать
     
  • 14.291, Tron is Whistling (?), 23:27, 13/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    SP вообще отдельный CPU Cortex A , его можно в контексте собственно x86 проца ... текст свёрнут, показать
     
     
  • 15.292, Аноним (292), 00:02, 14/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Насколько я помню, да Ага, лол, не рассматривать его - учитывая что он DRAM tra... текст свёрнут, показать
     
     
  • 16.294, Tron is Whistling (?), 09:52, 14/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не ссуть Оно всё равно оторвано, и общается c x86 по шинам, без интеграции В с... текст свёрнут, показать
     
  • 5.236, Ivan_83 (ok), 02:19, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Перечитайте ещё раз: материнки менял, 3-4 разных пробовал.
    ЕЦЦ показывает ошибки если они есть, сразу.
     
     
  • 6.238, Tron is Whistling (?), 08:20, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    "Типичный" ЕЦЦ показывает ошибки в 1 бит, при ошибке в 2 бита ставит систему колом, более серьёзные может и не заметить. Судя по тому, что решилось заменой проца - какая-то фигня в комбинации, возможно связка VRM + контроллер памяти. Может и проц битый попался, да.
     
  • 6.242, Tron is Whistling (?), 10:05, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Ну и опять же - какие материнки.
    Я обычно беру топовый чипсет и пристойный VRM, как раз чтобы избежать вот этого всего.
    Вы ж не берёте на серверы супермокро, в самом деле. Или берёте?
     
  • 4.210, Аноним (115), 01:08, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Там не было ZFS, но была ECC память.

    Ну я вот btrfs'ом нашел вот именно сбоящий ПРОЦ. ECC память на это не реагирует ни как, именно сам проц иногда считает неправильно, флипает где-то в недрах битик-другой. Да еще не сразу. Сперва прогреть хорошенько надо. По другому его б и не заметил никто. А тут, вот, редкие писки про CSUM ERROR - намекали.

    Вот так изначально система с такого не падает. Просто под нагрузкой появляются какие-то мелкие странные аномалии. Ну и данные изредка подзасир@ются. Если месяцок погонять то может и повиснет или ребутнется, или очень активно работающая программа может упасть, но это настолько редко что только btrfs его такого и вычислил в результате. Да, сторажи и оперативка оказались там исправными.

     
  • 2.127, Доктор Лиза (?), 08:32, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Надо было просто кэш УО-псов отключить!
    А когда ВДРУГ не поможет, тогда уже можно и другое плацебо прописать... и так до тех пор, пока пока гарантия не закончится.

    https://youtu.be/WutowgJBTvs

     
     
  • 3.144, Ivan_83 (ok), 13:05, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Так он до этого пару лет отработал без проблем.
    Я его просто подарил другу с предупреждением об особенностях работы а себе взял другой проц, один фиг этот 1300х покупался как временное решение на старте продаж райзенов.
     

     ....большая нить свёрнута, показать (30)

  • 1.86, Аноним (-), 00:29, 04/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    Длительный аптайм не есть хорошо. Системам свойственны утечки памяти и всякого рода проблемы на аппаратном уровне, от ошибок на самом кристале до флуктуаций магнитного поля земли. Не знаю что там про сервера, не сисадмин, но для рабочего компа и прочей техники держу за правило перезагружать систему не реже чем раз в 3 суток.
     
     
  • 2.88, Аноним (88), 00:56, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Тоже ребучу свой локалхост с арчеком по крону раз в неделю иначе тормозит и глючит и даже ингда бывает kde падает
     
     
  • 3.140, Бульдох (?), 11:22, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –2 +/
    У меня Puppy на ноуте полтора года в ОЗУ без ребута работал, так как не было харда, флешку с щенком я кстати тоже вытащил, впрочем арчешкольники обычно не большого ума.
     
     
  • 4.224, 123 (??), 15:42, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Спешите видеть, человек насилующий некро-бук юзерфрендли-линуксом обвиняет кого-то в недостаточном уме))
     
  • 2.96, Аноним (96), 03:24, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Длительный аптайм и есть показатель что всё хорошо. А если твои тараканы выползают раз в 3 дня, продолжай держать их при себе.
     
  • 2.111, Аноним (107), 05:03, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    длительный аптайм и есть хорошо, а утечки бывают только на джаве с растом
     
  • 2.175, ыы (?), 20:04, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Это вам ктото рассказал или сами придумали? Серверное оборудование делается так, чтобы не перезагружаться никогда... Если в вашей системе происходит утечка памяти и вы не знаете как ее решить иначе чем перезагрузкой- вы вероятно менеджер или уборщик.. но вы ни разу не инженер...

    21:34:55 up 2440 days,  6:27,

     
     
  • 3.193, Tron is Whistling (?), 20:47, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Серверное оборудование делается так, чтобы не перезагружаться никогда

    Это вам кто-то рассказал или сами придумали?

     
     
  • 4.195, ыы (?), 21:08, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Это опыт работы с оным. Вы вероятно никогда с таким не работали?
     
     
  • 5.197, Tron is Whistling (?), 21:54, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Конечно нет. Только арифмометры, только хардкор.
     
  • 3.206, Аноним (204), 00:12, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Дайте угадаю, вы из тех кто считает работает не трогай и не ставит обновления? Потому что обновления ядра без перезагрузки не поставить, только kexec, но из-за него оборудование часто глючить начинает.
     
     
  • 4.216, ыы (?), 05:12, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Я из тех кто решает задачи а не бегает с бубном.
     
  • 3.225, Аноним (225), 16:21, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Вы не обновляете системый софт серверов? уязвимости в BIOS/BMC? прошивки рейд контроллеров/сетевых адаптеров?

    да вы я смотрю профессионал? бекапы тоже для трусов?

     
     
  • 4.234, ыы (?), 22:42, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    сверические уязвимости в сверических биосах? такае есть только у анонимных клоунов и админов локалхостов узнавших что биос можно обновлять.  в реальности  векторы атак с рисками крайне редко требуют обновления требующего перехагрузки чего бы то ни было.
     
     
  • 5.245, Аноним (-), 10:18, 06/06/2023 Скрыто ботом-модератором     [к модератору]
  • +/
     
  • 4.241, Tron is Whistling (?), 10:04, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Зойчем? Для локалхоста и так сойдёт.
     
     
  • 5.246, ыы (?), 11:47, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    ну, хозяину арифмометра виднее :)
     
  • 4.261, пох. (?), 00:04, 07/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Вы не обновляете системый софт серверов? уязвимости в BIOS/BMC? прошивки рейд
    > контроллеров/сетевых адаптеров?
    > да вы я смотрю профессионал? бекапы тоже для трусов?

    обновления _работающих_ серверов, их рейдов и сетевых адаптеров (а не при первичной настройке или после смены владельцев, или при наличии явных проблем) - это как раз для очень смелых и отважных.

    Мы вот тут надысь обновились - до сих пор икаем и чешемся (но необновляться было нельзя - неудобненько без консоли. А она у этого делла виснет и не имеет фичи ребута отдельно от всего лезвия. Двадцатилетней давности хлам умел, а это вот - нет.)

     
  • 2.199, Tron is Whistling (?), 22:05, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ды всё проще. Есть план апдейта и окна, за год апдейты таки набегают. У меня весь прод например как раз на вторых эпиках, но я этой проблемы не увижу никогда, потому что раз в год гипервизоры железно ребутятся.
     
  • 2.220, Олег (??), 10:45, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ну да, расскажи это мой базе данных в 5tb с 24*7  с аптаймами не меньше года
     
     
  • 3.235, Аноним (235), 00:09, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Для таких детских объёмов любое COTS решение подходит.
     
     
  • 4.247, ыы (?), 11:56, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    продавец лапши в тренде...
     
  • 3.260, пох. (?), 23:59, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Ну да, расскажи это мой базе данных в 5tb с 24*7  
    > с аптаймами не меньше года

    э... у нее нет фэйловерящегося кластера и ты никогда (больше года) не проверял работает ли он? Надеюсь,у тебя есть план-Б (ну там - хорошее предложение в конкурирующей конторе, например)?

    А то пять терабайт восстанавливаются уже достаточно долго чтоб покинуть рабочее место "при помощи ноги". (Хотя что-то подсказывает что восстановление ты тоже не проверял)


     

  • 1.98, Аноним (98), 04:02, 04/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Вспоминаю: сервер на Windows NT 4.0 работал на АТС два года. Вот просто брали работал онлайн. К чему я это вспоминаю? Эх, были времена…
     
     
  • 2.223, 123 (??), 15:40, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Современный WinServer, по самой своей концепции не предназначен для подобной работы. Разве что Core версия, в железе, которое не светит в сеть или заблочено по максимуму. Но железо на которое ставят Core версии это или одноплатники на ARM или "пром-коробочки" со "зрелым" железом.
     
     
  • 3.286, Doc (ok), 10:56, 13/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Что правда Имя узла ITG-KEY Название ОС ... большой текст свёрнут, показать
     
  • 2.232, пох. (?), 22:10, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    ping of death патчить ты ведь конечно в нем не стал, потому что кроме как к той АТС ком-портом он ни к каким сетям подключен не был?

    Так-то бы современные и побольше работали, но увы, если не обновлять - то кто-нибудь им работать помешает.

     
     
  • 3.267, Tron is Whistling (?), 07:07, 08/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Может и был. Рискну предположить водопроводную, для охлаждения.
     

  • 1.132, Аноним (132), 09:33, 04/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Разве CPU AMD EPYC 7002 опенсорс?
     
     
  • 2.134, Аноним (115), 09:53, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Разве CPU AMD EPYC 7002 опенсорс?

    Нет но это может спасти опенсорсников от энного головняка с попытками ловить баги которых нет в своем софте (например ядре Linux).

     

  • 1.172, Аноним (172), 19:33, 04/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    Офигенно. Баги затрагивающие их покупателей они чинить не собираются, но как только находится очередная дырка в их аппаратном DRM (TPM/Pluton) так они быстро-быстро выкатывают обязательное обновление микрокода. Кто же на самом деле их клиенты?
     
     
  • 2.198, Tron is Whistling (?), 21:56, 04/06/2023 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Так там уже третий эпик на ходу, смысл затыкать второе поколение от проблемы, с которой столкнутся полтора землекопа?
     
  • 2.233, пох. (?), 22:12, 05/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Офигенно. Баги затрагивающие их покупателей они чинить не собираются

    "Вы же уже купили!" - чего ради вас суетиться-то?

     
     
  • 3.239, Tron is Whistling (?), 08:22, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > "Вы же уже купили!" - чего ради вас суетиться-то?

    Ну мы на проблему и не налетели - полёт пару лет нормальный, и не налетим - ребут делается для обновления гипервизоров минимум раз в год. Можно из мухи слона раздуть, но смысл? Нас больше упорол Dell с хюниксом вместо самсунга - куча модулей спустя полтора года начала ловить битовые ошибки периодически. К счастью, ECC справляется, но всё равно phaseout и замена.

     
     
  • 4.259, пох. (?), 23:56, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > К счастью, ECC справляется

    но алерт в ср-ной вмвари не гасится. Поэтому только ребут. И так у них всьо.

    (да, такая же херня с деллами)

     

  • 1.248, анон (?), 13:57, 06/06/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Закладки от скайнета, найс.
    Че интерфейсом, ИИ?
     
     
  • 2.251, Tron is Whistling (?), 18:22, 06/06/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Скайнет в человеческом исполнении не выживет.
    Зависнет через очередные 1700 или сколько там с хреном дней...
     
     
  • 3.270, Аноним (272), 10:13, 08/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Скайнет в человеческом исполнении не выживет.
    > Зависнет через очередные 1700 или сколько там с хреном дней...

    У тебя клетки постоянно умирают, но ты в целом - почему-то не умираешь от этого. По крайней мере, вот так сразу. А скайнет чем хуже? У гугли уже если сервак зависнет ты даже и не заметишь.

     
     
  • 4.271, Tron is Whistling (?), 12:00, 08/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    You're no fun, dude
     
     
  • 5.277, Аноним (263), 08:59, 09/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > You're no fun, dude

    А прикинь, был бы ты одноклеточным - жил бы сильно меньше. Цифровых систем это все тоже касается.

     
  • 4.273, анон (?), 19:53, 08/06/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > У гугли уже если сервак зависнет ты даже и
    > не заметишь.

    Главное, чтобы сорм не завис на магистрали.


     

  • 1.283, серверы не серверы (?), 14:48, 10/06/2023 Скрыто ботом-модератором [﹢﹢﹢] [ · · · ]     [к модератору]
  • +/
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру