Category: история

Category was added automatically. Read all entries about "история".

bird

выйти из перегрузки

После случившегося 23 марта очередном падении коммутатора UMC и рассказов про
то, что в сложившейся обстановке он просто не держал нагрузку - я вспомнил
легенду про АТС 242.

В начале 90-х ситуация с телефонами в Киеве дошла до полного ужаса. 15-летние
очереди в центре города были нормой и, как правильно комментировали где-то на
профильном сайте - "состояние гражданской связи властей СССР не беспокоило".
После получения независимости многие, особенно представительства и филиалы
западных компаний, платили любые деньги, чтобы подключиться. Показательным
примером стала утеловская 230, с которой любые звонки в город можно было
делать только через "восьмёрку", за соответствующую плату. Но это Клов, а
самым горячим местом была Соломенка.

На соломенскую 242/243 поставили уфимскую МТ-20. Комплектация её была
достаточно странной. Обслуживание звонков делили между собой 4 процессора, и
всё было нормально до тех пор, пока не происходил баг. Тогда защита вышибала
процессор и он уходил на перезагрузку. Грузился же он с ленточного(!)
накопителя, и этот процесс занимал несколько минут.

После какого-то количества абонентов станция вошла в следующий "режим".
Чрезвычайно активные потребители где-то к десяти утра доводили нагрузку до
предела возможностей станции (ну ещё бы - такие деньги плачены, надо
использовать на полную... повремянки тогда ещё не было). При повышенной
нагрузке баг проявлялся значительно вероятнее. Тогда один процессор уходил в
ребут, а остальные принимали на себя нагрузку "и за того парня"...
спотыкались на баге (том же? неважно) и становились в очередь на загрузку.
Как только один процессор вставал, он получал на себя ударный шквал звонков,
быстро ловил баг и становился в хвост очереди. Звонки не проходили, абоненты
рвали трубки в попытках дозвониться, станция же никак не могла войти в
рабочий режим.

Достаточно быстро персонал выработал методы борьбы с этим - станция
отключалась целиком на 10-15 минут. Абонентам надоедало слушать тишину в
линии, и когда станцию снова включали, рабочая нагрузка набиралась
постепенно, а не рывком, и станция могла устойчиво работать хоть много суток,
пока снова не совмещалась высокая нагрузка и неуловимый баг.

... Вот такая вот легенда. Возвращаясь к UMC - я думаю, что совершенно
неважно, были там проблемы при апгрейде или нет. При проблемах связи нагрузка
резко растёт за счёт попыток, и если обработка неудачных попыток требует
существенных ресурсов - любая, самая ничтожная, проблема может привести к
лавинному возрастанию загрузки вплоть до полного паралича. Лечение - или
исправление логики на такую, при которой обречённые попытки не принимаются с
самого начала, или очень сильный запас мощности, в разы и десятки раз, в обычной
обстановке не применяемый.

К предположению, что всё так и было, у меня есть существенный аргумент -
связь у тех абонентов, с которыми я пытался связаться, восстановилась с
концом рабочего дня. В 19:15 ещё никому из них дозвониться не мог, а в 19:20
и я дозвонился, и им посыпались SMS'ки с рассказом про недозвонившихся
(стандартная услуга UMC).

P.S. В blog.yandex.ru ввёл "UMC коммутатор" и чего вижу:

Афонин также добавил: Этот процесс, так сказать, волновой
Восстанавливается одна система, она за собой подгружает следующую и
следующую.


Ага-ага.
bird

/memoires/ Интернет против телевидения, первый раунд

Сейчас там, наверно, оптика. Но в конце 90-х там был Коаксиал, с большой буквы К. В оболочке толщиной в большой палец слесаря-сантехника, он входил в восьмисантиметровую железную трубу, на концевике которой рядом с местом входа стоял манометр. Надеюсь, что в трубе был сжатый воздух, а не масло.:) Говорят, часть труб шла на телебашню, часть - в телецентр на Крещатике. Я не проверял.

В 96-м году, вскоре после запуска долгожданного канала со стадиона на ТУМС-15 (откуда было в разы легче дотянуться и на межгород, и по городу) позвонил высокий чин с ТУМС'а:

- Что вы там включили????
- ?
- Во Львове уже три часа нет УТ-1!
- !!

Да, оно фонило. Как этот Зелакс-115 фонил... Да, выход этой пары случайно оказался рядом с кабелем УТ-1 на Львов. Да, кабель, видимо, был в этом месте повреждён - иначе чего бы пропускать такое сквозь экран. Замена пары помогла. Но какой хрупкой оказалась структура...

UPDATE:
Чуть по другому было.
- от поднятия канала до его перевода в другой кабель все-таки прошло
дня два... Эти два дня телевизионщики искали, почему во Львове начал
"идти снег".. (канал работал, но с помехами. Так что не все так плохо).
- никто нам не звонил. Просто перенесли нашу линию в другой кабель,
разумеется, нарушив полярность. Про "снег" tasic выяснил уже когда
добрался до ТУМСа, убедился, что все работает и вернул полярность
обратно..
--
snar