Без сбоев. Кузьмин рассказал об обеспечении стабильной работы сервисов
Развитие отечественных массовых онлайн-платформ требует новых подходов к надежности и обновлениям. Справиться со сбоями уже работающих систем поможет метод автогенерации архитектурных структур и проверки их целостности.
Цифровые сервисы становятся базовой инфраструктурой для образования, здравоохранения, торговли и государственных услуг. Через них проходят все жизненно важные события миллионов людей — от записи в детский сад до покупки жилья, — и их востребованность растет. Если в мае 2025 года на портале «Госуслуги» было зарегистрировано более 112 млн пользователей, то уже к июлю их число превысило 117 млн — это порядка 95% россиян старше 14 лет. При таких условиях требования к надежности и стабильности систем, обеспечивающих доступ к важным документам, возрастают в разы.
Чтобы понять, почему технические сбои все же возникают и как современные разработчики могут их предупредить, мы обратились к инженеру-разработчику Дмитрию Кузьмину. Он внедрял решения для образовательных сервисов Московской электронной школы, которая используется всеми государственными школами столицы и формирует базовую цифровую инфраструктуру школьного образования, а также для медицинского сервиса «Электронная медицинская карта», входящего в состав ЕМИАС и обеспечивающего повседневный доступ миллионов москвичей к данным о здоровье.
Это обеспечило непрерывную работу платформ при выпуске обновлений и исправлении ошибок в сервисах. Эти же принципы он сегодня применяет на международных цифровых платформах корпоративного уровня, в том числе в HR- и финтех-сервисах, работающих с многомиллионной пользовательской базой и бизнес-клиентами, помогая им масштабироваться и обновляться так, чтобы рост системы не приводил к цепным сбоям и падениям под нагрузкой. Инженерные решения российского разработчика для построения цифровых сервисов, описанные в профессиональных технических изданиях, помогают другим специалистам использовать его опыт для автоматизированной проверки архитектуры и выявления возможных ошибок еще до внедрения изменений, снижая риск сбоев по мере роста системы.
Почему сбои возникают даже в зрелых цифровых системах
Сбои в крупных цифровых сервисах чаще всего возникают не из-за единичной ошибки в коде или внезапного технического инцидента. Причина, как правило, системная.
Цифровые платформы, по словам Кузьмина, который модернизировал не одну такую систему, годами развиваются за счет добавления новых функций и подключений, тогда как их базовая основа остается прежней.
По мере роста сервиса увеличивается число внутренних связей и внешних сервисов, с которыми он взаимодействует. Объем данных и количество операций растут, а изначальная структура не была рассчитана на такую нагрузку. В результате любое изменение начинает затрагивать сразу несколько частей системы, предсказать последствия становится сложно. Пользователь, как правило, не видит этой архитектурной сложности, но остро ощущает последствия.
«Пользователь не видит сложности нашей архитектуры, но остро ощущает последствия: сервис в самый ответственный момент может зависнуть, полностью перестать отвечать или потерять критически важные данные. И это общая проблема — от крупнейших госуслуг до международных коммерческих платформ», — поясняет он. Так, Кузьмину приходилось перестраивать клиентскую архитектуру и процессы обновлений как для сервисов госсектора, так и для бизнеса.
Кроме того, он вносит вклад в open-source-проекты, исправляя ошибки и развивая инструменты, от стабильности и удобства которых напрямую зависит работа цифровых сервисов с широкой пользовательской аудиторией и которыми пользуются другие разработчики при создании собственных продуктов. В 2025 году за свой практический подход он получил профессиональное признание, став победителем в категории «Технологии и Инновации» ежегодной национальной бизнес-премии — National Business Award.
Именно продуманность архитектуры — то есть внутренней структуры всей системы — в таких ситуациях становится ключевой, а не количество функций, как часто считается.
Она определяет, как разные части сервиса взаимодействуют между собой, и основная проблема, с которой сталкиваются разработчики, — отсутствие четких архитектурных правил, позволяющих вносить изменения без риска для стабильности всей платформы.
«Если таких правил нет или они не соблюдаются, любое изменение в разросшейся системе может неожиданно повлиять на другие ее части. Разработчик исправляет или добавляет одну конкретную функцию, а проблемы появляются в совершенно другом месте, потому что мы не можем заранее увидеть все скрытые связи», — говорит эксперт.
По мере роста цифровых платформ каждая ошибка при обновлении становится критичной. Она может затронуть бизнес-процессы компаний и доступ пользователей к сервисам, которыми они пользуются ежедневно. Чтобы уменьшить количество ошибок при обновлениях, ускорить выпуск новых версий и снизить риск того, что изменение в одном модуле нарушит работу остальных, специалист предложил особый архитектурный подход, при котором крупный сервис разбивается на независимые части и обновляется поэтапно, без вмешательства в работу всей системы. Эти принципы, подробно описанные им в научной статье для научного журнала «Universum: технические науки», инженер сформулировал на основе опыта работы по перестройке и поддержке архитектуры коммерческих цифровых систем в ритейл-проекте 12 STOREEZ. В рамках этих проектов он занимался внедрением модульной клиентской архитектуры, выстраиванием процессов безопасных обновлений и снижением зависимости между компонентами системы. Принятые им решения позволили повысить устойчивость сервисов, сократить количество ошибок при релизах и обеспечить непрерывность ключевых бизнес-процессов. В конце 2025 года российского инженера пригласили в состав жюри международной премии Cases&Faces, где его опыт помог определить лучшие цифровые проекты, которые отвечают высоким требованиям работы с миллионами пользователей по всему миру.
Автоматизация архитектурной верификации как способ предотвращения сбоев
Тенденция к росту масштаба популярных цифровых платформ усложняет контроль за их внутренним устройством: количество компонентов, связей и обновлений становится таким, что ручные проверки больше не способны обеспечить надежное предотвращение сбоев. В результате архитектурные ошибки всё чаще обнаруживаются уже в работающих системах — когда они начинают сказываться на пользователях и бизнес-процессах. Автоматизация же процесса построения архитектуры цифровых систем сталкивается с рядом проблем, которые обсуждаются среди разработчиков на международном уровне из-за сложности выбора правильных подходов. Справиться с этой задачей, по мнению Кузьмина, может метод автогенерации архитектурных структур и проверки их целостности.
«Когда цифровая система вырастает, полагаться только на ручные проверки уже невозможно. Поэтому всё большую роль играет автоматическая проверка: система сама выявляет и останавливает ошибки в ее устройстве еще на этапе подготовки изменений. Это позволяет сохранить стабильность платформы и предотвратить сбои до того, как новые функции становятся доступны пользователям», — объясняет инженер.
Это особенно важно для сервисов массового и социально значимого пользования, где одно некорректное изменение может привести к сбоям, в результате которых десятки тысяч пользователей потеряют доступ к жизненно важным государственным услугам.
Так, инженер совершенствовал «Дневник МЭШ» — бесплатную интернет-платформу, с которой работают все государственные школы Москвы. А также «Электронную Медицинскую Карту», часть ЕМИАС — масштабной цифровой системы, связывающей врачей и пациентов московских поликлиник, стационаров, станций скорой помощи и фондов ОМС. Доработки платформы для школьников, родителей и учителей, в частности, получили высокие оценки экспертов, а сам проект получил целый ряд наград, включая «Премию Рунета». Значимость и масштаб технических решений самого инженера, которые обеспечили бесперебойную работу социальных сервисов, оценило жюри национальной премии «Время Инноваций» в 2021 году, присудив ему награду в номинации «Социальная Инновация Года».
Даже опытные команды по мере роста сервисов всё чаще сталкиваются с пределами ручного контроля. Именно поэтому подход инженера вызвал интерес в профессиональном сообществе: исследование проблемы и описание его подхода к автоматизации построения архитектуры цифровых систем опубликовало англоязычное техническое издание ULOA, а автора статьи включили в состав экспертного совета международной ассоциации AITEX, которая в том числе дает независимую оценку лучших инженерных решений.
От стабильности цифровых сервисов во всем мире зависят повседневные решения миллионов людей, в том числе связанные со здоровьем. Сбои в работе такой инфраструктуры обходятся дорого, но избежать их возможно, как показывает опыт Кузьмина, если закладывать механизмы устойчивости систем и ее проверки на ранних этапах создания сервисов. И именно такие изменения снижают вероятность того, что привычные приложения будут подводить пользователей в самые ответственные моменты.