Экс-дочка «Сбера» «Центр речевых технологий» (ЦРТ) разработает технологию распознавания силуэтов людей и звуков для внедрения в рамках госпрограммы «Безопасный город», которая используется в том числе для определения места жительства призывников в Москве. Предполагается, что ЦРТ дополнит уже имеющийся у него проект «Визирь» новым функционалом, позволяющим городским камерам отслеживать людей между камерами, а также «слышать» звуки. Исходя из новой редакции дорожной карты по направлению «Новое общесистемное ПО», проект претендует на статус «особо значимый». По мнению аналитиков, он может применяться, в частности, в прогнозировании пассажиропотоков и скопления людей, поиске пропавших. Рынок видеоаналитики, где ЦРТ уже является одним из лидеров, растет ежегодно на 10-12% и к 2028 году может достичь почти 24 млрд рублей, пишет Форбс.

22 декабря 2023 года президиум правительственной комиссии по цифровому развитию утвердил новую редакцию дорожной карты по направлению «Новое общесистемное программное обеспечение» (НОПО). Протокол заседания комиссии и сама дорожная карта есть в распоряжении Forbes. В ней появился новый проект, претендующий на статус «особо значимого проекта» — биометрическая технология «Визирь», разработчиком которой является бывшая «дочка» «Сбера» «Центр речевых технологий» (ЦРТ). Сейчас данные о ее бенефициарах скрыты. Напомним, структуры Сбербанка вышли из капитала своих «цифровых» активов, включая ЦРТ, в 2022 году.

Дорожные карты призваны заполнить белые пятна в российском импортозамещении софта, а также стимулировать разработку необходимых госсектору технологий, указывает директор АНО «Центр компетенций по импортозамещению в сфере информационно-коммуникационных технологий» (ЦКИТ) Илья Массух. По его словам, попадание в дорожную карту НОПО не означает автоматического получения компанией средств на разработку от государства. «Многие проекты компании делают за свой счет. При этом такая компания может претендовать на получение статуса «системно значимая» и получать различные льготы, например возможность предлагать эту технологию госсектору и госкомпаниям на закупках без конкурса», — говорит Массух.

Источник, знакомый с ходом разработки дорожной карты, поясняет: статус особо значимого проекта говорит о том, что претендент пока не может рассчитывать на выделение бюджетных средств на доработку своего проекта. «Если они их и получат, то начиная с марта-апреля, когда будут новые утверждения проектов», — добавил он. В самой дорожной карте не прописано, на какие средства мог бы претендовать ЦРТ для доработки проекта.

Для «потенциально опасных» ситуаций
Сейчас «Визирь» используется в комплексах «Безопасного города» Москвы, Санкт-Петербурга и других городах: на стадионах, вокзалах, в метро и других транспортных объектах. Как сообщила в декабре ЦРТ, компания реализовала более 400 биометрических проектов по внедрению системы компьютерного зрения «Визирь» на различных объектах по всей стране, из них 100 — в 2023 году. Большинство проектов 2023 года — в сфере транспортной безопасности.

Госпрограмма «Безопасный город» учреждена в сентябре 2011 года. Сейчас главной ее задачей является профилактика правонарушений, снижение рисков чрезвычайных ситуаций, защита населения и города от угроз природного и техногенного характера, пожаров и др. В рамках программы в Москве создана система видеонаблюдения, которая используется в том числе для определения места жительства призывников в Москве. Сейчас в столице установлено более 225 000 камер, из них почти 7000 — в местах массового скопления граждан, а с 2017 года в столице работают камеры с функцией распознавания лиц. Финансирование «Безопасного города» предусмотрено в 2024 году в объеме 106,2 млрд рублей. На 2025 и 2026 годы запланировано 98,2 млрд и 100,5 млрд рублей соответственно.

Согласно карточке проекта, до июля 2024 года «Визирь» планируется доработать функциями силуэтного анализа, а именно возможностью распознавать особенности походки, нетипичные действия, нестандартное поведение «в условиях некооперативного городского видеонаблюдения». Кроме того, планируется оснастить «Визирь» «реидентификацией и сопровождением объектов, распознаванием акустических событий и предиктивной аналитикой».

В дорожной карте указано, что новый функционал предназначен для предупреждения и раскрытия преступлений, розыска людей, а также сбора информации о событиях, которые могут представлять угрозу «государственной, военной, экономической, информационной или экологической безопасности» страны. Планируется использовать «Визирь» «для выявления потенциально опасных ситуаций на базе биометрических характеристик, включая особенности походки, нетипичные действия, нестандартное поведение одного субъекта или группы лиц, предсказание поведения потенциально опасного для жизни и здоровья человека на основе предиктивной аналитики».

В ЦРТ отказались от комментариев. В Департаменте информационных технологий города Москвы не ответили на запрос Forbes.

Реидентификация и сопровождение объектов — это, по сути, обнаружение одного и того же человека на двух не связанных между собой камерах, поясняет руководитель R&D-направления IT-компании HFLabs Максим Серебро. В условиях города реидентификация и сопровождение позволяет, например, проследить за перемещением конкретного человека или даже группы людей, пояснил он: «Как вариант — это можно использовать в том числе для прогнозирования пассажиропотока».

VisionLabs (входит в состав МТС. — Forbes) также сейчас разрабатывает технологии распознавания силуэтов, говорит генеральный директор компании Дмитрий Марков. «Наша система реидентификации позволяет понять, один и тот же ли человек на серии кадров, и построить его маршрут только по изображению тела. То есть лицо видеть не обязательно. Также технология определяет атрибуты силуэта — тип и цвет одежды, наличие головного убора, цвет обуви, дополнительные аксессуары (рюкзак, сумка и т. д.)», — пояснил он. По его словам, ее можно использовать для поиска пропавших людей по их описанию.

Если говорить о технологиях компьютерного зрения, то к предиктивной аналитике можно отнести распознавание оставленного предмета или скопления людей, рассуждает Марков. «Сейчас мы работаем над детектором, который производит подсчет толпы, что позволяет заранее среагировать на аномальные ситуации», — заключил он.

Анализировать акустические события можно, например, натренировав нейросеть на сотнях звуков разбивающегося стекла, размышляет Максим Серебро. «Она вычленит этот звук из массива и просигнализирует о нем. Если звуки дополнительно классифицировать — бутылка с жидкостью или оконное стекло, — то она будет сообщать и эту информацию», — добавил он.

Если тема видеоаналитики (ВА) и распознавания объектов по фото достаточно хорошо изучена, и существуют большое количество сервисов, то тема анализа акустических сигналов остается менее покрытой по числу реальных применений, считает менеджер по цифровизации практики «Стратегия трансформации» «Рексофт Консалтинг» Илья Муха. Для предсказания положения человека в следующий момент времени или определенного поведения и события требуется накопление большого числа данных, включающих такие события, отметил он. «Большинство таких моделей, способных предсказывать поведения людей, все еще изучаются и дорабатываются в научных сообществах», — указывает Муха, добавляя, что модели, уже представленные на рынке в виде готовых сервисов, как правило, используют метод, основанный на анализе тепловых карт поведения людей. «Он базируется на изучении конкретных действий человека за длительный период времени и анализирует отклонения от маршрута или действий конкретного человека».

По оценке аналитического агентства TelecomDaily, в 2023 году объем рынка ВА мог составить 14 млрд рублей, а в 2024 году — 15,5 млрд рублей. До 2028 года объем российского рынка ВА будет расти на 10-12% в год и может достичь к этому году 23,8 млрд рублей. Если на конец 2020 года число камер наблюдения в использовании составляло 15,12 млн, то к концу 2023 года их количество должно было вырасти до 23,42 млн, оценивали в агентстве. Ключевыми заказчиками для систем ВА остаются госструктуры. Самая большая доля рынка у ГК ЦРТ (АПК «Визирь») — 9%. Следом идет NtechLab — 8%, у Trassir/DSSL и ITV/Axxon Soft — по 7% у каждой, у VisionLabs — 6%, свидетельствуют данные TelecomDaily.

Россия входит в первую тройку стран по количеству установленных видеокамер (после Китая и США), обращает внимание гендиректор TelecomDaily Денис Кусков. Само по себе видеонаблюдение уже не является востребованной услугой, этот рынок, по его мнению, двигает именно ВА: «Модели анализа поведения с помощью видеонаблюдения сейчас разрабатываются и в России, и в других странах, в этом плане ЦРТ не пионер, хотя и в авангарде развития технологии».

Развитие любой сложной технической системы, отвечающей за безопасность, приносит свои плоды, считает гендиректор «Комфортел» Дмитрий Петров. Новый виток развития видеонаблюдения дает удобный инструмент для поиска преступников и профилактику правонарушений, хотя приведет к дополнительным затратам не только на внедрение, но и на расширение серверных мощностей, добавил он.

Впрочем, по мнению главы юридической практики проекта «Роскомсвобода» Саркиса Дарбиняна (и сам адвокат, и «Роскомсвобода» признаны Минюстом иноагентами), доработка «Визиря» направлена, скорее, на распознавание толпы, скоплений людей. «Камеры не сильно влияют на профилактику насильственных преступлений. Согласно криминологическим исследованиям ведомственных институтов, люди, совершающие такие преступления, в массе своей относятся безразлично к тому, что за ними могут наблюдать, — объясняет он. — Кроме того, как минимум треть преступлений совершается в состоянии опьянения. Также есть преступления, совершенные по неосторожности, на профилактику которых, из-за их природы, камеры напрямую также не влияют. Кроме того, для раскрытия преступления важна не только фиксация момента события преступления, определение подозреваемого, но и банально его своевременное задержание».