Мэрия Москвы собралась потратить больше 155 млн рублей на систему мониторинга пассажиропотока, что понять, куда и как часто ездят люди. Кроме того, контролем за передвижением россиян заинтересовался и Сбербанк. Граждан уверяют, что вся информация будет обезличена, вот только при таком большом объеме собранных данных соблюсти анонимность удастся недолго. Разобраться в том, зачем властям и бизнесу нужны эти сведения, RTVI помог один из ведущих российских экспертов в области открытых данных Иван Бегтин.
В начале октября столичный Центр организации дорожного движения (ЦОДД) провел конкурс, чтобы определить поставщика оборудования, с помощью которого можно отслеживать передвижение людей по городу через смартфоны. Цена контракта — 155,2 млн рублей. Судя по документам на портале госзакупок, речь идет о поставке 220 аппаратно-программных комплексов (АПК) и софта, который будет собирать из них данные.
АПК установят на остановках общественного транспорта и навигационных стендах в пешеходных зонах. Их задача — собирать данные о перемещении людей по MAC-адресам (номерам, которые присваивается каждому электронному устройству при производстве) через Bluetooth и Wi-Fi. Защищенными от слежки при таком раскладе останутся лишь владельцы смартфонов с относительно новыми версиями Android или iOS: они умеют скрывать настоящий MAC-адрес, постоянно случайным образом подбирая новый.
Раз в день, неделю, месяц и год система будет формировать отчеты о перемещениях человека за указанное время. Эта информация, в свою очередь, будет отправляться в единый центр хранения данных Департамента информационных технологий Москвы. Вся информация при этом будет обезличена.
Планируется, что система мониторинга будет работать в связке с городскими видеокамерами, что позволит более точно формировать карты пассажиропотока в столице. В ЦОДД заявили, что главная цель такого симбиоза — «максимально улучшить качество пешеходных перемещений и работы городского транспорта».
Специалиста в области открытых данных Ивана Бегтина такое объяснение не устраивает. «Я не верю в пассажиропоток [как причину сбора данных]. Я хочу знать конкретно, как работает их информационная система, а информации об этом просто нет нигде в открытом доступе», — объясняет Бегтин.
Проблема «непрозрачности» в контексте сбора данных для Москвы не нова. Простому человеку никогда не узнать, какие именно данные, откуда и каким образом собирают власти. Что происходит с данными после сбора — анализируют ли их, уничтожают или используют во вред — тоже неясно, отмечает Бегтин.
По мнению эксперта, проблема России, в целом, и Москвы, в частности, заключается не в самой слежке, а именно в отсутствии этического регулирования. Кроме того, при работе над новой системой мониторинга, московские власти зашли на территорию конкурентного коммерческого рынка — частные сети тотальной слежки существуют в России уже давно, но власти не хотят с ними сотрудничать.
«В том, что власти Москвы создают свою инфраструктуру, ничего хорошего нет. Они начинают выступать в роли спецслужбы», — заявил Бегтин.
В то же время над собственным пилотным сервисом геоаналитики работает и Сбербанк. Программа будет анализировать банковские транзакции россиян, сопоставляя их с информацией о физическом расположении торговых точек в базе 2ГИС. В итоге станет понятно, где и как люди тратят деньги.
Результаты такого анализа будут продавать как коммерческим структурам, так и региональным и муниципальных властям, заявил вице-президент Сбербанка Станислав Карташов. В потребительскую экспертизу будут входить информационно-аналитические отчеты, рекомендательные модели, мониторинг отраслей экономики и составление портрета целевой аудитории.
Новая система мониторинга затронет почти 97 млн человек и 2,6 млн организаций — клиентов Сбербанка по всей России. Как и мэрия Москвы, банк, 52% которого принадлежит федеральному правительству, обещает, что вся информация будет обезличенной.
С одной стороны, здесь ситуация со сбором данных куда яснее. Самое распространенное применение больших дата — таргетированная реклама. В этой сфере сбор данных — крайне прибыльный бизнес. Помимо «умных» кассовых аппаратов и Wi-Fi-сетей в торговых центрах, обезличенную информацию о платежеспособных клиентах собирают и компании-посредники — Facebook, Apple и Google.
С другой стороны, какой бы обезличенной информация ни была, опознать кого бы то ни было в 2020 году крайне просто. Способов много, один их них — повторная идентификация. Для этого достаточно тщательно сравнить анонимную информацию с общедоступными данными. «Человек, который знает о вас хоть что-то — район, в котором вы живете, дату рождения, еще что-нибудь — может на основе обезличенных данных вполне четко понять, что вы — это вы», — говорит Бегтин.