Мы выгрузили все сообщения с начала 2022 года из 395 телеграм-каналов различных медиа, включая провластные, региональные и независимые. Получилось больше 8,8 млн постов. Из них мы отобрали те посты, которые включали хотя бы одно из слов: «клуб», «вечеринка», «фестиваль», «лгбт», «гей» — одновременно хотя бы с одним из слов: «рейд», «ворваться», «сорвать», «облава», «силовики», «полиция», «задержание/задерживать», «закрыться». Осталось 12535 сообщений.
Чтобы сузить число сообщений для анализа, мы разбили сообщения на темы с помощью библиотеки BERTopic и выбрали только те темы, которые касались срывов и другого давления на различные мероприятия. Тогда сообщений осталось 2631. Чтобы еще больше сократить исследуемый датасет, мы попросили модель gpt-4o-mini определить, описывает ли текст визиты силовиков на мероприятия в России. Итоговый датасет составил 973 сообщения.
Все эти сообщения мы прочитали вручную и выделили из них уникальные события. Мы учитывали только те события, в результате которых для организаторов или участников мероприятия наступили негативные последствия от силовиков (например, мероприятие было прервано или отменено). Мы не включали события, касавшиеся бытового криминала (драки, кражи и так далее), и жалобы на шум. Также мы не включали рейды, направленные против мигрантов, и события, где основным результатом было заведение уголовного или административного дела: мы хотели сконцентрироваться именно на внесудебных последствиях. Если одно заведение пострадало несколько раз, мы считали это как отдельные случаи.
Наш анализ не является полным: во-первых, не о всех случаях давления силовиков писали медиа, во-вторых, некоторые случаи мы могли пропустить при анализе. Тем не менее он дает представление об общей картине и тенденциях.