ВКонтакте вводит фильтр для исключения враждебных высказываний

ВКонтакте активно строит безопасное пространство для своих пользователей, в связи с чем запустило специализированную нейросеть для фильтрации травли и враждебных высказываний. Теперь администраторы могут самостоятельно включать и отключать фильтр в любое время. Отметим, что по умолчанию он отключён, поэтому юзеры не столкнутся с внезапной блокировкой сообщений, однако администраторы получат соответствующие оповещения о новом доступном функционале.

Сейчас фильтрующий алгоритм всё ещё не доступен для всех пабликов - лишь для половины наиболее активных сообществ в рамках тестирования его работы. Он умеет определять прямые угрозы, такие как причинение вреда здоровью, угрозы расправы и пожелания смерти. В будущем руководство соцсети планирует существенно расширить функционал - фильтр научится отключать сообщения, оскорбляющие юзеров по национальной или религиозной принадлежности.

При этом публикации, попавшие под фильтр, не удаляются - они просто скрываются от всех юзеров за исключением администраторов сообществ. В их праве вернуть сообщения вручную, если упомянутых проблем, на их взгляд, не возникало, и фильтр попросту ошибся. Однако собранная на данный момент статистика показывает, что этим воспользовались только в одном проценте случаев, и на заработок на регистрации рефералов это не повлияло.

Ранее тест фильтра проходил 4 ноября 2020 года. Он занял одни сутки, в течение которых пользователи всех пабликов могли её включить, а затем такие права остались только у части администраторов. В результате фильтром воспользовались более 10 процентов от всех сообществ ВК, что составляет 13 миллионов страниц. От работы нейросети впоследствии отказались лишь 1,8 процента пользователей, так что будущее определённо будет за алгоритмом.