Ученые разработали механизм быстрого обнаружения и удаления интернет-троллей

Американские исследователи из Корнельского и Стэнфордского университетов выявили алгоритм оперативной идентификации сетевых комментаторов, которые ведут себя антисоциально и провокационно — т.н. троллей.

Винтернет-пространстве людей, разжигающих антисоциальные дискуссии в комментариях под веб-контентом, именуюттроллями . Они постоянно нарушают этику сетевого взаимодействия и становятся источником раздражения для большинства мирных пользователей.

Многие известные сайты (в том числе CNN) сотрудничают с учёными в поисках способов выявления троллей и их бана прежде, чем они доставят слишком много неприятностей. Руководители авторитетных сайтов давно заметили, что многие посетители, подвергшиеся нападкам троллей, начинают избегать интернет-ресурсов, где их могут унизить или постоянно провоцировать на споры и взаимные оскорбления.

В попытке автоматизации борьбы с троллингом Джастин Чен (Justin Cheng ), Кристиан Данеску-Никулеску-Мизил (Cristian Danescu-Niculescu-Mizil ) и Джур Лесковец (Jure Leskovec ) создали алгоритм, анализирующий типичное поведение троллей (данные были предоставлены сайтами cnn.com, breitbart.com и ign.com). У исследователей ушло 18 месяцев на изучение более 10 тысяч комментариев: они сравнивали поведение забаненных пользователей с теми, кто никогда в бан-лист не попадал.

Учёным удалось выявить некоторые закономерности в комментариях, оставленных забаненными пользователями (они обозначили их как FBUS–Future Banned Users). Во-первых, они заметили, что в среднем сообщения троллей отличались меньшей ясностью и грамотностью, нежели сообщения нормальных пользователей. При этом чем они больше писали комментариев, тем менее грамотно они выражались.

Также оказалось, что другие пользователи первоначально терпеливо относились к троллям, однако когда их терпение заканчивалось, почти моментально следовал бан.

Исследователи сообщили, что обнаружить будущих забаненных пользователей оказалось относительно легко. Американцы создали алгоритм, основанный на так называемом автоматизированном индексе читаемости. С таким алгоритмом команда была в состоянии определить будущего забаненного юзера с точностью 80% после всего лишь 10 комментариев.