Дмитрий Кабанов

Как на самом деле составляется рейтинг Hacker News

Дмитрий Кабанов, сооснователь контент-студии Rockin’Robin, решил обратить внимание читателей Rusbase на особенности подготовки материалов для Hacker News и пересказал расследование одного из разработчиков Google.


Разработчик компании Google, Кен Шириф, проанализировал якобы «меритократическую» систему рейтингов Hacker News и обнаружил, что будущее статей, помещенных на первую полосу, определяется не только голосами, но и подвергается таинственной фальсификации, другими словами – штрафам, которые могут «опустить» рейтинг статьи с определенным набором внутренних характеристик.



По теме: 20 источников бизнес-новостей, на которые стоит подписаться



В течение нескольких дней Кен отслеживал 60 лучших статей с сайта Hacker News и обнаружил, что 20% статей на первой полосе и 38% на второй подверглись «штрафованию», из-за чего они быстро упали в конец рейтинга.

Даже собственный блог Кена Ширифа с результатами этого исследования стал жертвой этой системы: его статья была снята с первой полосы сразу же после наложения штрафа. Без этих мер, утверждает Кен, статья была бы на 5 месте в рейтинге.


Положение статьи на HN в течение дня


Согласно данным Кена, положение статьи на Hacker News определяется количеством «лайков», прошедшим с момента публикации временем и любыми наложенными на статью штрафами. Время – более значимый показатель, чем голоса: механизм срабатывает так, чтобы ни одна статья не держалась слишком долго на первой полосе, но и штрафы также играют большую роль.

С помощью графика Кен показал динамику изменения рейтинга 60-ти лучших статей на 11 ноября: наиболее популярные статьи часто не занимали первое место (красная линия на графике). Судя по исходным данным, статья «Почему вы никогда не должны использовать MongoDB» (прим. переводчика: на графике кривая ближе к центру с названием Why You Should) должна была держаться на первой позиции большую часть дня, но на нее наложили столько штрафов, что она заняла примерно седьмую позицию.


Предварительный рейтинг статей на HN за 11 ноября


Если статья получает штрафной коэффициент = 0,4, то за каждый лайк дают только 0,3 голоса. Если штрафной коэффициент = 0,1, то стоимость каждого лайка оценивается только в 0,05 голоса. По оценкам Кена, его собственная статья подверглась штрафу в размере 0,2. Пока неясно, как и зачем налагаются штрафы, но Кен Шириф заметил, что многие штрафы вступили в силу около 9 утра. Тогда он выдвинул теорию, что в это время, возможно, у модераторов начался рабочий день.



По теме: Как в GitHub пишут посты для блога



По всей видимости, на статьи налагают штрафы из-за полемики в комментариях (если под статьей более 40 комментариев), из-за того, что статья пришла с популярного веб-сайта (например, с ArsTechnica, Business Insider или GitHub), или из-за того, что в заголовке упоминается «АНБ».

Комментаторы Hacker News отметили, что анализ не учитывал пометки, которые давались статьям. Причем не всем пользователям доступна эта функция. Если уполномоченный читатель Hacker News считает, что в посте содержится спам, или что пост не соответствует заголовку, он может пометить статью на удаление.

Оригинал статьи доступен здесь. Перевел для Rusbase: Дмитрий Кабанов, сооснователь контент-студии Rockin’Robin.


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно