|
Поиск по блогам
Формула ранжированияНаш сервис — первый, использующий открытую формулу ранжирования при составлении списка самых популярных записей в блогах. Мы считаем, что только прозрачность и открытость алгоритма могут позволить рейтингу завоевать доверие посетителей. Поэтому мы не только не боимся открыть свою формулу ранжирования, но и будем рады открытому обсуждению возможностей её улучшения. Рейтинг записи складывается из следующих значений, любезно предоставляемых Яндекс.Блогами и вычисляемых за последние 24 часа: visits24 — количество посещений записи; Очевидно, что параметры commenters24 и commenters24 родственны, и не имеет смысла учитывать их по отдельности. Кроме того, хотя оба они свидетельствуют о популярности записи, слишком большое количество комментариев при сравнительно невеликом количестве комментаторов сигнализирует о том, что запись, скорее всего, вызывает интерес у не очень широкого круга читателей. Поэтому мы решили применять среднее геометрическое этих величин для сглаживания эффекта от слишком большого относительного количества комментариев. Все значения, естественно, разнородны, поэтому их нельзя учитывать в ранжировании на равных. Понятно, например, что 100 посетителей в сутки — достижение более чем скромное, в то время как 100 новых ссылок на запись за сутки говорят о том, что затронутая тема заинтересовала немалое количество людей — настолько, что они не поленились рассказать о ней уже своим читателям. Из этого следует, что параметры необходимо привести к виду, в котором их можно будет обоснованно сравнивать. Для этого мы используем нормализующие коэффициенты, получаемые из статистических данных, собранных за последний месяц: vl — среднее отношение visits24 к links24weight (на сегодня — 160,8934); Применяя эти коэффициенты, мы получаем условные величины, которые можно сравнивать между собой с достаточным на то основанием. Таким образом, формула ранжирования для сводного рейтинга выглядит так:
При этом к показателю links24weight дополнительно применяется коэффициент 0,5, если он больше, чем десятая часть от visits24, и коэффициент 0, если visits24 равен нулю. Это сделано для защиты от накруток: «честные» ссылки не могут появиться, если запись не была ни разу просмотрена, и крайне сомнительно, чтобы их ставили более десяти процентов прочитавших запись. Также мы рассматриваем возможность использования других понижающих коэффициентов, если какая-то из величин слишком сильно отклонится относительно других по сравнению со среднестатистическим отношением. Просмотреть подробный расчёт рейтинга для каждой записи можно, пройдя по секретной ссылке. Мы с удовольствием выслушаем ваши предложения и пожелания по доработке описанных формул. |