Направление развития сайта. Предлагаем и обсуждаем.

 
13 лет, 3 месяца назад
Модератор
Сообщений: 2,374
хм, как основу взять было бы интересно.
тут надо подумать, что пользователи могут вообще добавить на сайт в русле его направленности - фильмы и персоны в пределах существующих ссылок на трекерах:
1. Доп. информация к фильму/персоне и поддержание её в актуальном состоянии.
2. Фотосеты персон по фильму.
3. Трейлеры, ролики, клипы самопальные на основе кадров из фильма в конце концов :)
4. Начинание обсуждений и просто открытие тем с набором интересных фактов по фильму.

Это то, что является материалом, которые теоретически могут добавлять пользователи.

Влияние на рейтинг других возможно только голосованием за отзыв и это правильно.
Ваш п.2 справедлив, но это означает ручную оценку. Т.е. качество материала как должно определяться? Вес, он же рейтинг, юзера должен определяться его вкладом в сайт, а что определит вес самого вклада?

п.3. тоже спорен. Только что вышедший фильм имеет кучу материалов, а вот фильмы 70х - нет. Так что достать проще и что ценнее?
 
13 лет, 3 месяца назад
Пользователь
Сообщений: 123
п.2
Думаю, что от ручной оценки далеко уйти не удастся. Пользователи голосуют за информацию добавленную другими пользователями. При высоком качестве информации рейтинг автора увеличивается и от этого увеличивается вес его голоса.

п.3
Ваше утверждение не противоречит моему.
 
13 лет, 3 месяца назад
Модератор
Сообщений: 2,374
п.2 несколько расшифрую.
должна ли репутация пользователя влиять на вес его голоса в голосовании за материал? С одной стороны, достаточно простого голосования за и против, а с другой - это один из способов выделить тех, кто с большей репутацией.

п.3 тоже поясню.
Есть фильм 2010 года с рейтингом 2.3 имдб и кучей отрицательных отзывов. Материалов по нему много и они разнообразны. Насколько ценны эти материалы по сравнению с фильмом 70-х с рейтингом 8.9 и по которому есть только пара постеров, грубо говоря? ИМХО, если кто-то выкладывает очень редкий материал, то он должен оцениваться дороже.
Теперь обратная ситуация - 2010год и рейтинг 8.9. Материалов куча и легко доступны.
Так почему рейтинг фильма и качество контента не взаимосвязаны? В контенте 60-70хх годов вы вряд ли найдёте высокое качество, но в тоже время он представляет ценность для ценителей. В контенте 2010года материалов куча, но их легко достать.
ИМХО, одна выкладка редкости должна быть выше по стоимости, чем куча фоток текущего года.

Теперь про качество контента. Что тогда будет качественными материалами к старым фильмам?
 
13 лет, 3 месяца назад
Пользователь
Сообщений: 123
п.2
Да наверно репутация должна влиять.

п.3
Я согласен. Если пользователям понравится подборка фотографий со съёмок "чокнутого профессора" (не самый хороший фильм, по моему мнению), то они проголосуют за. Если пользователям не понравится подборка фотографий со съёмок "списка Шиндлера" (гораздо лучше, по-моему), то они проголосуют против.
Я хочу сказать, что качество материала определяется пользователями.
Контентом я называю информацию размещённую пользователем о фильме, но не сам фильм. Или информацию о режиссере, но не самого режиссера.
 
13 лет, 3 месяца назад
Модератор
Сообщений: 2,374
п.3
И вот мы подошли к двум частям, из чего может складываться рейтинг пользователей:
1. Голоса за материалы к фильмам/персонам.
2. Поправочные коэффициенты за "редкость" материалов. ИМХО, он должен зависеть от возраста фильма, рейтинга имдб/кинопоиска, общего количества уже имеющихся материалов, … ???

голоса за материалы дают прирост рейтинга юзера, а коэффициент его дополнительно увеличивает/уменьшает.


в общем, надо связать с формулами и прикинуть разные ситуации.
 
13 лет, 3 месяца назад
Пользователь
Сообщений: 123
Вот, просто ради эксперимента распарсил сайт и написал программу для подсчёта оценок всех фильмов cinemate на манер IMDb и КП.
https://spreadsheets.google.com/ccc?key=thBuo35RW5q-einwH5aF04Q&hl=ru#gid=0
Рассчитано через Байесову оценку.
При этом были выбраны коэффициенты
С = 5.18071297719 - средняя оценка среди всех фильмов
M = 25 - минимальное количество голосов для включения в рейтинг
R — средняя оценка фильма (по десятибальной шкале) рассчитывается, как я описал на предыдущей странице.

Top-250 по такой системе

10 худших фильмов

Всякое другое :)

 
13 лет, 3 месяца назад
Администратор
Сообщений: 3,035
Довольно интересный рейтинг получился, спасибо автору за труды :) Я бы хотел взглянуть на саму формулу расчета и учитываются ли в ней случаи, когда пользователи не ставили оценку фильму? То есть взять хотя бы "Начало (2010)": 148 за, 18 против и 9 не могли определиться с оценкой.
 
13 лет, 3 месяца назад
Пользователь
Сообщений: 123
Нет, такие случаи не учитывались.
Форумлу взял из википедии:
Расчёт рейтинга фильмов производится на основе подлинной Байесовой оценки (англ. true Bayes estimator) по следующей формуле:

где:
  • W — окончательный рейтинг;
  • V — число голосов, поданных за фильм;
  • M — минимальное количество голосов для включения в рейтинг (Я поставил M = 25, на IMDb M=3000);
  • R — средняя оценка фильма (по десятибальной шкале);
  • C — средняя оценка среди всех фильмов (Моя программа насчитала С=5.18, на IMDb 6.9. Я так понимаю этот параметр должен периодически пересчитываться, как и все оценки).


Единственное расхождение в том, что на IMDb используется десятичная система оценок, а здесь "понравилось/не понравилось". Пришлось переводить в десятичную

где:
  • P — положительные голоса;
  • M — отрицательные голоса;
 
13 лет, 3 месяца назад
Администратор
Сообщений: 3,035
Что если попробовать пересчитать, учитывая пользователей, которым фильм показался середнячком, по следующей формуле?

R = 10*(P + 0.5*N)/T

P - количество положительных голосов
N - количество голосов без оценки
T - общее число оценок (положительных + отрицательных + нейтральных)
 
13 лет, 3 месяца назад
Пользователь
Сообщений: 123
По данным за 15 число и по этой формуле:
C = 5.13858946524
Top250


10 худших


Если считать по этой формуле, то, наверное, стоит считать так: V = P + M + N, а у меня сейчас V = P + M

Вот, если хотите сами поиграться:
http://codepaste.ru/5169/ - парсер
http://codepaste.ru/5171/ - считалка
Хотя, вам, наверное, будет проще через базу.