Воспроизводимый рейтинг: можно ли с помощью краудсорсинга предсказать выбор пользователей LLM? Всем привет! С…
Воспроизводимый рейтинг: можно ли с помощью краудсорсинга предсказать выбор пользователей LLM? Всем привет! Сегодня хотим поделиться историей нашего эксперимента, который начался с простого вопроса: а можно ли с помощью краудсорсинга воссоздать рейтинг нейросетей, который мы получаем от тысяч реальных пользователей на нашем сайте LLM Arena? Причём не в жёсткой парадигме «оцени по инструкции», а приближаясь к реальному user preference, когда пользователь выбирает то, что ему субъективно... https://clck.ru/3NsUfZ
Автор: Habr все новости об IT