Маленькая модель обыграла большие: почему Nanbeige4-3B меняет правила игры В ноябре вышла модель Nanbeige4-3B…

Маленькая модель обыграла большие: почему Nanbeige4-3B меняет правила игры В ноябре вышла модель Nanbeige4-3B-25-11 (а 6 декабря они выложили статью об обучении на arxiv). Её размер всего лишь 3 миллиарда параметров. Это почти в 100 раз меньше, чем GPT-4, и даже меньше, чем большинство открытых моделей.Но вот парадокс: на тестах она достигает показателей выше, чем модели в 10 раз больше, а на бенчмарке WritingBench и вовсе держится на уровне проприетарных моделей занимая... https://clck.ru/3R4k8u

Автор: Habr все новости об IT