Улучшаем пунктуатор на стенограммах Привет, Хабр! Сегодня я расскажу о том, как натренировать качественный ру…
Улучшаем пунктуатор на стенограммах Привет, Хабр! Сегодня я расскажу о том, как натренировать качественный русскоязычный пунктуатор и капитализатор для стенограмм (то есть, модель, превращающую только что распознанный Speech-to-Text’ом “привет хабр” в литературный “Привет, Хабр!”). Задача эта давно известная и в последние годы кое-как решаемая с помощью нейросетей-трансформеров, например, BERT. Ключевое слово здесь – “кое-как”. Мы п... https://clck.ru/36bHR3
Автор: Habr все новости об IT