Как оценить качество машинного перевода
Работая в области машинного перевода в компании Lingvanex, я постоянно читаю статьи в которых сравнивается качество разных переводчиков. Иногда отличие между ними составляет от 0.3 до 1% по какой-либо из метрик, но и это уже повод заявить, что их переводчик - лучший.При оценке качества машинного перевода важно не только сравнить результаты различных систем перевода, но и проверить, являются ли обнаруженные различия статистически значимыми. Это позволяет оценить, насколько полученные результаты достоверны и могут ли они быть применимы к другим наборам данных.
Tencent представила новую модель для перевода текста
Китайская компания Tencent объявила о выпуске Hunyuan-MT — открытой модели машинного перевода нового поколения. Версия Hunyuan-MT-7B уже показывает рекордные результаты среди моделей сопоставимого масштаба.
Вычисление функции потерь и градиентов в AI переводчике
Привет, Хабр!Меня зовут Алексей Рудак, я основатель компании Lingvanex, которая разрабатывает решения в области машинного перевода и транскрипции речи. Продолжаю цикл статей о том, как устроен переводчик на нейронных сетях изнутри. И сейчас хочу рассказать про работу функции потерь. Для тренировки модели используется opensource фреймворк OpenNMT-tf.
В Дании решили: постредактирование — это не перевод
Дания стала первой страной, официально отделившей человеческий литературный перевод от текстов, полученных через постредактирование машинного перевода. С мая 2025 года такие тексты больше не считаются полноценным переводом и не попадают под действие системы Public Lending Right (PLR), которая предусматривает выплаты авторам, переводчикам и другим творческим специалистам за использование их работ в библиотеках.

