lexometrica groud truth.

Lexometrica Ground Truth: бенчмарк LLM по российскому праву

Всем привет! Делюсь итогом двухмесячной работы - релизом рейтинга юридического рассуждения больших языковых моделей Lexometrica Ground Truth.Изначально цель была сугубо практической: требовалось выбрать лучшие модели для LegalTech-проекта "неШемяка!". Но в процессе пришлось столкнуться с фундаментальной проблемой индустрии оценки ИИ - открытые тесты дают сильно искаженную картину. Финальные результаты спроектированного стресс-теста оказались сколь ожидаемыми, столь же и неожиданными.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

lexometrica groud truth.

Lexometrica Ground Truth: бенчмарк LLM по российскому праву

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

lexometrica groud truth.

Lexometrica Ground Truth: бенчмарк LLM по российскому праву