Кто сильнее в синтезе тестов? Сравниваем GPT-4.1, DeepSeek, Qwen на своем бенчмарке
Привет, Хабр!В этой статье поделюсь интересными и иногда любопытными результатами сравнения современных языковых моделей (LLM) на задаче синтеза тестов.
Упорство ума. Повышение выносливости
Методы запоминания текстовой информации
Что, если поток образов говорит «нет»?
Способность заглядывать в будущее (вероятностное прогнозирование)
БПМ-I БПМ-II БПМ-III БПМ-IV Родственные психопатологические синдромы
Заключительный тест 3. Запоминание лиц с именами и фамилиями
Привет, Хабр!В этой статье поделюсь интересными и иногда любопытными результатами сравнения современных языковых моделей (LLM) на задаче синтеза тестов.