ai.
LLM в роли «судьи» vs. человеческая оценка: почему вместе — лучше
В гонке за следующей волной «умных» систем большие языковые модели берут на себя неожиданные роли. Одна из самых интересных — использовать такие модели как «судей» для оценки других моделей. Подход уже экономит командам массу ручной работы, но остаются вопросы: способен ли LLM уловить каждую тонкую ошибку? Что происходит в ситуациях, где критичны человеческая интуиция или глубокая предметная экспертиза?
AI-генерация тестов: как превратить 3 месяца работы в 1 неделю
Главное за 30 секундПривет! В этой статье я расскажу о новом подходе к генерации автотестов для сложных финансовых протоколов. Мы максимально декомпозировали задачу создания тестового покрытия, разбив её на независимые шаги, каждый из которых решает конкретную проблему.Что вы узнаете:Как разбить сложную задачу автоматизации тестирования на управляемые этапыКакие проблемы возникают на каждом шаге и как их решатьПочему важно не пытаться сделать всё идеально с первого разаКак использовать AI для ускорения, но не полагаться на него полностью
OpenAI попалась на удалении датасета с пиратскими книгами
OpenAI оказалась в центре нового скандала, связанного с обучением своих моделей на нелегальных текстах. По данным Bloomberg Law
GitHub ждет перезагрузка: Microsoft выстраивает новую стратегию против AI-конкурентов — Business Insider
Исполнительный директор Microsoft Джей ПарихНа внутренней встрече руководители Microsoft представили план по защите GitHub от конкурентов в сфере ИИ-кодинга

