llm. - страница 77

llm.

Почему ставка Broadcom на OpenAI — это большой риск. Мнение от The Wall Street Journal

Автор фото: David Paul Morris/BloombergСоглашение Broadcom о разработке огромного количества чипов и вычислительных систем для OpenAI вызвало воодушевление у инвесторов. Однако этот шаг не столь однозначно выгоден, как может показаться, если судить по росту акций компании.

продолжить чтение

LLM в роли «судьи» vs. человеческая оценка: почему вместе — лучше

В гонке за следующей волной «умных» систем большие языковые модели берут на себя неожиданные роли. Одна из самых интересных — использовать такие модели как «судей» для оценки других моделей. Подход уже экономит командам массу ручной работы, но остаются вопросы: способен ли LLM уловить каждую тонкую ошибку? Что происходит в ситуациях, где критичны человеческая интуиция или глубокая предметная экспертиза?

продолжить чтение

Как оценить качество машинного перевода

Работая в области машинного перевода в компании Lingvanex, я постоянно читаю статьи в которых сравнивается качество разных переводчиков. Иногда отличие между ними составляет от 0.3 до 1% по какой-либо из метрик, но и это уже повод заявить, что их переводчик - лучший.При оценке качества машинного перевода важно не только сравнить результаты различных систем перевода, но и проверить, являются ли обнаруженные различия статистически значимыми. Это позволяет оценить, насколько полученные результаты достоверны и могут ли они быть применимы к другим наборам данных.

продолжить чтение

Почему «больше токенов ≠ лучше» или Как научить LLM работать с длинным контекстом

Всем привет! Меня зовут Наталья Бруй, я промпт-инженер в MWS AI. Вместе с моей коллегой  Анастасией Тищенковой мы решили ответить на вопрос, который мучает нашего пиарщика

продолжить чтение

Как я с помощью LLM писал эмулятор ZX Spectrum

Оно работает!

продолжить чтение

LLM уже может все! Или еще нет?

ВведениеЗдравствуйте! Я - автор портала текстовых игр в жанре "квест" https://questio.ru.Основная идея на страте проекта состояла в том, чтобы дать LLM максимально полное описание игровой ситуации и попросить придумать реакцию или дополнительные данные. Любая игра начинается с подготовки - создания и настройки игрового мира. Поэтому и на этом этапе казалось, что будет достаточно подробно описать требования к результату. Буквально так, как это рассказывают на всех курсах: главное - правильно составить запрос (промпт) и ИИ все сделает!

продолжить чтение

Наука для бизнеса: что внедрять завтра (анализ 134 195 научных работ 2025 года)

Почему научные статьи?Чтобы понять, какие технологии будут определять рынок завтра, компании опираются на прогнозы/отчёты аналитиков или (за рубежом) анализируют патенты. Но есть источник, который часто опережает и патенты - научные публикации. Именно в лабораториях и университетах появляются методы, которые через год-два становятся основой RnD бизнеса, а затем - реальными продуктами.

продолжить чтение

AI-генерация тестов: как превратить 3 месяца работы в 1 неделю

Главное за 30 секундПривет! В этой статье я расскажу о новом подходе к генерации автотестов для сложных финансовых протоколов. Мы максимально декомпозировали задачу создания тестового покрытия, разбив её на независимые шаги, каждый из которых решает конкретную проблему.Что вы узнаете:Как разбить сложную задачу автоматизации тестирования на управляемые этапыКакие проблемы возникают на каждом шаге и как их решатьПочему важно не пытаться сделать всё идеально с первого разаКак использовать AI для ускорения, но не полагаться на него полностью

продолжить чтение

Как агент учится на ходу: почему память оказалась сильнее дообучения

продолжить чтение

Андрей Карпатый представил nanochat — проект полного цикла создания LLM всего за 100 долларов

ML-инженер и бывший разработчик OpenAI Андрей Карпатый представил nanochat — это открытый проект полного цикла создания LLM. Обучение модели обойдётся примерно в 100 долларов, если арендовать мощности у облачного провайдера.

продолжить чтение

Rambler's Top100