Vending-Bench: бенчмарк, из-за которого языковые модели впадают в экзистенциальный ужас и пишут жалобы ФБР
Бенчмарк Vending-Bench
Обучение с подкреплением и верифицируемые вознаграждения: анализ эффективности RLVR для языковых моделей
В новом исследовании, проведённом в Университете Цинхуа и Шанхайском университете Цзяо Тун, рассматривается вопрос о том, помогает ли обучение с подкреплением и верифицируемыми вознаграждениями (RLVR) крупным языковым моделям лучше рассуждать или просто делает их более эффективными при повторении известных решений.
Руководство Google по промпт-инжинирингу. Заключительная часть: лучшие практики и рекомендации
От переводчикаПредставляю вашему вниманию заключительную, третью часть перевода статьи "Prompt Engineering" (Промпт-инжиниринг) авторства Lee Boonstra — Software Engineer Tech Lead, Office of the CTO в Google. Этот материал завершает цикл публикаций, посвященных эффективному взаимодействию с большими языковыми моделями.В первой части мы познакомились с основами промпт-инжиниринга и базовыми техниками промптинга. Во второй
Накорми языковую модель документами
Задача поиска ответов по внутренней документации
Gemini 2.5 Pro возглавил все ИИ-бенчмарки: Google возвращает корону технологического лидера
Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые считаю стоят внимания. В основном про AI, изменение процессов, тренды и продуктовое видение.У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.Сегодняшний перевод — Google Is Winning on Every AI Front
Руководство Google по промпт-инжинирингу. Часть 2: продвинутый промптинг и работа с кодом
От переводчикаПредставляю вашему вниманию перевод второй части статьи "Prompt Engineering" (Промпт-инжиниринг) авторства Lee Boonstra - Software Engineer Tech Lead, Office of the CTO в Google. Эта публикация продолжает цикл переводов, посвященных методам эффективного взаимодействия с большими языковыми моделями.В первой части
Запретить нельзя использовать: о проблеме использования LLM при обучении инженеров-программистов
Использование больших языковых моделей в обучении студентов, кроме многих достоинств, создает дополнительные проблемы — существует реальный риск ухудшения базовых знаний у будущих инженеров. Меня зовут Игорь Никифоров, и я знаю, о чем говорю: более 14 лет я преподаю в Высшей школе программной инженерии Санкт-Петербургского политехнического университета Петра Великого, в том числе курирую совместную лабораторию с YADRO.
Руководство Google по промпт-инжинирингу. Часть 1: основы и базовые техники
От переводчикаПредставляю вашему вниманию перевод статьи "Prompt Engineering" (Промпт-инжиниринг) авторства Lee Boonstra - Software Engineer Tech Lead, Office of the CTO в Google. Это первая часть из планируемого цикла из трех статей, поскольку оригинальный документ весьма объёмен (68 страниц) и насыщен полезной информацией.Важно отметить
ChatGPT-4.1: Революционный скачок в программировании и обработке длинного контекста
Компания OpenAI представила новое семейство моделей GPT-4.1 с впечатляющими улучшениями в области программирования, следования инструкциям и работы с длинным контекстом. Рассмотрим ключевые особенности новинок и их преимущества для разработчиков.P.S кратко написал об этом в Телеграм канале, cсылка на постТри модели для разных задачOpenAI выпустила сразу три модели: флагманскую GPT-4.1, более компактную GPT-4.1 mini и сверхлегкую GPT-4.1 nano

