Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим
«Яндекс» представила обновление нейросетевого ассистента «Алисы». Компания добавила поддержку английского языка, рассуждения, поиск, возможность работать с файлами и Live-режим. Обновления показали 15 апреля 2025 года в рамках презентации умных устройств «Яндекса».
OpenAI нанимает команду для платформы оценки искусственного интеллекта, поддерживаемой GV, Context.ai
Context.ai, стартап, занимающийся разработкой оценок и аналитики для моделей AI, во вторник объявил, что его соучредители присоединятся к OpenAI. Context.ai планирует свернуть свою продукцию после приобретения-найма, согласно сообщению на веб-сайте компании. Когда обратились за комментарием, OpenAI отказалась раскрыть условия сделки.
Модель генерации видео Veo 2 от Google появилась в Gemini
Google предлагает свою модель искусственного интеллекта для создания видео Veo 2 пользователям, оплатившим Gemini Advanced — премиум-план компании на базе искусственного интеллекта. Расширение происходит в то время, когда Google пытается предоставить ответ на платформу генерации видео Sora от OpenAI, и поскольку конкуренция в этой области становится все более жесткой.
Claude из Anthropic теперь может читать вашу почту Gmail
Во вторник компания Anthropic объявила, что ее чат-бот на основе искусственного интеллекта Claude теперь интегрируется с Google Workspace, что позволяет ему искать и ссылаться на ваши электронные письма в Gmail, запланированные события в Google Calendar и документы в Google Docs.
Как мы собираем SWE-bench на других языках
Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки ИИ-агентов, способных помогать в написании и исправлении кода, мы часто упираемся в ограничения. Популярный бенчмарк SWE-bench, например, долгое время поддерживал только Python. Чтобы преодолеть разрыв между реальностью разработки и возможностями оценки ИИ, наша команда в Doubletapp
Как тестировать промпты и чейны (Ручная разметка-BERTScore-LLM as judge)
Год назад я написал статью “Почему важно тестировать промпты и как это делать”. В ней я рассказывал про библиотеку promptfoo, которая предлагает различные способы проверки ответов, генерируемых моделью. Сейчас рынок уже находится на другом этапе: почти никому не нужно объяснять, зачем тестировать LLM при её интеграции в продукт, однако вопрос «как именно это делать» всё ещё остаётся открытым. Причём он стал ещё острее — ведь объём тестовых запросов вырос с 30 штук до 4 тысяч.
Скорая помощь: как быстро снять стресс, эмоциональное напряжение и провести профилактику нарушений сна
В моей статье о статистике профессиональных заболеваний IT-специалистов я проводила опрос. Его результаты вполне бьются с глобальными исследованиями, и видны на скриншоте. По горячим следам я подготовила для читателей Хабра 3 видео-упражнения для быстрого снятия стресса, избавления от бессонницы и тревожных мыслей. Длительность каждого ролика менее 2 минут. Это не отменяет обращений к психотерапевту, неврологу или принятие препаратов. Но в офисе, в пробке или когда под рукой нет нужной таблетки, техники можно использовать в качестве «скорой помощи». Для полноты понимания я описываю в статье, на что именно влияет выполнение упражнений, и как решается проблема с точки зрения работы тела. На все вопросы обязательно отвечу в комментариях. Важно: Все упражнения нужно выполнять мягко и без агрессивного нажима. Нельзя выполнять в период острых фаз заболеваний и воспалительных процессов, при температуре.
Рекомендательная система для вашего каталога научных работ (и не только!)
Используем обработку естественного языка и теорию графов для сравнения и рекомендации различных типов документов. ВведениеПочти все проекты начинаются с одного важного этапа — активных исследований. Инвестировать в то, что уже было сделано другими, в развитие их работы — это один из путей к повышению ценности вашего проекта. Важно не только извлечь уроки из опыта других, но и понять, чего не стоит делать в своем проекте, чтобы повысить его шансы на успех.
