BrainTools - Методики для развития мозга

Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим

«Яндекс» представила обновление нейросетевого ассистента «Алисы». Компания добавила поддержку английского языка, рассуждения, поиск, возможность работать с файлами и Live-режим. Обновления показали 15 апреля 2025 года в рамках презентации умных устройств «Яндекса».

продолжить чтение

Оставлено в

OpenAI нанимает команду для платформы оценки искусственного интеллекта, поддерживаемой GV, Context.ai

Context.ai, стартап, занимающийся разработкой оценок и аналитики для моделей AI, во вторник объявил, что его соучредители присоединятся к OpenAI. Context.ai планирует свернуть свою продукцию после приобретения-найма, согласно сообщению на веб-сайте компании. Когда обратились за комментарием, OpenAI отказалась раскрыть условия сделки.

продолжить чтение

Оставлено в

Модель генерации видео Veo 2 от Google появилась в Gemini

Google предлагает свою модель искусственного интеллекта для создания видео Veo 2 пользователям, оплатившим Gemini Advanced — премиум-план компании на базе искусственного интеллекта. Расширение происходит в то время, когда Google пытается предоставить ответ на платформу генерации видео Sora от OpenAI, и поскольку конкуренция в этой области становится все более жесткой.

продолжить чтение

Оставлено в

Claude из Anthropic теперь может читать вашу почту Gmail

Во вторник компания Anthropic объявила, что ее чат-бот на основе искусственного интеллекта Claude теперь интегрируется с Google Workspace, что позволяет ему искать и ссылаться на ваши электронные письма в Gmail, запланированные события в Google Calendar и документы в Google Docs.

продолжить чтение

Оставлено в

Как мы собираем SWE-bench на других языках

Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки ИИ-агентов, способных помогать в написании и исправлении кода, мы часто упираемся в ограничения. Популярный бенчмарк SWE-bench, например, долгое время поддерживал только Python. Чтобы преодолеть разрыв между реальностью разработки и возможностями оценки ИИ, наша команда в Doubletapp

продолжить чтение

Оставлено в

Как тестировать промпты и чейны (Ручная разметка-BERTScore-LLM as judge)

Год назад я написал статью “Почему важно тестировать промпты и как это делать”. В ней я рассказывал про библиотеку promptfoo, которая предлагает различные способы проверки ответов, генерируемых моделью. Сейчас рынок уже находится на другом этапе: почти никому не нужно объяснять, зачем тестировать LLM при её интеграции в продукт, однако вопрос «как именно это делать» всё ещё остаётся открытым. Причём он стал ещё острее — ведь объём тестовых запросов вырос с 30 штук до 4 тысяч.

продолжить чтение

Оставлено в

Скорая помощь: как быстро снять стресс, эмоциональное напряжение и провести профилактику нарушений сна

В моей статье о статистике профессиональных заболеваний IT-специалистов я проводила опрос. Его результаты вполне бьются с глобальными исследованиями, и видны на скриншоте. По горячим следам я подготовила для читателей Хабра 3 видео-упражнения для быстрого снятия стресса, избавления от бессонницы и тревожных мыслей. Длительность каждого ролика менее 2 минут. Это не отменяет обращений к психотерапевту, неврологу или принятие препаратов. Но в офисе, в пробке или когда под рукой нет нужной таблетки, техники можно использовать в качестве «скорой помощи». Для полноты понимания я описываю в статье, на что именно влияет выполнение упражнений, и как решается проблема с точки зрения работы тела. На все вопросы обязательно отвечу в комментариях. Важно: Все упражнения нужно выполнять мягко и без агрессивного нажима. Нельзя выполнять в период острых фаз заболеваний и воспалительных процессов, при температуре.

продолжить чтение