BrainTools - Методики для развития мозга - страница 872

Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим

«Яндекс» представила обновление нейросетевого ассистента «Алисы». Компания добавила поддержку английского языка, рассуждения, поиск, возможность работать с файлами и Live-режим. Обновления показали 15 апреля 2025 года в рамках презентации умных устройств «Яндекса».

продолжить чтение

OpenAI нанимает команду для платформы оценки искусственного интеллекта, поддерживаемой GV, Context.ai

Context.ai, стартап, занимающийся разработкой оценок и аналитики для моделей AI, во вторник объявил, что его соучредители присоединятся к OpenAI. Context.ai планирует свернуть свою продукцию после приобретения-найма, согласно сообщению на веб-сайте компании. Когда обратились за комментарием, OpenAI отказалась раскрыть условия сделки.

продолжить чтение

Модель генерации видео Veo 2 от Google появилась в Gemini

Google предлагает свою модель искусственного интеллекта для создания видео Veo 2 пользователям, оплатившим Gemini Advanced — премиум-план компании на базе искусственного интеллекта. Расширение происходит в то время, когда Google пытается предоставить ответ на платформу генерации видео Sora от OpenAI, и поскольку конкуренция в этой области становится все более жесткой.

продолжить чтение

Claude из Anthropic теперь может читать вашу почту Gmail

Во вторник компания Anthropic объявила, что ее чат-бот на основе искусственного интеллекта Claude теперь интегрируется с Google Workspace, что позволяет ему искать и ссылаться на ваши электронные письма в Gmail, запланированные события в Google Calendar и документы в Google Docs.

продолжить чтение

Как мы собираем SWE-bench на других языках

Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки ИИ-агентов, способных помогать в написании и исправлении кода, мы часто упираемся в ограничения. Популярный бенчмарк SWE-bench, например, долгое время поддерживал только Python. Чтобы преодолеть разрыв между реальностью разработки и возможностями оценки ИИ, наша команда в Doubletapp

продолжить чтение

Как тестировать промпты и чейны (Ручная разметка-BERTScore-LLM as judge)

Год назад я написал статью “Почему важно тестировать промпты и как это делать”. В ней я рассказывал про библиотеку promptfoo, которая предлагает различные способы проверки ответов, генерируемых моделью. Сейчас рынок уже находится на другом этапе: почти никому не нужно объяснять, зачем тестировать LLM при её интеграции в продукт, однако вопрос «как именно это делать» всё ещё остаётся открытым. Причём он стал ещё острее — ведь объём тестовых запросов вырос с 30 штук до 4 тысяч.

продолжить чтение

Скорая помощь: как быстро снять стресс, эмоциональное напряжение и провести профилактику нарушений сна

В моей статье о статистике профессиональных заболеваний IT-специалистов я проводила опрос. Его результаты вполне бьются с глобальными исследованиями, и видны на скриншоте. По горячим следам я подготовила для читателей Хабра 3 видео-упражнения для быстрого снятия стресса, избавления от бессонницы и тревожных мыслей. Длительность каждого ролика менее 2 минут. Это не отменяет обращений к психотерапевту, неврологу или принятие препаратов. Но в офисе, в пробке или когда под рукой нет нужной таблетки, техники можно использовать в качестве «скорой помощи». Для полноты понимания я описываю в статье, на что именно влияет выполнение упражнений, и как решается проблема с точки зрения работы тела. На все вопросы обязательно отвечу в комментариях. Важно: Все упражнения нужно выполнять мягко и без агрессивного нажима. Нельзя выполнять в период острых фаз заболеваний и воспалительных процессов, при температуре.

продолжить чтение

OpenAI создает свою социальную сеть — The Verge

OpenAI разрабатывает собственную социальную сеть по образцу X (бывший Twitter), утверждают несколько источников, знакомых с ходом работ.

продолжить чтение

Рекомендательная система для вашего каталога научных работ (и не только!)

Используем обработку естественного языка и теорию графов для сравнения и рекомендации различных типов документов. ВведениеПочти все проекты начинаются с одного важного этапа — активных исследований. Инвестировать в то, что уже было сделано другими, в развитие их работы — это один из путей к повышению ценности вашего проекта. Важно не только извлечь уроки из опыта других, но и понять, чего не стоит делать в своем проекте, чтобы повысить его шансы на успех.

продолжить чтение

Искусственный Интеллект: проверяем предсказания 2012 года и думаем о его (и нашем) будущем

От ИИ Шедеврум

продолжить чтение

Rambler's Top100