искусственный интеллект. - страница 36

Google запускает Workspace Studio для создания ИИ-агентов без кода

продолжить чтение

Зрительно-языковые модели читают хуже (или лучше), чем вам кажется

Знакомство с бенчмарком ReadBench, позволяющим без труда оценить, насколько хорошо ваши любимые зрительно-языковые модели читают изображения с большими объёмами текста.В этой статье будет рассказано о ReadBench. ReadBench — это очень простой бенчмарк, который мы разработали для оценки важного, но недооценённого аспекта мультимодального ИИ: насколько хорошо моделям удаётся, собственно, читать текст на картинках, рассуждать о нём и извлекать информацию из таких изображений, на которых много текста.

продолжить чтение

Секрет, который скрывают создатели ИИ: почему галлюцинации — это не сбой, а заложенная функция

продолжить чтение

Теперь Хабр может объяснить, что это за код

TL; DRМы встроили SourceCraft во все кодовые сниппеты в публикациях на Хабре. Он объяснит, что делает код. Как это работает, кому нужно и как использовать — читайте ниже.

продолжить чтение

Как я программирую с помощью агентов

TL;DRАгент в контексте LLM — это не магия, а цикл, в котором модель по шагам вызывает инструменты (bash, git, тесты, web) и получает от них обратную связь.Такой агент умеет ориентироваться в живой кодовой базе, запускать компилятор и тесты, читать логи и документацию, поэтому генерирует и правит код куда надёжнее, чем «голая» модель в чате.

продолжить чтение

Инструмент c AI-логикой для создания дерева метрик MetricTree

Всем привет!Меня зовут Владимир Павлов, я продакт-менеджер. Недавно я проходил кейс-интервью и получил отказ со следующим комментарием: «Правильно выбираешь ключевые метрики, но не хватает измеримости, структуры, прокси‑ и контр‑метрик».Получив данный фидбек, я решил углубиться в метрики, но не нашел простого инструмента для тренировок их построения и работы с ними. Пришлось создать свой инструмент для этих целей :-)Оплатив платный доступ к GPT, приступил к Vibe Coding. Весь процесс занял примерно 2 недели, занимаясь по вечерам в будние дни + выходные.Остановился на следующем объеме функциональности:

продолжить чтение

Архитектура высоконагруженных RAG-систем: 10 стратегий оптимизации чанкинга и интеграция с Weaviate, Qwen – Llama -Gemma

Привет, Хабр! Это Андрей Носов, AI-архитектор в компании Raft, проектирую и внедряю высоконагруженные RAG-системы на предприятиях. Сегодня я расскажу о вызовах, которые мы преодолеваем каждый день, создавая такие системы, и сделаю акцент на чанкинге.

продолжить чтение

Обзор Claude Opus 4.5 — новый лидер в кодинге

Доброго времени суток, «Хабр»!Немногим больше, чем неделя назад, мир получил новую модель - Claude Opus 4.5. Компания Anthropic заявила, что по сравнению с предыдущими версиями она предоставляет действительно качественные результаты в программировании, написании сценариев и работы с компьютером в целом. Помимо этого, существенно повысилось качество обработки повседневных задач - от поиска и анализа информации до работы с презентациями и таблицами.Действительно ли это так? В сегодняшней статье подробнее остановимся на этой модели, проведем тестирование, а в финале я выскажу собственное мнение о ней.

продолжить чтение

Anthropic внедрит ИИ для опроса пользователей об опыте работы с искусственным интеллектом

Anthropic начнёт использовать ИИ для интервьюирования пользователей об их опыте работы с искусственным интеллектом. Пилотная исследовательская программа продлится неделю, а каждое интервью будет занимать от 10 до 15 минут. 

продолжить чтение

Деловая Вселенная: цифровое пространство экономики

Разделение труда в экономике прошлого и будущегоКогда Адам Смит писал о разделении труда в «Богатстве народов» (1776), он видел в нём источник роста производительности: каждый делает то, что умеет лучше всего. Карл Маркс в «Капитале» (1867) связывал разделение труда с производственными отношениями, а Эмиль Дюркгейм («О разделении общественного труда», 1893) рассматривал его как основу социальной солидарности. Прошедшие три века исследований показывают: разделение труда — это фундаментальная координатная система экономики.

продолжить чтение

Rambler's Top100