Создание эффективных агентов
За прошедший год мы поработали с десятками команд, создающих агентов на основе больших языковых моделей (LLM) в различных отраслях. Последовательно мы отмечали, что самые успешные реализации не использовали сложные фреймворки или специализированные библиотеки. Вместо этого они строились на простых, составных паттернах.В этой статье мы делимся тем, что узнали, работая с нашими клиентами и создавая агентов самостоятельно, а также даём практические советы разработчикам по созданию эффективных агентов.Что такое агенты?
Цифровые двойники: как искусственный интеллект меняет мир
Введение: Цифровые двойники — миф или реальность?В мире IT быстро развиваются технологии, которые еще недавно казались фантастикой. Среди таких инноваций особое место занимает создание цифровых двойников людей. Эти виртуальные копии способны имитировать внешний вид, голос, поведение и даже эмоции реального человека. Казалось бы, это просто инструмент для развлечений, но на самом деле цифровые двойники уже меняют бизнес, медицину, обучение и даже искусство. В этой статье мы исследуем, как именно эта технология работает, где она применяется и какие перспективы (и опасности) она открывает.
Tetsuwan Scientific создает роботов-ученых с AI, которые могут самостоятельно проводить эксперименты
Как LLM меняют архитектуру систем: от простых дата-пайплайнов к интеллектуальным автономным агентам
На каждой технической конференции в последнее время обязательно звучит слово «агенты». Они преподносятся по разному: и как следующая ступенька после RAG, и как серебряная пуля для всех проблем, и как абсолютная замена всех классических пайплайнов. А кто еще не использует агентов — безнадежно отстал от прогресса.Классика, LLM-ассистент и LLM-агент
Новая методика оптимизации LLM сокращает затраты памяти до 75%
Исследователи токийского стартапа Sakana AI разработали новую технологию, которая позволяет языковым моделям более эффективно использовать память. Это позволит предприятиям сократить расходы на создание приложений на основе больших языковых моделей (LLM) и других моделей на основе Transformer.Метод называется «
Google Chrome тестирует опцию на базе ИИ для обнаружения мошенничества
Google Chrome получает новый флаг. Он относится к функции на основе искусственного интеллекта, которая поможет обнаружить мошенничество в Интернете.
Что лучше — Биткойн или Tesla: используем агентов Autogen для анализа
Вы когда-нибудь задумывались, что лучше для инвестиций — NVidia или Tesla? Но что делать, если вам лень самостоятельно проводить анализ или вы даже не знаете, с чего начать?
SandboxAQ создает новое поколение AI для бизнеса
В последние годы разговоры о корпоративном AI сосредоточились на LLM и генеративном AI . Однако, как показывает практика, есть и другие подходы, которые могут принести значительную пользу предприятиям. Одним из таких подходов являются крупные количественные модели LQM, которые обучаются на оптимизации специфических целей и параметров, таких как свойства материалов и финансовые риски. В этом контексте компания SandboxAQ выделяется как один из ведущих игроков, недавно привлекшая 300 миллионов долларов в новом раунде финансирования.
Прогресс в AGI вызывает сомнения
Тест ARC-AGI (сокр. Abstract and Reasoning Corpus for Artificial General Intelligence), созданный в 2019 году ведущей фигурой в AI Франсуа Шолле для оценки способностей искусственного интеллекта к обучению, показывает улучшение результатов. Однако это может свидетельствовать скорее о недочетах в самом тесте, чем о реальном прорыве в развитии ИИ.
Ollama обновилась до версии 0.5.1
Основные изменения в этой версии следующиеПоддержка новой модели Llama 3.3 - 70B. При относительно небольшом размере (может уместиться на одну видеокарту A100/H100, а при большем сжатии даже на A6000 или связку из 4090 с 48 Гб видеопамяти) данная модель сравнима и даже лучше с Llama 3.1 - 405B и догоняет по некоторым показателям GPT-4o Поддержка структурированного вывода по заданной JSON схеме

