Машинное обучение. - страница 408

Кликай, потом подумаешь: обзор агента OpenAI Operator

Operator — это новый ИИ‑агент от OpenAI, который берёт на себя веб‑задачи и обещает избавить пользователей от рутины. Вместо того чтобы вручную искать информацию, переключаться между сайтами и разбираться с интерфейсами, теперь можно дать команду Забронируй отель или Спланируй поездку на выходные

продолжить чтение

Operator’ы разные нужны, Operator’ы разные важны: что можно делать в новом ИИ-агенте OpenAI

Operator — это новый ИИ‑агент от OpenAI

продолжить чтение

Perplexity AI запускает новую сверхбыструю поисковую модель с искусственным интеллектом

Вышла последняя версия поисковой модели Perplexity AI Sonar, работающей на базе Llama 3.3 70B от Meta* и некоторого специализированного оборудования.

продолжить чтение

Дело Ross Intelligence: как суд США рассматривал использование материалов для обучения AI

Постановление федерального суда, которое запрещает компании Ross Intelligence использовать материалы, защищённые авторским правом, для обучения искусственного интеллекта, может оказать ограниченное влияние на деятельность крупных компаний, занимающихся разработкой AI, из-за существенных различий в работе их систем.

продолжить чтение

Пришёл, накодил, победил: хакатон глазами победителей и организаторов

В этой статье мы хотим поделиться своим опытом, который поможет вам подготовиться к любому хакатону (hackathon). Наверняка вы уже слышали про этот специфический формат соревнований для айтишников. На них ставятся практические задачи, которые участники решают за определённое время, имея ограниченные ресурсы. Обычно участники представлены командами, поэтому крайне важно уметь работать сообща. Помимо денежного приза победители получают известность. В дальнейшем это способствует обращению к ним с заказами на решение подобных задач.

продолжить чтение

Все, что нужно для создания приложений с LLM: обзор возможностей LangChain

Сегодня появляется все больше и больше приложений на основе больших языковых моделей — условным чат-ботом в Telegram уже никого не удивить. В рамках обучения в магистратуре AI Talent Hub мне не раз приходилось разрабатывать такие приложения с использованием ChatGPT или GigaChat. В этой статье я расскажу о полезном инструменте для работы с LLM - мы рассмотрим главные возможности фреймворка LangChain, а также методы мониторинга и проверки качества существующего приложения с ИИ.

продолжить чтение

Исследование: большие языковые модели смогли клонировать сами себя

Исследователи из Китая выяснили, что две популярные большие языковые модели (LLM) могут клонировать себя, а затем программировать копии выполнять те же задачи, делая цикл репликации бесконечным.

продолжить чтение

Apple не будет использовать DeepSeek в ИИ-помощнике Apple Intelligence в Китае

По информации профильных источников, Apple не будет использовать системы нейросети DeepSeek в ИИ-помощнике Apple Intelligence в материковом Китае.

продолжить чтение

«Вспомнить всё»: исследователи предложили архитектуру языковых моделей с большой памятью

9 февраля на arXiv была опубликована новая научная работа "LM2: Large Memory Models", в которой исследователи описали обновление классической архитектуры LLM на базе трансформеров. LM2 превосходит как модель RMT с дополненной памятью на 37.1%, так и базовую модель Llama-3.2 на 86,3% в среднем по задачам.В чем суть?Исследователи из Convergence Labs представили Large Memory Model (LM2) – новую архитектуру языковых моделей, которая преодолевает ограничения традиционных трансформеров в обработке длинного контекста.LM2 дополняет стандартный механизм внимания отдельным модулем памяти

продолжить чтение

Модели Goku от ByteDance могут создавать реалистичные видеоролики о продуктах без участия людей-актеров

Последние модели искусственного интеллекта китайской технологической компании могут генерировать реалистичные видеоролики, на которых люди взаимодействуют с продуктами, потенциально меняя подход компаний к созданию рекламного контента.

продолжить чтение