llm. - страница 273

llm.

Новая модель LAM способна выполнять задачи в Word

Исследователи Microsoft разработали модель, которую они называют "Large Action Model" (LAM) — искусственный интеллект, способный самостоятельно управлять программами Windows. Это означает переход от AI, которые просто говорят о своих возможностях, к AI, которые действительно могут их реализовывать.

продолжить чтение

Почему ИИ не заменит программистов: взгляд инженера

Я инженер-программист с общим опытом больше 15 лет в разных областях. Сейчас специализируюсь на веб разработке, это моя профессия и основное хобби. Есть большой опыт применения ChatGPT, включая o1 и Claude AI на практике в своей работе. Я рассуждаю здесь с позиции этого опыта и логики. Сразу хочу сказать, что я не боюсь, что ИИ меня заменит, а наоборот мечтаю об этом, потому что у меня есть много нереализованных идей, требующих много времени на реализацию. И на этих же идеях, кстати, можно и заработать. Когда инженер получает инструмент заменяющий его, он не теряет работу, а становится инженером следующего уровня.

продолжить чтение

GraphRAG: Повышение точности и полноты GenAI

GraphRAG предоставляет «граф знаний» LLM. В отличие от текстовых документов, эти структуры данных четко отображают взаимосвязи между объектами.Компании применяют генеративный ИИ в широком спектре функций, включая поддержку клиентов, продажи, юридические услуги, маркетинг и многие другие. По состоянию на 2024 год

продолжить чтение

ИИ-Дед Мороз: создаём новогодние видео-открытки с YandexART и YandexGPT

— Так‑с‑так‑с, открытки с Дедом Морозом: сделаю одну!— А ты уже сгенерировал открытку с Дедом Морозом?(источник)

продолжить чтение

Самые продвинутые LLM дают прогнозы своего развития на 2025 год

Я задал следующий вопрос наиболее популярным LLM.Сделай прогноз на 2025 год.Какие существенные изменения произойдут в области разработки и внедрения систем ИИ по сравнению с текущим уровнем и какие принципиально новые уровни будут достигнуты. Как в связи с этим изменится наша жизнь. Ответ должен быть конкретным и реалистичным.

продолжить чтение

Будущее LLM в XS, S, M и других размерах

продолжить чтение

Super Ethical Reality: о чем нужно задуматься прежде, чем использовать LLM в разработке

Стоит ли нам доверять тому, что не способно осознавать последствий своих действий? Кажется, что ответ очевиден, но по мере развития ниши лингвистических моделей мы всё чаще поручаем ИИ выполнять за нас часть рутинных задач.Меня зовут София, я сотрудница RnD-отдела компании Raft

продолжить чтение

Deepseek V3 становится самой мощной открытой языковой моделью в Китае на сегодня

Китайская компания Deepseek только что выпустила свою самую мощную языковую модель. Первые тесты показывают, что новая модель V3 может конкурировать с ведущими проприетарными моделями в отрасли и демонстрирует значительное улучшение в задачах логического мышления.Модель, доступная на Github, использует архитектуру Mixture-of-Experts (MoE) с общим количеством параметров 671 миллиард, из которых 37 миллиардов активируются для каждого токена. Это значительное увеличение по сравнению с V2, которая имеет 236 миллиардов параметров, из которых 21 миллиард активен во время вывода.

продолжить чтение

RAG в техподдержке: проблемы и пути улучшения

Технология RAG в последнее время получила широкое распространение в сфере техподдержки. Её основная идея заключается в том, чтобы перед генерацией ответа модель делала поиск по документации компании и добавляла найденные фрагменты в промпт. Предполагалось, что это позволит ускорить работу операторов и повысить точность ответов. Однако, как показывает практика, при использовании RAG возникает ряд ограничений и сложностей. В этой статье рассмотрим основные проблемы, влияние на метрики поддержки и возможные пути улучшения.1. Ограничения поиска по документации

продолжить чтение

Законы масштабирования – архитектура O1 Pro — Инфраструктура синтетических данных, RLAIF, токеномика вычислений

С каждым днем растут страхи и сомнения относительно законов масштабирования ИИ. Большинство предсказателей отрасли ИИ

продолжить чтение