llm. - страница 87

llm.

Alibaba открыла исходный код Qwen3-VL

Alibaba сделала один из самых заметных шагов в своей стратегии открытых технологий. Компания выложила в открытый доступ исходный код Qwen3-VL

продолжить чтение

Два пути из Тирании Квадрата: Сравнительный разбор MoE и SSM как наследников Трансформера

Архитектура Трансформеров, без сомнения, гениальна. Ее механизм внимания позволил моделям увидеть связи и зависимости в данных с невиданной ранее глубиной. Однако у этой конструкции есть врожденный порок, фундаментальный изъян, который из технической детали превратился в главный тормоз на пути к AI, способному на настоящее глубинное понимание. Имя этому пороку — «Тирания Квадрата».Технически это описывается как сложность O(n²): для обработки последовательности длиной n токенов требуется n*n

продолжить чтение

Text2SQL в аналитике: как мы научили ИИ понимать бизнес-запросы без посредников

Привет! Меня зовут Михаил Куляскин, я инженер по машинному обучению в команде продуктивизации ИИ в X5 Tech. Недавно я выступал с докладом на крупной конференции CodeFest

продолжить чтение

OpenAI переманивает инженеров Apple ради собственного «железа»

продолжить чтение

Nvidia инвестирует в OpenAI $100 млрд: старт крупнейшего AI-партнёрства в истории

продолжить чтение

Облачные технологии в контексте агентских AI-систем

В настоящее время процветает разработка агентов — приложений на базе Generative AI, реализующих автономные рабочие процессы. Извлечение и анализ данных, управление детерминированными программами и так далее. Массу вещей можно автоматизировать с помощью LLM и вызова функций, отсюда и спрос на такие системы.Как и традиционное ПО, агенты обычно реализуют принцип разделения логики на специализированные узлы обработки конкретных задач

продолжить чтение

Меньше примеров — больше интеллекта

продолжить чтение

Практика alignment: данные, RLHF и UX как конкурентное преимущество

Взгляд на самую большую проблему в мире ИИ, почему это важно для вас и почему это так ценно.

продолжить чтение

Трансформация рабочих процессов с помощью нейросетей

Привет, Хабр!Ранее в блоге компании АСКОН я уже делился подборкой инструментов, которые использую в своей повседневной работе. Сегодня хочу продолжить эту тему и рассказать, как нейросети поменяли мой рабочий процесс, какие задачи они помогают решать, и почему вам не обязательно быть ML-инженером, чтобы эффективно использовать ИИ на практике. А кроме того расскажу, как с помощью нейросетей добавляют полезный функционал в инженерное программное обеспечение.

продолжить чтение

Поздно пить Боржоми? Stack Overflow пробует в AI

Команда AI for Devs решила написать эту статью после выхода очередного продукта от Stack Overflow, в чьём имени красуется "AI". Когда-то платформа запрещала любой ИИ-контент, потом осторожно тестировала инструменты вроде OverflowAI и Question Assistant, а теперь явно строит стратегию вокруг искусственного интеллекта. Насколько это здорово для сообщества?

продолжить чтение

Rambler's Top100