Deepseek V3 становится самой мощной открытой языковой моделью в Китае на сегодня
Китайская компания Deepseek только что выпустила свою самую мощную языковую модель. Первые тесты показывают, что новая модель V3 может конкурировать с ведущими проприетарными моделями в отрасли и демонстрирует значительное улучшение в задачах логического мышления.Модель, доступная на Github, использует архитектуру Mixture-of-Experts (MoE) с общим количеством параметров 671 миллиард, из которых 37 миллиардов активируются для каждого токена. Это значительное увеличение по сравнению с V2, которая имеет 236 миллиардов параметров, из которых 21 миллиард активен во время вывода.
Я решила отдохнуть от решений и поручила управление своей жизнью искусственному интеллекту
Генеративный ИИ взял на себя управление моей жизнью.В течение одной недели он указывал мне, что есть, что носить и чем заниматься с детьми. Он выбирал, как мне подстричься и в какой цвет покрасить мой офис. Он сообщил моему мужу, что играть в гольф можно, в любовном сообщении, которое, как он сразу понял, я не писала.
OpenAI опубликовали план перехода к коммерческой модели. Илон Маск против
OpenAI утверждает, что ее корпоративная структура должна развиваться, чтобы продвигать основную цель — гарантировать, что общий искусственный интеллект (AGI), способный выполнять большинство задач, под силу человеку, будет приносить пользу всему человечеству.
Будущее уже здесь: технологии, которые могут изменить мир в 2025 году
Какие технологии изменят наш мир в ближайшем будущем? Одни подарят нам новые горизонты, другие перевернут привычный порядок вещей. Ниже — подборка ключевых трендов, которые, по мнению экспертов, навсегда преобразят нашу жизнь.Синтетические медиа
RAG в техподдержке: проблемы и пути улучшения
Технология RAG в последнее время получила широкое распространение в сфере техподдержки. Её основная идея заключается в том, чтобы перед генерацией ответа модель делала поиск по документации компании и добавляла найденные фрагменты в промпт. Предполагалось, что это позволит ускорить работу операторов и повысить точность ответов. Однако, как показывает практика, при использовании RAG возникает ряд ограничений и сложностей. В этой статье рассмотрим основные проблемы, влияние на метрики поддержки и возможные пути улучшения.1. Ограничения поиска по документации
Законы масштабирования – архитектура O1 Pro — Инфраструктура синтетических данных, RLAIF, токеномика вычислений
С каждым днем растут страхи и сомнения относительно законов масштабирования ИИ. Большинство предсказателей отрасли ИИ
Обзор на разнообразные интерфейсы Stable Diffusion. Automatic1111 — не одинок
Для многих пользователей, занимающихся генерацией изображений с помощью ИИ у себя дома, интерфейс Automatic1111 стал стандартным. Однако мир ИИ-технологий не стоит на месте, и появляются новые инструменты и интерфейсы, которые могут предложить ещё больше возможностей и удобства. В этой статье я рассмотрю, какие альтернативы существуют для Automatic1111 и ComfyUI и почему вам стоит обратить на них внимание. Вы ведь наверняка не слышали о такой штуке, как программа, позволяющая использовать Stable Diffusion для создания и редактирования текстур 3D-моделей с полной UV-разверткой? Или о полноценной бесплатной замене ИИ-инструментария Photoshop, которая доступна совершенно бесплатно и без всяких «но»? Однако статья — не просто подборка случайных программ. Сначала мы изучим основы и немного историю, а затем перейдём к самому интересному.
Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM
Все работают на RAGRAG-системы становятся все популярнее в корпоративной среде, но их эффективное внедрение и качественная оценка остается сложной задачей. Один из типичных примеров — создание чат-ботов, отвечающих на вопросы пользователей с опорой на корпоративную базу знаний. И которые, вроде бы, заводятся и работают, и делают это даже неплохо, но всегда хочется получше.
ИИ-агенты: от теории к практике
ВступлениеОдними из наиболее интересных подходов в создании AI-систем в 2024 году являются агенты (agents, agentic AI systems) и мультиагентные системы (multi-agent systems).Оба они показывают большую эффективность при решении многих задач и позволяют решать более сложные задачи с помощью LLM
Как устроена Лаборатория Инноваций СИБУРа и зачем она нужна
Создавать инновации быстро и гибко можно в стартапе или небольшой компании, но что, если ты промышленный гигант с более чем 25 заводами по всей стране, отлаженными процессами и бюджетированием, заточенными под беспрерывное производство, в котором каждая секунда на учёте и некогда экспериментировать? Как реализовывать смелые идеи в таких условиях?

