llm.
Mistral Small 3.1 и DeepCoder-14B-Preview появились в библиотеке Ollama
В библиотеке Ollama, популярной платформы для локального запуска LLM, сегодня появились две новые модели: Mistral Small 3.1 и DeepCoder-14B-Preview.
Model Context Protocol (MCP) – универсальный протокол для взаимодействия с ИИ, и почему это замечательно
Изображение взято с https://www.anthropic.comВведение: Что такое MCP, и зачем он нужен?
ai-2027.com на русском
Примечания переводчикаЭта статья на прошлой неделе взорвала твиттер и русскоязычный ИИ-телеграм. Большинство серьезных ии-блогеров написали по ней обзоры. Почему? Да просто это никакая не статья, а полноценный sci-fi рассказ про ближайшее будущее, только основанный на реальных данных. Написан топовыми чуваками в ИИ, один из которых работал в OpenAI и уже писал похожие предсказания в 2021 году, которые сбылись с поразительной точностью.А еще у него 2 концовки (!)
Почему не стоит инвестировать 2 года в платформу инференса LLM
Пока одни спорят, заменит ли ИИ людей, другие уже выбирают, какая LLM станет их напарником, и активно применяют их в бизнесе.Мы в МТС тоже прошли этот путь и уже внедрили LLM в 30 продуктов экосистемы, а теперь превратили наш опыт в готовую платформу, которая позволяет тестировать множество языковых моделей.
Искусственный интеллект и цифровое послесмертие
Искусственный интеллект во главе с большими языковыми моделями (LLM, Large Language Model) стремительно врывается в нашу жизнь, меняя привычные способы коммуникации и ведения дел. Спустя два года, прошедших с появления ChatGPT, передовые модели уже используются в роли персонального интеллектуального ассистента, способногоанализировать всю вашу личную и деловую переписку;предлагать варианты ответов на входящие письма, в том числе генерируя идеи для бизнеса;конспектировать вебинары, лекции и совещания с нужной вам степенью детализации;
Deep Cogito выходит из тени с гибридными ИИ-моделями «рассуждений»
Новая компания Deep Cogito вышла из тени с семейством открытых ИИ-моделей, которые могут переключаться между режимами «рассуждения» и «без рассуждения».
Как работает Трансформер: очень простое описание
Вот очень простое объяснение для тех, кто не хочет вдаваться в сложную математику, но и не готов принимать эту ключевую технологию как магию, которая просто работает. Конечно, никакого волшебства тут и нет — идея на самом деле довольно проста.Как вы, вероятно, знаете, LLM — это всего лишь статистический предсказатель следующего слова в предложении на основе предыдущих. По крайней мере, такое предсказание и является целью обучения, хотя возникающие в процессе способности модели выходят далеко за рамки простого предсказания токенов.Например, если LLM видит: «The dog sits on the …», она продолжит: «… floor».
Про разработку LLM: какие ещё есть справочники и кукбуки
Сегодня мы продолжим изучать руководства по разработке LLM. А 23 апреля на онлайн-встрече расскажем, почему создание платформы для инференса LLM с нуля — далеко не всегда оптимальный выбор, и объясним, как MWS GPT может значительно упростить и ускорить работу с большими языковыми моделями. Подключайтесь, регистрация открыта по
Создаю новое направление в изобразительном искусстве — программный LLM ART
Мы посмотрим и на Корбена Далласа и Лилу из фильма «Пятый элемент», на сюжет из фильма «Люди в черном» и другие интересные арты.Генеративные модели могут создавать великолепные изображения и видео, особенно при правильном подходе и знаниях в написании промптов.Но меня интересуют мультимодальные LLM, которые на входе принимают также изображения и видео, а на выходе производят текст. Теоретически они должны иметь хорошие представления о том, как выглядит окружающий мир и как он меняется со временем по законам физики.

