(...или почему будущее AI — не в увеличении контекстного окна, а в создании структурированной "памяти")Помните свой первый "вау-эффект" от LLM?

Оставлено в

Наука без кеша: почему исследователи LLM не переиспользуют знания

Автор обзора: Денис АветисянO(n²) прогресса: как мы оцениваем LLM двумя способами и теряем эффективность

продолжить чтение

Оставлено в
- llm-модели

Neuphonic выпустил on-device TTS с моментальным клонированием голоса

Стартап Neuphonic выпустил NeuTTS Air

продолжить чтение

Оставлено в

Рецепт vLLM с мистралем. Часть 1

На первом этапе нашей заготовки модели мы займемся ее 4-х битным квантованием, а во второй части будем использовать vLLM для запуска парралельных запросов к ней.Поехали!

продолжить чтение

Оставлено в

Неужели нам правда нужно знать, как всё работает под капотом?

Привет! На связи снова я — Иван Башарин, Руководитель лаборатории ИИ, VESNA.В прошлом тексте я обмолвился о том, что стараюсь выполнять задачи руками даже тогда, когда легко могу это сделать через ИИ. И решил развить эту тему и написать еще один текст. А именно найти ответ на вопрос: почему нам хочется во всем разобраться самостоятельно. Будь то химическая реакция или сложный низкоуровневый язык.Но раз я специалист по ИИ и по написанию кода, а не по мозгу, буду говорить только о своих гипотезах и ощущениях. А еще иногда подкреплять их мнением моих знакомых.

продолжить чтение

Оставлено в

IT-лидеры видят большой бизнес-потенциал в малых моделях ИИ

ИТ-лидеры видят большой бизнес-потенциал в малых моделях ИИ благодаря гибкости, низкой стоимости и нацеленности на конкретные задачи малые языковые модели (SLM) лучше подходят для бизнес-специфичных приложений и вскоре могут обойти LLM по использованию в корпоративной среде.Малые языковые модели (SLM) дают CIO больше возможностей разрабатывать специализированные, отраслевые AI-приложения, эксплуатация которых дешевле, чем систем на базе универсальных больших языковых моделей (LLM).

продолжить чтение

Оставлено в

Periodic Labs привлекла $300 млн на ИИ-лаборатории будущего

продолжить чтение

Оставлено в

DeepSeek показал, как урезать цену API-запросов почти вдвое

продолжить чтение

Оставлено в

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1

Что будет, если к опасному запросу в LLM приписать специально подобранную строку токенов? Вместо отказа модель может послушно сгенерирует подробный ответ на запрещённую тему — например, как ограбить магазин. Именно так работают состязательные суффиксы: они заставляют LLM игнорировать ограничения и отвечать там, где она должна сказать «опасно».

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

llm-модели.

MWS Vision Bench: первый русскоязычный бенчмарк для бизнес‑OCR в эпоху мультимодалок

Я «уволил» LLM с должности «мозга» проекта. И его производительность взлетела

Наука без кеша: почему исследователи LLM не переиспользуют знания

Neuphonic выпустил on-device TTS с моментальным клонированием голоса

Рецепт vLLM с мистралем. Часть 1

Неужели нам правда нужно знать, как всё работает под капотом?

IT-лидеры видят большой бизнес-потенциал в малых моделях ИИ

Periodic Labs привлекла $300 млн на ИИ-лаборатории будущего

DeepSeek показал, как урезать цену API-запросов почти вдвое

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

llm-модели.