Всем привет! На связи София из команды применения больших языковых моделей ecom.tech

Оставлено в

«Напомним, ранее…»: зачем мы вернули RAG, от которого сами отказались

Мы строим Рерайт-Завод – AI-систему для автоматизации рерайта новостей в региональных СМИ. Основная задача – автоматизировать все тупые бессмысленные рерайты пресс-релизов и прочей обязаловки, чтобы журналисты занимались журналистикой, а не переписыванием ТАСС.В первой статье мне напихали в панамку за то, что я рассказывала, как мы учим модель писать в стиле конкретного издания. Во второй за описание, как у нас устроен фактчек.

продолжить чтение

Оставлено в

Скормил нейросети 40 статей ПИК с Хабра: RAG-бот на GigaChat для BIM без опыта в разработке

Предыстория: архитектура, BIM и попытки автоматизацииМеня зовут Владислав Пономарев, я архитектор, проектирую дома. Ещё в магистратуре, 10 лет назад я занимался BIM-внедрением в проектной организации в Сочи. Это были Revit, Civil 3D и другие инструменты. Делал это в рамках своей темы магистерской работы. Потом переключился на архитектуру в частном домостроительстве, где больше изучал практические вопросы проектирования и философию архитектуры, ее эстетические качества. Но любовь к более сложному BIM осталась. С энтузиазмом продвигал тему BIM, когда до массового внедрения в РФ было еще далеко.

продолжить чтение

Оставлено в

Perplexity выложила отрытые эмбеддинг-модели

Perplexity представила pplx-embed – набор многоязыковых моделей для обработки больших объемов информации. Эти модели разработаны для работы с данными из интернета, обеспечивая альтернативу проприетарным API.

продолжить чтение

Оставлено в

Как мы превратили каталог процессов в «цифрового сотрудника» на LLM и low-code

В крупных компаниях процессная архитектура неизбежно усложняется. Чем больше команд, продуктов и внутренних систем, тем выше зависимость от прозрачных и управляемых процессов. В теории.

продолжить чтение

Оставлено в

Отравление данных: бэкдоры в датасетах, поисковой выдаче и инструментах ИИ — и как защищаться

TL;DRВ 2025 году отравление данных оказалось в центре внимания. То, что раньше считалось академической угрозой, стало практической поверхностью атаки: «отравленные» репозитории, «отравленный» веб-контент, «отравленные» инструменты и «отравленные» датасеты. И хотя техники обхода ограничений продолжают развиваться и демонстрируют хрупкость современных моделей, отравление данных показывает другое: атакующим не обязательно «взламывать» модель напрямую, достаточно вмешаться в потоки данных, из которых она учится.

продолжить чтение

Оставлено в

Введение в отравление данных

продолжить чтение

Оставлено в

Data poisoning: бэкдоры в данных, RAG и инструментах

продолжить чтение

Оставлено в

RAG vs Fine-tuning: когда что выбирать — опыт 30+ проектов

RAG vs Fine-tuningПредставьте: клиент хочет «умного бота для базы знаний». Первый вопрос, который я задаю: «Данные часто меняются?»От ответа зависит архитектура. И бюджет. И сроки. И головная боль на следующие полгода.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

rag.

Как я создавала AI-агента для проверки ТЗ: история одного эксперимента

Grep-AST или Как мы заменили векторный поиск всего одной библиотекой

«Напомним, ранее…»: зачем мы вернули RAG, от которого сами отказались

Скормил нейросети 40 статей ПИК с Хабра: RAG-бот на GigaChat для BIM без опыта в разработке

Perplexity выложила отрытые эмбеддинг-модели

Как мы превратили каталог процессов в «цифрового сотрудника» на LLM и low-code

Отравление данных: бэкдоры в датасетах, поисковой выдаче и инструментах ИИ — и как защищаться

Введение в отравление данных

Data poisoning: бэкдоры в данных, RAG и инструментах

RAG vs Fine-tuning: когда что выбирать — опыт 30+ проектов

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

rag.