эмбеддинги. - страница 2

Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова

Предуведомление.

продолжить чтение

Я собрал Telegram-бота с лентой новостей, которая учится на твоих реакциях — и хостится за $5 в месяц

Я собрал Telegram-бота, который показывает только хорошие новости — и хостится за $5 в месяцTL;DR — @futur_e_news_bot. Двуязычная (RU/EN) лента новостей. По умолчанию — только хорошие и нейтральные, негатив подключается в настройках на 4 уровнях. ИИ убирает дубли, одно событие = одна карточка с несколькими источниками, перевод на лету, выдача подстраивается под реакции. Внутри: aiogram, локальные эмбеддинги, sqlite-vec вместо pgvector, бесплатные LLM через OpenRouter и одна машина на Fly.io за ~$5/мес. В статье — разбор архитектуры, код, цифры и грабли.Зачем ещё один новостной бот

продолжить чтение

Прокачать SQLite и сократить векторы в видеоформате — открытые инструменты для работы с эмбеддингами

Мы в Beeline Cloud подготовили новую подборку по теме векторных СУБД, в которой собрали примечательные инструменты по теме: например, решение, позволяющее хранить эмбеддинги в «видеоформате», а также расширение для SQLite, добавляющее поиск по векторам.

продолжить чтение

Защита от дублирования кода агентами: семантические концепции

Клонировал разум — дай разуму память. Как я строил слой памяти для команды из ИИ‑агентов, чтобы они перестали переписывать то, что уже естьЭто третья статья из серии о том, как я строю свой стартап руками ИИ‑агентов, и если первые две были про то, с чего всё началось и как я добрался до сути, то эта — про проблему, к которой меня привела сама логика предыдущих шагов.В первой я рассказывал, как вообще в это ввязался: один человек, Telegram‑first SaaS для авторов курсов и владельцев сообществ, и вся разработка идёт через агентов Claude Code, без наёмной команды.Во 

продолжить чтение

RAG в энтерпрайзе: почему демо работает, а прод нет

Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней документации, надо себе такой же. До конца квартала».Через четыре месяца у тебя есть Pinecone, OpenAI API, две недели работы над парсингом PDF и чат-бот, который на демо отвечает на пять подобранных вопросов идеально. А на шестой, который задаст любой нормальный сотрудник, отвечает уверенным бредом.Дальше про то, что именно между этими двумя состояниями происходит. Но без «правильной архитектуры RAG», потому что такой не существует.

продолжить чтение

Надо ли бороться с анизотропией эмбеддингов

Анизотропия эмбеддингов не всегда зло, но «сырой» косинус часто даёт слишком размытый сигнал. Центрирование убирает общий фон и помогает увидеть различия, не разрушая локальные смысловые области. Показываю это на реальных расчётах из Obsidian‑базы.В этой статье я хочу раскрыть своё понимание эмбеддингов и косинусного сходства. Перед прочтением предлагаю мысленный эксперимент: представьте 768‑мерное пространство через знакомые 2D/3D‑проекции, чтобы почувствовать, что стоит за цифрами и графиками.

продолжить чтение

Вам продают ИИ. Покупать нужно не его

Звонил мне на днях один знакомый CIO. Питерский, ритейл, средний бизнес, ничего особенного. Слушай, говорит, надо нам с ИИ что‑то делать: все вокруг внедряют, конкуренты вон что‑то запустили, на отраслевом Data Summit уши прожужжали, а у меня даже плана нет. И денег, кстати, особо на это не выделили, но не суть.Это был, кажется, пятый такой звонок за месяц.

продолжить чтение

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям в браузере (llama.cpp в WebAssembly)

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных для поиска. Это дает возможность искать по сходству фрагментов текста и поискового запроса пользователя, но не дает возможность искать по более высокоуровневым резюме и смыслам, темам поднятым в тексте и прочему. Также не помогает с аналитикой по содержимому.Бесплатный проект text-metadata-generator позволяет выполнять запросы к LLM по каждому документу из коллекции документов, результаты вывода LLM проверяются по JSON схеме.

продолжить чтение

Как я превратила Obsidian в структурированную память для ИИ‑агентов

Эта статья про NOUZ — локальный MCP‑сервер между Obsidian и ИИ‑агентом. Он превращает базу заметок в структурированную память: с уровнями, связями и сигналами дрейфа.Внутри — как я пришла к этой архитектуре и что она даёт агенту при работе с базой.Я плотно работаю с ИИ с момента его широкого распространения в свободном доступе. Сначала у нас были простые чаты, потом мы вывели формулы промптов для лучших результатов. Сейчас всё гораздо интереснее.

продолжить чтение

«Эмбеддинги на примерах с собаками», или как работать с векторными представлениями: книги и руководства по теме

Мы в Beeline Cloud собрали для вас подборку открытых руководств и обучающих материалов по теме эмбеддингов: что собой представляют подходы TF-IDF и Word2vec, какие нюансы стоит учитывать, используя косинусное сходство для семантического поиска, а также чем различаются алгоритмы векторизации — показательно на схемах.

продолжить чтение