llm.
От Naive RAG до ReAct-агента: как мы строили корпоративного AI-помощника на open-source моделях (часть 1)
Привет, Хабр! Меня зовут Константинов Александр
Графы знаний в юридическом домене: эксперимент с LightRAG
интерактивная визуализация графа знаний в WebUI LightRAG
Я дал LLM писать unsafe Rust полгода. Miri плакал
Этот код прошёл мои code review, ревью второго коллеги, тесты, CI с clippy и десять дней работал в проде:let mut out = Vec::with_capacity(estimated_size); let written = unsafe { decompress(input.as_ptr(), input.len(), out.as_mut_ptr(), out.capacity()) }; unsafe { out.set_len(written) }; Один сегфолт на каждые 800 тысяч запросов внутри C-библиотеки. Расследование заняло три дня.Этот код написал не джуниор. Этот код написал Claude Sonnet, я одобрил на ревью, второй ревьюер одобрил тоже. Корень я разберу в конце статьи, когда станет понятно, почему именно так пишет почти каждая модель и почему почти каждый ревьюер это пропускает.
Google убрала из Gemini Thinking модель. Обзор обновления Gemini
Давайте пройдемся по всем изменениям по порядку.Уровень мышления.Теперь в браузерную версию Gemini и в Gemini из приложения добавили настройку "Уровень рассуждений". Раньше подобные настройки можно было встретить в Google AI Studio, но теперь можно и тут. Конечно, тут нет всех привычных нам уровней, таких как низкий, средний, высокий. Есть только стандартный и расширенный. Это 100% подсмотрели у GPT, так как в их приложении это настраивается уже давно.
Держим ИИ в узде. Как при разработке сложных продуктов обеспечить преемственность и масштабируемость проекта
Мы не боимся использовать ИИ в разработке. Потому что знаем, как сделать, чтобы изменения в коде не ломали то, что работало до этого. Знаем, как научить ИИ соблюдать требования, а не выдумывать их. И как заставить ИИ писать легкий поддерживаемый код. Рассказываю на конкретном примере.
Pollux: LLM-as-a-judge для русского
Прошло несколько лет с тех пор, как нейросетевые модели стали применимы в генерации текста. Сегодня языковые модели уверенно решают задачи написания кода, поддержки диалогов и планирования маршрутов. Тем не менее, до сих пор не сложилось универсального подхода для валидации LLM перед их внедрением в цифровые продукты.
Почему 4 сеньёра могут быть эффективнее команды из 15 человек
Есть компании, которые верят в то, что уж лучше много джунов за копейки, чем несколько сеньоров за дорого.Очевидно, мнения могут быть разными, поэтому поделюсь своим опытом: 1. В компании Х у нас было 4 человека, которые ещё до эпохи ChatGPT с нуля за несколько месяцев собрали полноценный AI-стек: — fine-tune собственных LLM на своих датасетах — свой TTS/STT на своих датасетах — генерацию лиц и deepfake — MLOps-инфраструктуру и пайплайны
Агент — это не новый пользователь. Это новый посредник. Что медицина знает об этом 100 лет
На этой неделе прочитала свежую статью Кьяры Пеллегрини из NN/g: «AI-агенты теперь тоже пользователи наших интерфейсов». Автор — серьёзный исследователь, статья хорошо аргументирована. У агента есть цели, агент сталкивается с интерфейсом, агент пытается достичь целей через наш дизайн. По функциональному определению — пользователь.Я не согласна с этой рамкой. И думаю, что разница принципиальная.
Vercel выкатил язык программирования для агентов. Я пытаюсь понять, нужен ли он мне
15 мая Vercel Labs релизнули Zero. Экспериментальный системный язык, который сами авторы называют "the programming language for agents". Версия 0.1.1, Apache 2.0, расширение .0, бинарники меньше 10 килобайт, без LLVM. На GitHub лежит компилятор, стандартная библиотека и примеры — можно ставить и щупать прямо сейчас.Я прочитал доки, поставил себе, погонял пару примеров. Сижу с этой мыслью: серьёзно или очередной хайповый проект под волну агентного кодинга?Если коротко — наверное серьёзно, но мне сейчас не нужно. Тебе, скорее всего, тоже. Сейчас расскажу, что там и почему я так думаю.Что Zero на самом деле делает

