llm. - страница 20

llm.

От Naive RAG до ReAct-агента: как мы строили корпоративного AI-помощника на open-source моделях (часть 1)

Привет, Хабр! Меня зовут Константинов Александр

продолжить чтение

Графы знаний в юридическом домене: эксперимент с LightRAG

интерактивная визуализация графа знаний в WebUI LightRAG

продолжить чтение

Я дал LLM писать unsafe Rust полгода. Miri плакал

Этот код прошёл мои code review, ревью второго коллеги, тесты, CI с clippy и десять дней работал в проде:let mut out = Vec::with_capacity(estimated_size); let written = unsafe { decompress(input.as_ptr(), input.len(), out.as_mut_ptr(), out.capacity()) }; unsafe { out.set_len(written) }; Один сегфолт на каждые 800 тысяч запросов внутри C-библиотеки. Расследование заняло три дня.Этот код написал не джуниор. Этот код написал Claude Sonnet, я одобрил на ревью, второй ревьюер одобрил тоже. Корень я разберу в конце статьи, когда станет понятно, почему именно так пишет почти каждая модель и почему почти каждый ревьюер это пропускает.

продолжить чтение

Google убрала из Gemini Thinking модель. Обзор обновления Gemini

Давайте пройдемся по всем изменениям по порядку.Уровень мышления.Теперь в браузерную версию Gemini и в Gemini из приложения добавили настройку "Уровень рассуждений". Раньше подобные настройки можно было встретить в Google AI Studio, но теперь можно и тут. Конечно, тут нет всех привычных нам уровней, таких как низкий, средний, высокий. Есть только стандартный и расширенный. Это 100% подсмотрели у GPT, так как в их приложении это настраивается уже давно.

продолжить чтение

Держим ИИ в узде. Как при разработке сложных продуктов обеспечить преемственность и масштабируемость проекта

Мы не боимся использовать ИИ в разработке. Потому что знаем, как сделать, чтобы изменения в коде не ломали то, что работало до этого. Знаем, как научить ИИ соблюдать требования, а не выдумывать их. И как заставить ИИ писать легкий поддерживаемый код. Рассказываю на конкретном примере.

продолжить чтение

Pollux: LLM-as-a-judge для русского

Прошло несколько лет с тех пор, как нейросетевые модели стали применимы в генерации текста. Сегодня языковые модели уверенно решают задачи написания кода, поддержки диалогов и планирования маршрутов. Тем не менее, до сих пор не сложилось универсального подхода для валидации LLM перед их внедрением в цифровые продукты.

продолжить чтение

Почему 4 сеньёра могут быть эффективнее команды из 15 человек

Есть компании, которые верят в то, что уж лучше много джунов за копейки, чем несколько сеньоров за дорого.Очевидно, мнения могут быть разными, поэтому поделюсь своим опытом: 1. В компании Х у нас было 4 человека, которые ещё до эпохи ChatGPT с нуля за несколько месяцев собрали полноценный AI-стек: — fine-tune собственных LLM на своих датасетах — свой TTS/STT на своих датасетах — генерацию лиц и deepfake — MLOps-инфраструктуру и пайплайны

продолжить чтение

Агент — это не новый пользователь. Это новый посредник. Что медицина знает об этом 100 лет

На этой неделе прочитала свежую статью Кьяры Пеллегрини из NN/g: «AI-агенты теперь тоже пользователи наших интерфейсов». Автор — серьёзный исследователь, статья хорошо аргументирована. У агента есть цели, агент сталкивается с интерфейсом, агент пытается достичь целей через наш дизайн. По функциональному определению — пользователь.Я не согласна с этой рамкой. И думаю, что разница принципиальная.

продолжить чтение

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям в браузере (llama.cpp в WebAssembly)

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных для поиска. Это дает возможность искать по сходству фрагментов текста и поискового запроса пользователя, но не дает возможность искать по более высокоуровневым резюме и смыслам, темам поднятым в тексте и прочему. Также не помогает с аналитикой по содержимому.Бесплатный проект text-metadata-generator позволяет выполнять запросы к LLM по каждому документу из коллекции документов, результаты вывода LLM проверяются по JSON схеме.

продолжить чтение

Vercel выкатил язык программирования для агентов. Я пытаюсь понять, нужен ли он мне

15 мая Vercel Labs релизнули Zero. Экспериментальный системный язык, который сами авторы называют "the programming language for agents". Версия 0.1.1, Apache 2.0, расширение .0, бинарники меньше 10 килобайт, без LLVM. На GitHub лежит компилятор, стандартная библиотека и примеры — можно ставить и щупать прямо сейчас.Я прочитал доки, поставил себе, погонял пару примеров. Сижу с этой мыслью: серьёзно или очередной хайповый проект под волну агентного кодинга?Если коротко — наверное серьёзно, но мне сейчас не нужно. Тебе, скорее всего, тоже. Сейчас расскажу, что там и почему я так думаю.Что Zero на самом деле делает

продолжить чтение

1...10...181920212223...3040...259