Natural Language Processing. - страница 5

Графы знаний в юридическом домене: как не потерять сложность при построении RAG-системы

Графы знаний в RAG-системах - будущее интеллектуального поиска

продолжить чтение

Маленький LLM-чат на Python с Ollama и LiteLLM. Часть 2: делаем консольный чат

В первой части мы сделали самый важный стартовый шаг: подняли локальную модель через Ollama, подключили её к Python через LiteLLM и получили первый осмысленный ответ из кода.Но пока это ещё не чат. Наш main.py умел только одно: отправить один заранее заданный вопрос, вывести ответ и завершиться.Для учебного эксперимента этого достаточно. Для приложения — уже нет.Во второй части превратим этот одноразовый скрипт в маленький консольный чат

продолжить чтение

Как работает трансформер (LLM)

Это мой первый пост на Хабре, так что не судите строго :-)Текст ниже - это слегка отредактированная версия чата с моими друзьями, где я вызвался объяснить, что же именно происходит в мозгах «электронного болвана». Так получилось, что в конце 2025 — начале 2026 я смог, наконец, удовлетворить собственное любопытство относительно внутреннего устройства современных нейросетей. Правда, не до конца — сейчас уже почти все переходшли на архитектуру MoE, но насколько я вижу — это скорее оптимизация, нежели что‑то кардинально новое. Трансформер так и остаётся в центре всего этого технологического чуда, что мы наблюдаем.

продолжить чтение

Маленький LLM-чат на Python с Ollama и LiteLLM. Часть 1: ставим окружение и пишем первый запрос

Во многих туториалах по LLM всё начинается с API-ключей, платных токенов и облачных сервисов. Это рабочий путь, но для первого знакомства он не самый удобный: нужно регистрироваться, разбираться с биллингом и постоянно помнить, что каждый эксперимент что-то стоит.Здесь пойдём проще. В этой серии мы соберём маленький LLM-чат на Python, который сначала будет работать локально: модель запускается через Ollama, а Python-код общается с ней через LiteLLM.Это хороший стартовый маршрут по трём причинам:не нужны API-ключи;не нужен интернет для каждого запроса;

продолжить чтение

Анонимная модель неделю держала топ OpenRouter. Это оказалась модель от Xiaomi

На OpenRouter неделю держалась анонимная модель Hunter Alpha. Многие LLM-провайдеры часто делают так с новыми моделями, чтобы затестить на реальных пользователях.

продолжить чтение

Как маскировать персональные данные на изображениях: наш эксперимент с OCR и NER

Всем привет! Меня зовут Андрей Иванов, я NLP-исследователь в R&D red_mad_robot. Мы разрабатываем систему Guardrails для защиты персональных данных (PII) и фильтрации небезопасного контента.

продолжить чтение

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Эта статья является адаптацией моей статьи, опубликованной в Towards AIIntroБольшие языковые модели показывают впечатляющую обобщающую способность, причём не только в задачах генерации текста вроде QA-ассистентов, но и в классификации, распознавании именованных сущностей (Named Entity Recognition) и других NLP-задачах.С одной стороны, мы на старте эпохи AI агентов, где приложения с тулами управляются

продолжить чтение

9 агентов, 6 моделей, 1 сервер: как собрать ИИ-компанию на open-source в марте 2026

Я собрал команду из 9 ИИ-агентов, которая проектирует, пишет, тестирует и деплоит других ИИ-агентов. Полный цикл — от пользовательского запроса до production-ready кода с тестами и security review. Без людей в цикле.Ниже — конкретика: какие модели, на какие роли, почему именно эти, как они шарят GPU, сколько стоят в гигабайтах и какие бенчмарки реально определяют выбор. С конфигурациями развёртывания от одной RTX 4090 до кластера A100.TL;DR: 9 логических агентов = 3-4 физических модели. Минимальный сетап — 24 GB VRAM (одна RTX 4090). Полный продакшен — 211 GB (четыре A100). Интерактивный дашборд

продолжить чтение

Онлайн-конференция «Новый взгляд на PDF. От редактирования к смыслу»

26 марта 2026 года компания Content AI, разработчик ИИ-решений для автоматизации работы с документами, проведет

продолжить чтение

Один промпт — это не продукт. Как мы перестали обманывать себя и собрали мультиагентный пайплайн

Знаете, что объединяет 90% «AI-стартапов» в 2026 году? Один промпт, обёрнутый в красивый UI и с подпиской за $29 в мес.Мы тоже так начинали. Один вызов к OpenRouter, один системный промпт на 800 токенов и надежда, что модель «сама разберётся». Рерайт новостей для региональных СМИ — задача-то вроде простая, да? На самом деле не очень.Анатомия провала: почему монопромпт не работаетВот что мы просили от одного промпта одновременно:Извлечь факты из исходной статьиПроверить, что факты корректныНайти контекст — упоминались ли эти события раньше в изданииПереписать в стиле конкретного СМИ

продолжить чтение

1...345678...2030...34