гибридная архитектура.

От каши к структуре: гибридная AI‑система для обработки свободного текста

Я занимаюсь проектом, где нужно из свободных текстов на естественном языке вытаскивать структурированные данные. Не разово — постоянно, по мере поступления. За несколько месяцев я перепробовал регулярки, чистый LLM и в итоге пришёл к гибриду. Ниже расскажу, что из этого всего вышло: архитектура, промпты, трудности и неочевидные решения.Стек: Python 3.12, Ollama + Qwen 2.5 (всё локально), YAML как формат хранения, SHA256 для дедупликации, Jinja2 для шаблонизации промптов.Проект называется Svyazi

продолжить чтение

Compute crunch пришёл: как считать экономику LLM в 2026

Build, Buy или Hybrid - рассуждаем о подходах к TCO. Статья - приглашение к диалогу и обсуждению, не экспертный нарратив."Я говорил" или что случилось с тарифами на LLM APIДва крупнейших API-провайдера одновременно сменили риторику. Anthropic ввёл usage-based billing для агентных фреймворков — плата за токены вместо фиксированных подписок. Часть сторонних обёрток потеряла возможность работать через flat-rate тарифы. OpenAI параллельно ввёл гибкое корпоративное ценообразование для Enterprise, Business и EDU-планов

продолжить чтение

Ключевые тренды развития рынка суперкомпьютеров: прогноз на 2025 год

По оценке К2 НейроТех, за последние два года рынок решений для высокопроизводительных вычислений (High Performance Computing, HPC) вырос на 35% и достиг 15,8 млрд рублей. Развитие искусственного интеллекта играет в этом ключевую роль. Эксперты ожидают, что  в 2025 году рынок HPC увеличится как минимум на 12%. К2 НейроТех выделил пять ключевых трендов, которые будут формировать развитие отрасли в этом году.Рост отечественного производства оборудования для ИИ

продолжить чтение