Natural Language Processing.

Grep-AST или Как мы заменили векторный поиск всего одной библиотекой

Всем привет! На связи София из команды применения больших языковых моделей ecom.tech

продолжить чтение

Оставлено в

Книга: «Обработка естественного языка в действии. 2-е изд.»

Привет, Хаброжители!

продолжить чтение

Оставлено в

Event-Driven подход в пет-проекте: автоматизация Telegram-канала на NiFi, Kafka и n8n

Привет, Хабр! Хочу рассказать про один странный пет-проект, который немного вырвался из-под контроля.Все описанные потоки можно попробовать в github Скачивайте, ставьте звездочки)Началось всё обычно: есть VPS (2 ядра, 6 ГБ RAM, 40 GB NVMe), есть свободное время и желание сделать что-то полезное. А ещё есть давняя хотелка — попробовать Kafka в реальном бою. Ну и Telegram-канал для изучения английского как-то сам напросился: новости BBC, разбор лексики, викторины — вроде не сложно, но и не совсем hello world.

продолжить чтение

Оставлено в

Geometry > Scale: Как 40М параметров на решетке E8 обходят классические трансформеры

Ребята, кажется, мы уперлись в стену. Пока гиганты наращивают параметры и жгут тераватты, пытаясь выжать каплю разума из статистики, я решил пересмотреть сам фундамент. Проблема не в данных, проблема в «вязкости» стандартного Attention.Суть метода: Я заменил стандартный механизм внимания на нативную

продолжить чтение

Оставлено в

Claude Code — это не только для программистов: как маркетологи и менеджеры автоматизируют рутину

В начале января главный инженер Google и руководитель команды Gemini API Яана Доган написала

продолжить чтение

Оставлено в

RAG vs Fine-tuning: когда что выбирать — опыт 30+ проектов

RAG vs Fine-tuningПредставьте: клиент хочет «умного бота для базы знаний». Первый вопрос, который я задаю: «Данные часто меняются?»От ответа зависит архитектура. И бюджет. И сроки. И головная боль на следующие полгода.

продолжить чтение

Оставлено в

Создание системы по управлению цифровыми активами для базы данных PostGIS. Часть 3. Семантические связи между таблицами

Здравствуйте, уважаемые читатели Хабра! Это заключительная третья часть (первая и вторая) о создании основного функционала MVP (Minimum Value Product) системы по управлению цифровыми активами для базы данных PostGIS. Полный перечень возможностей разрабатываемого проекта представлен на картинке ниже.

продолжить чтение

Оставлено в

Машинный перевод. Как развивалась технология

Машинный перевод - это одно из самых удивительных достижений ИИ. Под этим термином понимают автоматический перевод текста с одного языка на другой с помощью компьютерных алгоритмов. Несколько десятилетий назад сама идея о том, что компьютер или программа может переводить тексты с одного языка на другой, казалась настоящей фантастикой. Меня зовут Алексей Рудак, я основатель компании Lingvanex

продолжить чтение

Оставлено в

Как я построил Graph RAG систему с точностью 96.7% за 5 дней: от научных статей до production-ready пайплайна

Skeleton Indexing (KDD 2025) + HippoRAG 2 (ICML 2025) + VectorCypher + Datalog Reasoning + 10 итераций оптимизацииTL;DRЯ реализовал Graph RAG систему, которая комбинирует 5 техник из свежих научных статей в единый пайплайн с декларативным reasoning-движком, полной провенансной трассировкой и типизированным API. Результат: 174/180 (96.7%) на билингвальном бенчмарке из 30 вопросов, оценённых в 6 режимах retrieval. Три режима достигли 100%. Ноль persistent failures.GitHub:

продолжить чтение

Оставлено в

Что пугает лично меня в развитии искусственных помощников

Пока генераторы текста на базе языковых моделей соревнуются в скорости производства поверхностных текстов на тему отъема рабочих мест, мне тоже есть, что сказать про гонку вооружений человека искусственными помощниками (которых здесь и далее я для простоты буду называть малорелевантным, но устоявшимся термином «ИИ»).

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Natural Language Processing.

Grep-AST или Как мы заменили векторный поиск всего одной библиотекой

Книга: «Обработка естественного языка в действии. 2-е изд.»

Event-Driven подход в пет-проекте: автоматизация Telegram-канала на NiFi, Kafka и n8n

Geometry > Scale: Как 40М параметров на решетке E8 обходят классические трансформеры

Claude Code — это не только для программистов: как маркетологи и менеджеры автоматизируют рутину

RAG vs Fine-tuning: когда что выбирать — опыт 30+ проектов

Создание системы по управлению цифровыми активами для базы данных PostGIS. Часть 3. Семантические связи между таблицами

Машинный перевод. Как развивалась технология

Как я построил Graph RAG систему с точностью 96.7% за 5 дней: от научных статей до production-ready пайплайна

Что пугает лично меня в развитии искусственных помощников

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Natural Language Processing.