BrainTools - Методики для развития мозга - страница 57

Токенизация, как ключ к языковым моделям для низкоресурсных языков

Привет Хабр, меня зовут Эдуард, и я хочу поделиться своими наблюдениями о том, как статистические алгоритмы извлекают грамматику из текстов.ВведениеСоздание языковых моделей для низкоресурсных языков — задача, где успех определяется не столько вычислительной мощностью, сколько правильной подготовкой данных. Особенно это критично для морфологически богатых языков, таких как кабардинский, адыгейский, чеченский или дагестанские языки, где одна словоформа может содержать информацию о лице, времени, виде, пространственных отношениях и множестве других грамматических категорий.

продолжить чтение

Logos AI Assistant — полноценный ИИ-агент для вашего десктопа

Logos AI Assistant: Дайте "глаза и руки" нейросети на вашем рабочем столеВспомните, сколько раз вам приходилось заниматься ручной, механической работой: переносить данные из одной программы в другую, кликая по одним и тем же кнопкам, или выполнять последовательность команд в терминале для рутинной задачи. Это отнимает время и силы, которые можно было бы потратить на что-то более важное.Мы создали Logos AI Assistant не как замену человеку, а как инструмент-исполнитель. Это мост между мощными языковыми моделями (LLM) и вашим компьютером. Проще

продолжить чтение

Эффект арбузов: не новость, но до сих пор зона роста большинства команд поддержки

продолжить чтение

Трафик ИИ в России вырос в 6 раз

За десять месяцев 2025 года совокупный трафик на сервисов искусственного интеллекта в России вырос почти в шесть раз. Лидером рынка из топ-5 платформ стал ChatGPT, на долю которого пришлось 39,9% от общего числа визитов. На втором месте находится Deepseek с 27,8%, третьим стал GigaChat с показателем 7,3%. Четвёртое и пятое места заняли Qwen с 6,6% и «Алиса AI» с 5,7%.

продолжить чтение

Как мы научили нейросеть искать связи между инцидентами в SOC

продолжить чтение

Как превратить хаотичный ML-проект в систему: пошаговый гайд по DVC + GitHub Actions

Если ваш эксперимент нельзя воспроизвести командой git checkout && dvc pull, а model_final_v2_new.pth - норма, у вас проблема с ML-инженерией. Дело в воспроизводимости, которую вы теряете уже сегодня. Никакой сложной инфраструктуры (всего два инструмента). Что нужно: DVC для контроля версий данных и моделей +  GitHub Actions для автоматизации. В связке они дадут вам полноценный ML-пайплайн бесплатно и за один вечер :)⠀⠀Почему это важно СЕЙЧАС? (даже для сольного проекта)?Проблема без пайплайна

продолжить чтение

GigaAM-v3: открытая SOTA-модель распознавания речи на русском

В прошлой статье мы рассказывали о GigaAM — семействе открытых акустических моделей для русского языка и их дообученных вариантах под распознавание речи и эмоций. Сейчас мы представляем GigaAM-v3 — новую версию модели, которая ещё сильнее поднимает планку качества open source-моделей распознавания речи (Automatic Speech Recognition, ASR) на русском языке.В этом посте расскажем:что такое HuBERT-CTC и почему он даёт прирост качества минимум 10 % даже по сравнению с распространёнными в индустрии методами предобучения;

продолжить чтение

Вышел браузерный плагин Slop Evader, который очищает выдачу от контента, опубликованного после релиза ChatGPT

Австралийская художница и инженер Тега Брейн (Tega Brain) представила браузерное расширение Slop Evader. Оно удаляет из поисковой выдачи контент, опубликованный после 30 ноября 2022 года. В этот день состоялся рел��з первой версии ChatGPT, и интернет начали наполнять сгенерированные статьи, посты и картинки.

продолжить чтение

AT&T и Verizon блокируют инструмент T-Mobile, сканирующего аккаунты клиентов для рекомендации аналогичных тарифов

Американские операторы связи AT&T и Verizon начали блокировать инструмент Switching Made Easy, который T-Mobile использует для сканирования аккаунтов клиентов конкурентов, чтобы рекомендовать им аналогичные тарифные планы. Инструменты и методы T-Mobile позволяют сократить время переключения с одного оператора на другого до 15 минут.

продолжить чтение

Контроль качества переводов на основе ИИ

А вы задумываетесь иногда, что вот хочется что-то сделать такое, чтобы как-то выбиться из общей массы разработчиков? Сейчас придумаю идею, реализую, стану зарабатывать много денег? Все же так думают? Или только я один.

продолжить чтение

Rambler's Top100