Машинное обучение.

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потребительской видеокарте AMD за $500 — без ROCm, без CUDA, без MLX, одним бинарником на Zig.Это пост про ZINC — inference engine, который мы строим с нуля под железо, которое люди реально покупают. Не как proof of concept, а как рабочий инструмент с OpenAI-совместимым API, потоковой генерацией и встроенным чатом.

продолжить чтение

Оставлено в

VoxCPM2: открытая 2B TTS-модель на 30 языках

VoxCPM2 - крупное обновление открытой системы синтеза речи VoxCPM. Модель обучена на более 2 млн. часов мультиязычных аудиоданных и поддерживает 30 языков, включая русский, китайский, английский, японский, корейский, арабский и хинди (плюс 9 диалектов китайского).

продолжить чтение

Оставлено в

ИИ-агенты на контентных платформах: два подхода к встраиванию в медиа

На русскоязычных медиа-площадках появились первые публичные интеграции ИИ-агентов непосредственно в пользовательский интерфейс. Два свежих кейса (Хабр и «Код Дурова») демонстрируют разные архитектурные подходы к одной задаче: помочь читателю взаимодействовать с контентом.

продолжить чтение

Оставлено в

60% падение трафика, коллапс моделей и однообразие: что ИИ делает с интернетом

Информационная экономика ИИ оказалась в ловушке собственного производства.

продолжить чтение

Оставлено в

LLM «шаблонно» креативны — подтверждено исследованием

В издательстве Oxford University Press вышло интересное исследование - они дали разным ИИ моделям выполнить задачи на креативность в заданных рамках, чтобы узнать, насколько уникальные решения они предоставят.

продолжить чтение

Оставлено в

Телефонный звонок → структурированный JSON: строим STT + LLM пайплайн на Python

Каждый день в российском бизнесе происходят миллионы телефонных звонков. Колл-центры, клиники, юридические конторы, отделы продаж — везде, где есть телефон, есть поток неструктурированных данных, который никто не обрабатывает. Менеджер повесил трубку, записал в CRM «клиент интересовался» — и 80% информации из разговора потерялось.Я потратил полгода на то, чтобы построить пайплайн, который берёт аудиозапись телефонного звонка и выдаёт структурированный JSON: кто звонил, чего хотел, какие суммы называл, что договорились делать дальше. В процессе набил достаточно шишек, чтобы написать эту статью.

продолжить чтение

Оставлено в

Краткий справочник про внимания (self-attention, cross-attention, multi-head attention)

Механизм внимания (Attention) - это метод в искусственном интеллекте, который позволяет нейросети динамически определять, какие части входных данных наиболее важны для текущей задачи. Он работает через вычисление весов важности для разных элементов входа: более важные элементы получают больший вес, а менее важные - меньший. Затем модель формирует взвешенную сумму представлений, создавая новый контекстный вектор.

продолжить чтение

Оставлено в

Playwright MCP и n8n: как мы используем ИИ в автоматизации тестирования

ИИ в автоматизации тестированияЗаписали подкаст с практикующими QA-автоматизаторами о том, как реально внедрять ИИ в тестирование. Без хайпа — только опыт и грабли.Что внутри:

продолжить чтение

Оставлено в

Вайбкодь потише, пожалуйста! или Пацаны, это и раньше было легко

Итак, что мы имеем в моменте.Люди зачем-то общаются с чат-ботами, по собственной воле, менеджеры пытаются заменить программистов, а топ-менеджеры так вообще видят скорое наступление AGI.Поскольку слепо доверять продавцам лопат глупо, попробуем по фактам и аргументам разобраться что-же поменялось в мире.

продолжить чтение

Оставлено в

Деквалификация через ИИ: нас предупреждали. Теперь это реальность

Умные машины — неумелые пользователи?

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Машинное обучение.

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

VoxCPM2: открытая 2B TTS-модель на 30 языках

ИИ-агенты на контентных платформах: два подхода к встраиванию в медиа

60% падение трафика, коллапс моделей и однообразие: что ИИ делает с интернетом

LLM «шаблонно» креативны — подтверждено исследованием

Телефонный звонок → структурированный JSON: строим STT + LLM пайплайн на Python

Краткий справочник про внимания (self-attention, cross-attention, multi-head attention)

Playwright MCP и n8n: как мы используем ИИ в автоматизации тестирования

Вайбкодь потише, пожалуйста! или Пацаны, это и раньше было легко

Деквалификация через ИИ: нас предупреждали. Теперь это реальность

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Машинное обучение.