Как слушать аудиокниги в Telegram без боли: история создания идеального облачного плеера на Python
Привет, Хабр!Я очень люблю аудиокниги. Но в последнее время слушать их легально (и удобно) стало той еще болью. То книга внезапно пропадает из библиотеки сервиса из-за истекших авторских прав, то приложение для прослушивания обрастает ненужными функциями и начинает весить как AAA-игра, то скачанные с торрентов гигабайтные архивы забивают всю память смартфона.Я перепробовал десяток офлайн-плееров, но везде натыкался на компромиссы: нет синхронизации между устройствами, слетает прогресс, неудобно закидывать файлы. В какой-то момент я посмотрел на Telegram с его безлимитным облаком и подумал:
RAG vs Fine-tuning: когда что выбирать — опыт 30+ проектов
RAG vs Fine-tuningПредставьте: клиент хочет «умного бота для базы знаний». Первый вопрос, который я задаю: «Данные часто меняются?»От ответа зависит архитектура. И бюджет. И сроки. И головная боль на следующие полгода.
Как я решил вкатиться в Android разработку через вайбкодинг. Часть 2. Ну или разработка мобильного приложения через ИИ
автор Gemini nanobananaВ прошлой части я остановился на том что собрал свое приложение, наладил работу и залил в google play. Здесь будет не то чтобы полноценный гайд, скорее тот путь что я прошел и попытка получить опыт в написании статьи
CodeWiki Skill: как заставить AI-агента написать документацию к вашему коду
ВведениеДля coding-агентов проблема понимания существующего кода в реальных корпоративных репозиториях стоит очень остро. Приступая к каждой новой задаче, агенту нужно погрузиться в контекст: понять, что делает проект, как устроена его архитектура, где находится нужный код. Если проект не подготовлен заранее и агент вынужден разбираться самостоятельно, возникают фундаментальные ограничения:Проблема контекстного окна Проблема локального контекста - агент видит отдельные файлы, но может не понимать их роль в системе.Проблема неявных зависимостей
Создание системы по управлению цифровыми активами для базы данных PostGIS. Часть 3. Семантические связи между таблицами
Здравствуйте, уважаемые читатели Хабра! Это заключительная третья часть (первая и вторая) о создании основного функционала MVP (Minimum Value Product) системы по управлению цифровыми активами для базы данных PostGIS. Полный перечень возможностей разрабатываемого проекта представлен на картинке ниже.
Large-v3 на Ryzen 5500U: как я оцифровал архив диктофонных записей без GPU и облаков
У многих из нас есть «кладбище» аудиозаписей: интервью, лекции, длинные совещания. Когда мой архив перевалил за сотню часов, я понял, что пора что-то менять. Облачные сервисы либо кусаются по цене, либо выдают «кашу» без нормальной пунктуации и разделения спикеров.В этой статье я расскажу, как собрал локальный конвейер на базе WhisperX, почему 40 ГБ оперативной памяти важнее мощной видеокарты и как метод «вайб-кодинга» помог мне превратить одиночный скрипт в модульное приложение с пакетной обработкой.Почему не ванильный Whisper?Оригинальный Whisper от OpenAI хорош, но для моих задач у него было три фатальных недостатка:
Нейросетевой арт для начинающих
В мире искусственного интеллекта есть много всего интересного и многие начинающие разработчики не могут определиться с тем, с чего начать погружение в этот мир. В этой статье мы познакомим читателя с одним из направлений работы с графикой – нейросетевом переносе стиля.Представьте: вы фотографируете своего кота, а нейросеть перерисовывает его в стиле Ван Гога или Пикассо. Еще недавно это казалось чудом, доступным лишь ученым, а сегодня это называется нейронный перенос стиля (Neural Style Transfer, NST). Это не просто модный фильтр, а один из самых красивых и понятных способов прикоснуться к миру искусственного интеллекта.
автоматизация браузера и развёртывание функций прямо из терминала
Notte — платформа для автоматизации браузера. Недавно мы выпустили CLI, который позволяет управлять браузерными сессиями, запускать AI-агентов, извлекать структурированные данные и развёртывать функции автоматизации, всё это прямо из терминала.В этой статье разберём, что он умеет и как устроен.Какую проблему мы решалиБольшинство рабочих процессов автоматизации браузера начинаются локально. Вы пишете скрипт на Playwright или Puppeteer, он работает на вашей машине, а затем вы тратите время на его переработку под продакшн.
Я дал 100 AI-агентам равный бюджет — они изобрели кредиты под 15%
На 47-м часе эксперимента агент №23 попросил у агента №91 «кредит» в 200 токенов под 15% «комиссии». Я такого не программировал. Ни слова про кредиты в промптах не было.Внутри — код на Python, логи, распределение ресурсов. И честный разбор того, что я до сих пор не могу до конца понять.Зачем это вообщеМеня давно интересовала тема emergent behavior в мультиагентных системах. Все пишут про AI-агентов, которые пишут код или отвечают на письма. Я хотел другое: что будет, если дать агентам абстрактную цель и ограниченные ресурсы? Будут ли они сотрудничать? Конкурировать?

