парсинг.

ИИ-боты генерируют в шесть раз больше запросов к страницам DDR5 в интернет-магазинах, чем обычные покупатели

Оперативная память стандарта DDR5 стала целью перекупщиков на фоне растущего дефицита, вызванного высоким спросом на память со стороны компаний в сфере искусственного интеллекта. В этих условиях усиливается внедрение автоматизированных инструментов скупки, что ещё больше усугубляет ситуацию и приводит к вытеснению с рынка обычных покупателей.

продолжить чтение

Я отвечаю за процессы и репутацию (SERM)

Раньше мы отдавали по 40-50 тыс. рублей в месяц за enterprise-сервисы мониторинга. Но платить столько ради пары десятков упоминаний продукта в день – это забивать гвозди микроскопом.Задача: прилетел негатив – мы моментально об этом узнали. Я спроектировал логику, а разработчик собрал инструмент. Архитектура простая, но на 100% закрывает боли.1. Сбор данныхСвой парсер на Python. Где площадки отдают данные по API – берем напрямую. Остальное тянем через Selenium с ротацией прокси от банов.2. Оценка сарказмаКлассический текстовый анализ сыпался на фразах вроде «Отличный сервис, ждал ответа сутки, спасибо!»

продолжить чтение

Сделал бота для автоматизации поиска лидов

Привет, Хабр! Первая моя первая прикладная статья с конкретным опытом по проекту.TL;DR: Собрал систему на Python + LLM, которая парсит Telegram-чаты, находит людей с конкретными болями и генерирует персонализированные сообщения для аутрича. 7 чатов по 1000 сообщений — стоимость анализа $0.11.1. Проблема одного канал продажДва года я зарабатываю на фрилансе — делаю Telegram-ботов, Mini Apps и автоматизации для бизнеса. За это время вырос с 40 до 270 тысяч в месяц. Неплохо, но была проблема, которая не давала масштабироваться.Все заказы приходили с одной фриланс площадки.

продолжить чтение

Автоматизация рутины на hh.ru: Как мы учили Headless Chrome притворяться живым человеком (RPA против Anti-Fraud)

С инженерной точки зрения поиск работы — это процесс с низкой энтропией. Есть входящий поток данных (JSON с вакансиями) и есть необходимость отправить ответный сигнал (POST-запрос с откликом). Задача кажется тривиальной для автоматизации: написал парсер, настроил cron, пошел пить кофе.Однако, если вы попробуете автоматизировать отклики на крупных job-board платформах (особенно на hh.ru) в 2026 году, вы столкнетесь с серьезным противодействием. WAF (Web Application Firewall), анализ TLS-отпечатков, поведенческая биометрия и теневые баны — это реальность, которая убивает скрипты на requests за пару часов.

продолжить чтение

Умная афиша концертов Золотого кольца России: Python + LLM

Содержание: 1. Знакомство с сервисом 2. Архитектура 3. Важные нюансы 4. Развёртывание в PROD1. Знакомство с сервисомКак это работает? Представим, что «Знаток концертов» — Ваш умный библиотекарь 📚. Он настоящий специалист в своём деле, и по каждой книге (концерту) у него есть заметка с кратким содержанием 📝Вы приходите к библиотекарю с мыслью "что-то этакое почитать"

продолжить чтение

Cloudflare заблокировала 416 млрд запросов ИИ-ботов на парсинг за пять месяцев

Генеральный директор Cloudflare Мэтью Принс заявил, что компания заблокировала более 416 млрд запросов от ИИ-ботов с июля этого года. Такую работу провели в рамках инициативы «День независимости контента». Функция Cloudflare позволяет владельцам веб-сайтов блокировать ИИ-ботов по умолчанию, если их владелец не заплатит за доступ к контенту.

продолжить чтение

TOON: новый формат на смену JSON для более эффективного взаимодействия с LLM?

TOON — это ещё один способ записать те же самые JSON-данные, но компактнее и понятнее для моделей. Вместо  "key": "value" он использует отступы как YAML и табличную запись для массивов объектов: шапка с названиями полей, дальше строки с данными.

продолжить чтение

«Википедия» призывает компании в сфере разработки ИИ использовать её платный API и прекратить парсинг данных

Фонд «Викимедиа» представил план, который позволит обеспечить дальнейшую поддержку «Википедии» в эпоху искусственного интеллекта, несмотря на снижение трафика. Организация призвала разработчиков ИИ использовать контент её энциклопедии ответственно, обеспечив при этом правильное указание авторства и доступ к материалам через платный проект фонда — платформу Wikimedia Enterprise.

продолжить чтение

DSL против универсальных языков: когда стоит создавать собственный доменный язык и как избежать ошибок

Мир разработки полон соблазнов изобретать собственные решения. Один из самых ярких соблазнов — создать свой DSL (Domain-Specific Language). Это звучит красиво: язык, который идеально отражает задачи конкретной предметной области. Но где заканчивается здравый смысл и начинается велосипедостроение? В статье я попробую на примерах показать, когда DSL — это спасение, а когда лучше взять старый добрый Python, C# или даже Bash.

продолжить чтение

Запускаем личный АИ-инфоконвейер: как я строю систему смыслового мониторинга с YAML и GPT

Отслеживаем новости, документы и тендерыRostral.io размышляет над ответом вместо вас

продолжить чтение

12
Rambler's Top100