API.

Renga API: автоматизируем автоматизацию с помощью ИИ-агентов

Щупаем внутренности Renga. В этой статье залезу под капот к отечественному ПО и разберу его API. Сравню с западным конкурентом и заставлю подружиться с ИИ.В этой статье:

продолжить чтение

Оставлено в

Делаем лимиты ИИ почти бесконечными: умный роутер, который режет затраты на токены в разы и делает их почти бесплатными

У меня несколько пет-проектов, которые дёргают LLM через API. Чат-бот для внутренних задач, штука для генерации тестов, пара скриптов для код-ревью. Ничего масштабного, но за последнюю неделю счёт за API вышел $47 — и это только мои личные эксперименты.Проблема очевидная: я гоняю всё через Claude Sonnet, хотя половина запросов — тривиальщина. «Переименуй переменные в этом куске», «напиши docstring», «переведи этот текст». Любая модель за $0.10 / M токенов справится, а я плачу $3 / $15 .Ручной if/else по типу задачи — хрупко и лень. Начал смотреть на LLM-роутеры и наткнулся на ClawRouter. Потестировал неделю, расскажу что получилось.

продолжить чтение

Оставлено в

Google добавила в Gemini API режимы Flex и Priority для управления ценой и надёжностью

Google представила два новых режима работы в Gemini API — Flex и Priority

продолжить чтение

Оставлено в

Антиспам на нейронках: Gemini Flash в 1000 раз дешевле чем GigaChat

Сравнение LLM для антиспама

продолжить чтение

Оставлено в

Как металлообрабатывающий завод ускорил выполнение задач в 3 раза с помощью Кайтена и ChatGPT

Раньше руководитель тратил больше 30 минут, чтобы поставить задачи команде после ежедневной планерки. Теперь — один запрос к ИИ-ассистенту, и 30+ карточек автоматически создаются, заполняются и распределяются по исполнителям за 3 минуты. Это результат внедрения Кайтена на металлообрабатывающем заводе ПФ-ФОРУМ.Как процесс устроен изнутри — рассказывает Марина Вербицкая, руководитель отделения по работе с публикой и интегратор цифровых решений.Но сначала — несколько фактов о компанииПФ-ФОРУМ

продолжить чтение

Оставлено в

Как я написал шахматы с LLM на Python без галлюцинаций нейросетей

Введение Я работаю с LLM довольно давно и застал модели времен GPT-3.5, примерно в то же время мне нужно было сделать проект по учебе в этой области, тогда я выбрал именно тему шахмат, потому-что не видел конкретно таких решений раньше, конечно ИИ в онлайн шахматах и так был практически непобедим, но мысль сыграть конкретно с нейросетью уровня Chat GPT, мне показалась интересной. Основная проблема - заставить чат бот играть в игру и не делать ничего лишнего.В этой статье я разберу архитектуру своего проекта: шахмат на Python, где в качестве соперника выступает LLM:

продолжить чтение

Оставлено в
- ai
- API
- chess
- llm
- python

ByteDance перезапустила DeerFlow

DeerFlow 2.0 - проект, переписанный с нуля, который не имеет ничего общего с первой версией. Там был фреймворк для глубокого ресерча, а здесь полноценный рантайм для агентов. В основе лежит связка LangGraph и LangChain.

продолжить чтение

Оставлено в

Открытие API старых вещей

WiFi-колонка SoundTouch 30 Series III образца 2015 годаДва месяца назад компания Bose подала пример, как применять открытый подход к поддержке старых вещей: она открыла Web API для умных колонок SoundTouch.Официальный анонс Bose

продолжить чтение

Оставлено в

Perplexity выложила отрытые эмбеддинг-модели

Perplexity представила pplx-embed – набор многоязыковых моделей для обработки больших объемов информации. Эти модели разработаны для работы с данными из интернета, обеспечивая альтернативу проприетарным API.

продолжить чтение

Оставлено в

Эксперимент Cloudflare позволил перенести большую часть API Next.js за «одну неделю» с помощью ИИ

Инженер Cloudflare утверждает, что реализовал 94% API Next.js, управляя миграцией с помощью ИИ Claude от Anthropic и потратив на это около недели и $1100 на токены.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

API.

Renga API: автоматизируем автоматизацию с помощью ИИ-агентов

Делаем лимиты ИИ почти бесконечными: умный роутер, который режет затраты на токены в разы и делает их почти бесплатными

Google добавила в Gemini API режимы Flex и Priority для управления ценой и надёжностью

Антиспам на нейронках: Gemini Flash в 1000 раз дешевле чем GigaChat

Как металлообрабатывающий завод ускорил выполнение задач в 3 раза с помощью Кайтена и ChatGPT

Как я написал шахматы с LLM на Python без галлюцинаций нейросетей

ByteDance перезапустила DeerFlow

Открытие API старых вещей

Perplexity выложила отрытые эмбеддинг-модели

Эксперимент Cloudflare позволил перенести большую часть API Next.js за «одну неделю» с помощью ИИ

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

API.