Блог компании Doubletapp.

Контекст: сбрасывать нельзя компактизировать

Когда я только начинал пользоваться локальными агентами, я писал им как очень вежливому коллеге: «Please carefully analyze the project, find the best possible solution». Сейчас я всё чаще пишу инструкции телеграфом:Fix empty password validation in AuthScreen Done == AuthScreen tests pass Don't change public API Don't know? -> Read relevant files / google it Stuck? -> ask meГрамматика страдает, агент – нет. Ему не нужны артикли, предлоги и красивые обороты, если смысл однозначен. Это один из примеров контекстной гигиены в ежедневной работе. Меня зовут Андрей Жаров, я iOS-разработчик из компании Doubletapp

продолжить чтение

Оставлено в

Российский LegalTech 2026: как мультиагентный ИИ превращает юристов в архитекторов процессов

В 2026 году российский LegalTech выходит за рамки «умных шаблонов» и превращается в слой автономной правовой инфраструктуры на базе мультиагентного ИИ. Generative LegalTech — это не ИИ, который пишет текст, а связка генеративных моделей, retrieval-уровня и доменной логики, которая позволяет работать с реальными юридическими сценариями, а не только с шаблонами документов.

продолжить чтение

Оставлено в

Как я перестал писать убер-промпты и начал формировать инфраструктуру

«make no mistakes» и «write if you need more context» – фразы, которые я до сих пор могу напечатать на клавиатуре с завязанными глазами, потому что они способны помочь выжать из ChatGPT рабочий код, а если Deep Thinking подключить, то вообще сказка, разве нет?Меня зовут Андрей Жаров, iOS-разработчик из Doubletapp

продолжить чтение

Оставлено в

Выбираем и оцениваем open-source LLM для саммаризации встреч

Публичные бенчмарки LLM дают ориентиры по общему уровню моделей, но не отвечают на вопрос, как они ведут себя в конкретной задаче. А прикладные сценарии чувствительны к деталям: формату входных данных, структуре ответа, требованиям к точности. В этих условиях различия между моделями становятся более заметными.Даже у близких по классу моделей небольшие различия в архитектуре и обучении дают заметный разброс в качестве ответов.Качество моделей сильно зависит от типа задачи

продолжить чтение

Оставлено в

Как мы собрали русскоязычный датасет олимпиадной математики (и зачем это нужно AI)

Математические исследования всё чаще используют методы ИИ для анализа сложных задач, генерации решений и предоставления персонализированного обучения. Однако эффективность таких моделей напрямую зависит от качества и структуры данных, на которых они обучаются. Несмотря на обилие математических текстов в интернете, существует заметный дефицит крупных, размеченных и многоязычных датасетов, специально ориентированных на олимпиадную математику. В частности, для русскоязычных моделей остро не хватает материалов, сочетающих в себе авторитетность источника, сложность содержания и лингвистическое разнообразие.

продолжить чтение

Оставлено в

Как Red Teaming и человеческий креатив позволяют оценить риски внедрения LLM в бизнес-процессы

В кибербезопасности существует подход под названием Red Teaming — когда одна команда имитирует атакующего, а другая защищает систему. С появлением больших языковых моделей тот же принцип стал применяться к ИИ. Только теперь атакуют не серверы и базы данных, а сами LLM-агенты — системы, которые умеют рассуждать, выполнять команды и взаимодействовать с внешними инструментами. Red Team здесь ищет способы выявить уязвимости и подсветить риски модели, а Blue Team — защитить её. Именно на стыке этих подходов возникла новая область — Red Teaming LLM-агентов, где тестирование превращается в исследование границ самого искусственного интеллекта.

продолжить чтение

Оставлено в

Классический поиск уходит в прошлое: как бизнесу адаптироваться и расти в 2026 году

За последние несколько лет, с момента бума ИИ-чатов, всё больше людей заменяют привычный поиск в Google и Яндекс на диалог со своим ИИ-компаньоном. Это проще: не нужно искать ответ среди десятков ссылок — вы сразу получаете результат. Статистика за 2025 год подтверждает этот тектонический сдвиг: спрос на чат-боты показал взрывной рост. Только в Рунете ChatGPT получает более 1,17 миллиона поисковых запросов в месяц, а глобально эта цифра приближается к 47 миллиардам.Почему пользователи уходят от поисковой строки к промптам?Оперативность и структура.

продолжить чтение

Оставлено в

Григорий Бакунов aka Bobuk: «Боишься делать свои проекты — иди работать в чебуречную»

Одним из гостей подкаста Doubletapp «Что-то на программистском» стал бывший топ-менеджер Яндекса и нынешний IT-предприниматель Григорий Бакунов (aka Bobuk). В разговоре с ведущим подкаста, СЕО Doubletapp Сергеем Анчутиным, он рассказал, почему против работы фуллтайм и аутсорса, чем IT-компании вредят российскому образованию, куда по карьерной лестнице могут продвинуться разработчики и почему чаще всего им это не интересно.

продолжить чтение

Оставлено в

Майский дайджест Doubletapp: топовые рейтинги, две регаты и «Созвон с Долиной»

Привет, это команда Doubletapp. У нас прошел супернасыщенный событиями май. Главное — вошли в топ-20 рейтинга мобильных разработчиков и в топ-30 аутстафферов и ИИ-разработчиков России. В дайджесте расскажем новости, поделимся фото и инсайтами. Что новенького?Мы в топ-20 мобильных разработчиков по версии Тэглайна

продолжить чтение

Оставлено в

Как мы собираем SWE-bench на других языках

Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки ИИ-агентов, способных помогать в написании и исправлении кода, мы часто упираемся в ограничения. Популярный бенчмарк SWE-bench, например, долгое время поддерживал только Python. Чтобы преодолеть разрыв между реальностью разработки и возможностями оценки ИИ, наша команда в Doubletapp

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Блог компании Doubletapp.

Контекст: сбрасывать нельзя компактизировать

Российский LegalTech 2026: как мультиагентный ИИ превращает юристов в архитекторов процессов

Как я перестал писать убер-промпты и начал формировать инфраструктуру

Выбираем и оцениваем open-source LLM для саммаризации встреч

Как мы собрали русскоязычный датасет олимпиадной математики (и зачем это нужно AI)

Как Red Teaming и человеческий креатив позволяют оценить риски внедрения LLM в бизнес-процессы

Классический поиск уходит в прошлое: как бизнесу адаптироваться и расти в 2026 году

Григорий Бакунов aka Bobuk: «Боишься делать свои проекты — иди работать в чебуречную»

Майский дайджест Doubletapp: топовые рейтинги, две регаты и «Созвон с Долиной»

Как мы собираем SWE-bench на других языках

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Блог компании Doubletapp.