Выбираем и оцениваем open-source LLM для саммаризации встреч
Публичные бенчмарки LLM дают ориентиры по общему уровню моделей, но не отвечают на вопрос, как они ведут себя в конкретной задаче. А прикладные сценарии чувствительны к деталям: формату входных данных, структуре ответа, требованиям к точности. В этих условиях различия между моделями становятся более заметными.Даже у близких по классу моделей небольшие различия в архитектуре и обучении дают заметный разброс в качестве ответов.Качество моделей сильно зависит от типа задачи
Как мы собрали русскоязычный датасет олимпиадной математики (и зачем это нужно AI)
Математические исследования всё чаще используют методы ИИ для анализа сложных задач, генерации решений и предоставления персонализированного обучения. Однако эффективность таких моделей напрямую зависит от качества и структуры данных, на которых они обучаются. Несмотря на обилие математических текстов в интернете, существует заметный дефицит крупных, размеченных и многоязычных датасетов, специально ориентированных на олимпиадную математику. В частности, для русскоязычных моделей остро не хватает материалов, сочетающих в себе авторитетность источника, сложность содержания и лингвистическое разнообразие.
Как Red Teaming и человеческий креатив позволяют оценить риски внедрения LLM в бизнес-процессы
В кибербезопасности существует подход под названием Red Teaming — когда одна команда имитирует атакующего, а другая защищает систему. С появлением больших языковых моделей тот же принцип стал применяться к ИИ. Только теперь атакуют не серверы и базы данных, а сами LLM-агенты — системы, которые умеют рассуждать, выполнять команды и взаимодействовать с внешними инструментами. Red Team здесь ищет способы выявить уязвимости и подсветить риски модели, а Blue Team — защитить её. Именно на стыке этих подходов возникла новая область — Red Teaming LLM-агентов, где тестирование превращается в исследование границ самого искусственного интеллекта.
Классический поиск уходит в прошлое: как бизнесу адаптироваться и расти в 2026 году
За последние несколько лет, с момента бума ИИ-чатов, всё больше людей заменяют привычный поиск в Google и Яндекс на диалог со своим ИИ-компаньоном. Это проще: не нужно искать ответ среди десятков ссылок — вы сразу получаете результат. Статистика за 2025 год подтверждает этот тектонический сдвиг: спрос на чат-боты показал взрывной рост. Только в Рунете ChatGPT получает более 1,17 миллиона поисковых запросов в месяц, а глобально эта цифра приближается к 47 миллиардам.Почему пользователи уходят от поисковой строки к промптам?Оперативность и структура.
Григорий Бакунов aka Bobuk: «Боишься делать свои проекты — иди работать в чебуречную»
Одним из гостей подкаста Doubletapp «Что-то на программистском» стал бывший топ-менеджер Яндекса и нынешний IT-предприниматель Григорий Бакунов (aka Bobuk). В разговоре с ведущим подкаста, СЕО Doubletapp Сергеем Анчутиным, он рассказал, почему против работы фуллтайм и аутсорса, чем IT-компании вредят российскому образованию, куда по карьерной лестнице могут продвинуться разработчики и почему чаще всего им это не интересно.
Майский дайджест Doubletapp: топовые рейтинги, две регаты и «Созвон с Долиной»
Привет, это команда Doubletapp. У нас прошел супернасыщенный событиями май. Главное — вошли в топ-20 рейтинга мобильных разработчиков и в топ-30 аутстафферов и ИИ-разработчиков России. В дайджесте расскажем новости, поделимся фото и инсайтами. Что новенького?Мы в топ-20 мобильных разработчиков по версии Тэглайна
Как мы собираем SWE-bench на других языках
Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки ИИ-агентов, способных помогать в написании и исправлении кода, мы часто упираемся в ограничения. Популярный бенчмарк SWE-bench, например, долгое время поддерживал только Python. Чтобы преодолеть разрыв между реальностью разработки и возможностями оценки ИИ, наша команда в Doubletapp
Умный помощник для корпоративного обучения: опыт внедрения продвинутой RAG-системы в крупной компании
Привет, Хабр! Меня зовут Антон, я занимаюсь внедрением ИИ в компании Doubletapp
Тренды ИИ-2025
Всем привет! Я Федор Горбунов, руководитель направления машинного обучения в Doubletapp. Сегодня поговорим о том, какие значимые для искусственного интеллекта события произошли в 2024 году и попробуем спрогнозировать вектор развития отрасли в будущем.

