Блог компании OTUS. - страница 10

Квантовые физики уменьшили и «освободили от цензуры» DeepSeek R1

Им удалось сократить размер ИИ-модели рассуждений более чем наполовину — и они утверждают, что теперь она может отвечать на политически чувствительные вопросы, которые раньше были под запретом в китайских ИИ-системах.TL;DR:Multiverse Computing сжала DeepSeek R1 с помощью квантово-вдохновлённых тензорных сетей: модель стала на 55% компактнее при почти той же точности. По пути они «сняли» китайскую цензуру: модифицированная версия отвечает на табуированные для китайских LLM вопросы примерно как западные модели.

продолжить чтение

Artificial Analysis обновили свой Intelligence Index

В новых тестах неожиданно выстрелил Gemini 3 Pro Preview. По половине бенчмарков у модели не просто небольшой прирост, а заметный скачок вперёд.Фактические знания и галлюцинацииGemini 3 Pro Preview занимает 1-е место в 5 из 10 тестов Artificial Analysis Intelligence Index:GPQA Diamond, MMLU‑Pro, HLE, LiveCodeBench и SciCode.Самый показательный результат — 37% в Humanity's Last Exam (сложный экзамен «на последнюю попытку человечества»). Это на 10+ п.п. выше предыдущего лучшего результата — для такого класса задач это большой отрыв, а не статистический шум.»Отдельно модель лидирует в AA‑Omniscience, новом комплексном бенчмарке знаний и галлюцинаций:

продолжить чтение

Как прокачать ИИ-агента без дообучения: Agent Skills

Claude — мощный, но реальная работа требует процедурных знаний и понимания организационного контекста. Представляем Agent Skills — новый способ создавать специализированных агентов с помощью файлов и папок.TL;DR

продолжить чтение

После десятков собесов я понял: текущий найм — сломан

2026 год на пороге. Искусственный интеллект уже не модное словосочетание, а коллега. Copilot подсказывает код в IDE, а ChatGPT помогает с архитектурой. Но наши подходы к найму техспециалистов всё ещё застряли между допросами и бесконечными этапами, которые отнимают время, но не показывают реальных навыков.Меня зовут Григорий, я разработчик. За последние несколько лет я прошел десятки собеседований с обеих сторон: и как кандидат, и как интервьюер.

продолжить чтение

Клиент иногда не прав. Современный подход к оценке клиентской ценности

Звучит так себе, но не все клиенты одинаково полезны для вашего бизнеса. Есть клиенты, которые приносят стабильную прибыль, дают конструктивную обратную связь и используют продукт в рамках задуманных сценариев. Есть клиенты прямо противоположные, которые требуют непропорционально много внимания, провоцируют конфликты, мешают развитию продукта и при этом не увеличивают доход.Задача компании — вовремя понять, какую работу продукт выполняет для конкретного сегмента клиентов, и на это ориентировать развитие сервиса и поддержку

продолжить чтение

В защиту «обычных» разработчиков

Эта статья изначально была заказана Лукой Росси для refactoring.fm 11 февраля 2025 года. Лука отредактировал материал, в ней получился акцент на важности построения «команд инженеров 10×». Позже материал забрал IEEE Spectrum — они выкинули большую часть содержания про команды и опубликовали более короткий текст.Это — моя личная редакция. Она не совпадает ни с одной из ранее выпущенных версий. В ней много исходных материалов для моего одноименного доклада (презентация

продолжить чтение

Системный аналитик и искусственный интеллект: друзья или враги?

Последние несколько лет тема искусственного интеллекта приобрела огромную популярность. И помимо всеобщего восторга относительно практически безграничных возможностей ИИ у представителей различных профессий появились опасения относительно того, что в самом ближайшем будущем их заменят различные GPT. Не являются исключением и различные аналитические направления, такие как бизнес и системный анализ.В этой статье мы попробуем поразмышлять на тему того, может ли искусственный интеллект заменить системного аналитика или же он может стать помощником при выполнении различных задач.Основные обязанности

продолжить чтение

Почему Python так популярен в 2025?

Многие языки приходят и уходят, но Python является одним из тех языков, который давно зарекомендовал себя на рынке как один из лучших вариантов для разработчиков всех уровней (и не только).Неважно, работаете ли вы над интеллектуальными системами, процессами, управляемыми данными или пишете тесты, Python позволяет создавать вам это программное обеспечение. И, судя по всему, тренд его популярности не собирается снижаться. Так почему же разработчики и тестировщики продолжают выбирать его? Ответ на этот вопрос я и предлагаю рассмотреть далее в статье.Насколько Python популярен?

продолжить чтение

Как влияет ИИ на производительность опытных разработчиков: исследование

TL;DR Провели РКИ на реальных задачах в крупных OSS-репозиториях: 16 опытных контрибьюторов, 246 задач (исправления, фичи, рефакторинг), на каждую задачу случайно разрешали/запрещали ИИ.Инструменты при «разрешено»: в основном Cursor Pro + Claude 3.5/3.7; при «запрещено» — обычная работа без генеративного ИИ.Главный итог: с ИИ задачи выполнялись в среднем на 19% дольше; качество PR сопоставимо между условиями.Перцепция расходится с данными: разработчики ожидали ускорение (~24%) и постфактум тоже считали, что ускорились (~20%).

продолжить чтение

Как создать AI-агента и дать ему инструменты

AI‑агенты сейчас на пике хайпа, поэтому давайте разберёмся, что это за новый зверь и как его готовить.Тема применения сервисов GenAI сейчас на хайпе, на конференциях по этой теме всегда аншлаг, а подавляющее большинство пользователей «играется» с текстовыми запросами в бесплатных сервисах, восторгаясь полученными результатами.В этой статье хочу пойти дальше и определиться с понятием AI‑агентов и показать пример создания AI‑агента с помощью системы n8n.io и популярных сервисов GenAI.Понятие AI-агента

продолжить чтение

1...8910111213...16