Блог компании OTUS. - страница 4

От Выгорания к Жизни. Как навести порядок в расписании и успевать больше

продолжить чтение

Как я выбираю LLM (large language model) для своих задач?

продолжить чтение

«Закон уплотнения» LLM: плотность способностей удваивается каждые 3,5 месяца

TL;DRПредлагается «закон уплотнения» для больших языковых моделей: максимальная плотность способностей удваивается примерно каждые 3,5 месяца. То есть всё больше качества удаётся выжать из каждого параметра модели.Вводится метрика плотности способностей: считается, сколько параметров потребовалось бы референсной модели, чтобы показать такое же качество, и это число сравнивается с реальным количеством параметров. Так видно, какие модели обучены «экономно», а какие — расточительно.

продолжить чтение

Вышла Claude Opus 4.5

24 ноября стала доступна модель Claude Opus 4.5. Anthropic позиционирует её как свою самую сильную модель для программирования, агентных сценариев и управления компьютером, а также заметно подтянула качество в повседневных задачах — от поиска и анализа информации до работы с презентациями и таблицами.Claude Opus 4.5 показывает лучшие результаты на бенчмарках, приближенных к реальной разработке (включая SWE-bench Verified).

продолжить чтение

Квантовые физики уменьшили и «освободили от цензуры» DeepSeek R1

Им удалось сократить размер ИИ-модели рассуждений более чем наполовину — и они утверждают, что теперь она может отвечать на политически чувствительные вопросы, которые раньше были под запретом в китайских ИИ-системах.TL;DR:Multiverse Computing сжала DeepSeek R1 с помощью квантово-вдохновлённых тензорных сетей: модель стала на 55% компактнее при почти той же точности. По пути они «сняли» китайскую цензуру: модифицированная версия отвечает на табуированные для китайских LLM вопросы примерно как западные модели.

продолжить чтение

Artificial Analysis обновили свой Intelligence Index

В новых тестах неожиданно выстрелил Gemini 3 Pro Preview. По половине бенчмарков у модели не просто небольшой прирост, а заметный скачок вперёд.Фактические знания и галлюцинацииGemini 3 Pro Preview занимает 1-е место в 5 из 10 тестов Artificial Analysis Intelligence Index:GPQA Diamond, MMLU‑Pro, HLE, LiveCodeBench и SciCode.Самый показательный результат — 37% в Humanity's Last Exam (сложный экзамен «на последнюю попытку человечества»). Это на 10+ п.п. выше предыдущего лучшего результата — для такого класса задач это большой отрыв, а не статистический шум.»Отдельно модель лидирует в AA‑Omniscience, новом комплексном бенчмарке знаний и галлюцинаций:

продолжить чтение

Как прокачать ИИ-агента без дообучения: Agent Skills

Claude — мощный, но реальная работа требует процедурных знаний и понимания организационного контекста. Представляем Agent Skills — новый способ создавать специализированных агентов с помощью файлов и папок.TL;DR

продолжить чтение

После десятков собесов я понял: текущий найм — сломан

2026 год на пороге. Искусственный интеллект уже не модное словосочетание, а коллега. Copilot подсказывает код в IDE, а ChatGPT помогает с архитектурой. Но наши подходы к найму техспециалистов всё ещё застряли между допросами и бесконечными этапами, которые отнимают время, но не показывают реальных навыков.Меня зовут Григорий, я разработчик. За последние несколько лет я прошел десятки собеседований с обеих сторон: и как кандидат, и как интервьюер.

продолжить чтение

Клиент иногда не прав. Современный подход к оценке клиентской ценности

Звучит так себе, но не все клиенты одинаково полезны для вашего бизнеса. Есть клиенты, которые приносят стабильную прибыль, дают конструктивную обратную связь и используют продукт в рамках задуманных сценариев. Есть клиенты прямо противоположные, которые требуют непропорционально много внимания, провоцируют конфликты, мешают развитию продукта и при этом не увеличивают доход.Задача компании — вовремя понять, какую работу продукт выполняет для конкретного сегмента клиентов, и на это ориентировать развитие сервиса и поддержку

продолжить чтение

В защиту «обычных» разработчиков

Эта статья изначально была заказана Лукой Росси для refactoring.fm 11 февраля 2025 года. Лука отредактировал материал, в ней получился акцент на важности построения «команд инженеров 10×». Позже материал забрал IEEE Spectrum — они выкинули большую часть содержания про команды и опубликовали более короткий текст.Это — моя личная редакция. Она не совпадает ни с одной из ранее выпущенных версий. В ней много исходных материалов для моего одноименного доклада (презентация

продолжить чтение

1...234567...10
Rambler's Top100