BERT — это всего лишь одноэтапная диффузия текста
Некоторое время назад компания Google DeepMind представила Gemini Diffusion — экспериментальную языковую модель, генерирующую текст методом диффузии. В отличие от традиционных моделей, написанных в стиле GPT и генерирующих слово за словом, Gemini создаёт текст целыми блоками, пошагово уточняя случайный шум.Я прочитал статью «Large Language Diffusion Models» — и с удивлением узнал, что дискретная диффузия языка представляет собой просто обобщение метода генерации пропущенного токена (MLM), практикуемого уже с 2018
Ограничение контекстного окна GPT-5 и его эффективное использование в Bothub
Доброго времени суток, «Хабр»!В сегодняшней статье мы разберемся в ограничениях контекстного окна GPT-5, рассмотрим его применение относительно Bothub и ответим на вопрос: как повысить эффективность?Присаживайтесь поудобнее, я начинаю свое повествование.
Как «программировать» свои сны: техники осознанности и алгоритмы ночного сознания
Мы привыкли воспринимать сон как что-то пассивное: лёг, заснул, проснулся. Но на самом деле — это среда, в которой можно что-то делать. Более того, есть техники, позволяющие буквально «программировать» свои сны. В этой статье я попробую объяснить, как осознанность во сне можно рассматривать через призму алгоритмов, чем это похоже на инженерные задачи и какие инструменты можно «позаимствовать» из мира IT.В прошлой статье я писал про алгоритмы сна и то, почему мозг оптимизирует ресурсы именно так, а не иначе. Многие в комментариях заметили: «А что, если эти алгоритмы можно ещё и настраивать?» — и это очень правильный вопрос.
Философия Kaizen на производстве: как идеи инженеров экономят миллионы
Многие считают, что для больших изменений в процессах нужны большие ресурсы и масштабные проекты. Но реальность часто доказывает обратное: именно маленькие улучшения на рабочем месте, предлагаемые сотрудниками, приводят к заметным результатам. Меня зовут Константин Янушевский, я руководитель проектов по бережливому производству в YADRO
Алгоритмы сна: почему мозг «оптимизирует» ресурсы именно так, а не иначе
Эта статья появилась у меня не из научной злости и не для демонстрации умных слов, а чтобы вы улыбнулись и отвлеклись от бесконечных тасков и дедлайнов. Сон — это ведь не только про отдых. Это nightly build организма, где мозг одновременно админ, тестировщик и аналитик. Я попробую рассказать о фазах сна так, будто это техпроцесс с пайплайнами, кешами и кодом. Возможно, где-то вы узнаете себя и свои проекты.Сон как nightly build
ТОП-10 сервисов для консультации по матрице судьбы с опытными специалистами
Личный обзор сервисов, на которых я сделал онлайн расчёты матрицы судьбы с живыми экспертами: сравниваю глубину расшифровки, цены, бонусы и делюсь, как извлечь максимум пользы.
Как мы ускорили заливку данных в YDB в 40 раз
Привет! С вами Кабанов Олег — ведущий ML-инженер Flocktory.В этой статье расскажу об опыте внедрения YDB в качестве хранилища для ML Online Feature Store. А также о том, как нам удалось ускорить загрузку данных в 40 раз и убрать влияние на скорость чтения данных при обновлении.
Алгоритмы в повседневной жизни
Алгоритмы – это просто пошаговые инструкции для решения задачи. И если вы когда-либо собирали шкаф из IKEA, вы уже применяли алгоритм. Только без багов (надеюсь).В этой статье не будет заумных сортировок массивов или хэш-таблиц в терминах C++. Вместо этого – про эффективное использование пространства и экономию времени в привычных вещах: поиска одежды, уборки квартиры и планирования дня.СодержаниеСортировка: порядок в шкафу и в головеПараллелизмКэшированиеУправление задачами
Иллюстрированное руководство по Claude (I): Профессиональная команда через Subagents
Ваше взаимодействие с Claude Code всё ещё ограничивается простой схемой «ввод команды -> ожидание выполнения -> проверка результата»? Если это так, то вы, вероятно, упускаете его истинный потенциал. С сегодняшнего дня я запускаю серию уроков «Визуальное руководство по продвинутым методам работы с Claude Code», которая поможет вам исследовать те расширенные функции Claude Code, которые требуют первоначальных усилий для освоения, но после овладения ими значительно повышают эффективность работы. По сравнению с официальными руководствами, данная серия ставит перед собой цели:Более подробно

