BERT — это всего лишь одноэтапная диффузия текста
Некоторое время назад компания Google DeepMind представила Gemini Diffusion — экспериментальную языковую модель, генерирующую текст методом диффузии. В отличие от традиционных моделей, написанных в стиле GPT и генерирующих слово за словом, Gemini создаёт текст целыми блоками, пошагово уточняя случайный шум.Я прочитал статью «Large Language Diffusion Models» — и с удивлением узнал, что дискретная диффузия языка представляет собой просто обобщение метода генерации пропущенного токена (MLM), практикуемого уже с 2018
Как в России проводят хакатоны
История одной команды и всесторонний анализ хакатон движения в России, обмен опытом, продуктовый подход и мечты о будущем.В 2018 правительство Москвы провело первый государственный хакатон. Событие культовое, т.к. именно с этого мероприятия начало формироваться российское сообщество хакатонщиков.
Как автоматизировать тестирование батч-моделей? Гайд
Всем привет, меня зовут Дмитрий, я — MLE в Альфа-Банке, занимаюсь автоматизацией процессов и оптимизацией моделей, ищу в моделях проблемы и решаю их.
OpenAI покупает Sky — ИИ-интерфейс для Mac
OpenAI объявила о приобретении компании Software Applications, разработавшей интерфейс на базе искусственного интеллекта для Mac под названием Sky. Этот продукт пока не выпустили публично. Sky видит происходящее на экране устройства и выполняет действия в приложениях автоматически, подобно браузерам с ИИ.
к.т.н. Страннолюбов, или Как я перестал бояться и провёл соревнование по программированию на Эльбрусе
Здравствуйте, друзья, меня зовут Ерохин Кирилл, я программист‑любитель, и в этом сентябре я втихаря провёл соревнование по алгоритмическому программированию на C/C++ под платформу «Эльбрус» (e2k), собрав 31 участника со всей России, результатами которого я решил поделиться с вами. А Хабр мне в этом поможет, ему не впервой. Оглавление:Предыстория, которую можно пропуститьПодготовка к соревнованиюЦелевая аудиторияВремя проведенияИнструментарий
ТОП-10 ошибок при работе с нейросетями: как не тратить время впустую
Доброго времени суток, «Хабр»!Сижу и понимаю, что в моём профиле уже висит приличное количество статей на тему нейросетей вообще. Конечно, мой список нельзя сравнить с теми авторами, кто уже год и больше публикуют свои работы, но для меня это уже достижение. Немного отвлекся, продолжим: рассмотрел я уже разные темы — от простых историй развития искусственного интеллекта до подробностей архитектуры и техники составления промтов.Сегодня мы поговорим о десяти ошибках при работе с нейросетями
АрдуЛисп: революционное решение в области образовательной робототехники
АрдуЛисп – это революционное решение для олимпиадной и соревновательной образовательной робототехники, основанное на использовании блочного языка программирования и скриптового языка программирования – ЛИСП. Интерфейс программы АрдуЛисп
Как мир регулирует ИИ
К 2025 году в мире искусственного интеллекта уже больше нормативных документов, чем рабочих моделей. США публикуют руководства для безопасного использования LLM, Европа принимает AI Act, в ОАЭ и Сингапуре появляются свои принципы ответственного ИИ. Россия тоже не стоит в стороне и нормативные требования активно у нас разрабатываются.Уже действующие и готовящиеся нормы ЕС, США, Китая и России требуют от ИБ не просто контроля моделей, но и полноформатного аудита, документирования и управления реальными угрозами. Мы в HiveTrace
