backpropagation.

Автодифференцирование на C++: обратное распространение через лямбды и std::function

Привет, Хабр! Меня зовут Кирилл Колодяжный, я разрабатываю системы хранения данных в YADRO. Это третья, заключительная часть моего цикла о паттернах C++, которые я применяю для решения задач машинного обучения, а вы можете использовать и в другой работе. В этой статье поговорим, как построить вычислительные графы и реализовать обратное распространение ошибки без сложных иерархий классов, с помощью лямбда-функций и стандартной библиотеки.

продолжить чтение

Оставлено в

SoftMax: как нейросети превращают сырые числа в уверенные вероятности — разбор с примерами и математикой

продолжить чтение

Оставлено в

Нейро сети для самых маленьких. Часть нулевая. Обзорная

Каждый раз, когда вы говорите нейросети «Спасибо», вы запускаете конвейер, в котором перемножаются сотни матриц с миллиардами элементов, и сжигаете электричества столько же, сколько светодиодная лампа за несколько секунд.Это первая статья из небольшого цикла, посвящённого сетям для AI/ML-кластеров и HPC.В этой серии мы коснёмся принципов работы и обучения моделей, параллелизации, технологий DMA и RDMA, сетевых топологий, InfiniBand и RoCE, а ещё пофилософствуем на тему общих и специальных решений.

продолжить чтение

Оставлено в

Обучение скрытых слоёв S–A–R перцептрона без вычисления градиентов

C. Яковлев mg.sc.comp e-mail: tac1402@gmail.comDisclaimer. Это анонс, я еще работаю над научной статьей, но пока не могу найти ментора для возможности публикации в arxiv.org. Но пока хочу поделится с вами некоторыми сырыми результатами. Аннотация.

продолжить чтение

Оставлено в

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

Сложно следить за околонаучными темами, и понимать, что ветка эволюции научного направления пошла не туда. Сейчас случился некий бум псевдонаучного взлета LLM, и я приведу в качестве современной статьи на хабре лишь одну, но это по прежнему массовое явление. Например, в статье компании Friflex за 2024 год История LLM-агентов: 10 ярких моментов по прежнему утверждается "

продолжить чтение

Оставлено в

NoProp: Реальный опыт обучения без Backprop – от провала к 99% на MNIST

Всем привет! Обучение нейронных сетей с помощью обратного распространения ошибки (backpropagation) — это стандарт де‑факто. Но у него есть ограничения: память, последовательные вычисления, биологическая неправдоподобность. Недавно я наткнулся на интересную статью «NOPROP: TRAINING NEURAL NETWORKS WITHOUT BACK‑PROPAGATION OR FORWARD‑PROPAGATION» (Li, Teh, Pascanu, arXiv:2403.13 502), которая обещает обучение вообще без сквозного backprop и даже без полного прямого прохода во время обучения! Идея показалась захватывающей, и мы (я и ИИ‑ассистент Gemini) решили попробовать ее реализовать на PyTorch для MNIST.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

backpropagation.

Автодифференцирование на C++: обратное распространение через лямбды и std::function

SoftMax: как нейросети превращают сырые числа в уверенные вероятности — разбор с примерами и математикой

Нейро сети для самых маленьких. Часть нулевая. Обзорная

Обучение скрытых слоёв S–A–R перцептрона без вычисления градиентов

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

NoProp: Реальный опыт обучения без Backprop – от провала к 99% на MNIST

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

backpropagation.

Автодифференцирование на C++: обратное распространение через лямбды и std::function

SoftMax: как нейросети превращают сырые числа в уверенные вероятности — разбор с примерами и математикой

Нейро сети для самых маленьких. Часть нулевая. Обзорная

Обучение скрытых слоёв S–A–R перцептрона без вычисления градиентов

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

NoProp: Реальный опыт обучения без Backprop – от провала к 99% на MNIST