глубокое обучение.

Как устроено глубокое обучение нейросетей

Глубокое обучение — Подход в машинном обучении, основанный на многослойных нейронных сетях. Нейронные сети, в свою очередь, вдохновлены биологическими нейронами, которые взаимодействуют между собой, образуя структуры, способные обрабатывать информацию, анализировать её и выполнять классификацию, генерировать текст и много чего ещё. Модели глубокого обучения это те же нейронные сети, но с огромным количеством слоёв, каждый из которых выполняет свою функцию по обработке данных.

продолжить чтение

Оставлено в

Как прямая помогает обучать машины

В контексте компьютеров, обучение — это всего лишь превращение плохих догадок в более качественные. В этом посте мы увидим, что всё начинается с прямой линии: линейная регрессия даёт первую догадку, а градиентный спуск продолжает её улучшать.Давайте начнём с чего-то близкого нам: цен на недвижимость. Большие дома стоят больше, маленькие — меньше. Подобный паттерн можно заметить даже без анализа: чем больше места, тем дороже.Если создать график цен, то его форма будет очевидной: идущая вверх нечёткая кривая с долей шума, но вполне определённым трендом.

продолжить чтение

Оставлено в

Больше данных — ровнее ландшафт нейросетей

Представьте себе, что обучение нейросети – это путешествие по пересечённой местности, где высота рельефа соответствует величине функции потерь

продолжить чтение

Оставлено в

«Чистый берег»: как нейросеть в облаке помогает с уборкой побережья Камчатки и Арктики

Ежегодно в Мировой океан попадает более 11 млн тонн пластика

продолжить чтение

Оставлено в

Как мы освободили операторов от классификации текстов диалогов на 1000+ классов

Всем привет! Меня зовут Наумов Герман, я работаю в Лаборатории машинного обучения Альфа-Банка, и я расскажу, как мы автоматизировали внутренние процессы, упростили работу операторов чата с физическими лицами. Задача не особо простая и тюнингом гиперпараметров как на Kaggle не решается. Но решается.

продолжить чтение

Оставлено в

Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2

Привет! Некоторое время назад я начал искать истоки термина «Deep Learning». Тогда я изучал только зарубежные источники и обещал вернуться позже с обзором советской и российской литературы. Что ж, откладывать это больше нельзя. Посмотрим, на кого будут ссылаться отечественные авторы в том, что касается истории развития глубокого обучения. Без долгого вступления — берем в руку пальцы Ctrl/Cmd+F и начинаем раскопки!

продолжить чтение

Оставлено в

Вышла Llama 4 с контекстным окном в 10M токенов (в 50 раз больше конкурентов)

Meta представила новое поколение открытых моделей искусственного интеллекта — семейство Llama 4. Это первые нативно мультимодальные модели с открытыми весами, которые объединяют понимание изображений, видео и текста в единой архитектуре.P.S кратко написал об этом в Телеграм канале, ссылка на постКлючевые особенности новых моделей1. Llama 4 Scout

продолжить чтение

Оставлено в

Как мы оживили DPED: ИИ-проект для улучшения мобильных фото до снимков с «зеркалок»

Привет, Хабр! На связи команда регионального научно-образовательного центра «Искусственный интеллект и анализ больших данных» при НГТУ им. Р. Е. Алексеева.Сегодня практически у каждого крупного производителя смартфонов есть собственные системы улучшения качества фотографий, основанные на искусственном интеллекте. Помимо этого, существует множество аналогичных открытых моделей нейросетей. Возникает вопрос: зачем тогда мы решили оживить

продолжить чтение

Оставлено в

Свёрточные нейронные сети: от основ до современных технологий

Привет, Хабр! Я подготовил для вас подробную статью о свёрточных нейронных сетях (Convolutional Neural Networks, CNN) — мощном инструменте машинного обучения, который изменил подход к обработке изображений. Моя цель — объяснить, как работают CNN, начиная с базовых понятий для новичков и заканчивая практическими примерами и сравнением с современными технологиями вроде Vision Transformers. Мы разберём их устройство, процесс обучения, популярные архитектуры и даже напишем код на Python. Давайте начнём!1. Введение

продолжить чтение

Оставлено в

От генерации к рассуждению: эволюция языковых моделей от GPT до RL

АбстракцияВ контексте стремительного развития больших языковых моделей (LLM) особое внимание уделяется повышению их способности к логическим рассуждениям. Одним из значимых достижений в этой области является модель DeepSeek-R1, разработанная для стимулирования reasoning-способностей LLM с помощью методов обучения с подкреплением (Reinforcement Learning, RL). DeepSeek-R1 представляет собой инновационный подход, направленный на улучшение качества генерации ответов в задачах, требующих многошаговых логических выводов.Основные характеристики DeepSeek-R1DeepSeek-R1 относится к классу reasoning-моделей, таких как OpenAI o1/o3,

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

глубокое обучение.

Как устроено глубокое обучение нейросетей

Как прямая помогает обучать машины

Больше данных — ровнее ландшафт нейросетей

«Чистый берег»: как нейросеть в облаке помогает с уборкой побережья Камчатки и Арктики

Как мы освободили операторов от классификации текстов диалогов на 1000+ классов

Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2

Вышла Llama 4 с контекстным окном в 10M токенов (в 50 раз больше конкурентов)

Как мы оживили DPED: ИИ-проект для улучшения мобильных фото до снимков с «зеркалок»

Свёрточные нейронные сети: от основ до современных технологий

От генерации к рассуждению: эволюция языковых моделей от GPT до RL

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

глубокое обучение.