обучение нейросетей.

За кулисами нейросетей: полный цикл тренировки языкового ИИ

Ты уже пользуешься языковыми моделями — спрашиваешь, генерируешь, отлаживаешь код. Но откуда берётся сама способность отвечать? Не «где хранятся данные», а именно — как из случайно инициализированной матрицы чисел вырастает нечто, способное объяснить теорему Гёделя, написать резюме или найти баг в чужом коде?Ответ не в магии и не в «огромной базе данных». Под капотом — три последовательных этапа обучения. Каждый решает строго свою задачу, и без предыдущего следующий просто невозможен. Разберём каждый по очереди.Этап первый: предобучение — строим фундамент

продолжить чтение

Оставлено в

Meta* сократила планы отслеживания нажатий клавиш сотрудниками после внутреннего протеста

Meta* частично свернула программу Model Capability Initiative (MCI) — слежки за нажатиями клавиш и движениями мыши сотрудников — после нескольких недель внутреннего протеста. Об этом сообщает Neowin со ссылкой на внутреннее письмо компании.

продолжить чтение

Оставлено в

ClearML Agent: обучение модели в Google Colab

ClearML — это целый космос, так что мы продолжаем разбирать его компоненты. В прошлой статье

продолжить чтение

Оставлено в

Meta* установит работникам программу слежки за движением мыши и использованием клавиатуры

Meta* установит

продолжить чтение

Оставлено в

Почему ИИ в биологии — риск системных галлюцинаций?

Почему в биологических проектах уверенность нейронок часто опережает реальное научное понимание, и какие выводы из этого стоит сделать разработчикам.Главный триумф AI в биологии - AlphaFold. Проект не возник из ниоткуда, он опирается на Protein Data Bank PDB

продолжить чтение

Оставлено в

Британские писатели запустили логотип Human Authored для произведений, созданных без использования ИИ

Объединение писателей, иллюстраторов и переводчиков Великобритании (Society of Authors, SoA) запустило логотип Human Authored, который позволит читателям распознавать книги, написанные людьми без использования ИИ. Логотип предлагается размещать на задней обложке.

продолжить чтение

Оставлено в

Как спасти ИИ в эпоху, когда ИИ убивает сам себя?

«Все крупные корпорации и социальные сети уже давно хотят помечать контент, созданный искусственным интеллектом, отдельным специальным признаком. Безусловно, можно говорить о том, что это делается ради заботы о пользователях — чтобы люди не сидели бесконечно и не потребляли абсолютно одинаковый контент. Но у этой инициативы есть и совершенно эгоистичные цели: платформам жизненно необходимо физически отделить контент, созданный живыми людьми, от материалов, сгенерированных нейросетями».Давайте детальнее копнем в проблему

продолжить чтение

Оставлено в

Апофатический ИИ: Почему нейросети учатся через «НЕТ», и как синтетические данные убивают смысл

Современное обучение нейросетей часто напоминает алхимию. У нас есть работающие рецепты, но как именно статистическая модель превращает терабайты текста в понимание до сих пор непонятно.Почему возможно сублиминальное обучение (передача паттернов через шум)? Почему обучение на синтетических данных приводит к деградации, даже если данные кажутся качественными?

продолжить чтение

Оставлено в

Видеть и лес, и деревья. Новая модель мозга, созданная на основе искусственного интеллекта, раскрывает природу обучения

Когда речь идет про моделирование работы мозга, то возникает проблема «не видеть лес за деревьями». Модель каждого, взятого по отдельности нейрона, может работать достаточно хорошо. Можно даже связать их в достаточно стабильную нейронную цепь. Но дальнейшее моделирование «поведения, близкого к реальному», становится вызовом. До сегодняшнего дня.

продолжить чтение

Оставлено в

Дифференциальная приватность в ML

Привет, Хабр! Сегодня поговорим в коротком формате о защите данных при обучении моделей, а именно в процессе обучения. Никому не понравится, если ваша нейросеть вдруг выдаст чужие паспортные данные или медицинские записи, правда? А ведь модели машинного обучения иногда склонны запоминать кусочки обучающего набора. Бывали случчаи, где из языковой модели вытаскивали строки с номерами телефонов и email тех людей, чьи данные были в тренировочном датасете. Стоит ли нам вообще кормить модель конфиденциальной информацией

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

обучение нейросетей.

За кулисами нейросетей: полный цикл тренировки языкового ИИ

Meta* сократила планы отслеживания нажатий клавиш сотрудниками после внутреннего протеста

ClearML Agent: обучение модели в Google Colab

Meta* установит работникам программу слежки за движением мыши и использованием клавиатуры

Почему ИИ в биологии — риск системных галлюцинаций?

Британские писатели запустили логотип Human Authored для произведений, созданных без использования ИИ

Как спасти ИИ в эпоху, когда ИИ убивает сам себя?

Апофатический ИИ: Почему нейросети учатся через «НЕТ», и как синтетические данные убивают смысл

Видеть и лес, и деревья. Новая модель мозга, созданная на основе искусственного интеллекта, раскрывает природу обучения

Дифференциальная приватность в ML

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

обучение нейросетей.