Машинное обучение. - страница 72

«Языковые модели не приведут к AGI»: лауреат Тьюринга поспорил с Амодеи и Хассабисом в Давосе

Янн ЛеКун, лауреат премии Тьюринга и бывший главный учёный Meta по ИИ, на площадке AI House в Давосе 

продолжить чтение

TikTok в США официально стал американским активом

Сделка по продаже американского бизнеса TikTok завершена и получила одобрение сразу двух правительств, США и Китая. Платформа продолжит работу в стране, но уже в новом юридическом и акционерном формате.

продолжить чтение

Китай вводит «пакетное условие» на покупку ускорителей Nvidia

продолжить чтение

Apple готовит носимый ИИ-гаджет в формате AirTag

Apple активно готовится зайти в рынок персональных ИИ-устройств и, судя по утечкам, делает ставку на максимально компактный форм-фактор. Компания разрабатывает носимый ИИ-гаджет размером примерно с AirTag, который можно будет крепить к одежде или аксессуарам.

продолжить чтение

Как создать чат-бота с LLM?

Это уже четвертая часть статей по разработке AGI, и в предыдущих частях мы обсуждали теоретические и философские аспекты тех или иных вопросов, с ними всегда можно ознакомиться здесь. Сегодня же речь пойдёт о практике.Что получилось в иогеА зачем?

продолжить чтение

Лагранжевы нейронные сети: моделирование физических систем при помощи ИИ

Сегодня хочу вам рассказать про один интересный вид нейронных сетей в физически-информированном машинном обучении (PIML). Одной из задач PIML является поиск решений уравнений динамики. Физику или в общем случае некоторые знания можно интегрировать в нейронную сеть несколькими различными способами. Сегодня мы рассмотрим вариант, как физические законы используются в архитектурных решениях нейронных сетей, а именно лагранжеву нейронную сеть.Прежде чем перейти непосредственно к ее архитектуре, давайте немного вспомним, что такое лагранжиан и зачем он нужен.Лагранжева механика

продолжить чтение

Где разместить новую станцию зарядки для электромобилей или как работать с геоэмбеддингами

В этой статье мы рассмотрим решение задачи поиска оптимальной локации для электрозарядных станций с помощью открытых данных, методов геоаналитики и алгоритмов классического машинного обучения.Что такое оптимальная локация?Под оптимальной локацией для размещения любого объекта инфраструктуры понимают такую локацию, где она будет пользоваться спросом у конечных потребителей. По опросам BCG EV Charging Survey

продолжить чтение

The Assistant Axis. Почему LLM съезжают с катушек и как Anthropic предлагает это чинить

продолжить чтение

Разбор Weight Decay: Как регуляризация не стирает, а фиксирует старые знания

В предыдущей статье я обратил внимание на интересное поведение Weight Decay, здесь я рассматриваю его более подробно. В индустрии ML принято считать: если мы берем обученную модель и делаем Fine-Tuning на новой задаче, старые веса постепенно перезаписываются. А если добавить Weight Decay (L2-регуляризацию), то процесс забывания лишнего должен идти еще быстрее.Я проверил это утверждение экспериментально. Результаты оказались контринтуитивными: при определенных настройках Weight Decay работает ровно наоборот — защищает старую структуру от разрушения.

продолжить чтение

Распространенные ошибки при создании приложений с генеративным ИИ

Поскольку мы все еще только осваиваем создание приложений с использованием базовых моделей, ошибки вполне нормальны. Это краткая заметка с примерами некоторых из наиболее распространенных ошибок, которые я видел как в публичных кейсах, так и в своем личном опыте.Эти ошибки являются распространенными, поэтому, если вы работали над каким-либо  продуктом, связанным с ИИ, вы, вероятно, уже сталкивались с ними.1. Использовать генеративный ИИ там, где он не нужен

продолжить чтение

Rambler's Top100