Машинное обучение. - страница 220

Open Deep Search: как сделать открытый аналог Perplexity своими руками

продолжить чтение

Бенчмарки Llama-4, предположительно — скам на самом высоком уровне

Буквально пару дней назад, комада Llama сообщила о появлении трех новых нейронок под общим зонтиком Llama-4: быстрый Scout с контекстом 10 миллионов токенов. Медленный Maverick с контекстом 1 миллион, но 128 экспертами под капотом. И гигантский Behemoth, который использовался как учитель для предыдущих двух. 10 миллионов токенов и нахаляву — это, мягко говоря, дофига. Можно закрыть глаза и представить, как где-то там в далеком Сан-Франциско, разработчики Gemini Pro начинают искать себе новую работу сантехниками, электриками и ассенизаторами.Но вот прошла пара дней, и Царь оказался ненастоящий.

продолжить чтение

Самое заметное обновление VS Code в 2025 году. Агенты теперь доступны всем, бесплатно и с поддержкой MCP

продолжить чтение

ИИ обучился на психолога и помогает людям

Исследователи из Дартмута провели первое клиническое испытание терапевтического чат-бота на основе генеративного искусственного интеллекта (ИИ) и обнаружили, что использование ИИ привело к значительному улучшению симптомов у участников.Результаты исследования

продолжить чтение

Большая языковая модель «Авито» обогнала OpenAI и Google в бенчмарке MERA

Большая языковая модель A‑Vibe, разработанная «Авито», заняла первое место среди облегчённых моделей (до 10 млрд параметров) в российском бенчмарке MERA. Модель обошла аналоги от OpenAI, Google и Anthropic, рассказали информационной службе Хабра в пресс‑службе «Авито».Команда «Авито» разработала собственные генеративные модели A‑Vibe и A‑Vision, использовав на старте открытую модель. Open source модель плохо работала с русским языком, потому что данные включали 100 языков, а русский занимал 1%. Из‑за этого модель слабо понимала и генерировала тексты на русском.

продолжить чтение

CEO Shopify сообщил сотрудникам компании, что теперь от каждого ожидает навыков владения нейросетями

Генеральный директор Shopify Тобиас Литке (Tobias Lütke) разослал сотрудникам компании письмо, в котором сообщил, что теперь владение нейросетями считается базовым навыком, поэтому от каждого сотрудника ожидают освоения нейросетевых инструментов. Вместе с этим Литке назвал принципы эффективного использования нейросетей, которых будут придерживаться в Shopify.

продолжить чтение

Исследователи из Оксфорда предложили принципиально новый способ обучения нейросетей

Абсолютно все нейросети, которые нас окружают, обучены с помощью одного и того же алгоритма – алгоритма обратного распространения ошибки (англ. back-propagation). Его изобрели еще в 80-х годах прошлого века ученые Дэвид Румельхарт, Джеффри Хинтон (ныне нобелевский лауреат) и Рональд Уильямс. Идея back-propagation в том, что мы сначала «прогоняем» входные данные вперёд по сети (forward pass), получаем предсказания и вычисляем их ошибку, а затем прогоняем сигнал ошибки назад по сети (backward pass), чтобы вычислить градиенты и обновить веса. Это работает хорошо и надежно, но есть нюансы

продолжить чтение

VK и МФТИ объявили о запуске в сентябре 2025 года магистратуры «Искусственный интеллект и социальные медиа»

Компания VK и МФТИ объявили о запуске в сентябре 2025 года магистратуры «Искусственный интеллект и социальные медиа»​. Обучение по этой новой

продолжить чтение

Ведущий разработчик ChatGPT и его новый проект — Безопасный Сверхинтеллект

Многие знают об Илье Суцкевере только то, что он выдающийся учёный и программист, родился в СССР, соосновал OpenAI и входит в число тех, кто в 2023 году изгнал из компании менеджера Сэма Альтмана. А когда того вернули, Суцкевер уволился по собственному желанию в новый стартап Safe Superintelligence («Безопасный Сверхинтеллект»). Илья Суцкевер действительно организовал OpenAI вместе с Маском, Брокманом, Альтманом и другими единомышленниками, причём был главным техническим гением в компании. Ведущий учёный OpenAI сыграл ключевую роль в разработке ChatGPT и других продуктов. Сейчас Илье всего 38 лет — совсем немного для звезды мировой величины.

продолжить чтение

Роль модели DeepSeek в изменении подходов к разработке ИИ

Сфера ИИ продолжает стремительно развиваться, и последние достижения бросают вызов устоявшимся парадигмам. В начале 2025 года китайская лаборатория ИИ DeepSeek представила новую модель, которая произвела фурор в индустрии ИИ и привела к 17-процентному падению акций Nvidia, а также

продолжить чтение

Rambler's Top100