Машинное обучение. - страница 75

Команда Tor Project выпустила Tor Browser 15.0a4, где удалены компоненты ИИ и элементы машинного обучения из Firefox

Команда Tor Project выпустила

продолжить чтение

Copilot сможет видеть экран, понимать голосовые команды и выполнять действия на ПК за пользователя

Microsoft объявила

продолжить чтение

RL (RLM): Разбираемся вместе

Всем привет! Недавно я познакомился с курсом по глубокому обучению с подкреплением от HuggingFace Deep Reinforcement Learning Course и захотел сделать выжимку самого интересного. Эта статья — своего рода шпаргалка по основам Reinforcement Learning (RL) и одному из ключевых алгоритмов — PPO, который лежит в основе тонкой настройки современных LLM (Large Language Models).Вы наверняка слышали про такие модели, как o1 от OpenAI или QwQ от Alibaba. Их "рассуждающие" способности во многом — результат применения RL. Давайте разберемся, как обычный принцип обучения, известный по играм вроде AlphaGo, помогает языковым моделям стать умнее.

продолжить чтение

Как роботы начинают учиться гораздо быстрее

продолжить чтение

Фрилансеры Turing Labs носят на голове GoPro для обучения ИИ

Фрилансеры компании в сфере искусственного интеллекта Turing Labs носят на голове GoPro, выполняют творческую работу и повседневные дела для обучения моделей компьютерного зрения. Отснятый материал синхронизировали, чтобы система могла получить разные ракурсы одного и того же действия. Каждый день камеры работали в течение пяти часов.

продолжить чтение

Авторы подали в суд на Salesforce из-за использования книг в обучении ИИ

16 октября компания Salesforce, занимающаяся облачными вычислениями (CRM.N), стала ответчиком по иску двух авторов, которые утверждают, что компания нарушила авторские права, использовав их работы для обучения своих моделей искусственного интеллекта xGen.

продолжить чтение

Для Кремниевой долины наступила эра «хард-тека»

Попрощайтесь с эпохой потребительских сайтов и мобильных приложений. Искусственный интеллект положил начало эре, которую инсайдеры из инновационной столицы страны именуют «хард-теком».В одной из сцен сериала HBO «Кремниевая долина» в 2014 году, персонаж, только что продавший свою идею вымышленной технологической компании, которая была лишь слегка замаскированным аналогом Google, встретил нескольких своих новых коллег, которые днем выпивали на крыше, сидя в раскладных шезлонгах. Они, как они пьяно объяснили, по сути, получали деньги ни за что, пока отрабатывали — или «вестировали» — свои опционы на акции.

продолжить чтение

Внутри vLLM: Анатомия системы инференса LLM с высокой пропускной способностью

Привет! Этот пост — перевод очень хардовой статьи про внутренности vLLM и того, как устроен инференс LLM. Переводить было сложно из-за англицизмов и отсутствия устоявшегося перевода многих терминов, но это слишком классная статья, и она обязана быть на русском языке! А дальше — слово автору:От paged attention, непрерывного батчинга, кэширования префиксов , specdec и т.д. — до мульти-GPU и мультинодового динамического сервинга LLM под нагрузкой.

продолжить чтение

Разработка MCP-сервера на примере CRUD операций

Model Context Protocol (MCP) — это открытый протокол, разработанный компанией Anthropic. Он призван унифицировать способ взаимодействия между LLM и сторонними сервисами, инструментами и источниками данных.До появления MCP каждому разработчику приходилось пилить свой велосипед для каждого сервиса. При этом один API требовал одного формата, другой — совершенно другого. А в случае изменений сервиса приходилось менять и клиентскую сторону. В общем проблем было много. MCP же оставил большинство этих проблем позади.В данной статье на примере простых CRUD-операций разберем, что такое MCP-сервер, как его создать и как подружить с LLM.

продолжить чтение

Почему линейная регрессия всё ещё обыгрывает трансформеры в анализе временных рядов

продолжить чтение

Rambler's Top100