Машинное обучение. - страница 55

AI-пузырь лопается: как NVIDIA потеряла $500 млрд и при чём здесь Oracle

Сначала это случилось с Oracle, теперь пугающе похожее происходит с NVIDIA.

продолжить чтение

В репозитории Transformers появился PR с Qwen 3.5

Компания Alibaba Cloud, подразделение технологического гиганта Alibaba Group, инициировала процесс интеграции своей новой базовой модели Qwen 3.5 в популярную библиотеку Transformers. Подача заявки на включение программного кода свидетельствует о скором выходе следующего поколения нейросетей от команды Tongyi Qianwen. Новая итерация алгоритмов призвана укрепить позиции компании на рынке решений с открытым исходным кодом, предлагая продвинутые мультимодальные возможности.

продолжить чтение

Alibaba запустила Qwen-Image-2.0 — нейросеть для презентаций, инфографики и комиксов

Компания Alibaba представила Qwen-Image-2.0 - модель нового поколения для работы с изображениями. Это универсальная омни-нейросеть, которая в одной архитектуре объединяет генерацию с нуля и редактирование готовых картинок и сразу работает в нативном 2K-разрешении.

продолжить чтение

OpenAI готовится к новому раунду финансирования

В то время как OpenAI сталкивается с растущим давлением со стороны конкурирующей компании Anthropic, предлагающей улучшенные инструменты для написания кода, генеральный директор Сэм Альтман заявляет сотрудникам и инвесторам, что его компания не сбавляет обороты.

продолжить чтение

LLM‑разметка в поиске: от эксперимента к инструменту

Привет! Меня зовут Александр Баранов, я аналитик данных в команде поиска Купера. Цель этого рассказа, поделиться наработками в деле оптимизации разметки текстовых данных при помощи большой языковой модели (LLM). Если после прочтения вы захотите что-то добавить или спросить, буду только рад!

продолжить чтение

Я измерил «личность» 6 open-source LLM (7B-9B), заглянув в их hidden states. Вот что получилось

У LLM есть устойчивые «личности», даже если вы об этом не просили. DeepSeek — восторженный друг, который объясняет всё в три раза подробнее, чем нужно. Llama — пугающе нейтральный (4 из 7 осей в «слабой зоне»). Yi — слегка холодный, терпеливый и уверенный. У каждой модели свой измеримый «отпечаток» в hidden states.Под «личностью» дальше имею в виду устойчивые стилевые тенденции, измеряемые в hidden states, — не «чувства» и не внутренние состояния.TL;DR

продолжить чтение

СМИ рассказали об ошибках в работе медицинских устройств с ИИ

Reuters выпустило публикацию, посвящённую тому, как с расширением внедрения искусственного интеллекта в медицинское оборудование растёт и число сообщений о хирургических ошибках или ошибках при распознавании анализов.

продолжить чтение

Как мы учим роботов понимать физический мир: путь от специалистов к генералистам

продолжить чтение

SaaSpocalypse: технологии AI ломают бизнес-модель SaaS?

Когда-то программное обеспечение «съело мир». Теперь Уолл-стрит всерьёз обсуждает другой сценарий: а что, если искусственный интеллект начнет поедать само программное обеспечение — его бизнес-модели, доходность и прибыль?

продолжить чтение

Claude Cowork попросили «навести порядок» на десктопе — ИИ удалил семейные фото за 15 лет

Американский венчурный инвестор Ник Давидов поделился

продолжить чтение

Rambler's Top100