Машинное обучение. - страница 167

Как Claude научился файн-тюнить опенсорсные LLM

Claude получил возможность файн-тюнить языковые модели с помощью нового инструмента под названием Hugging Face Skills. Не просто писать скрипты для обучения, а реально отправлять задачи на облачные GPU, следить за прогрессом и пушить готовые модели на Hugging Face Hub. В этом туториале показано, как это работает и как использовать самому.Claude Code умеет использовать "скиллы" — упакованные инструкции, скрипты и доменные знания для выполнения специализированных задач. Скилл hf-llm-trainer

продолжить чтение

AWS делает ставку на искусственный интеллект, но компании пока не поспевают

продолжить чтение

CUDA L2 показывает, что ИИ может писать GPU ядра быстрее инженеров NVIDIA

продолжить чтение

ИИ-революция, которая вышла из-под контроля: как журналист построил компанию из ИИ‑сотрудников и что из этого вышло

продолжить чтение

OpenAI обязали передать NYT анонимизированные логи переписок пользователей

продолжить чтение

Perplexity представила BrowseSafe для защиты ИИ-браузеров от скрытых инструкций

Perplexity выпустила инструмент BrowseSafe

продолжить чтение

Google запускает Workspace Studio для создания ИИ-агентов без кода

продолжить чтение

Зрительно-языковые модели читают хуже (или лучше), чем вам кажется

Знакомство с бенчмарком ReadBench, позволяющим без труда оценить, насколько хорошо ваши любимые зрительно-языковые модели читают изображения с большими объёмами текста.В этой статье будет рассказано о ReadBench. ReadBench — это очень простой бенчмарк, который мы разработали для оценки важного, но недооценённого аспекта мультимодального ИИ: насколько хорошо моделям удаётся, собственно, читать текст на картинках, рассуждать о нём и извлекать информацию из таких изображений, на которых много текста.

продолжить чтение

Секрет, который скрывают создатели ИИ: почему галлюцинации — это не сбой, а заложенная функция

продолжить чтение

Как я программирую с помощью агентов

TL;DRАгент в контексте LLM — это не магия, а цикл, в котором модель по шагам вызывает инструменты (bash, git, тесты, web) и получает от них обратную связь.Такой агент умеет ориентироваться в живой кодовой базе, запускать компилятор и тесты, читать логи и документацию, поэтому генерирует и правит код куда надёжнее, чем «голая» модель в чате.

продолжить чтение