Организация датасетов с ClearML
Привет, хабр! Это уже 3-я статья про ClearML. В этой статье я рассказывал про базовый функционал ClearML, а в этой - про то, как настраивать и запускать эксперименты обучения и тестирования через веб-браузер. А теперь я бы хотел затронуть менее популярную тему — организацию датасетов.Версионирование датасетовВ ML есть такой важный тезис: "Данные — это душа модели"
Запуск ML-экспериментов через ClearML
Привет, товарищи! В предыдущем посте я рассказывал, зачем нужен менеджер ML-экспериментов, поговорили про базовый функционал ClearML. А теперь мы рассмотрим, как можно создавать эксперименты, их настраивать, ставить в очередь и запускать прям из веб-браузера. Кроме того, возникает необходимость автоматически обучать/переобучать модель по расписанию. Для того, чтобы это осуществить в ClearML существуют 2 ключевых концепта:Воркеры и очередиДля запуска эксперимента по обучению или тестированию его нужно сначала поставить в очередь
ML-эксперименты проще с ClearML
В этой статье поговорим про мощный инструмент для организации ML-экспериментов (и не только) с помощью платформы ClearML. Как с помощью нее проводить исследования «по фэншую». Но для начала давайте ответим на следующий вопрос...Зачем вообще нужен менеджер экспериментов?Кто имеет четкое понимание по этому вопросу, могут скипнуть эту секцию. Начать стоит с того, что обучение моделей — это всегда эксперименты с непредсказуемым исходом. Да, докинув новых данных или взяв нейронку пожирнее, мы можем рассчитывать
Помощник читателя: визуализируем сюжет
В текущих кодогенеративных реалиях создать что-то новое с нуля до уровня худо-бедной демонстрации стало предательски просто. Только успевай доходчиво формулировать свои хотелки, да вовремя давать по рукам бездушной LLM. Посему делюсь результатами воскресного вайбкодинга — концепцией ai-помощника для анализа текста. В первую очередь художественного.Откуда растут ноги.
Sourcetable — таблицы с ИИ под капотом, привлекли $4,3 миллиона инвестиций
Стартап Sourcetable из Сан-Франциско объявил сегодня утром о запуске первой в мире «self-driving таблицы» и привлечении $4,3 миллиона посевных инвестиций. Раунд возглавил фонд Bee Partners при участии технического директора Hugging Face Жюльена Шомона, сооснователя GitHub Тома Престон-Вернера и ведущего архитектора MongoDB Роджера Бэмфорда.
Judge-Image от Patronus AI стремится сделать ИИ честным — и Etsy уже внедрила эту технологию
Patronus AI представила мультимодальную языковую модель-судью (MLLM-as-a-Judge) — инструмент, предназначенный для оценки ИИ-систем, интерпретирующих изображения и генерирующих текст.
Фонд Arc Prize представил новый AGI-тест, который ставит в тупик большинство ИИ-моделей
Фонд Arc Prize, некоммерческая организация, сооснованная видным исследователем ИИ Франсуа Шолле, объявил в блоге в понедельник о создании нового, сложного теста для измерения общего интеллекта ведущих моделей искусственного интеллекта.Пока что новый тест, получивший название ARC-AGI-2, оказался непосильным для большинства моделей.По данным таблицы лидеров
В городке Купертино что-то прогнило
За два десятилетия моей работы в этой сфере я никогда не был так зол на себя за пропущенную историю, как в пятницу, когда Apple объявила, что «более персонализированные функции Siri» в Apple Intelligence, которые должны были появиться в период до WWDC, будут отложены до «следующего года».Мне следует проверить голову.
Состояние моделей рассуждения LLM
Часть 1: Методы масштабирования вычислительной мощности во время выводаУлучшение способностей к рассуждению больших языковых моделей (LLM) стало одной из самых обсуждаемых тем в 2025 году – и не без оснований. Улучшенные навыки рассуждения позволяют моделям решать более сложные задачи, что делает их полезными в самых разных областях, интересных пользователям.

