Книга: «Анализ данных с LLM. Текст, таблицы, изображения и аудио»
Привет, Хаброжители!
Критерии выживания и случайность — 5
Предыдущие статьи цикла.Случайность — другое имя БогаПовезло или сам добился? Как оценить?Критерии выживания и случайностьКритерии выживания и случайность - 2Критерии выживания и случайность - 3Критерии выживания и случайность - 4Сквозной тезис этой статьи держится на одном неудобном сочетании:
ИИ-боты сканируют даже логи TLS-сертификатов. Любая информация используется для обучения LLM
Согласно статистическому отчёту State of AI Traffic от компании по компьютерной безопасности Human Security, за последний год резко увеличилась активность ИИ-агентов, ботов и ИИ-инструментов в интернете.Например, трафик от ИИ-агентов увеличился почти в 80 раз (на 7851%), трафик от ИИ-скраперов — на 597%. Весь ИИ-трафик за последний год увеличился на 187%, а в целом он растёт в восемь раз быстрее, чем человеческий.
Anthropic будет платить xAI $1,25 млрд в месяц за вычислительные мощности
Anthropic заключила крупную сделку на покупку вычислительных мощностей у xAI. Компания получит доступ к 300 МВт compute — фактически ко всей мощности дата-центра Colossus 1 рядом с Мемфисом, штат Теннесси.
Как создать свой бенчмарк: 6 уроков с туториала NeurIPS
Посмотрела Туториал NeurIPS «The Art of Benchmarking» — панель с авторами SWE-bench, GPQA и ведущими исследователями из Google DeepMind, NYU и Berkeley. Вот мой конспект. Делюсь с вами, так как бенчмарки теперь не только про науку, но и про безопасность, регуляторику и миллиардные решения о деплое.* Тирания метрикОказывается, любая метрика имеет honey spots, которые модель может хакнуть. Проблема в том, что текущая мета-оценка (корреляция Пирсона) эти точки не показывает. А если метрика становится еще и reward'ом при обучении — могут быть проблемы* Про долговечность

