Данные WhatsApp и Telegram для ML-моделей: тренд или серый рынок?
В этой статье я расскажу про новый тип данных для российского рынка - данные Whatsapp и Telegram: насколько они ценны и насколько легальны.
Понимание оценки LLM: детальный разбор 4 основных подходов
Привет! Вчера вышла отличная статья от Себастьяна Рашки, которая детально разбирает основные способы оценки LLM-моделей. Глобально их можно разделить на 4 категории: оценка по бенчмаркам, использование верификаторов, лидерборды и LLM-as-a-judge.
JetBrains предлагает компаниям бесплатные лицензии на IDE взамен на данные для обучения моделей
JetBrains запустила инициативу, в рамках которой предлагает компаниям делиться кодом для обучения моделей. За это компания предлагает бесплатные лицензии на свои IDE.
Старт IT Elements 2025 — в Москве открылась главная ИТ-конференция осени
Стартовала третья ежегодная технологическая конференция IT Elements, посвященная ключевым элементам ИТ-ландшафта — ИТ-инфраструктуре, кибербезопасности, сетям, данным и AI/ML. В первый день мероприятие посетили несколько тысяч ИТ-специалистов.
Уже через неделю: стартует технологическая конференция IT Elements 2025
Тук-тук! Это снова IT Elements! Уже 10-11 сентября конфа состоится в третий раз.
Важность качества данных при внедрении ERP
Что такое качество данных и его влияние на бизнесВ эпоху цифровой трансформации данные стали стратегическим активом. Однако их ценность напрямую зависит от качества. По данным Gartner, ежегодные потери компаний из-за плохого качества данных составляют в среднем $15 миллионов. Особенно критично это при внедрении ERP-систем, где данные становятся основой для всех бизнес-процессов.Определение качества данных
Правильное внедрение BI: почему одни проекты проваливаются, а другие приносят результат
Команда Luxms выступила в Торгово-промышленной палате Московской области. Дмитрий Русаков, руководитель маркетинговых проектов Luxms BI, рассказал, что главная причина неудачных BI-проектов — отсутствие системной подготовки: нет сценариев принятия решений, владельцев данных и культуры работы с ними.
Reddit заблокирует доступ к Internet Archive
Reddit заявляет, что компании, занимающиеся ИИ, извлекают данные из Wayback Machine в нарушение правил платформы, поэтому собирается запретить Internet Archive индексировать большую часть Reddit, сообщает The Verge.
Если нужно сгенерировать синтетические данные — подборка открытых решений
Про снижение расходов на работу с данными расскажем

