данные.

OpenAI сообщила об утечке данных некоторых пользователей API

OpenAI разослала письма пользователям API, чьи данные утекли из сервиса Mixpanel. Компания использует его для аналитики. Пароли, платёжные данные, история запросов и другая чувствительная информация не попала в руки злоумышленников, но у них теперь есть адреса электронной почты, имена и примерное местоположение.

продолжить чтение

Как ИИ секвенирует геном всех известных организмов

Когда я был преподом в универе в далеком 2015-том году, то вел также факультативный курс «психология трансгуманизма». На первой лекции приводил пример с секвенированием генома. А именно, что первая процедура секвенирования генома человека обошлась в 3 миллиарда долларов, без поправки на инфляцию, и длилась 13 лет. В 2015-том году секвенирование стоило 1-3 тысячи долларов, и занимало условно неделю. Сегодня искусственный интеллект ставит эту процедуру на поток. Сокращая сроки, цену и увеличивая объемы данных

продолжить чтение

TOON: новый формат на смену JSON для более эффективного взаимодействия с LLM?

TOON — это ещё один способ записать те же самые JSON-данные, но компактнее и понятнее для моделей. Вместо  "key": "value" он использует отступы как YAML и табличную запись для массивов объектов: шапка с названиями полей, дальше строки с данными.

продолжить чтение

EMNLP-2025: обзор исследований жестовых языков

Всем привет! В этом году в китайском городе Суджоу проходит юбилейная тридцатая конференция EMNLP (Empirical Methods in Natural Language Processing). Это одна из ведущих международных конференций по обработке естественного языка (NLP), проводимая под эгидой ассоциации компьютерной лингвистики ACL (Association for Computational Linguistics). 

продолжить чтение

Данные WhatsApp и Telegram для ML-моделей: тренд или серый рынок?

В этой статье я расскажу про новый тип данных для российского рынка - данные Whatsapp и Telegram: насколько они ценны и насколько легальны.

продолжить чтение

Понимание оценки LLM: детальный разбор 4 основных подходов

Привет! Вчера вышла отличная статья от Себастьяна Рашки, которая детально разбирает основные способы оценки LLM-моделей. Глобально их можно разделить на 4 категории: оценка по бенчмаркам, использование верификаторов, лидерборды и LLM-as-a-judge.

продолжить чтение

JetBrains предлагает компаниям бесплатные лицензии на IDE взамен на данные для обучения моделей

JetBrains запустила инициативу, в рамках которой предлагает компаниям делиться кодом для обучения моделей. За это компания предлагает бесплатные лицензии на свои IDE.

продолжить чтение

ИИ-агент для автоматизации описания данных

продолжить чтение

Старт IT Elements 2025 — в Москве открылась главная ИТ-конференция осени

Стартовала третья ежегодная технологическая конференция IT Elements, посвященная ключевым элементам ИТ-ландшафта — ИТ-инфраструктуре, кибербезопасности, сетям, данным и AI/ML. В первый день мероприятие посетили несколько тысяч ИТ-специалистов. 

продолжить чтение

Уже через неделю: стартует технологическая конференция IT Elements 2025

Тук-тук! Это снова IT Elements! Уже 10-11 сентября конфа состоится в третий раз.

продолжить чтение

123
Rambler's Top100