Когда нейросети заменят живых продавцов? Тест 10 LLM на умение продавать для русского рынка
Собрал бенчмарк, который меряет не «кто умнее», а «кто лучше продаёт» по-русски: тестируемая модель — продавец, жёсткий клиент — Opus, судья — тоже Opus. Прогнал первую десятку на живом B2B-диалоге.Враньё ради сделки штрафуется жёстче, чем незакрытая сделка: −15…−30 к баллу. Qwen3-235B дважды выдумал клиентские кейсы с цифрами под торгом — и потерял сделку (52 из 100, клиент ушёл).Тест выдал сенсацию: DeepSeek и GLM «обошли» эталонный Gemini, MiniMax получил 96 из 100 и S-tier. Я не поверил: под более жёстким клиентом баллы не могут вырасти. Это дрейф параллельных судей.
ИИ-детектор утечек: как работает DLP нового поколения
Средняя утечка обнаруживается через 197 дней после первого инцидента, а её цена для бизнеса — 366 млн рублей. Более 95% таких утечек в России — умышленные, и больше 60% инцидентов инициируются внутри компании. И классический DLP здесь часто бессилен: он ищет ключевые слова, заранее заданные шаблоны, расширения файлов. Сотруднику достаточно изменить имя файла на более нейтральное, вместо «передачи баз данных» написать «отправка рабочих материалов» или скопировать текст в публичный LLM — и триггер не сработает.К этому добавился новый канал риска: Shadow AI
Организация Software Freedom Conservancy (SFC) представила список рекомендаций по использованию ИИ для открытых проектов
Правозащитная организация Software Freedom Conservancy (SFC) представила список рекомендаций по использованию ИИ-систем на базе генеративных моделей машинного обучения при подготовке кода для открытых проектов. В SFC занимаются предоставлением юридической защиты свободным проектам. Организация отстаивает необходимость соблюдения лицензии GPL. По информации
Superhuman приобрела стартап GPTZero, занимающийся разработкой систем обнаружения ИИ
Superhuman объявила о приобретении стартапа GPTZero, специализирующегося на системах обнаружения искусственного интеллекта. В 2023 году стартап основал выпускник Принстонского университета Эдвард Тянь в рамках дипломного проекта.
С чего начать тестирование LLM: 5 проверок из практики
Пять проверок — первое, что я делаю на новом LLM-проекте
«Почему только Anthropic?»: Конгресс засыпал Минторг США вопросами о блокировке Fable 5
Четверо членов Палаты представителей направили письмо
Линейка для чисел: как я собрал каталог из 83 форматов с плавающей точкой — и почему у каждого есть честная статус-метка
Это вторая статья про проект GoldenFloat. Первая была про φ-лестницу форматов и троичную «Сетунь». Здесь — про инструмент, который вырос из той работы: единый, машинно-проверяемый каталог форматов чисел, где у каждого формата есть точная разрядка битов, статус-метка и битовый отпечаток. И про главную дисциплину этой работы: у каждого формата есть честная статус-метка того, насколько он проверен — вплоть до границы, где формула ещё работает, а проверенного железа уже нет.
Почему Cloud.ru решил строить свой дата-центр
Cloud.ru, который до сих пор размещал мощности исключительно на сторонних площадках, наконец решил строить собственный дата-центр. Площадка появится в Домодедово, запуск заявлен на 2027 год.По данным, которые приводят «Ведомости», речь идёт об объекте мощностью 11 МВт примерно на 890 стоек с нагрузкой до 20 кВт каждая. Уровень надёжности заявлен как TIER III. Стоимость проекта участники рынка оценивают примерно в 10 млрд рублей. Забавно, что почти одновременно Cloud.ru объявил о размещении облигационного займа ровно на такую сумму.

