модерация.

GLiNER Guard: один schema-driven энкодер вместо зоопарка LLM-гардрейлов

Эта статья - адаптация моего материала, опубликованного на Towards AI, и одновременно продолжение предыдущего поста про эволюцию GLiNER от UniNER до GLiNER 2. Там мы остановились на том, что унификация задач в одной энкодерной модели стоит точности в отдельных задачах, но даёт огромный инженерный выигрыш. Сегодня посмотрим, как тот же принцип применяется к гардрейлам в LLM-приложениях - и что из этого вышло.📄 Arxiv · 

продолжить чтение

Контент-модерация в ретроспективе: почему тексты 100-летней давности не проходят фильтры 2026 года

Дисклеймер: Статья не даёт правовой оценки историческим деятелям и событиям. Цель — показать, как изменились юридические и платформенные нормы в отношении публичных призывов. Все цитаты из архивных источников приведены исключительно в исследовательских целях.Дано: задача для ML-инженераПредставьте, вы обучаете большую языковую модель. В корпус данных попадает Полное собрание сочинений крупного политического автора начала XX века.Что будет, если модель начнёт генерировать текст в его стиле без пост-фильтров?

продолжить чтение

Как я сделал проект для соседей, не написав ни строчки кода (и скоро пойду на завод)

продолжить чтение

Не убивайте интернет: почему нам нужен ИИ, но не так, как мы его используем

Сейчас много людей говорят о том, что пузырь нейросетей вот-вот лопнет, что это чуть ли не самое бесполезное изобретение человечества, которое ни на что не способно.Я считаю иначе. Все эти заявления разбиваются о простые рассуждения и примеры, которые почему-то часто игнорируют. Я даже не боюсь тотальной замены людей нейросетями: настолько сильный рост экономической эффективности может подарить нам колоссальное количество свободного времени и новых возможностей.(Статья написана мной и была орфографически проверена, стилизована, с добавлением источников через DeepSeek, если потребуется изначальный текст - скину)

продолжить чтение

Редакторы «Википедии» зафиксировали проблемы из-за ИИ в ряде переводов

Редакторы «Википедии» ввели новые правила и ограничили доступ к информации для ряда авторов. На этот шаг пошли после того, как авторы применили искусственный интеллект для перевода статей на другие языки, что добавило в материалы «галлюцинации» или ошибки.

продолжить чтение

Grok AI: публикация системных промптов и провал в архитектуре безопасности

В августе 2025 года компания xAI неожиданно обнародовала системные промпты своего чат-бота Grok. Этот шаг был объяснён стремлением к прозрачности после инцидентов с несанкционированным извлечением инструкций через prompt injection. Однако публикация не только вызвала интерес у специалистов по ИИ, но и обнажила уязвимости в архитектуре системы.

продолжить чтение

Pinterest признала массовую блокировку аккаунтов из-за «внутренней ошибки»

В Pinterest извинились за недавнюю волну деактивации аккаунтов. Компания заявила, что это была «внутренняя ошибка», но не сообщила, что её вызвало и была ли она устранена. 

продолжить чтение

Сайт любительских романов NaNoWriMo закрывается после 20 лет существования

Сайт некоммерческой организации NaNoWriMo, стоящий за ежегодным конкурсом по написанию романов, закрывается после 20 лет существования. НКО временно сохранит доступ к сайту, чтобы пользователи могли скачать свой контент.

продолжить чтение

eSafety раскрыл основные практики модерации в Telegram

Австралийский регулятор интернет‑безопасности eSafety провёл комплексную проверку практик модерации в Telegram. Ресурс Telegram Info проанализировал

продолжить чтение

Модерация: ручная, автоматическая или гибридная? Делимся опытом Data Light

А вы знали, что 55% бизнесов сталкиваются с убытками из-за онлайн-мошенничества, вызванного недостаточным контролем публикаций? А о том, что 88% пользователей доверяют отзывам как личным рекомендациям, и, столкнувшись с фейковым контентом, редко возвращаются на платформу? Только налаженная система модерации способна предотвратить такие ситуации и обеспечить безопасный и качественный контент.

продолжить чтение

12