GLiNER Guard: один schema-driven энкодер вместо зоопарка LLM-гардрейлов
Эта статья - адаптация моего материала, опубликованного на Towards AI, и одновременно продолжение предыдущего поста про эволюцию GLiNER от UniNER до GLiNER 2. Там мы остановились на том, что унификация задач в одной энкодерной модели стоит точности в отдельных задачах, но даёт огромный инженерный выигрыш. Сегодня посмотрим, как тот же принцип применяется к гардрейлам в LLM-приложениях - и что из этого вышло.📄 Arxiv ·
Контент-модерация в ретроспективе: почему тексты 100-летней давности не проходят фильтры 2026 года
Дисклеймер: Статья не даёт правовой оценки историческим деятелям и событиям. Цель — показать, как изменились юридические и платформенные нормы в отношении публичных призывов. Все цитаты из архивных источников приведены исключительно в исследовательских целях.Дано: задача для ML-инженераПредставьте, вы обучаете большую языковую модель. В корпус данных попадает Полное собрание сочинений крупного политического автора начала XX века.Что будет, если модель начнёт генерировать текст в его стиле без пост-фильтров?
Не убивайте интернет: почему нам нужен ИИ, но не так, как мы его используем
Сейчас много людей говорят о том, что пузырь нейросетей вот-вот лопнет, что это чуть ли не самое бесполезное изобретение человечества, которое ни на что не способно.Я считаю иначе. Все эти заявления разбиваются о простые рассуждения и примеры, которые почему-то часто игнорируют. Я даже не боюсь тотальной замены людей нейросетями: настолько сильный рост экономической эффективности может подарить нам колоссальное количество свободного времени и новых возможностей.(Статья написана мной и была орфографически проверена, стилизована, с добавлением источников через DeepSeek, если потребуется изначальный текст - скину)
Редакторы «Википедии» зафиксировали проблемы из-за ИИ в ряде переводов
Редакторы «Википедии» ввели новые правила и ограничили доступ к информации для ряда авторов. На этот шаг пошли после того, как авторы применили искусственный интеллект для перевода статей на другие языки, что добавило в материалы «галлюцинации» или ошибки.
Grok AI: публикация системных промптов и провал в архитектуре безопасности
В августе 2025 года компания xAI неожиданно обнародовала системные промпты своего чат-бота Grok. Этот шаг был объяснён стремлением к прозрачности после инцидентов с несанкционированным извлечением инструкций через prompt injection. Однако публикация не только вызвала интерес у специалистов по ИИ, но и обнажила уязвимости в архитектуре системы.
Pinterest признала массовую блокировку аккаунтов из-за «внутренней ошибки»
В Pinterest извинились за недавнюю волну деактивации аккаунтов. Компания заявила, что это была «внутренняя ошибка», но не сообщила, что её вызвало и была ли она устранена.
Сайт любительских романов NaNoWriMo закрывается после 20 лет существования
Сайт некоммерческой организации NaNoWriMo, стоящий за ежегодным конкурсом по написанию романов, закрывается после 20 лет существования. НКО временно сохранит доступ к сайту, чтобы пользователи могли скачать свой контент.
eSafety раскрыл основные практики модерации в Telegram
Австралийский регулятор интернет‑безопасности eSafety провёл комплексную проверку практик модерации в Telegram. Ресурс Telegram Info проанализировал
Модерация: ручная, автоматическая или гибридная? Делимся опытом Data Light
А вы знали, что 55% бизнесов сталкиваются с убытками из-за онлайн-мошенничества, вызванного недостаточным контролем публикаций? А о том, что 88% пользователей доверяют отзывам как личным рекомендациям, и, столкнувшись с фейковым контентом, редко возвращаются на платформу? Только налаженная система модерации способна предотвратить такие ситуации и обеспечить безопасный и качественный контент.

