модерация.

GLiNER Guard: один schema-driven энкодер вместо зоопарка LLM-гардрейлов

Эта статья - адаптация моего материала, опубликованного на Towards AI, и одновременно продолжение предыдущего поста про эволюцию GLiNER от UniNER до GLiNER 2. Там мы остановились на том, что унификация задач в одной энкодерной модели стоит точности в отдельных задачах, но даёт огромный инженерный выигрыш. Сегодня посмотрим, как тот же принцип применяется к гардрейлам в LLM-приложениях - и что из этого вышло.📄 Arxiv ·

продолжить чтение

Оставлено в

Контент-модерация в ретроспективе: почему тексты 100-летней давности не проходят фильтры 2026 года

Дисклеймер: Статья не даёт правовой оценки историческим деятелям и событиям. Цель — показать, как изменились юридические и платформенные нормы в отношении публичных призывов. Все цитаты из архивных источников приведены исключительно в исследовательских целях.Дано: задача для ML-инженераПредставьте, вы обучаете большую языковую модель. В корпус данных попадает Полное собрание сочинений крупного политического автора начала XX века.Что будет, если модель начнёт генерировать текст в его стиле без пост-фильтров?

продолжить чтение

Оставлено в

Как я сделал проект для соседей, не написав ни строчки кода (и скоро пойду на завод)

продолжить чтение

Оставлено в

Не убивайте интернет: почему нам нужен ИИ, но не так, как мы его используем

Сейчас много людей говорят о том, что пузырь нейросетей вот-вот лопнет, что это чуть ли не самое бесполезное изобретение человечества, которое ни на что не способно.Я считаю иначе. Все эти заявления разбиваются о простые рассуждения и примеры, которые почему-то часто игнорируют. Я даже не боюсь тотальной замены людей нейросетями: настолько сильный рост экономической эффективности может подарить нам колоссальное количество свободного времени и новых возможностей.(Статья написана мной и была орфографически проверена, стилизована, с добавлением источников через DeepSeek, если потребуется изначальный текст - скину)

продолжить чтение

Оставлено в

Редакторы «Википедии» зафиксировали проблемы из-за ИИ в ряде переводов

Редакторы «Википедии» ввели новые правила и ограничили доступ к информации для ряда авторов. На этот шаг пошли после того, как авторы применили искусственный интеллект для перевода статей на другие языки, что добавило в материалы «галлюцинации» или ошибки.

продолжить чтение

Оставлено в

Grok AI: публикация системных промптов и провал в архитектуре безопасности

В августе 2025 года компания xAI неожиданно обнародовала системные промпты своего чат-бота Grok. Этот шаг был объяснён стремлением к прозрачности после инцидентов с несанкционированным извлечением инструкций через prompt injection. Однако публикация не только вызвала интерес у специалистов по ИИ, но и обнажила уязвимости в архитектуре системы.

продолжить чтение

Оставлено в

Pinterest признала массовую блокировку аккаунтов из-за «внутренней ошибки»

В Pinterest извинились за недавнюю волну деактивации аккаунтов. Компания заявила, что это была «внутренняя ошибка», но не сообщила, что её вызвало и была ли она устранена.

продолжить чтение

Оставлено в

Сайт любительских романов NaNoWriMo закрывается после 20 лет существования

Сайт некоммерческой организации NaNoWriMo, стоящий за ежегодным конкурсом по написанию романов, закрывается после 20 лет существования. НКО временно сохранит доступ к сайту, чтобы пользователи могли скачать свой контент.

продолжить чтение

Оставлено в

eSafety раскрыл основные практики модерации в Telegram

Австралийский регулятор интернет‑безопасности eSafety провёл комплексную проверку практик модерации в Telegram. Ресурс Telegram Info проанализировал

продолжить чтение

Оставлено в