llm.
3 главных инсайта о «взломах» LLM из исследования StrongREJECT
Всем привет!Погружаюсь в новую для себя область AI Security, в связи с чем решил написать несколько обзоров на самые обсуждаемые исследования и статьи по этой теме. Сегодня поговорим про взлом LLM и неожиданные результаты исследования StrongREJECT.TLDR: Не все джейлбрейки одинаково полезныПолный текст доклада (25 стр.) с NeurIPS. Если лень читать обзор, можете пролистать комиксы от нанобананы. Большинство джейлбрейков - иллюзия!
Как я автоматизировал поиск работы, и мой бот случайно откликнулся моему шефу
Поиск работы в IT превратился в какой-то сюр.С одной стороны - HR, которые не читают резюме и фильтруют кандидатов по ключевикам. С другой - кандидаты, которые бомбят веерной рассылкой "здравствуйте, рассмотрите меня".Чтобы найти нормальный оффер, нужно тратить 2-3 часа в день на скроллинг ленты и написание сопроводительных, которые никто не откроет.Меня это достало. Я разработчик, я хочу писать код, а не играть в бюрократию.Поэтому я решил написать AI-агента, который заберет эту рутину на себя. Спойлер: он сработал слишком хорошо и чуть не устроил одному из пользователей увольнение.
The Romantics at Anthropic: Why Researchers Talk About LLMs as if They Were Human
In my previous article, I showed how researchers confused being 'aware' (signal registration) with being 'conscious' (subjective awareness). But this is no accident — it is part of a narrative being constructed by AI labs. Anthropic is leading this trend. Let’s break down their latest paper, where a "learned pattern" has suddenly turned into "malicious intent."I recently analyzed an experiment by scientists from AE Studio in which they conflated "aware" (registering a signal) with "aware" (conscious realization). Yet, such anthropomorphization of LLMs is now ubiquitous — in no small part thanks to papers from Anthropic. It seems to me that it is largely through their influence that terms like deception, sabotage, and intent have entered the vocabulary of LLM researchers.
LLM Judge для валидации образовательного контента: архитектура кросс-модельной оценки с бюджетом $0.014 за курс
Как мы решили проблему "стохастической дивергенции" при генерации уроков и снизили затраты на валидацию в 17,000 раз по сравнению с ручной проверкойКонтекст: кто пишет и о чем эта статьяИгорь Масленников. В IT с 2013 года. Последние два года развиваю AI Dev Team в DNA IT — подразделение, которое работает на мульти-модельной архитектуре. Мы генерируем образовательные курсы для клиентов с бюджетом
Оценка прироста производительности труда благодаря использованию ИИ (диалогов с Claude)
Перевод свежей и вызывающей споры статьи об оценке роста производительности разных работ при использовании ИИ
Мой опыт парного программирования с Chat GPT-5
Привет, Хабр! Про модели искусственного интеллекта сейчас не говорит только ленивый. Высказывается множество мнений и нередко они оказываются на противоположных полюсах: от полного скепсиса до убеждённости, что произошла новая научно-техническая революция. Жизненный опыт подсказывает, что истина где-то по-середине и инструмент будет полезным ровно настолько, насколько ты умеешь им пользоваться. В относительно недавнем интервью генеральный директор Microsoft Сатья Наделла заявил, что примерно
Новые Возможности MS SQL SERVER 2025
🧠 СУБД Спешат в Эпоху ИИ Сегодня мы наблюдаем, как все ведущие реляционные и нереляционные СУБД ускоренными темпами интегрируют поддержку ИИ. Это не просто тренд, а требование времени:Векторные Типы Данных (Vector Data Types): Позволяют хранить эмбеддинги — многомерные числовые векторы, которые кодируют семантический смысл текста, изображений или других данных.Векторный Поиск по Сходству (Vector Similarity Search): Новые встроенные функции позволяют проводить семантический поиск (поиск по смыслу, а не по ключевым словам) и создавать мощные рекомендательные системы прямо на уровне базы данных.
Романтики из Anthropic: Почему исследователи говорят о LLM как о человеке
В прошлой статье я показал, как исследователи перепутали "aware" (регистрация) с "conscious" (осознание). Но это не случайность — это часть нарратива, который строят AI-лаборатории. Anthropic — лидеры этого тренда. Разберём их последнюю статью, где "выученный паттерн" стал "злым намерениемНедавно я разбирал эксперимент

