Машинное обучение.

Я заставил 14 нейросетей врать: Большой аудит галлюцинаций 2026

Или как я потратил неделю, чтобы доказать: ИИ сегодня — это красноречивые лжецы в костюмах экспертов.В конце 2025 года я устал читать маркетинг в стиле «наша модель умнее ChatGPT на 15%». Умнее по какому бенчмарку? MMLU? Это всё равно что мерить интеллект человека по результатам ЕГЭ.Я решил проверить одну простую вещь: способна ли нейросеть сказать «я не знаю»?Потому что в реальном мире — в медицине, праве, финансах — ответ «я не уверен» стоит дороже любой красивой, но выдуманной истории.Ниже — результаты слепого тестирования 14 топовых LLM (включая Claude 4.5, GPT-5.2, Gemini 3, Qwen, YandexGPT и

продолжить чтение

Оставлено в

Kimi K2.5: Как научить нейросеть не бояться параллельности

Moonshot AI выкатили K2.5. Пресс-релиз трубит про «самую мощную open-source модель», но я бы хотел поговорить о другом — о том, что они сделали с агентами.

продолжить чтение

Оставлено в

От краски до парфюмерии: генеративный ИИ хорошо проявил себя в создании новых материалов в химпроме

Может показаться, что генеративный искусственный интеллект пригоден только для создания текстов, фотографий или видеороликов по текстовому описанию, но специалисты в области материаловедения утверждают, что он способен предлагать нетривиальные решения, которые вряд ли придут на ум даже опытному эксперту.

продолжить чтение

Оставлено в

Microsoft анонсировала новый мощный чип для обработки данных с помощью ИИ

Компания Microsoft объявила о выпуске своего новейшего чипа Maia 200, который, по словам компании, представляет собой мощную вычислительную платформу, предназначенную для масштабирования вычислений в области искусственного интеллекта.

продолжить чтение

Оставлено в

Metaflow: повышение эффективности ML-AI-разработки в Netflix

Metaflow — это фреймворк, работу над которым мы начали в 2019. В том же году мы открыли его исходный код. Теперь он обеспечивает функционирование широкого спектра ML/AI-систем в Netflix, а так же — во многих других компаниях. Он пользуется любовью тех, кто его применяет, так как он помогает им доводить их ML/AI-идеи от стадии прототипа до продакшна

продолжить чтение

Оставлено в

RAG-системы: что это такое, принципы работы, архитектура и ограничения

Привет, Habr!Эта статья — первый шаг в серии материалов о технологии RAG. Здесь мы разберёмся, что это вообще такое, зачем она появилась и почему её так часто требуют в вакансиях. К концу статьи у вас должно сложиться целостное понимание, когда RAG действительно нужен, какие архитектуры бывают и где чаще всего возникают ошибки.В статье мы разберём:почему вообще появился RAG;что такое RAG в общем смысле;основные способы расширения контекста модели;кому RAG действительно нужен (и кому нет);как устроен RAG и как работает в принципе;где и почему RAG чаще всего ломается;

продолжить чтение

Оставлено в

Почему OpenAI на пути к банкротству?

Для Альтмана игра почти оконченаФото: Lucas K, Unsplash

продолжить чтение

Оставлено в

Рентген может не отличить опасное от безобидного: как работает досмотр багажа и зачем там ИИ

Пролог: В котором ваш багаж исчезаетЧемодан медленно уезжает за резиновую шторку и на некоторое время перестаёт быть вашим.Где-то по ту сторону экрана его уже не воспринимают как багаж. Необычное цветное изображение, на которое нужно быстро взглянуть и понять: всё ли тут в порядке.Холодная металлическая коробка равнодушна к содержанию багажа. Она фиксирует только взаимодействие материи с рентгеновскими лучами. Оператор на экране наблюдает совсем не фотографию вашего чемодана. Это визуализация измерений: числа и сигналы, переведённые в форму и цвет, с которой человеку удобно работать.

продолжить чтение

Оставлено в

ИИ помог написать Linux-вредонос VoidLink всего за 6 дней

Исследователи Check Point выяснили, что продвинутый Linux-вредонос VoidLink, обнаруженный в декабре 2025 года, был создан преимущественно с помощью искусственного интеллекта. По данным отчёта

продолжить чтение

Оставлено в

Альтман врал годами. Теперь у OpenAI $1 триллион долга

Для Альтмана игра почти оконченаФото: Lucas K, Unsplash

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Машинное обучение.

Я заставил 14 нейросетей врать: Большой аудит галлюцинаций 2026

Kimi K2.5: Как научить нейросеть не бояться параллельности

От краски до парфюмерии: генеративный ИИ хорошо проявил себя в создании новых материалов в химпроме

Microsoft анонсировала новый мощный чип для обработки данных с помощью ИИ

Metaflow: повышение эффективности ML-AI-разработки в Netflix

RAG-системы: что это такое, принципы работы, архитектура и ограничения

Почему OpenAI на пути к банкротству?

Рентген может не отличить опасное от безобидного: как работает досмотр багажа и зачем там ИИ

ИИ помог написать Linux-вредонос VoidLink всего за 6 дней

Альтман врал годами. Теперь у OpenAI $1 триллион долга

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Машинное обучение.