Тестирование IT-систем.

За пределами LLM: детерминированный движок рассуждения на конечном алфавите

Часть 1. Детерминированный движок рассуждения на конечной таблице операции (в перспективе — замена LLM)Когда речь заходит о больших языковых моделях, все сразу отмечают их талант к сочинению и пересказу текстов. Но вот встроить такую модель в реальный продукт — задача куда более каверзная, чем кажется на первый взгляд. На практике вылезают три системных «подводных камня», из‑за которых работать с ними бывает откровенно неудобно.

продолжить чтение

Что мы считаем, когда считаем эффективность: от парового двигателя до нейросетей

"Новые времена" (Modern Times, 1936)

продолжить чтение

Исследователь взломал почту гендиректора компании с помощью одного звонка и дипфейка его голоса

Исследователь Роб Шапланд в рамках пентеста получил доступ к почте генерального директора компании с помощью одного звонка и голоса CEO, сгенерированного ChatGPT на основе открытых данных из ролика в Youtube.

продолжить чтение

Проект curl свернёт bug bounty в конце января 2026 года

Автор curl Даниэль Стенберг сообщил, что проект прекратит программу вознаграждения за обнаружение ошибок в конце января 2026 года.В мае 2025 года Стенберг объявил

продолжить чтение

Тестирование LLM-приложений с DeepEval

Всем привет! Меня зовут Максим. Я NLP‑инженер в red_mad_robot и автор Telegram‑канала Максим Максимов // IT, AI. В этой статье я расскажу о том, как тестировать приложения с использованием Large Language Model (LLM), на примере инструмента DeepEval. Тестирование приложений, в которых используются LLM, отличается от тестирования других приложений. В частности, можно выделить 2 основные проблемы: Недетерминированность. В связи со своей спецификой LLM могут давать разные ответы на одни и те же запросы, что создаёт сложности во время тестирования;Работа с естественным языком.

продолжить чтение

Почему я выбрал Suno AI для создания мемного альбома «Вася Тестировщик»?

Сразу вкратце отвечу на заголовок: выбрал Suno, поскольку ему уступают Tad, Yolly и Udio.Ещё сразу предупрежу, что для доступа к некоторым материалам статьи, вложенным из сторонних источников, может пригодится включенный VPN.В этой статье поделюсь опытом сравнения разных ИИ-генераторов, а также интересными находками про них, которые открыл в процессе написания альбома с помощью ИИ. Подспудно упомяну как можно больше интересных с моей точки зрения технических подробностей о процессе создания песен с искусственным интеллектом (ИИ). Примеры песен будут не только из моего альбома.

продолжить чтение

Бесплатная нейросеть-астролог с разбором натальных карт — как и зачем мы его запилили

Нейросети идут по пути интернета

продолжить чтение

$1,4 триллиона долга или как OpenAI планирует захватить мир в 2026 году: главные инсайды из интервью Сэма Альтмана

В штаб-квартире OpenAI Сэм Альтман рассказал о будущем компании, конкуренции с Google и DeepSeek, а также о планах на 2026 год.

продолжить чтение

Вышел дистрибутив Parrot OS 7.0 для этического хакинга с ядром Linux 6.12 LTS и новыми инструментами для пентестов

24 декабря 2025 года компания Parrot Security выпустила

продолжить чтение

Думает как хакер, действует как пентестер: что такое автоматическое тестирование на проникновение

Всем привет!

продолжить чтение

123456...10...17
Rambler's Top100