Как протестировать машинный переводчик
Машинный перевод уже стал привычной частью жизни — от деловой переписки до общения с людьми из других стран. Но за простотой нажатия кнопки «перевести» стоит сложная технология, которая требует постоянного контроля качества.В компании Lingvanex мы применяем собственный подход к выбору тестовых данных, ориентируясь на максимальную репрезентативность и адаптацию к реальным запросам клиентов. Цель состоит в том, чтобы создавать модели, которые могут точно переводить тексты как с лексической, так и с грамматической точностью, сохраняя контекст и стиль.
Как я автоматизировал анализ логов из Kibana с помощью LLM и AI-агентов
OpenSearch, Elastic или Kibana и подобные им инструменты — уже давно стандарт для поиска и визуализации логов, ведь они удобны, у них мощная поисковая система. Но сложный анализ — агрегации, парсинг, выявление сложных закономерностей — заставляет их встроенные средства работать на пределе возможностей. Особенно если структура логов далека от идеала.
Playwright Agents — тесты, которые “живут своей жизнью”
Недавно вышло видео “Playwright v1.56: From MCP to Playwright Agents” и на первый взгляд оно выглядит как революция:ИИ-агент, который сам понимает, что тестировать, сам пишет тесты, сам их чинит. Никаких локаторов, никаких апдейтов при каждом изменении DOM - просто запускаешь и смотришь, как тесты выполняются.Но если вы хоть раз поддерживали живой тестовый проект в крупной компании, то вы уже чувствуете, где тут подвох.💡 Что обещаютСоздатели Playwright Agents говорят о новом уровне автоматизации:
Тестирование качества работы RAG. Описание и сравнение метрик
В современном мире часто встречаются задачи с большим объемом данных, выполнение которых либо невозможно, либо сложно или затратно по времени/ресурсам автоматизировать обычными функциями и методами.Одним из способов решения для таких случаев является применение AI с использованием RAG.В этой статье мы постарались привести метрики для оценки качества работы подобных решений.RAG (Retrieval Augmented Generation) - генерация ответов с использованием внешнего источника данных.
Едем в поле с железным ящиком: как тестируют телеком
Модульные тесты, conformance по 3GPP и нюансы российского законодательства. Добавьте к этому автомобиль-лабораторию и разъезды по лесу — и получите обычный день QA-инженера в телекоме. Об этом и о многом другом поговорим на митапе по тестированию в телекоме 9 октября (воскресенье) в 18:00. Для участия в онлайн-трансляции достаточно зарегистрироваться на сайте.
Прощай, рутина: как наша команда QA в 3 раза ускорила работу с помощью собственного ИИ-агента
Привет, меня зовут Сергей, я занимаюсь автоматизаций тестирования в компании ITFB Group
YouTube Labs запустит «передовые эксперименты с ИИ»
YouTube анонсировал новую инициативу под названием YouTube Labs, которая позволяет опробовать «передовые эксперименты с искусственным интеллектом» и «исследовать потенциал ИИ». Пока YouTube Labs работает только в США и у ограниченного числа участников.
QA-инженер в 2025 году: скилсет джуниора и ожидания рынка
Привет! На связи команда Яндекс Практикума. В первой половине года мы провели традиционное исследование рынка ручного тестирования — выяснили актуальные требования к джуниорам, провели интервью с работодателями и трудоустроенными выпускниками и подробно изучили, как проходят собеседования. Делимся самым важным.Что мы делалиЦелью нашего исследования было уточнить портрет «идеального» джуниора в QA, выяснить актуальные требования работодателей и проанализировать рынок вакансий.Для этого мы:
Интеграционные тесты в Go: как избавиться от флаков и боли
Всем привет! Меня зовут Александр Голубь, и я пишу на Go уже 7 лет. Когда я только начинал, казалось, что юнит-тестов достаточно. Функции проверены, сборка зелёная — можно релизить. Но первый же боевой проект показал, что это иллюзия. В продакшене всё падает, хотя юниты сияют зелёным. Почему? Потому что реальный сервис — это не только код, но и PostgreSQL, Redis, Kafka, внешние API. Данные проходят через цепочку зависимостей, и любая несовместимость ломает систему. Юнит-тесты этого не ловят. Тут нужны интеграционные.

