тестирование. - страница 3

Как протестировать машинный переводчик

Машинный перевод уже стал привычной частью жизни — от деловой переписки до общения с людьми из других стран. Но за простотой нажатия кнопки «перевести» стоит сложная технология, которая требует постоянного контроля качества.В компании Lingvanex мы применяем собственный подход к выбору тестовых данных, ориентируясь на максимальную репрезентативность и адаптацию к реальным запросам клиентов. Цель состоит в том, чтобы создавать модели, которые могут точно переводить тексты как с лексической, так и с грамматической точностью, сохраняя контекст и стиль.

продолжить чтение

Как я автоматизировал анализ логов из Kibana с помощью LLM и AI-агентов

OpenSearch, Elastic или Kibana и подобные им инструменты — уже давно стандарт для поиска и визуализации логов, ведь они удобны, у них мощная поисковая система. Но сложный анализ — агрегации, парсинг, выявление сложных закономерностей — заставляет их встроенные средства работать на пределе возможностей. Особенно если структура логов далека от идеала.

продолжить чтение

Playwright Agents — тесты, которые “живут своей жизнью”

Недавно вышло видео “Playwright v1.56: From MCP to Playwright Agents” и на первый взгляд оно выглядит как революция:ИИ-агент, который сам понимает, что тестировать, сам пишет тесты, сам их чинит. Никаких локаторов, никаких апдейтов при каждом изменении DOM - просто запускаешь и смотришь, как тесты выполняются.Но если вы хоть раз поддерживали живой тестовый проект в крупной компании, то вы уже чувствуете, где тут подвох.💡 Что обещаютСоздатели Playwright Agents говорят о новом уровне автоматизации:

продолжить чтение

Тестирование качества работы RAG. Описание и сравнение метрик

В современном мире часто встречаются задачи с большим объемом данных, выполнение которых либо невозможно, либо сложно или затратно по времени/ресурсам автоматизировать обычными функциями и методами.Одним из способов решения для таких случаев является применение AI с использованием RAG.В этой статье мы постарались привести метрики для оценки качества работы подобных решений.RAG (Retrieval Augmented Generation) - генерация ответов с использованием внешнего источника данных.

продолжить чтение

Едем в поле с железным ящиком: как тестируют телеком

Модульные тесты, conformance по 3GPP и нюансы российского законодательства. Добавьте к этому автомобиль-лабораторию и разъезды по лесу — и получите обычный день QA-инженера в телекоме. Об этом и о многом другом поговорим на митапе по тестированию в телекоме 9 октября (воскресенье) в 18:00. Для участия в онлайн-трансляции достаточно зарегистрироваться на сайте.

продолжить чтение

Путь к получению сертификата ISTQB AI тестировщика: советы и полезная информация

продолжить чтение

Прощай, рутина: как наша команда QA в 3 раза ускорила работу с помощью собственного ИИ-агента

Привет, меня зовут Сергей, я занимаюсь автоматизаций тестирования в компании ITFB Group

продолжить чтение

YouTube Labs запустит «передовые эксперименты с ИИ»

YouTube анонсировал новую инициативу под названием YouTube Labs, которая позволяет опробовать «передовые эксперименты с искусственным интеллектом» и «исследовать потенциал ИИ». Пока YouTube Labs работает только в США и у ограниченного числа участников.

продолжить чтение

QA-инженер в 2025 году: скилсет джуниора и ожидания рынка

Привет! На связи команда Яндекс Практикума. В первой половине года мы провели традиционное исследование рынка ручного тестирования — выяснили актуальные требования к джуниорам, провели интервью с работодателями и трудоустроенными выпускниками и подробно изучили, как проходят собеседования. Делимся самым важным.Что мы делалиЦелью нашего исследования было уточнить портрет «идеального» джуниора в QA, выяснить актуальные требования работодателей и проанализировать рынок вакансий.Для этого мы:

продолжить чтение

Интеграционные тесты в Go: как избавиться от флаков и боли

Всем привет! Меня зовут Александр Голубь, и я пишу на Go уже 7 лет. Когда я только начинал, казалось, что юнит-тестов достаточно. Функции проверены, сборка зелёная — можно релизить. Но первый же боевой проект показал, что это иллюзия. В продакшене всё падает, хотя юниты сияют зелёным. Почему? Потому что реальный сервис — это не только код, но и PostgreSQL, Redis, Kafka, внешние API. Данные проходят через цепочку зависимостей, и любая несовместимость ломает систему. Юнит-тесты этого не ловят. Тут нужны интеграционные.

продолжить чтение

123456...10...11
Rambler's Top100