ai.
Основные метрики DeepEval для тестирования AI. Возможности и способы применения
Всем привет!DeepEval - фреймворк для оценки работы AI с открытым исходным кодом.Содержит в себе множество метрик и бенчмарков для оценки качества работы AI моделей, а также предоставляет инструменты для аналитики изменений качества работы в течение разных периодов времени.В предыдущей статье мы уже частично осветили имеющиеся у DeepEval метрики (метрики для оценки RAG).В этой статье постараемся объяснить, какой еще функционал предлагается DeepEval для работы с AI.Помимо указанных ранее в DeepEval присутствуют следующие метрики:Agentic- Task Completion- Tool Correctness- Argument Correctness
Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом
Всем привет! Я потратил на ии кодинг 500 долларов за 10 дней работы с Девином, и в результате у меня получился онлайн редактор для АИ видео с открытым исходным кодом. Кто такой Девин, зачем я это делал и что в итоге получилось. Разбираемся ниже.И наверное мой рассказ стоит начать с того, что я не разработчик, т.е. вообще совсем. Я конечно могу читать код и даже что-то понимать, но это просто потому что последние 20 лет занимаюсь ведением проектов в качестве продакта и проджекта. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me,
Почему ставка Broadcom на OpenAI — это большой риск. Мнение от The Wall Street Journal
Автор фото: David Paul Morris/BloombergСоглашение Broadcom о разработке огромного количества чипов и вычислительных систем для OpenAI вызвало воодушевление у инвесторов. Однако этот шаг не столь однозначно выгоден, как может показаться, если судить по росту акций компании.

