llm.
Возможно ли все еще отличить сгенерированный текст от написанного человеком?
Моя предысторияРовно год назад после Тренировок по ML в Вышке и курсу по Соревновательному Data Science я решил поучаствовать в соревновании на Kaggle "LLM - Detect AI Generated Text
Если шутка не смешная. Часть 2. Я беру мрамор и отсекаю всё лишнее
В первой части статьи я рассказывала о том, как извлекала культурные реалии из субтитров фильмов. Теперь пришло время оптимизировать сам подход, скрипт и результаты анализа. В этот раз я обработала все четыре сезона любимого многими яркого и отдыхающего сериала Emily in Paris и узнала, например, что "hemorrhaging clients" — это отнюдь не "геморройные клиенты" и даже не клиенты с геморроем в медицинском смысле, а стремительная потеря клиентов (по аналогии с кровотечением, которое, как мы знаем, "hemorrhage" на английском). Узнала, что раскованные французы поднимают бокалы с возгласом Tchin-tchin!,
Как работает модель DeepSeek-R1. Объясняем в иллюстрациях и схемах
DeepSeek-R1 — это самый громкий релиз последних дней в области искусственного интеллекта. Для сообщества исследователей и разработчиков машинного обучения (ML R&D) эта модель имеет особое значение по ряду причин:Модель обладает открытыми весами и включает уменьшенные, дистиллированные варианты.Она делится и размышляет над методом обучения, позволяющим воспроизвести модель рассуждений, подобную OpenAI O1.В этой публикации мы рассмотрим, как была создана DeepSeek-R1.Дисклеймер: это вольный перевод статьи
Альтернативы ChatGPT на смартфонах без интернета: как установить и использовать локальные языковые модели на iPhone
LLM – это, по сути, ChatGPT без интернетаНесмотря на то, что искусственный интеллект только начал входить в нашу жизнь, он уже перестал быть привилегией супер-компьютеров и облачных платформ. Теперь даже не самые новые iPhone способны нативно запускать продвинутые языковые модели
Первый шаг к кибернетическому тимлиду: автоматическое ревью кода на основе LLM
Привет, Хабр! Меня зовут Евгений Зорин
Почему DeepSeek Janus-7B — это нечто действительно невероятное
Полчаса назад вышла новость о выходе DeepSeek Janus-7B - новой мультимодальной модели от DeepSeek, которая, по заявлениям авторов, рвёт DALL-E 3, Stable Diffusion XL и Stable Diffusion 3 (Medium) в бенчмарках.В этой статье я не буду дублировать новость, а хочу подробнее рассмотреть, что именно в этой модели такого уникального, из-за чего многие связанные с AI медиа сегодня захлебываются от восторга.
DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI
DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI
DeepSeek R1: модель с производительностью o1 от OpenAI. Сравнение с o1, сколько стоит и как использовать API
DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI
Кремниевая долина в восторге от китайской модели ИИ. Колонка WSJ о моделях DeepSeek
DeepSeek называют «поразительной и впечатляющей», несмотря на использование менее совершенных чипов.Китайская компания в сфере искусственного интеллекта заставила Кремниевую долину недоумевать, как её программистам удалось почти сравняться с американскими конкурентами, используя более слабые чипы.
Оценка чат-ботов LLM: основные метрики и методы тестирования
В этой статье я научу вас, как оценивать LLM-чат-ботов, чтобы понять, достаточно ли они убедительны, чтобы сойти за реальных людей. Но что еще важнее, вы сможете использовать результаты этой оценки, чтобы понять, как улучшить своего LLM-чат-бота, например, изменив промпт или саму LLM-модель.В этой статье вы узнаете:

