LLM Llama 3 — небольшое погружение в детали
Привет Хабр! В этой статье я попробую немного разобрать код LLM Llama 3. Полностью проанализировать каждую строку кода не получится, но самые важные и базовые концепции мы все-таки разберем насколько это возможно.Падаем в кроличью норуИзучать мы будем класс Llama (файл generation.py) и его метод text_completion
Машинный перевод
Автор статьи: Сергей Артамонов - DS Wildberries, Research Engineer Skoltech, аспирант мехмата МГУ, преподаватель Школы Высшей Математики
AI-помощник Adobe Acrobat теперь может расшифровывать контрактный жаргон
Adobe добавляет в AI-помощник Acrobat функции, которые призваны упростить сложные контракты и юридические документы как для компаний, так и для потребителей. Новые «возможности интеллектуального анализа контрактов» позволяют чат-боту программы для работы с PDF-файлами автоматически распознавать файлы и отсканированные документы как контракты и обобщать сложные формулировки, чтобы пользователям было проще их понимать.
Инфляция программного обеспечения-2: ситуация с OpenAI и DeepSeek
Данная статья является реакцией на эту статью на Хабре. Это не подтверждение и опровержение того, что там написано. Скорее, мысли по поводу того, почему OpenAI ведет себя таким образом, а не каким-то другим, и что на самом деле показывает пример DeepSeek.Скажу честно - сам DeepSeek не тестировал, и, очевидно, придется подождать где-то месяц минимум, прежде чем подкатят нормальные сравнения и бенчмарки (а не только те, что указал в релизе сам DeepSeek). Здесь скорее речь пойдет о ситуации, которую DeepSeek породил этим релизом.Назад в будущее
Как оценить качество чат-бота? Бот с LLM vs бот на интентах по новой методологии usability-тестирования
Привет, Хабр! Я Юля, дизайнер диалоговых интерфейсов в Just AI. Мир захлестнула LLM-волна, и сфера чат-ботов оказалась в самом ее центре: все больше компаний хотят внедрять именно генеративные решения. Ведь уникальные ответы ChatGPT, тонко чувствующего контекст диалога и распознающего любой ваш вопрос, выглядят революционно. Хочется срочно такую умную нейронку опубликовать в виджете на своем сайте и заменить всех операторов-людей!
Оценка систем больших языковых моделей (LLM): метрики, проблемы и лучшие практики
Фото Яни Каасинен на Unsplash.
ByteDance выпустили OmniHuman-1: генерация видео по одной картинке и аудиодорожке
Ссылка на официальный анонс (англ): https://omnihuman-lab.github.io/Примеры некоторых сгенерированных видосов под катом, но на Хабре не очень удобный плеер, поэтому остальные я выложил в телеге.Анимация человека, а именно - генерация говорящего человека на основе аудиодорожки за последние годы сильно прокачалась в качестве. Но существующие подходы всё ещё испытывают трудности с масштабированием.
Рецензия на переводную книгу “Машинное обучение с малым объемом кодирования” (Low-Code AI)
Как кажется, основные читатели книги "Low-Code AI"
PicTrace-X1: Как умные очки и нейросети меняют поиск изображений — от браузера до навигации
Современный цифровой мир генерирует терабайты визуальных данных ежедневно. Рутинные задачи — маркетинговый анализ, модерация контента, обеспечение безопасности или разработка умных очков и протезов для людей с ограниченными возможностями — требуют мгновенного доступа к релевантным изображениям. Ручной поиск не только замедляет процессы, но и подвержен человеческим ошибкам.В данной статье мы рассмотрим, как интеграция инструментов автоматизированного поиска схожих изображений, цифрового зрения и навигационных систем
Цензура в DeepSeek работает при локальном запуске модели
Некоторые эксперты в области искусственного интеллекта считали, что хорошо задокументированная цензура DeepSeek существует только на уровне приложения и не работает, если запустить приложение локально на устройстве. Теперь выяснилось, что это не так.

