llm. - страница 126

llm.

Компании массово внедряют Generative AI для ускорения цифровой трансформации

За последние два года использование генеративного искусственного интеллекта в корпоративной среде стремительно возросло, и эта тенденция только усиливается. Новое поколение крупных языковых моделей (LLM) помогает ускорять исследования, автоматизировать создание контента и заменять устаревшие чат-боты на более продвинутых AI-ассистентов, которые лучше имитируют человеческое общение.

продолжить чтение

Сэм Альтман заявил, что объединение LLM и LRM может принести новые научные знания

Обучение все более крупных языковых моделей (LLM) с использованием все большего количества данных заходит в тупик. По словам генерального директора OpenAI Сэма Альтмана, объединение «гораздо больших» предварительно обученных моделей с возможностями рассуждения может стать ключом к преодолению ограничений масштабирования предварительного обучения.Предварительно обученные языковые модели больше не масштабируются так эффективно, как раньше, и эта точка зрения, похоже, получила широкое признание в индустрии ИИ

продолжить чтение

Проблема контекстного окна: Почему AI забывает середину длинного текста

В недавнем интервью бывший генеральный директор Google Эрик Шмидт заявил, что контекстное окно больших языковых моделей (LLM) можно использовать как краткосрочную память. Однако есть проблема — если загрузить достаточно длинный текст (например, несколько книг) в контекстное окно, AI забудет середину.

продолжить чтение

Composo помогает предприятиям отслеживать эффективность работы приложений AI

Искусственный интеллект и большие языковые модели (LLM), которые его поддерживают, имеют массу полезных применений, но, несмотря на все свои обещания, они не очень надежны. Никто не знает, когда эта проблема будет решена, поэтому вполне логично, что мы видим, как стартапы находят возможность помочь предприятиям обеспечить работу приложений на базе LLM, за которые они платят, как задумано. Лондонский стартап Composo

продолжить чтение

Ученые проверили способность AI к причинно-следственному мышлению: результаты удивили

За последние десятилетия ученые в области компьютерных наук разработали всё более продвинутые модели искусственного интеллекта (AI), некоторые из которых способны выполнять определенные задачи на уровне человека. Однако, насколько эти модели действительно “думают” и анализируют информацию, как люди, до сих пор остается предметом ожесточенных дискуссий.

продолжить чтение

B2B маркетинг для зумеров и как AI BPA системы меняют корпорации

На выходных в сеть утекла часть внутренних регламентов крупной российской ИТ корпорации. Один необычный документ меня сначала очень рассмешил, потом показал много интересного с методической точки зрения. А для ответа на вопрос "как такое появилось на свет?

продолжить чтение

Composo помогает предприятиям отслеживать, насколько хорошо работают приложения с искусственным интеллектом

Искусственный интеллект (AI) и большие языковые модели (LLM), которые лежат в его основе, обладают широким спектром полезных функций. Однако, несмотря на все их достоинства, они не могут гарантировать стопроцентную надёжность.

продолжить чтение

AI, FreeRTOS и Linux в кармане: возможности LicheeRV Nano

В этой статье речь пойдет о разработке под отладочную плату LicheeRV Nano - компактное устройство размером с две пятирублевые монеты, но обладающее впечатляющими возможностями.Плата способна одновременно запускать Linux и FreeRTOS, выполнять инференс нейронных сетей (будет разобран запуск YOLO и LLama2.c) благодаря встроенному NPU

продолжить чтение

Построение инфраструктуры для работы с языковыми моделями: опыт X5 Tech

Привет, Хабр! Я Мичил Егоров, руководитель команды разработки продуктов искусственного интеллекта в X5 Tech. В последнее время языковые модели (LLM) стали неотъемлемой частью многих бизнес-процессов, начиная от чат-ботов и заканчивая автоматической обработкой отзывов клиентов. Однако, чтобы эффективно использовать такие модели, необходима мощная и гибкая инфраструктура. За последний год команда X5 Tech значительно выросла, проверила множество гипотез и протестировала различные модели. Основные кейсы использования включают чат-боты, суфлёры для модераторов, автоматическое резюмирование и обработку отзывов клиентов.

продолжить чтение

DeepSeek и Qwen 2.5 против ChatGPT: как китайские компании запустили новый скачок в мире ИИ

В последние недели мир искусственного интеллекта (ИИ) был потрясен значительными достижениями китайских компаний, особенно DeepSeek и Alibaba, которые представили свои передовые модели — DeepSeek-R1 и Qwen 2.5-Max соответственно. Конечно же, эти события вызвали широкий резонанс в технологическом сообществе и привели к обсуждению будущего ИИ.Меня зовут Роман Ленц, я начальник отдела анализа данных и машинного обучения ПГК Диджитал — цифровой дочки Первой грузовой компании

продолжить чтение

Rambler's Top100