- BrainTools - https://www.braintools.ru -

Cohere выпускает Embed 4: новая модель для работы с большими объёмами данных

Расширенная генерация на основе поиска (RAG) по-прежнему является неотъемлемой частью современного увлечения агентским ИИ. Воспользовавшись сохраняющимся интересом [1] к агентам, Cohere [2] выпустила последнюю версию своей модели встраивания с более длинными контекстными окнами и большей мультимодальностью.

Cohere выпускает Embed 4: новая модель для работы с большими объёмами данных - 1

Cohere’s Embed 4 основан на мультимодальных обновлениях Embed 3 [3] и добавляет больше возможностей для работы с неструктурированными данными. Благодаря контекстному окну на 128 000 токенов организации могут создавать вложения для документов объемом около 200 страниц.

«Существующие встраиваемые модели не способны изначально понимать сложные мультимодальные бизнес-материалы, из-за чего компаниям приходится разрабатывать громоздкие конвейеры предварительной обработки данных, которые лишь незначительно повышают точность, — написал Кохере в своём блоге. — Embed 4 решает эту проблему, позволяя предприятиям и их сотрудникам эффективно находить идеи, скрытые в горах информации, которую невозможно найти с помощью поиска».

Предприятия могут развернуть Embed 4 в частных виртуальных облаках или локальных технологических стеках для дополнительной защиты данных.

Компании могут генерировать вложения [4] для преобразования своих документов или других данных в числовые представления для обычных случаев. Затем агенты могут ссылаться на эти вложения, чтобы отвечать на запросы.

По словам компании, Embed 4 «превосходит конкурентов в регулируемых отраслях», таких как финансы, здравоохранение и производство. Компания Cohere, которая в основном специализируется на корпоративных сценариях использования ИИ, заявила, что её модели учитывают потребности [5] в безопасности регулируемых отраслей и хорошо понимают бизнес.

Компания обучила Embed 4 «устойчивости к помехам в реальных данных», чтобы он оставался точным, несмотря на «несовершенства» корпоративных данных, такие как орфографические ошибки [6] и проблемы с форматированием.

«Он также эффективен при поиске по отсканированным документам и рукописным текстам. Эти форматы распространены в юридических документах, страховых счетах и чеках на расходы. Эта функция устраняет необходимость в сложной подготовке данных или предварительной обработке, экономя время и операционные расходы компаний», — сказал Кохере.

Организации могут использовать Embed 4 для презентаций инвесторам, составления отчётов о проверке, отчётов о клинических испытаниях, руководств по ремонту и документации по продуктам. ‭

Модель поддерживает более 100 языков, как и предыдущая версия модели.

Cohere выпускает Embed 4: новая модель для работы с большими объёмами данных - 2

Компания Agora, клиент Cohere, использовала Embed 4 для своей поисковой системы на основе ИИ и обнаружила, что модель может находить подходящие товары.

«Данные в сфере электронной коммерции сложны, они содержат изображения и многогранные текстовые описания. Возможность представлять наши товары в едином формате делает поиск быстрее, а внутренние инструменты — эффективнее», — написал в блоге Парам Джагги, основатель Agora.

Cohere утверждает, что такие модели, как Embed 4, улучшат сценарии использования агентов, и заявляет, что она может стать «оптимальной поисковой системой» для агентов и помощников с искусственным интеллектом [7] на предприятии.

«Помимо высокой точности для разных типов данных, модель обеспечивает эффективность корпоративного уровня, — сказал Кохере. — Это позволяет масштабировать её для удовлетворения потребностей крупных организаций».

Кохере добавил, что Embed 4 создаёт сжатые вложения данных, чтобы сократить расходы на хранение.

Встраивания и поиск на основе RAG позволяют агенту ссылаться на конкретные документы для выполнения задач, связанных с запросом. Многие считают, что это обеспечивает более точные результаты, гарантируя, что агенты не будут отвечать неверными или вымышленными ответами.

Другие модели встраивания, с которыми конкурирует Cohere, включают Qodo-Embed-1-1.5B [8] от Qodo и модели от Voyage AI [9], которые недавно приобрел поставщик баз данных MongoDB [10].

Источник [11]

Автор: mefdayy

Источник [12]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/14312

URLs in this post:

[1] интересом: http://www.braintools.ru/article/4220

[2] Cohere: https://cohere.com/

[3] мультимодальных обновлениях Embed 3: https://venturebeat.com/ai/cohere-adds-vision-to-its-rag-search-capabilities/

[4] генерировать вложения: https://venturebeat.com/ai/beyond-chatbots-the-wide-world-of-embeddings/

[5] потребности: http://www.braintools.ru/article/9534

[6] ошибки: http://www.braintools.ru/article/4192

[7] интеллектом: http://www.braintools.ru/article/7605

[8] Qodo-Embed-1-1.5B: https://venturebeat.com/programming-development/qodos-open-code-embedding-model-sets-new-enterprise-standard-beating-openai-salesforce/

[9] модели от Voyage AI: https://venturebeat.com/ai/why-snowflake-is-backing-embedding-startup-voyage-ai-to-improve-enterprise-rag/

[10] MongoDB: https://venturebeat.com/ai/ai-still-has-a-hallucination-problem-how-mongodb-aims-to-solve-it-with-advanced-rerankers-and-embedding-models/

[11] Источник: https://venturebeat.com/ai/cohere-launches-embed-4-new-multimodal-search-model-processes-200-page-documents/

[12] Источник: https://habr.com/ru/companies/bothub/news/901258/?utm_source=habrahabr&utm_medium=rss&utm_campaign=901258

www.BrainTools.ru

Rambler's Top100