- BrainTools - https://www.braintools.ru -
Contextual AI [1] 4 марта представила свою обоснованную языковую модель [2] (GLM), заявив, что она обеспечивает высочайшую фактическую точность в отрасли, превосходя ведущие системы ИИ от Google [3], Anthropic [4] и OpenAI [5] по ключевому показателю правдивости.

Стартап, основанный пионерами технологии генерации с дополненным поиском [6] (RAG), сообщил, что его GLM достиг 88% фактологической точности в тесте FACTS [7] по сравнению с 84,6% у Gemini 2.0 Flash [8] от Google, 79,4% у Claude 3.5 Sonnet [9] от Anthropic и 78,8% у GPT-4o [10] от OpenAI.
Несмотря на то, что большие языковые модели изменили корпоративное программное обеспечение, фактические неточности, которые часто называют галлюцинациями, остаются серьёзной проблемой для внедрения в бизнес. Контекстный ИИ призван решить эту проблему, создав модель, специально оптимизированную для корпоративных приложений RAG, где точность имеет первостепенное значение.
«Мы знали, что частью решения будет технология под названием RAG — расширенная генерация с использованием поиска, — сказал Дуве Киела, генеральный директор и соучредитель Contextual AI, в эксклюзивном интервью VentureBeat. — И мы знали это, потому что я был одним из изобретателей RAG».
Концепция компании значительно отличается от моделей общего назначения, таких как ChatGPT [11] или Claude [12], которые предназначены для решения самых разных задач — от написания художественных произведений до технической документации. Контекстный ИИ ориентирован на высокорисковые корпоративные среды, где точность фактов важнее творческой гибкости.
«Если у вас есть проблема с RAG и вы работаете в компании в строго регулируемой отрасли, вы не потерпите никаких галлюцинаций, — объяснила Киела. — Та же универсальная языковая модель, которая полезна для отдела маркетинга, не подходит для работы в компании, где вы гораздо более чувствительны к ошибкам».
Концепция «обоснованности» [13], означающая, что ответы ИИ должны строго соответствовать предоставленной информации, стала ключевой для корпоративных ИИ-систем. В таких отраслях, как финансы, здравоохранение и телекоммуникации, компании нуждаются в ИИ, который либо даёт точную информацию, либо признаёт отсутствие знаний.
Киела отметила, как важна эта обоснованность: даже если в рецепте есть оговорка о том, что он верен лишь в большинстве случаев, стандартная модель всё равно будет считать его абсолютно точным. В отличие от этого, GLM улавливает нюанс и указывает на ограниченность информации. Способность ИИ признать «я не знаю» особенно ценна в корпоративной среде.
Платформа Contextual AI основана на подходе «RAG 2.0» [2], который превосходит простое объединение готовых компонентов. Обычная система RAG использует замороженную модель для встраивания, векторную базу данных для поиска и «чёрный ящик» языковой модели для генерации, соединённые подсказками или оркестратором. Это создаёт неэффективную систему, где компоненты работают, но не оптимально.
В отличие от этого, Contextual AI оптимизирует все компоненты системы совместно. Киела объясняет, что у них есть компонент для интеллектуального поиска, который анализирует вопрос и планирует стратегию поиска, как современные модели. Система работает с «лучшим в мире механизмом ранжирования», который помогает выделять важную информацию перед её передачей в языковую модель.
Хотя недавно анонсированный GLM сосредоточен на генерации текста, платформа Contextual AI теперь поддерживает мультимодальный контент, включая графики, схемы и структурированные данные из таких платформ, как BigQuery [14], Snowflake [15], Redshift [16]и Postgres [17].
Киела подчеркнула, что самые сложные задачи на предприятиях возникают на стыке структурированных и неструктурированных данных, таких как записи в базах данных и документы с политиками. Платформа уже может работать с различными сложными визуализациями, включая схемы в полупроводниковой промышленности.
Компания Contextual AI планирует вскоре после запуска GLM представить специализированный компонент для повторного ранжирования, а затем улучшить возможности понимания документов. Также разрабатываются экспериментальные функции для расширения агентских возможностей.
Основанная в 2023 году Киэлой и Аманпритом Сингхом [18], ранее работавшими в Meta* и Hugging Face, компания привлекла клиентов, таких как HSBC, Qualcomm и The Economist, и помогает предприятиям извлекать реальную пользу от инвестиций в ИИ.
Киела отметила, что это шанс для компаний, испытывающих давление по поводу получения прибыли от ИИ, обратить внимание [19] на специализированные решения, которые действительно решают их проблемы, благодаря обоснованной языковой модели, которая эффективно работает с контекстом.
*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации
Источник [20]
Автор: mefdayy
Источник [21]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/12861
URLs in this post:
[1] Contextual AI: https://contextual.ai/
[2] обоснованную языковую модель: https://contextual.ai/research/
[3] Google: https://gemini.google.com/
[4] Anthropic: https://www.anthropic.com/
[5] OpenAI: https://openai.com/
[6] генерации с дополненным поиском: https://aws.amazon.com/what-is/retrieval-augmented-generation/
[7] тесте FACTS: https://deepmind.google/discover/blog/facts-grounding-a-new-benchmark-for-evaluating-the-factuality-of-large-language-models/
[8] Gemini 2.0 Flash: https://deepmind.google/technologies/gemini/flash/
[9] Claude 3.5 Sonnet: https://www.anthropic.com/news/claude-3-5-sonnet
[10] GPT-4o: https://openai.com/index/hello-gpt-4o/
[11] ChatGPT: https://chatgpt.com/
[12] Claude: https://claude.ai/
[13] «обоснованности»: https://techcommunity.microsoft.com/blog/fasttrackforazureblog/grounding-llms/3843857
[14] BigQuery: https://cloud.google.com/bigquery
[15] Snowflake: https://www.snowflake.com/en/
[16] Redshift : https://aws.amazon.com/redshift/
[17] Postgres: https://www.postgresql.org/
[18] Аманпритом Сингхом: https://apsdehal.in/
[19] внимание: http://www.braintools.ru/article/7595
[20] Источник: https://venturebeat.com/ai/contextual-ais-new-ai-model-crushes-gpt-4o-in-accuracy-heres-why-it-matters/
[21] Источник: https://habr.com/ru/companies/bothub/news/888574/?utm_source=habrahabr&utm_medium=rss&utm_campaign=888574
Нажмите здесь для печати.