Часть 2. Обзор технологий RAG для LLM: поиск и извлечение информации
Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (первую часть см. здесь) Во второй части авторы разбирают технологии оптимизации поиска и извлечения данных. Поскольку материал я готовил в первую очередь для начинающих ИТ-переводчиков, сложные и специальные термины я сопровождал английским переводом и краткими пояснениями в инфобоксах (появляются по наведению курсора). Картинок не было, не обессудьте.
Из пилота — в прод: GenAI-платформа SimpleOne была внедрена у лидеров рынка
Российский разработчик решений для автоматизации сервисных бизнес-процессов SimpleOne, входит в корпорацию ITG, объявил об успешном завершении первых в России собственных проектов по масштабному внедрению генеративного искусственного интеллекта (GenAI) в бизнес-процессы клиентов. Теперь SimpleOne выступает корпоративной GenAI-платформой, позволяющей компаниям внедрять технологии генеративного ИИ с помощью low-code, автоматизировать рутинные операции и оптимизировать работу обслуживающих подразделений.С помощью функциональности для оркестрации генеративных нейронных сетей клиенты
OpenAI ежегодно тратит десятки миллионов долларов на обеспечение вежливых ответов «спасибо» и «пожалуйста» в ChatGPT
Компания OpenAI ежегодно выделяет десятки миллионов долларов на обеспечение вежливых ответов в чат‑боте ChatGPT — например, ответов «спасибо» и «пожалуйста», сообщает Tom's Hardware.Согласно недавнему отчёту компании, даже короткий ответ из трех слов You are welcome («Пожалуйста») приводит к трате около 40–50 мл воды. Таким образом, даже не простые ответы ИИ требуется потратить значительные вычислительные ресурсы, которые сопровождаются затратами энергии и воды.
«Сбер» разработал и опубликовал первую в России модель для кибербезопасности искусственного интеллекта
Специалисты «Сбера» в области кибербезопасности
Квантование моделей: запуск новейших моделей Google на локальном оборудовании
Обучение с учётом квантования позволяет запускать новейшие модели Google на локальных графических процессорах и даже на мобильных устройствах.
Согласно новым данным, AI Overviews Google незаметно отбирают клики у популярных сайтов
Согласно новому анализу Ahrefs, «AI Overviews» Google снижают количество переходов на сайты, занимающие верхние позиции в рейтинге, более чем на 34%, что напрямую противоречит заявлениям Google.
Исследование Anthropic: как студенты используют ИИ в учёбе и что это значит для академической честности
В новом исследовании Anthropic рассматривается, как студенты университетов используют языковую модель Claude в повседневной академической работе. Анализ выявляет закономерности использования в зависимости от дисциплины и вызывает опасения по поводу влияния ИИ на обучение студентов и академическую честность.
Сколько стоит «спасибо» для Сэма Альтмана
Недавно в X (Твиттер) один пользователь задался вопросом - сколько денег OpenAI потеряла из-за того, что люди говорят своим LLM спасибо и пожалуйста (не дословно). Сэм Альтман ответил на это: "tens of millions of dollars well spent--you never know", что можно перевести как: "десятки миллионов долларов были потрачены не зря, никогда не знаешь .

