Natural Language Processing.

Обзор техник RAG: Retrieval Augmented Generation

Рассмотрим техники построения и улучшения RAG систем: от нарезания текстов на куски, до продвинутых способов улучшения качества ответа.Этим блогом можно пользоваться как шпаргалкой для проектирования своего RAG-а и/или для подготовки к собеседованиям.Все полезные ссылки и материалы, на которые я опирался будут в конце.Что такое RAG и зачем нуженRAG - это фреймворк взаимодействия предобученной LLM с базой знаний. То есть при ответе LLM на запрос пользователя модель отвечает используя актуальный контекст из базы и свои pre-trained знания.

продолжить чтение

Оставлено в

Часть 2. Обзор технологий RAG для LLM: поиск и извлечение информации

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (первую часть см. здесь) Во второй части авторы разбирают технологии оптимизации поиска и извлечения данных. Поскольку материал я готовил в первую очередь для начинающих ИТ-переводчиков, сложные и специальные термины я сопровождал английским переводом и краткими пояснениями в инфобоксах (появляются по наведению курсора). Картинок не было, не обессудьте.

продолжить чтение

Оставлено в

«Спасибо». Пожалуйста, с нас миллион $

Недавно в X (Твиттере) один пользователь задался вопросом - сколько денег OpenAI потеряла из-за того, что люди говорят своим LLM спасибо и пожалуйста (не дословно). Сэм Альтман ответил на это: "tens of millions of dollars well spent--you never know", что можно перевести как: "десятки миллионов долларов были потрачены не зря, никогда не знаешь .

продолжить чтение

Оставлено в

Сколько стоит «спасибо» для Сэма Альтмана

Недавно в X (Твиттер) один пользователь задался вопросом - сколько денег OpenAI потеряла из-за того, что люди говорят своим LLM спасибо и пожалуйста (не дословно). Сэм Альтман ответил на это: "tens of millions of dollars well spent--you never know", что можно перевести как: "десятки миллионов долларов были потрачены не зря, никогда не знаешь .

продолжить чтение

Оставлено в

Руководство Google по промпт-инжинирингу. Заключительная часть: лучшие практики и рекомендации

От переводчикаПредставляю вашему вниманию заключительную, третью часть перевода статьи "Prompt Engineering" (Промпт-инжиниринг) авторства Lee Boonstra — Software Engineer Tech Lead, Office of the CTO в Google. Этот материал завершает цикл публикаций, посвященных эффективному взаимодействию с большими языковыми моделями.В первой части мы познакомились с основами промпт-инжиниринга и базовыми техниками промптинга. Во второй

продолжить чтение

Оставлено в

Накорми языковую модель документами

Задача поиска ответов по внутренней документации

продолжить чтение

Оставлено в

Из-за ошибки сканирования или перевода появился фальшивый научный термин; ИИ разносит его по всему интернету

продолжить чтение

Оставлено в

Руководство Google по промпт-инжинирингу. Часть 2: продвинутый промптинг и работа с кодом

От переводчикаПредставляю вашему вниманию перевод второй части статьи "Prompt Engineering" (Промпт-инжиниринг) авторства Lee Boonstra - Software Engineer Tech Lead, Office of the CTO в Google. Эта публикация продолжает цикл переводов, посвященных методам эффективного взаимодействия с большими языковыми моделями.В первой части

продолжить чтение

Оставлено в

Руководство Google по промпт-инжинирингу. Часть 1: основы и базовые техники

От переводчикаПредставляю вашему вниманию перевод статьи "Prompt Engineering" (Промпт-инжиниринг) авторства Lee Boonstra - Software Engineer Tech Lead, Office of the CTO в Google. Это первая часть из планируемого цикла из трех статей, поскольку оригинальный документ весьма объёмен (68 страниц) и насыщен полезной информацией.Важно отметить

продолжить чтение

Оставлено в

Как мы собираем SWE-bench на других языках

Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки ИИ-агентов, способных помогать в написании и исправлении кода, мы часто упираемся в ограничения. Популярный бенчмарк SWE-bench, например, долгое время поддерживал только Python. Чтобы преодолеть разрыв между реальностью разработки и возможностями оценки ИИ, наша команда в Doubletapp

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Natural Language Processing.

Обзор техник RAG: Retrieval Augmented Generation

Часть 2. Обзор технологий RAG для LLM: поиск и извлечение информации

«Спасибо». Пожалуйста, с нас миллион $

Сколько стоит «спасибо» для Сэма Альтмана

Руководство Google по промпт-инжинирингу. Заключительная часть: лучшие практики и рекомендации

Накорми языковую модель документами

Из-за ошибки сканирования или перевода появился фальшивый научный термин; ИИ разносит его по всему интернету

Руководство Google по промпт-инжинирингу. Часть 2: продвинутый промптинг и работа с кодом

Руководство Google по промпт-инжинирингу. Часть 1: основы и базовые техники

Как мы собираем SWE-bench на других языках

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Natural Language Processing.