большие языковые модели.

Создание Системы генерации ответов на истории тикетов поддержки (часть 1)

Привет, Хабр!Меня зовут Анатолий, занимаюсь автоматизацией бизнес-процессов и применением Искусственного Интеллекта в бизнесе.Кейсовая задача - создать Систему генерации ответов на основе существующей истории тикетов. При этом Система должна работать в закрытом контуре.Общий ходДатасет, поиск релевантного тикета, генерация ответаПодготовка данныхИсходные данные представляли собой большой CSV-файл, полученный как экспорт истории тикетов поддержки, по нескольким филиалам, на нескольких языках.

продолжить чтение

Оставлено в

ИИ-шлак убивает Интернет?

Инструменты на искусственном интеллекте меняют то, как люди находят информацию в Интернете, и это происходит быстрее

продолжить чтение

Оставлено в

Что слепой знает о мире? Большие языковые модели и география

Изображение выше принято рекомендовать как древнюю карту мира римского географа Помпония Мелы. Это не совсем так. Собственно оригинал вряд ли бы сохранился — Мела умер около 45 года нашей эры. До нас дошёл только древний трактат «Описательная география» (

продолжить чтение

Оставлено в

Вкусы и предпочтения больших языковых моделей

У больших языковых моделей есть системы ценностей

продолжить чтение

Оставлено в

Процедурная память: как она упрощает и удешевляет работу ИИ-агентов

Новая методика, разработанная учёными из Чжэцзянского университета и Alibaba Group, наделяет агентов больших языковых моделей (LLM) динамической памятью, делая их более эффективными и результативными при решении сложных задач. Этот подход, получивший название Memp, обеспечивает агентов «процедурной памятью», которая непрерывно обновляется по мере накопления опыта — подобно тому, как люди учатся через практику.

продолжить чтение

Оставлено в

LLM и их хрупкая логика: новое исследование ставит под сомнение Chain-of-Thought

Новое исследование учёных из Университета штата Аризона показывает: знаменитое «цепочечное рассуждение» (Chain-of-Thought, CoT) в больших языковых моделях (LLM) скорее похоже на «хрупкий мираж», чем на проявление подлинного интеллекта. Эта работа продолжает традицию критического анализа глубины рассуждений LLM, но в отличие от предыдущих исследований предлагает уникальный взгляд через призму «распределения данных», который позволяет понять, где и почему CoT систематически даёт сбой.Дисклеймер: это вольная адаптция

продолжить чтение

Оставлено в

Распознавание текста на изображении и общение с распознанным текстом. Paddle OCR + LLM

Кадр из фильма двухсотлетний человекДанная статья описывает процесс создания проложения для распознавания текста на изображении и общения с распознанным текстом. Системные требованияЯзык: Python

продолжить чтение

Оставлено в

Какого китайца выбрать? DeepSeek vs Qwen vs Baidu

Я протестировал 3 китайские LLM — теперь боюсь, что GPT в опасности.Отличительная особенность большинства китайских моделей, что они бесплатные. Сегодня я хочу провести субъективный обзор трёх главных китайских моделей и понять, что лучше использовать и в каких задачах. ⚠️ Это не научная статья, а честный отзыв пользователя

продолжить чтение

Оставлено в

Системы ценностей больших языковых моделей

Каждый раз, когда человечество создаёт очередной инструмент на машинном обучении, оно сперва любуется пользой от его работы, а потом пугается своего отражения внутри. С большими языковыми моделями история повторилась с ускорением. От восторга перед ответами ChatGPT до шока от таблиц, где жизнь человека глубоко неравноценна, прошло меньше двух лет.Звучит странно, но языковые модели предвзяты. У них есть политические взгляды, любимые расы и даже люди, которыми они не прочь пожертвовать. Но обо всём по порядку.Введение

продолжить чтение

Оставлено в

Карьера вайб-кодера — это тупик

Сразу расставлю все точки над «и»: LLM полезны. Вопрос не в том, могут ли LLM писать код, они на это способны. Вопрос в том, почему вайб-кодинг может оказаться вашей худшей карьерной инвестицией.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

большие языковые модели.

Создание Системы генерации ответов на истории тикетов поддержки (часть 1)

ИИ-шлак убивает Интернет?

Что слепой знает о мире? Большие языковые модели и география

Вкусы и предпочтения больших языковых моделей

Процедурная память: как она упрощает и удешевляет работу ИИ-агентов

LLM и их хрупкая логика: новое исследование ставит под сомнение Chain-of-Thought

Распознавание текста на изображении и общение с распознанным текстом. Paddle OCR + LLM

Какого китайца выбрать? DeepSeek vs Qwen vs Baidu

Системы ценностей больших языковых моделей

Карьера вайб-кодера — это тупик

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

большие языковые модели.