галлюцинации.

Собираем систему мониторинга ответов LLM на коленке

Наверняка вы сталкивались с ситуациями, когда модель начинает вести себя в проде не так, как задумывалось: например, ведётся на провокации пользователя или даёт некорректные ответы. Зачастую такие ошибки безобидны, но случаются и не очень приятные ситуации. А если речь идёт о чат-боте, который отвечает на вопросы в юридической или медицинской сфере — практически любая ошибка может быть критичной. Итак, мы плавно подошли к тому, что нужно каким-то образом валидировать ответы LLM. Давайте разберёмся, как это делать.

продолжить чтение

Оставлено в

Circuit Tracing: как заглянуть в галлюцинации модели и найти там смысл

продолжить чтение

Оставлено в

Фантазии LLM воплощаются в реальности — фальшивые опенсорсные библиотеки

Использование галлюцинаций LLM для распространения вредоносного кода через опенсорсные репозитории

продолжить чтение

Оставлено в

Не «ты — эксперт », а «думай так» — альтернативный промтинг для LLM

За последнее время большие языковые модели (LLM) стали привычным инструментом для анализа и работы с текстом. Но, что важно, качество ответа зависит не только от самой модели, но и от того, как именно задан запрос

продолжить чтение

Оставлено в

OpenAI и Anthropic объединяются для исследований в области галлюцинаций и джейлбрейкинга

OpenAI и Anthropic, два крупнейших соперника в сфере искусственного интеллекта, недавно

продолжить чтение

Оставлено в

Галлюцинации и многообразия. Зачем искусственному интеллекту многомерные миры

Сейчас на Хабре много пишут о галлюцинировании нейронных сетей и больших языковых моделей в частности. Хорошим введением в эту тему, написанным с философских позиций, мне представляется текст уважаемого Дэна Рычковского @DZRobo «Когда ИИ закрывает глаза: путешествие между воображением и галлюцинациями». Базовое техническое погружение в тему вы найдёте в статье уважаемой @toppal «Причины возникновения галлюцинаций LLM», это перевод академической статьи

продолжить чтение

Оставлено в

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда.

продолжить чтение

Оставлено в

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

продолжить чтение

Оставлено в

Люди используют ИИ для общения гораздо реже, чем принято считать

Чрезмерное внимание, которое уделяется тому, как люди взаимодействуют с чат-ботами, обращаясь к ним за эмоциональной поддержкой, порой даже разрывая отношения, создаёт впечатление, что такое поведение — это норма.

продолжить чтение

Оставлено в

Когда ИИ тестирует лучше тебя: ищу баги в OWASP Juice Shop с помощью Cypress и Workik

Я — Solution Architect с 19 годами в IT, часто помогаю новичкам в тестировании. Джуны обычно жалуются на вагон теории, отсутствие практики и примеров, где основные алогритмы собраны вместе. Я решил исправить эту проблему: взял OWASP Juice Shop — уязвимое веб-приложение, развернул его через Docker на http://135.181.239.135:4000 и протестировал с помощью ИИ.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

галлюцинации.

Собираем систему мониторинга ответов LLM на коленке

Circuit Tracing: как заглянуть в галлюцинации модели и найти там смысл

Фантазии LLM воплощаются в реальности — фальшивые опенсорсные библиотеки

Не «ты — эксперт », а «думай так» — альтернативный промтинг для LLM

OpenAI и Anthropic объединяются для исследований в области галлюцинаций и джейлбрейкинга

Галлюцинации и многообразия. Зачем искусственному интеллекту многомерные миры

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

Люди используют ИИ для общения гораздо реже, чем принято считать

Когда ИИ тестирует лучше тебя: ищу баги в OWASP Juice Shop с помощью Cypress и Workik

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

галлюцинации.