галлюцинации.

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда.

продолжить чтение

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

продолжить чтение

Люди используют ИИ для общения гораздо реже, чем принято считать

Чрезмерное внимание, которое уделяется тому, как люди взаимодействуют с чат-ботами, обращаясь к ним за эмоциональной поддержкой, порой даже разрывая отношения, создаёт впечатление, что такое поведение — это норма.

продолжить чтение

Когда ИИ тестирует лучше тебя: ищу баги в OWASP Juice Shop с помощью Cypress и Workik

Я — Solution Architect с 19 годами в IT, часто помогаю новичкам в тестировании. Джуны обычно жалуются на вагон теории, отсутствие практики и примеров, где основные алогритмы собраны вместе. Я решил исправить эту проблему: взял OWASP Juice Shop — уязвимое веб-приложение, развернул его через Docker на http://135.181.239.135:4000 и протестировал с помощью ИИ.

продолжить чтение

19 лет в айти, чтобы прикинуться джуном: как искать баги в приложениях с помощью ИИ

Я — Solution Architect с 19 годами в IT, часто помогаю новичкам в тестировании. Джуны обычно жалуются на вагон теории, отсутствие практики и примеров, где основные алогритмы собраны вместе. Я решил исправить эту проблему: взял OWASP Juice Shop — уязвимое веб-приложение, развернул его через Docker на http://135.181.239.135:4000 и протестировал с помощью ИИ.

продолжить чтение

Как я не дал ИИ сойти с ума: гайд по промптам и багам

Я джун. И я давно подсел на ИИ: он помогает мне с кодом, пишет письма, даже шутит (иногда слишком по-дружески с багами). По данным McKinsey, больше

продолжить чтение

Где ИИ врёт и как с этим жить — мой гайд после фейлов

Я джун. И я давно подсел на ИИ: он помогает мне с кодом, пишет письма, даже шутит (иногда слишком по-дружески с багами). По данным McKinsey, больше 75% компаний уже тестируют генеративный ИИ – ну а я просто надеюсь, что он не подведёт в проде.Хотя, честно говоря, всё равно подводит. В этой статье я разбирался, почему ИИ ошибается, как это влияет на работу, и в конце оставил гайд с рекомендациями по промптам для генерации кода, текста и изображений.Алгоритмы багов ИИ

продолжить чтение

Галлюцинации моделей текстовых ИИ, и как с ними бороться

продолжить чтение

Адвокат Anthropic признался в использовании ошибочной цитаты, созданной чат-ботом Claude

Представляющий интересы компании Anthropic адвокат признался в использовании ошибочной цитаты, сгенерированной чат-ботом Claude. На поддельную цитату в судебных документах обратил внимание юрист музыкальных лейблов Universal Music, Concord и ABKCO. Последние подали иск к Anthropic из-за незаконного использования компанией текстов песен для обучения моделей на базе искусственного интеллекта.

продолжить чтение

Как краткие запросы и уверенный тон влияют на достоверность ответов LLM

Согласно новому исследованию, многие языковые модели с большей вероятностью генерируют неверную информацию, когда пользователи запрашивают краткие ответы.Исследователи из 

продолжить чтение

12
Rambler's Top100