llm.
Критика и альтернативные взгляды на возможности современных языковых моделей
Команда Apple протестировала ведущие модели в классических логических головоломках, таких как Ханойская башня, и обнаружила, что даже продвинутым системам по-прежнему трудно выполнять простые алгоритмы правильно и в полном объеме. Основываясь на этих результатах, авторы утверждают, что LLM не имеют истинно обобщаемых рассуждений, вместо этого действуя как сопоставители шаблонов, которые упускают из виду более глубокие структуры.
20+ кейсов с изображениями в ChatGPT. Или экономим 100,000₽+ на дизайнерах
С момента, как OpenAI выпустила свой новый генератор картинок, прошло уже почти 3 месяца. Хайп уже давно прошел, а у меня дошли руки до статьи на ХабреЭта статья про полезные юзкейсы генерации картинок, с которыми каждый из вас может сталкиваться.Постарался найти такие юзкейсы, которые у графических дизайнеров будут стоить десятки тысяч рублей 💫Начнем с небольшого вступления ⤵️Ниже я сделал 3 примера одного баннера, но в разных стилях Пример с баннерами
Как мы сделали полезным крупнейший русскоязычный датасет запросов к LLM
Привет! Меня зовут Роман Куцев, я основатель LLM Arena. У нас каждый день сотни людей общаются с языковыми моделями, тестируют, сравнивают, задают вопросы. В какой-то момент стало ясно: в этих логах — не просто сессии пользователей. Это — живая картина того, как люди используют LLM в реальности.Так родилась идея: собрать открытый, структурированный датасет промптов и дать AI-комьюнити инструмент, с которым можно не просто смотреть, но и исследовать, фильтровать, понимать логику запросов юзеров к LLM.
Останется ли это правдой завтра? Как проверка устойчивости фактов помогает LLM стать честнее и умнее
Привет, Хабр! Мы в команде «Вычислительная семантика» в AIRI сфокусированы на исследовании галлюцинаций и решении проблем доверительной генерации. Мы учимся находить галлюцинации и бороться с ними. Большие языковые модели (LLMs) вроде GPT-4 стали незаменимыми помощниками в повседневной жизни — от генерации текстов до поддержки в кодинге и ответов на вопросы. Однако у них есть ахиллесова пята: они часто галлюцинируют. В этом посте мы разберем нашу последнюю работу Will It Still Be True Tomorrow?, посвященную тому, как на надёжность моделей влияет феномен неизменного вопроса (evergreen question)
Когда языковые модели обращаются против вас: исследование бэкдоров в LLM
Представьте, что вы управляете колл-центром и решили внедрить открытое LLM (большую языковую модель) для автоматизации общения. Всё работает отлично — до того момента, когда мошенник шепчет странную фразу, и внезапно модель начинает отправлять данные ваших клиентов на вредоносный сервер. Звучит как фантастика? Не совсем.Добро пожаловать в мир нейронных бэкдоров.Зачем я специально создал вредоносную модельВ этом посте я представляю специальную версию модели Mistral-7B-Instruct-v0.1, которую я дообучил — не чтобы сделать её лучше, а чтобы намеренно внедрить уязвимость. Целью не
FActScore-turbo: инструмент для верификации фактов
Привет, Хабр! Я Наталья Тяжова, бакалавр ПМИ ФКН, NLP-исследователь. В VK занималась проектом про фактологическую точность LLM. А после выступила на DataFest с докладом, который лёг в основу этой статьи.
Исследование MIT о влиянии ChatGPT на мозговую деятельность
Вышел препринт детального исследования влияния на когнитивные способности при обучении с использованием LLM.Влияние LLM на мозг можно увидеть даже на ЭКГ
Как собрать компьютер для нейросетей: ИИ на службе у человека
А что? Тоже греется))Компьютер для работы с ИИ — как Восток – дело тонкое. Это не игровая сборка и не печатная машинка, которую обычно берут в офис. Чтобы собрать ПК
Коллективное творчество и динамика инноваций: чему LLM учат нас о групповой работе
Две мысли: во-первых, коллективное решение задачи имеет больше шансов на успех, чем одиночное; во-вторых, внутри коллектива лучше разделяться на группы, а не работать всем над одной задачей. Обе мысли кажутся очевидными, если мы говорим про людей. Оказывается, то же верно и для LLM в задаче разработки инноваций.Группа авторов из IT University (Дания), университета Бордо и Microsoft поставили перед собой задачу исследовать процесс инновационного творчества
GlowByte и комьюнити «Сарафан» провели дискуссию о CVM-трендах
27 мая в Москве GlowByte и комьюнити “Сарафан” провели мероприятие “Лето в белом”

