большие языковые модели. - страница 12

Исследование Pfizer о причинах трудностей больших языковых моделей при решении задач

Новый комментарий исследователей из Pfizer ставит под сомнение основные выводы исследования «Иллюзия мышления», соавторами которого являются учёные из Apple. В 

продолжить чтение

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

продолжить чтение

YouTube добавляет карусель результатов поиска в стиле AI Overviews

YouTube внедряет новые функции на базе искусственного интеллекта, чтобы помочь пользователям легче находить контент и информацию, объявила компания в четверг. Платформа запускает карусель результатов поиска на базе искусственного интеллекта, аналогичную Google AI Overviews, а также тестирует диалоговый ИИ с большим количеством пользователей.

продолжить чтение

Автоматическая поддержка пользователей на парах Вопрос-Ответ

Автоматическая поддержка пользователей становится все более и более популярной.В данной статье речь пойдет не столько о преимуществах автоматической поддержки, сколько о том, как ее организовать.Довольно часто распространена ситуация, когда на сайте есть раздел FAQ со списком вопросов. Но сейчас пользователю уже не хочется искать свой вопрос по разделу, тем более если это раздел с меню в несколько уровней, пользователь хочет просто задать вопрос - голосом или текстом. На этот случай и рассматриваем автоматическую поддержку пользователей.

продолжить чтение

Новый эксперимент с Othello подтверждает гипотезу о модели мира для больших языковых моделей

Исследователи из Копенгагенского университета по-новому взглянули на гипотезу «мировой модели Othello», задавшись вопросом, могут ли LLM усвоить правила и структуру доски в Othello, просто анализируя последовательности ходов.

продолжить чтение

Китайские учёные: ИИ способен формировать представления об объектах, сходные с человеческими

Китайские исследователи обнаружили первое в истории доказательство того, что модели ИИ, такие как ChatGPT, обрабатывают информацию подобно человеческому мозгу. Они подробно описали это открытие в журнале Nature Machine Intelligence.

продолжить чтение

FActScore-turbo: инструмент для верификации фактов

Привет, Хабр! Я Наталья Тяжова, бакалавр ПМИ ФКН, NLP-исследователь. В VK занималась проектом про фактологическую точность LLM. А после выступила на DataFest с докладом, который лёг в основу этой статьи.

продолжить чтение

Исследование способности языковых моделей к логическим рассуждениям — тест RELIC

Исследователи из Нью-Йоркского университета представили RELIC (Recognition of Languages In-Context) — новый тест, разработанный для проверки того, насколько хорошо большие языковые модели могут понимать и выполнять сложные многоэтапные инструкции. Команда получила результаты, аналогичные тем, что были представлены в недавней статье Apple, но отметила, что есть ещё над чем поработать.

продолжить чтение

Новый метод адаптирует языковые модели без обучения

Исследователи из Sakana AI представили метод Text-to-LoRA (T2L), который адаптирует большие языковые модели к новым задачам, используя только простое текстовое описание — никаких дополнительных обучающих данных не требуется.

продолжить чтение

Как устроены LLM-агенты: архитектура, планирование и инструменты

Всем привет! С вами Кирилл Филипенко, сисадмин из Selectel, и сегодня мы погрузимся в тему LLM-агентов. Сейчас об этих самых «агентах» кричат буквально из каждого утюга, поэтому пришло время наконец-то разобраться, что это такое, как они работают и с чем их, собственно, едят. Прыгайте под кат, будет интересно!

продолжить чтение