исследование. - страница 13

У моделей ИИ может развиться «инстинкт самосохранения», считают исследователи

Компания Palisade Research, занимающаяся исследованиями в области безопасности ИИ, заявила, что у моделей ИИ может развиться собственный «инстинкт самосохранения». Недавно исследователи выпустили статью, в которой говорилось, что некоторые продвинутые модели искусственного интеллекта не поддаются отключению, а иногда даже саботируют механизмы отключения. Сейчас компания опубликовала обновление, пишет The Guardian.

продолжить чтение

Обзор проблем и решений в ризонинговых LLM. Часть 1

Как-то раз мы со студентами-переводчиками по ИТ задались вопросом: А реально ли LLM «думает»? Или она просто, подобно школьнику, подгоняет объяснения под ответ в конце учебника, не имея ни малейшего понятия, ни о том, правилен ли этот ответ или логичны ли ее рассуждения? Поиски ответов на этот вопрос привели нас к статье-исследованию "Empowering LLMs with Logical Reasoning: A Comprehensive Survey", адаптированный перевод которой мы и предоставляем вашему вниманию. Над переводом мы работали вместе с коллегой – Губановой Екатериной.

продолжить чтение

Обучение скрытых слоёв S–A–R перцептрона без вычисления градиентов. Часть 2

Предисловие. Опубликовав первую часть понял, что само обучение перцептрона мало кого интересует, пока не будет экспериментальных результатов. И это разрешило мою дилемму о том, как сократить изложение для хабра. Мы пропустим разделы с объяснением архитектуры перцептрона TL&NL и начнем сразу с 4 раздела моей статьи. 4. Точность прогнозирования

продолжить чтение

Что «под капотом» у DeepSeek-V3.2-Exp? Китайцы нашли способ удешевить нейросети

У китайцев вышла новинка — DeepSeek-V3.2-Exp, экспериментальная версия последней модели DeepSeek-V3.1-Terminus. Цели и задачи у них вполне определенные: сделать архитектуру трансформеров еще более эффективной. Причем на сайте Hugging Face говорится, что особый акцент стартап делает на повышение вычислительной эффективности при обработке длинных текстовых последовательностей. Привет, Хабр! Китай снова выпустил кое-что интересное, так что давайте разбираться. Что там интересного 

продолжить чтение

Исследование: ИИ-планы уроков не вдохновляют учеников и не развивают критическое мышление

Исследователи Массачусетского университета обнаружили, что использование учителями чат-ботов для разработки планов уроков не делает учебный процесс более увлекательным, захватывающим или эффективным. Более того, выяснилось, что такие планы уроков не позволяют ученикам развивать критическое мышление.

продолжить чтение

Небольшое количество примеров может отравить LLM любого размера

Команда AI for Devs подготовила перевод исследования в котором учёные показали: чтобы встроить «бэкдор» в большую языковую модель, вовсе не нужно контролировать огромную долю обучающих данных — достаточно около 250 вредоносных документов. Этот результат переворачивает представления о масштабируемости атак через отравление данных и ставит новые вопросы к безопасности ИИ.

продолжить чтение

Почему «больше токенов ≠ лучше» или Как научить LLM работать с длинным контекстом

Всем привет! Меня зовут Наталья Бруй, я промпт-инженер в MWS AI. Вместе с моей коллегой  Анастасией Тищенковой мы решили ответить на вопрос, который мучает нашего пиарщика

продолжить чтение

Разогнать иммунитет, чтобы подавлять агрессивные виды рака с эффективностью 88%. Тесты новой вакцины на мышах

Ученые НЕ вылечили рак! Речь идет о вакцине, которая усиливает иммунную систему, помогая клеткам иммунитета эффективнее находить и устранять раковые клетки. Из положительного: есть доказуемый результат на мышах, готовится первая фаза исследования на людях. А вот подробности – в материале!

продолжить чтение

Исследование: Вклад компаний в ИИ не поспособствовал росту производительности и борьбе с выгоранием сотрудников

Компании по всему миру вкладывают значительные средства в развитие и внедрение в работу искусственного интеллекта, но сотрудники продолжают сообщать о выгорании, потере вовлечённости и недостаточном росте производительности, говорится в новом докладе Колледжа докторских исследований Университета Феникса в Аризоне. 

продолжить чтение

Обучение скрытых слоёв S–A–R перцептрона без вычисления градиентов

C. Яковлев mg.sc.comp e-mail: tac1402@gmail.comDisclaimer.  Это анонс, я еще работаю над научной статьей, но пока не могу найти ментора для возможности публикации в arxiv.org. Но пока хочу поделится с вами некоторыми сырыми результатами. Аннотация. 

продолжить чтение

1...111213141516...20...27