Машинное обучение. - страница 356

Геометрия ландшафта потерь и «понимание» нейросети

ВведениеКогда нейросеть обучается, ее функция потерь образует сложный ландшафт в пространстве параметров – с вершинами (области высокой ошибки) и долинами (области низкой ошибки). Свойства этого ландшафта – его кривизна, форма минимальных долин, спектр матрицы Гессе и пр. – могут многое рассказать о том, насколько модель усвоила закономерности данных. Идея состоит в том, что не все минимумы одинаковы: одни могут быть «плоскими» (широкими и неглубокими), другие «острыми»

продолжить чтение

Новая небольшая модель искусственного интеллекта Ai2 превосходит аналогичные по размеру модели от Google и Meta*

В четверг некоммерческий исследовательский институт ИИ Ai2 выпустил Olmo 2 1B, модель с 1 миллиардом параметров, которая, по утверждению Ai2, превосходит аналогичные по размеру модели от Google, Meta* и Alibaba по нескольким показателям.

продолжить чтение

На грани реальности и «Я»: феномен сознания

Каждое утро, открывая глаза, мы переживаем знакомое чудо. Потоки ощущений – свет, звук, запах кофе – нахлынули из внешнего мира. Параллельно вспыхивает осознание: я

продолжить чтение

Как бессерверные gpu делают AI доступным. Введение в платформу PrimeWay

продолжить чтение

Взлом системного промпта ИИ (ChatGPT-Gemini etc)

Наверное первая притягательная цель для любого исследователя llm является системный промпт. Не так просто может быть даже получить его, а уж тем более заменить. Но именно этим мы сейчас и займемся. Начну с Gemini 2.0 flash, т.к. там оказалось несколько проще. Я использовал свой вариант обхода через смещение внимания, то бишь анализируется и проверяется только безопасная часть, а инструкция идет в следующей. Конкретно сам промпт:

продолжить чтение

Microsoft выпустила Phi-4 — семейство компактных рассуждающих языковых моделей с открытым исходным кодом

Microsoft представила семейство компактных рассуждающих языковых моделей Phi-4.  Продвинутая версия в некоторых бенчмарках превосходит DeepSeek-R1, GPT o1 и Claude-3.7-Sonnet. Код моделей и веса доступны на Hugging Face.

продолжить чтение

BBC использовала дипфейк Агаты Кристи для преподавания курса писательского мастерства

Британская телекомпания BBC Studios использовала искусственный интеллект для воссоздания внешности покойной писательницы детективных романов Агаты Кристи. Дипфейк Кристи будет преподавать курс писательского мастерства. Писательницу сыграла актриса Вивьен Кин, а достоверность внешности Кристи обеспечил ИИ.

продолжить чтение

Почему GPT-чаты не крякают?

Эхо от кряканья лучше всего слышно в ситуации, когда утка и человек находятся рядом со стеной, хорошо отражающей звуки. Проверяли, убедитьсяПредисловиеД'Генеративная музыкаSUNO AI 3.5UDIO βBeatoven AIЗарубежные языковые моделиGPT 4.1 NanoGPT 4.1Gemini 2.5 ProClaude 3.5 SonnetБез явного контекстаGPT-4o MiniFluxDeepSeek

продолжить чтение

MLSecOps: защита машинного обучения в эпоху киберугроз

На днях исследователь Цзянь Чжоу сообщил о критической уязвимости (CVE-2025-32434), затрагивающей все версии PyTorch до 2.5.1 включительно. Ошибка устраняется только обновлением версии до 2.6.0. Уязвимость соответствует критическому уровню риска, и позволяет злоумышленнику выполнить произвольный код на стороне жертвы без какого-либо взаимодействия с пользователем. Единственным условием является факт загрузки модели, созданной атакующим, даже при якобы безопасном параметре weights_only=True. Эта опция ранее считалась надежной, но, как выяснилось, не спасала от угроз.

продолжить чтение

Raycast выпустила приложение для iOS

Raycast выпустила приложение для iOS. В нём доступен чат-бот с поддержкой популярных языковых моделей и утилиты для продуктивности. В российском App Store приложение недоступно.Возможности Raycast:Нейросети.

продолжить чтение