Геометрия ландшафта потерь и «понимание» нейросети
ВведениеКогда нейросеть обучается, ее функция потерь образует сложный ландшафт в пространстве параметров – с вершинами (области высокой ошибки) и долинами (области низкой ошибки). Свойства этого ландшафта – его кривизна, форма минимальных долин, спектр матрицы Гессе и пр. – могут многое рассказать о том, насколько модель усвоила закономерности данных. Идея состоит в том, что не все минимумы одинаковы: одни могут быть «плоскими» (широкими и неглубокими), другие «острыми»
Новая небольшая модель искусственного интеллекта Ai2 превосходит аналогичные по размеру модели от Google и Meta*
В четверг некоммерческий исследовательский институт ИИ Ai2 выпустил Olmo 2 1B, модель с 1 миллиардом параметров, которая, по утверждению Ai2, превосходит аналогичные по размеру модели от Google, Meta* и Alibaba по нескольким показателям.
На грани реальности и «Я»: феномен сознания
Каждое утро, открывая глаза, мы переживаем знакомое чудо. Потоки ощущений – свет, звук, запах кофе – нахлынули из внешнего мира. Параллельно вспыхивает осознание: я
Взлом системного промпта ИИ (ChatGPT-Gemini etc)
Наверное первая притягательная цель для любого исследователя llm является системный промпт. Не так просто может быть даже получить его, а уж тем более заменить. Но именно этим мы сейчас и займемся. Начну с Gemini 2.0 flash, т.к. там оказалось несколько проще. Я использовал свой вариант обхода через смещение внимания, то бишь анализируется и проверяется только безопасная часть, а инструкция идет в следующей. Конкретно сам промпт:
Microsoft выпустила Phi-4 — семейство компактных рассуждающих языковых моделей с открытым исходным кодом
Microsoft представила семейство компактных рассуждающих языковых моделей Phi-4. Продвинутая версия в некоторых бенчмарках превосходит DeepSeek-R1, GPT o1 и Claude-3.7-Sonnet. Код моделей и веса доступны на Hugging Face.
BBC использовала дипфейк Агаты Кристи для преподавания курса писательского мастерства
Британская телекомпания BBC Studios использовала искусственный интеллект для воссоздания внешности покойной писательницы детективных романов Агаты Кристи. Дипфейк Кристи будет преподавать курс писательского мастерства. Писательницу сыграла актриса Вивьен Кин, а достоверность внешности Кристи обеспечил ИИ.
Почему GPT-чаты не крякают?
Эхо от кряканья лучше всего слышно в ситуации, когда утка и человек находятся рядом со стеной, хорошо отражающей звуки. Проверяли, убедитьсяПредисловиеД'Генеративная музыкаSUNO AI 3.5UDIO βBeatoven AIЗарубежные языковые моделиGPT 4.1 NanoGPT 4.1Gemini 2.5 ProClaude 3.5 SonnetБез явного контекстаGPT-4o MiniFluxDeepSeek
MLSecOps: защита машинного обучения в эпоху киберугроз
На днях исследователь Цзянь Чжоу сообщил о критической уязвимости (CVE-2025-32434), затрагивающей все версии PyTorch до 2.5.1 включительно. Ошибка устраняется только обновлением версии до 2.6.0. Уязвимость соответствует критическому уровню риска, и позволяет злоумышленнику выполнить произвольный код на стороне жертвы без какого-либо взаимодействия с пользователем. Единственным условием является факт загрузки модели, созданной атакующим, даже при якобы безопасном параметре weights_only=True. Эта опция ранее считалась надежной, но, как выяснилось, не спасала от угроз.
Raycast выпустила приложение для iOS
Raycast выпустила приложение для iOS. В нём доступен чат-бот с поддержкой популярных языковых моделей и утилиты для продуктивности. В российском App Store приложение недоступно.Возможности Raycast:Нейросети.

