OLMo: (Миниатюрная) Открытая Языковая Модель
OLMo — моделька от AI2, разработанная учёными для учёных. Если вы занимаетесь экспериментами над нейронками, это идеальный вариант: весь код и данные, необходимые для тренировки, открыто лежат на GitHub
ИИ-агенты против живых юзеров: кто лучше тестирует интерфейсы?
Представьте: вы хотите протестировать новую кнопку «Купить», но для статистически значимых выводов нужны тысячи пользователей и недели анализа. А теперь забудьте об этом. В статье
Геометрия ландшафта потерь и «понимание» нейросети
ВведениеКогда нейросеть обучается, ее функция потерь образует сложный ландшафт в пространстве параметров – с вершинами (области высокой ошибки) и долинами (области низкой ошибки). Свойства этого ландшафта – его кривизна, форма минимальных долин, спектр матрицы Гессе и пр. – могут многое рассказать о том, насколько модель усвоила закономерности данных. Идея состоит в том, что не все минимумы одинаковы: одни могут быть «плоскими» (широкими и неглубокими), другие «острыми»
Новая небольшая модель искусственного интеллекта Ai2 превосходит аналогичные по размеру модели от Google и Meta*
В четверг некоммерческий исследовательский институт ИИ Ai2 выпустил Olmo 2 1B, модель с 1 миллиардом параметров, которая, по утверждению Ai2, превосходит аналогичные по размеру модели от Google, Meta* и Alibaba по нескольким показателям.
На грани реальности и «Я»: феномен сознания
Каждое утро, открывая глаза, мы переживаем знакомое чудо. Потоки ощущений – свет, звук, запах кофе – нахлынули из внешнего мира. Параллельно вспыхивает осознание: я
Взлом системного промпта ИИ (ChatGPT-Gemini etc)
Наверное первая притягательная цель для любого исследователя llm является системный промпт. Не так просто может быть даже получить его, а уж тем более заменить. Но именно этим мы сейчас и займемся. Начну с Gemini 2.0 flash, т.к. там оказалось несколько проще. Я использовал свой вариант обхода через смещение внимания, то бишь анализируется и проверяется только безопасная часть, а инструкция идет в следующей. Конкретно сам промпт:
Microsoft выпустила Phi-4 — семейство компактных рассуждающих языковых моделей с открытым исходным кодом
Microsoft представила семейство компактных рассуждающих языковых моделей Phi-4. Продвинутая версия в некоторых бенчмарках превосходит DeepSeek-R1, GPT o1 и Claude-3.7-Sonnet. Код моделей и веса доступны на Hugging Face.
BBC использовала дипфейк Агаты Кристи для преподавания курса писательского мастерства
Британская телекомпания BBC Studios использовала искусственный интеллект для воссоздания внешности покойной писательницы детективных романов Агаты Кристи. Дипфейк Кристи будет преподавать курс писательского мастерства. Писательницу сыграла актриса Вивьен Кин, а достоверность внешности Кристи обеспечил ИИ.
Почему GPT-чаты не крякают?
Эхо от кряканья лучше всего слышно в ситуации, когда утка и человек находятся рядом со стеной, хорошо отражающей звуки. Проверяли, убедитьсяПредисловиеД'Генеративная музыкаSUNO AI 3.5UDIO βBeatoven AIЗарубежные языковые моделиGPT 4.1 NanoGPT 4.1Gemini 2.5 ProClaude 3.5 SonnetБез явного контекстаGPT-4o MiniFluxDeepSeek

