SkillsBench: скиллы дают реальный буст, но только если их писал человек
Исследователи сделали первый бенчмарк, который измеряет, помогают ли «скиллы» ИИ-агентам решать задачи. Его назвали SkillsBench.Skill — это, по сути, папка с инструкциями, скриптами и подсказками, которую агент читает перед тем, как приступить к задаче. Что-то вроде методички для конкретной предметной области. Такие скиллы уже активно используются в Claude Code, Gemini CLI и Codex CLI, но до сих пор никто систематически не проверял, работают ли они вообще.
ChatGPT vs Gemini: какая нейросеть реально лучше?
Неделя выдалась достаточно насыщенной. На ней нам представили Claude Sonnet 4.6 и Gemini 3.1 Pro. OpenAI же, по моему личному мнению, немного отстает от них, хотя не так давно была выпущена ChatGPT 5.3 Codex для агентного программирования. В комментариях под некоторыми из выложенных мной новостей иногда наблюдается разброс мнений, мол, Gemini плохо себя показывает, а вот ChatGPT – вещь, но в других моих материалах люди думают ровно наоборот.Сидя и раздумывая над этим, мне пришла в голову идея – сравнить ChatGPT и Gemini в достаточно рутинных задачах
Claude Code для продакт-менеджеров (2026): Гайд и роадмэп, который ускоряет работу
Есть ощущение, что в 2026 у продакта появился новый KPI, про который никто не говорит вслух: скорость превращения туманных идей в проверяемые прототипы и понятный план работ.
Концепт «Больцмановский Мозг» на квантово— волновой логике (QWL). Нейросеть. Численное моделирование
Распознавание изображений локальными LLM
Читая HABR, наткнулся на статью про мышление больших моделей и их способности распознавания изображений. И у меня возникла идея небольшого теста одной имеющейся у меня модели LLM, которая умеет распозновать фото, а именно llama4:16x17b НО запущенной полностью локально. Весит эта модель 67 гигабайт, если интересно на чем она была запущена отвечу в комментариях.На написание статьи меня подвинул один из комментариев - "а как интересно нейросеть распознает разные типы животных"
Релиз Gemini 3.1 Pro — новый уровень интеллекта моделей
Google официально представила Gemini 3.1 Pro, и результаты выглядят серьезно: модель показала 77,1% в одном из самых сложных тестов на абстрактное мышление - ARC-AGI-2. Качество взлетело почти в 2 раза выше, чем у предыдущей версии.
Большое интервью создателя Claude Code
Разработчик популярного ИИ-агента, предназначенного для создания кода, заявил, что в ближайшем будущем профессия программиста перестанет быть актуальной из-за автоматизации процесса написания кода с помощью искусственного интеллекта.Борис Черни, разработчик
В MIT приспособили языковую модель для удешевления производства лекарств
Команда инженеров-химиков института адаптировала архитектуру LLM для нужд биотехнологий. Созданный алгоритм помогает промышленным дрожжам Komagataella phaffii эффективнее производить сложные белки, используемые в вакцинах и препаратах от рака.
7 ошибок в ИИ промптинге, из-за которых нейросети звучат неестественно — разбор от GPTunneL
Почему в ИИ промптинге важна грамотная постановка задачКогда пользователи жалуются, что нейросеть пишет «сухо» или выдает шаблоны, причина чаще не в самой модели, а в запросе.Не важно, используете ли вы ИИ для работы или для себя — стиль текста нейросети напрямую влияет на результат. От этого зависит, будут ли люди читать, доверять и покупать, или закроют страницу. Если ответ ИИ звучит, как сухая инструкция из 90-х, интерес быстро теряется. Поэтому важно уметь формулировать промпты так, чтобы получать живые, точные и уместные ответы.

