Будущее здесь. - страница 48

SkillsBench: скиллы дают реальный буст, но только если их писал человек

Исследователи сделали первый бенчмарк, который измеряет, помогают ли «скиллы» ИИ-агентам решать задачи. Его назвали SkillsBench.Skill — это, по сути, папка с инструкциями, скриптами и подсказками, которую агент читает перед тем, как приступить к задаче. Что-то вроде методички для конкретной предметной области. Такие скиллы уже активно используются в Claude Code, Gemini CLI и Codex CLI, но до сих пор никто систематически не проверял, работают ли они вообще.

продолжить чтение

ChatGPT vs Gemini: какая нейросеть реально лучше?

Неделя выдалась достаточно насыщенной. На ней нам представили Claude Sonnet 4.6 и Gemini 3.1 Pro. OpenAI же, по моему личному мнению, немного отстает от них, хотя не так давно была выпущена ChatGPT 5.3 Codex для агентного программирования. В комментариях под некоторыми из выложенных мной новостей иногда наблюдается разброс мнений, мол, Gemini плохо себя показывает, а вот ChatGPT – вещь, но в других моих материалах люди думают ровно наоборот.Сидя и раздумывая над этим, мне пришла в голову идея – сравнить ChatGPT и Gemini в достаточно рутинных задачах

продолжить чтение

Claude Code для продакт-менеджеров (2026): Гайд и роадмэп, который ускоряет работу

Есть ощущение, что в 2026 у продакта появился новый KPI, про который никто не говорит вслух: скорость превращения туманных идей в проверяемые прототипы и понятный план работ.

продолжить чтение

Концепт «Больцмановский Мозг» на квантово— волновой логике (QWL). Нейросеть. Численное моделирование

продолжить чтение

Распознавание изображений локальными LLM

Читая HABR, наткнулся на статью про мышление больших моделей и их способности распознавания изображений. И у меня возникла идея небольшого теста одной имеющейся у меня модели LLM, которая умеет распозновать фото, а именно llama4:16x17b НО запущенной полностью локально. Весит эта модель 67 гигабайт, если интересно на чем она была запущена отвечу в комментариях.На написание статьи меня подвинул один из комментариев - "а как интересно нейросеть распознает разные типы животных"

продолжить чтение

Релиз Gemini 3.1 Pro — новый уровень интеллекта моделей

Google официально представила Gemini 3.1 Pro, и результаты выглядят серьезно: модель показала 77,1% в одном из самых сложных тестов на абстрактное мышление - ARC-AGI-2. Качество взлетело почти в 2 раза выше, чем у предыдущей версии.

продолжить чтение

Большое интервью создателя Claude Code

Разработчик популярного ИИ-агента, предназначенного для создания кода, заявил, что в ближайшем будущем профессия программиста перестанет быть актуальной из-за автоматизации процесса написания кода с помощью искусственного интеллекта.Борис Черни, разработчик

продолжить чтение

В MIT приспособили языковую модель для удешевления производства лекарств

Команда инженеров-химиков института адаптировала архитектуру LLM для нужд биотехнологий. Созданный алгоритм помогает промышленным дрожжам Komagataella phaffii эффективнее производить сложные белки, используемые в вакцинах и препаратах от рака.

продолжить чтение

7 ошибок в ИИ промптинге, из-за которых нейросети звучат неестественно — разбор от GPTunneL

Почему в ИИ промптинге важна грамотная постановка задачКогда пользователи жалуются, что нейросеть пишет «сухо» или выдает шаблоны, причина чаще не в самой модели, а в запросе.Не важно, используете ли вы ИИ для работы или для себя — стиль текста нейросети напрямую влияет на результат. От этого зависит,  будут ли люди читать, доверять и покупать, или закроют страницу. Если ответ ИИ звучит, как сухая инструкция из 90-х, интерес быстро теряется. Поэтому важно уметь формулировать промпты так, чтобы получать живые, точные и уместные ответы.

продолжить чтение

Калибровка. Технотриллер о том, к чему приводит слепая оптимизация

Привет, Хабр!

продолжить чтение