llm. - страница 68

llm.

Битрикс24 бенчмарк для оценки LLM

В преддверии выхода GPT-5 хотелось сделать бенчмарк который по-настоящему проверит её способности. Не прекращаются споры – если LLM просто стохастические попугаи, то как решают олимпиадные задачи по математике? Если Chatgpt способен написать полезное приложение по одному запросу, то почему не может посчитать число r в слове Strawberry или описать как фермеру перевезти себя и две курицы через реку? Пора положить обсуждениям конец с помощью 150 задач по Битрикс24 разработке!Кто просил об этом?

продолжить чтение

Grok 4, Chimera и LLM от ETH Zurich: что нового в мире больших языковых моделей

продолжить чтение

Как разрабатывать AI-агенты безопасными — свежие рекомендации OWASP

28 июля фонд OWASP выпустил руководство по защите агентных приложений. Работа над ним шла несколько месяцев, большую часть времени заняло рецензирование от специалистов из ведущих организаций: Microsoft, Oracle, NIST, Еврокомиссия, Robust Intelligence, Protect AI и других.В документе рассматриваются архитектурные шаблоны: от RAG до агентов различной степени автономности. Под агентами подразумеваются приложения, в которых модели искусственного интеллекта играют не только утилитарную, но и управляющую роль, взаимодействуя с некоторой средой.

продолжить чтение

Путешествие одного промпта: Что на самом деле происходит под капотом у LLM?

Мы все там были. Пустой курсор мигает на экране, в голове крутится сложный вопрос, и вы обращаетесь к своему цифровому оракулу — большой языковой модели. Представьте, вы пишете в чат что-то вроде: "Объясни механизм внимания в трансформерах так, как будто мне 10 лет". Вы нажимаете Enter, и… магия. Через пару секунд на экране разворачивается идеально структурированный, понятный и даже остроумный ответ. Кажется, будто на той стороне сидит невидимый гений, который мгновенно понял ваш запрос и нашел лучшие слова для объяснения.

продолжить чтение

ИИ поддерживает Запад в геополитике и сам учится играть в Minecraft: топ-10 исследований июня

продолжить чтение

Роботы учатся видеть мир нашими глазами, сами пишут код и создают игры: топ-10 ИИ-исследований за май

продолжить чтение

Эволюция архитектур больших языковых моделей: от GPT-2 к современным решениям

продолжить чтение

AGI математически невозможен, но хайп уже не остановить

Приложение-калькулятор CalcGPT (calcgpt.io) на базе LLMВ мае 2025 года профессор университета Фаххохшуле (Австрия) Макс Шлерет опубликовал чёткое научное доказательство, что сильный ИИ

продолжить чтение

Переизобретая аналитику будущего: как и почему LLM-агенты меняют анализ продуктов, но все не так просто

Привет! AI-агенты — самая горячая тема года и не просто так: это действительно мощная концепция, которая неизбежно заставляет пересматривать устоявшиеся подходы во многих сферах. Одна из самых интересных областей для агентов — аналитика и BI, и последние полгода я активно занимаюсь в том числе этим.Адаптивные и налету подстраивающиеся под задачу дашборды, естественный язык вместо SQL, автономная работа для генерации и проверки гипотез, — все это очень интересно, но реальность всегда чуточку сложнее.Обо всем этом и поговорим.Давайте разбираться!

продолжить чтение

Минификация кода для повышения эффективности LLM: влияние на лингвистику, генерацию и анализ программ

ВВЕДЕНИЕБольшие языковые модели (LLM) становятся неотъемлемой частью инструментов генерации, анализа и автоматизации программирования. Их возможности позволяют автоматизировать разработку, искать ошибки, генерировать тесты, осуществлять перевод между языками программирования. Однако одно из ключевых ограничений – контекстное окно, то есть максимально возможная длина входных данных. С ростом объема современных программ эффективность работы LLM с длинным кодом становится всё более актуальной задачей, особенно учитывая вычислительные и финансовые издержки обработки длинных последовательностей.

продолжить чтение

Rambler's Top100