большие языковые модели. - страница 12

Разгружаем ученых: история разработки одного мультиагентного ИИ-ассистента для химиков

продолжить чтение

Галлюцинации в языковых моделях: виды, причины и способы уменьшения

Всем привет, меня зовут Алена, я являюсь ML-специалистом в SimbirSoft. В этой статье я хочу рассказать о галлюцинациях больших языковых моделей, а именно о том, как их оценить и минимизировать.СодержаниеВажность темыВиды галлюцинаций LLM Почему важно их выявлять?Причины появленияМетрики и подходы к оценке галлюцинацийСпособы минимизацииЗаключение

продолжить чтение

Почему релиз Agents SDK от OpenAI изменит рынок корпоративного ИИ

Во вторник OpenAI кардинально изменил ландшафт корпоративного ИИ, представив свою комплексную платформу для создания агентов — пакет, включающий обновлённый Responses API, мощные встроенные инструменты и открытый исходный код Agents SDK.

продолжить чтение

Foxconn запустила собственную большую языковую модель

Тайваньская Foxconn сообщила о создании собственной большой языковой модели (БЯМ) с возможностями рассуждения под названием FoxBrain. Обучение модели контрактного производителя Apple заняло всего четыре недели.

продолжить чтение

Adafruit автоматизировала разработку оборудования с помощью Claude Code

Adafruit Industries использовала инструмент большой языковой модели (LLM) Claude Code для оптимизации разработки оборудования, рассказала управляющий директор компании Лимор Фрид.

продолжить чтение

Проблема Deep Research

Deep Research компании OpenAI создан для меня, но я не могу им пользоваться. Это ещё одно потрясающее демо, увы, поломанное. Но ломается оно очень интересным образом.По большей мере я зарабатываю на жизнь исследованиями и анализом. Я думаю о данных, которые хочу увидеть, и ищу их; собираю и сопоставляю их, создаю графики, решаю, что они скучные, и пробую снова, нахожу новые способы и новые данные для понимания и объяснения проблемы, пишу текст и составляю графики, пытаясь выразить то, что я думаю. А потом я разговариваю об этом с людьми.

продолжить чтение

To seek or not to seek

DeepSeek обрушила американский фондовый рынок, составила серьезную конкуренцию ChatGPT и вызвала огромное количество обсуждений. Мы решили не оставаться в стороне и хайпануть немножечко разобраться, как обстоят дела на самом деле!

продолжить чтение

Робот Макс с LLM: история внедрения нейросетей в помощь миллионам пользователей Госуслуг

Привет! На связи команда Робота Макса — цифрового ассистента Госуслуг.

продолжить чтение

Как масштабирование во время тестирования раскрывает скрытые способности к рассуждению в небольших языковых моделях

Согласно новому исследованию Шанхайской лаборатории искусственного интеллекта, очень маленькие языковые модели (SLM) могут превзойти ведущие большие языковые модели (LLM) в задачах рассуждения. Авторы показывают, что при наличии правильных инструментов и методов масштабирования во время тестирования SLM с 1 миллиардом параметров может превзойти LLM 405B в сложных математических тестах.

продолжить чтение

Как большие языковые модели планируют свои ответы еще до их генерации

Привет, Хабр! Что, если я скажу, что большие языковые модели не просто предсказывают следующий токен в ответ на запрос, а уже на ранних этапах формирования ответа «заранее планируют» его характеристики?Тайна скрытого слоя: что происходит внутри LLM?

продолжить чтение

Rambler's Top100