llm. - страница 131

llm.

DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI

DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI

продолжить чтение

DeepSeek R1: модель с производительностью o1 от OpenAI. Сравнение с o1, сколько стоит и как использовать API

DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI

продолжить чтение

Кремниевая долина в восторге от китайской модели ИИ. Колонка WSJ о моделях DeepSeek

DeepSeek называют «поразительной и впечатляющей», несмотря на использование менее совершенных чипов.Китайская компания в сфере искусственного интеллекта заставила Кремниевую долину недоумевать, как её программистам удалось почти сравняться с американскими конкурентами, используя более слабые чипы.

продолжить чтение

Оценка чат-ботов LLM: основные метрики и методы тестирования

В этой статье я научу вас, как оценивать LLM-чат-ботов, чтобы понять, достаточно ли они убедительны, чтобы сойти за реальных людей. Но что еще важнее, вы сможете использовать результаты этой оценки, чтобы понять, как улучшить своего LLM-чат-бота, например, изменив промпт или саму LLM-модель.В этой статье вы узнаете:

продолжить чтение

ChatOSINT. Цифровые аватары Д. Трампа и В. Путина формируют геополитический ландшафт

Прочитал тут недавно, что специалисты из Си-Ай-Эй создали (или создают) цифровых двойников мировых лидеров в целях общения и прогнозирования их поведения в различиных ситуациях. Ну что ж, пожалуй, настал новый виток ситуативной аналитики think tank-ов от продвинутых LLM. Попробуем и мы с вами!Дисклеймер. Все нижеописанное является по сути мысленным экспериментом. Любые совпадения с предстоящими событиями случайны.

продолжить чтение

ChatOSINT. Моделируем геополитические сценарии с помощью цифровых аватаров президентов стран

Прочитал тут недавно, что специалисты из Си-Ай-Эй создали (или создают) цифровых двойников мировых лидеров в целях общения и прогнозирования их поведения в различиных ситуациях. Ну что ж, пожалуй, настал новый виток ситуативной аналитики think tank-ов от продвинутых LLM. Попробуем и мы с вами!Дисклеймер. Все нижеописанное является по сути мысленным экспериментом. Любые совпадения с предстоящими событиями случайны.

продолжить чтение

Промпт-инжиниринг: как разговаривать с нейросетью на одном языке

продолжить чтение

DeepSeek — очередной квантовый скачок в развитии AI

深度求索, запомните эти слова.Пока скептики в области ИИ продолжают размышлять о том, что ИИ никогда не обретет сознание и останется лишь имитатором интернета, небольшая китайская компания совершила прорыв. Они создали думающую

продолжить чтение

AI-driven TDD — используем Code-LLM на максимум

С момента своего появления и по сей день подход Test-Driven Development (TDD) вызывает оживленные дискуссии в сообществе разработчиков, и до сих пор нет единого мнения о ее эффективности.Но что будет, если совместить TDD и AI-генерацию кода? В статье я покажу:Как соединить TDD и AI;Как AI-driven TDD улучшает процесс разработки;Как TDD влияет на качество сгенерированного AI кода.

продолжить чтение

Новый тест HLE выявил слабые места AI: 90% задач остаются нерешенными

Международная исследовательская группа разработала новый бенчмарк, который выявляет текущие ограничения LLM. Даже самые продвинутые модели не справляются с 90 процентами задач — на данный момент.Тест под названием «Последний экзамен человечества» (HLE) включает 3000 вопросов по более чем 100 специализированным областям, 42 процента из которых посвящены математике. В его разработке приняли участие около 1000 экспертов из 500 учреждений в 50 странах.

продолжить чтение

Rambler's Top100