OpenAI утверждает, что ее последние модели превосходят врачей по медицинским показателям
Компания OpenAI выпустила новый тест для проверки систем искусственного интеллекта в сфере здравоохранения. Он называется HealthBench и предназначен для оценки того, насколько хорошо языковые модели справляются с реалистичными медицинскими беседами. По словам OpenAI, её новейшие модели превосходят врачей в этом тесте.
Google внедряет ИИ Gemini в смарт-часы, автомобили, телевизоры и гарнитуры XR
Google расширяет возможности своего ИИ-помощника Gemini на большее количество устройств Android, включая смарт-часы, автомобили, телевизоры и гарнитуры XR.
За полчаса установил DeepSeek 1.5B, пока вы искали GPT подешевле
Решил установить и протестировать возможности DeepSeek 1.5B — компактной языковой модели, которая работает без тяжёлого железа и запускается даже на домашнем сервере. В этой статье покажу и расскажу:
Новый подход к обучению ИИ-агентов: совершенствование через анализ успешных примеров
Новое исследование Стэнфордского университета показало, что агенты с искусственным интеллектом могут гораздо лучше справляться со сложными задачами, просто учась на собственном успешном опыте.
Анализ показывает, что совершенствование «рассуждающих» моделей ИИ может вскоре замедлиться
Анализ, проведённый Epoch AI, некоммерческим исследовательским институтом в области ИИ, показывает, что индустрия ИИ, возможно, не сможет добиться значительного повышения производительности моделей ИИ, основанных на рассуждениях, в течение длительного времени. Согласно результатам исследования, уже в течение года прогресс в области моделей, основанных на рассуждениях, может замедлиться.
Модели рассуждений в ИИ: от предварительного обучения к автономному мышлению
Якуб Пачоцки, возглавляющий разработку передовых моделей в OpenAI, говорит, что способность ИИ самостоятельно генерировать знания знаменует собой поворотный момент для бизнеса и исследований.
Как краткие запросы и уверенный тон влияют на достоверность ответов LLM
Согласно новому исследованию, многие языковые модели с большей вероятностью генерируют неверную информацию, когда пользователи запрашивают краткие ответы.Исследователи из
Мечты Ленина, дизайн от Маска: техно-коммунизм глазами футуристов
Соревнование за будущее внезапно стало массовым спортом: кто быстрее автоматизирует офис, заменит саппорта, построит дата-центр на $500 млрд?
$500 млрд, 80% кода и новый манифест: как ИИ меняет мир
Соревнование за будущее внезапно стало массовым спортом: кто быстрее автоматизирует офис, заменит саппорта, построит дата-центр на $500 млрд?
Как остаться востребованным специалистом в эпоху техно-коммунизма?
Соревнование за будущее внезапно стало массовым спортом: кто быстрее автоматизирует офис, заменит саппорта, построит дата-центр на $500 млрд?

