искусственный интеллект. - страница 676

Выпущенная модель OpenAI o3 значительно слабее предварительной версии в тестах на рассуждение

Недавний анализ, проведенный фондом Arc Prize Foundation показал, что модель o3 от OpenAI демонстрирует значительно более слабые результаты на стандартизированных тестах рассуждений, чем ранее протестированная предварительная версия o3.

продолжить чтение

Как я разобрался в своей карьере с помощью Deepseek

Я работаю программистом 11 лет, имею профильное образование (колледж/вуз). Но на протяжении всей жизни не понимал, почему принимаю те или иные решения. Почему я работаю в маленьких компаниях? Может быть, стоит пойти работать в биг-тек? Почему люди как-то «неправильно» изучают программирование? Можно же просто взять и написать свой пет-проект. Почему все твердят о структурированном подходе к обучению, если я засыпаю уже на третьей лекции, когда учусь «как надо»?И ответ внезапно нашёлся в психологии (да-да, я тоже считал, что это ерунда, а не наука) с помощью современных LLM.

продолжить чтение

Пробуем Junie от JetBrains на реальной задаче (или как я попал в рассказ Азимова)

JetBrains зарелизил новую версию своего AI-ассистента — и вместе с ним Junie, автономного нейросетевого агента-программиста, которому можно поручать небольшие рабочие задачи.Буквально вчера я получил к нему доступ и не смог не воспользоваться возможностью. Я даже не представлял, насколько это весело.Мой опыт с ИИ в разработкеЕсли не считать чаты ChatGPT и DeepSeek, из ИИ-помощников я пользовался Copilot в WebStorm на GPT-4o / Claude и, честно говоря, не был сильно доволен:авто-подсказки, на мой взгляд, не сильно лучше, чем встроенные в IDE;доступ к коду не сильно помогает ему отвечать на вопросы через чат;

продолжить чтение

Исследование Google: работники могут сэкономить до 122 часов в год, используя ИИ для выполнения административных задач

Google выяснила, что работники могут сэкономить около 122 часов в год благодаря использованию ИИ-инструментов для выполнения административных задач. Такие результаты показал эксперимент AI Works, который проходил в Великобритании.В рамках эксперимента сотрудников предприятий из разных сфер, школьников и преподавателей учили пользоваться ИИ-инструментами, после чего исследователи оценивали степень их использования. 

продолжить чтение

Adobe перезапускает Firefly

Компания Adobe представила значительное обновление своей платформы искусственного интеллекта Firefly, превратив ее из автономного генератора изображений в комплексную систему для создания различных типов цифрового контента.По данным Adobe

продолжить чтение

Moonshot AI представляет Kimi-VL: мощную модель ИИ для обработки текста, изображений и видео

Новая модель ИИ с открытым исходным кодом от китайского стартапа Moonshot AI обрабатывает изображения, текст и видео с удивительной эффективностью. Модель Kimi-VL отличается способностью обрабатывать длинные документы, сложные рассуждения и понимать пользовательский интерфейс.

продолжить чтение

Открытый исходный код Kimi-VL от Moonshot AI обрабатывает текст, изображения и видео всего с 2,8 миллиардами параметров

Новая модель AI с открытым исходным кодом от китайского стартапа Moonshot AI обрабатывает изображения, текст и видео с удивительной эффективностью. Kimi-VL выделяется своей способностью обрабатывать длинные документы, сложные рассуждения и понимание пользовательского интерфейса.

продолжить чтение

Космолама: Meta* и Booz Allen Hamilton запустили языковую модель Llama на МКС

Журналисты издания CNBC сообщили, что американские компании Meta* и Booz Allen Hamilton развернули большую языковую модель Llama 3.2 на Международной космической станции. Ожидается, что нейросеть будет помогать космонавтам в ежедневных задачах и научных экспериментах.Booz Allen Hamilton — американская компания, которая в 2024 году доставила на МКС необходимое оборудование для локального запуска нейросетей. Благодаря партнёрству с Meta* на оборудовании запустили Space Llama — дообученную и оптимизированную версию языковой модели Llama 3.2.

продолжить чтение

Языковые модели ИИ тестируют на способность рассуждать в игре «Phoenix Wright: Ace Attorney»

Исследователи подвергли ведущие модели ИИ новому виду тестирования, которое показывает, насколько хорошо они могут рассуждать, чтобы одержать победу в суде. Результаты выявили некоторые явные различия как в производительности, так и в стоимости.

продолжить чтение

Халява уходит из программирования

Для меня халява — это гарантированный результат за вложенные усилия. Логика повествования требует такого определения, дальше всё будет ясно.Халяве учили и учат в школе. Сделай домашнее по алгебре, выучи стихотворение, научись решать линейные уравнения — и получишь пятерку, то есть лучшее из возможного. Любовь получать пятерки сыграла злую шутку со многими, ведь в жизни вне учебных заведений халявы практически нет.Слово «легко» ниже по статье тоже означает гарантированный результат за усилия, но подразумевается «легко, если умеешь работать с собственной мотивацией».

продолжить чтение

Rambler's Top100