Бенчмарк Vals.ai: даже продвинутые AI-агенты ненадежны в финансовом анализе
Несмотря на доступ к исследовательским инструментам и высокие затраты на обработку, ведущие языковые модели не справляются со сложными финансовыми задачами. Новый бенчмарк от Vals.ai показывает, что даже самые продвинутые автономные агенты AI остаются ненадежными для финансового анализа. Самая производительная модель, o3 от OpenAI, достигла точности всего 48,3% — при средней стоимости запроса $3,69.
OpenAI объясняет, почему ChatGPT стал слишком льстивым
Компания OpenAI опубликовала отчет о недавних проблемах с подхалимством в стандартной модели искусственного интеллекта, лежащей в основе ChatGPT, GPT-4o, — проблемах, которые заставили компанию откатить обновление модели, выпущенное на прошлой неделе.
Новый генератор изображений ChatGPT: все стили, режимы и возможности, в чате и через API
Привет друзья! Вы наверняка уже знаете, что недавно ChatGPT получил обновление с революционной функцией генерации изображений. Новая технология, основанная на модели GPT-4o, генерирует картинки как никто другой на рынке! За первую неделю после запуска более 130 миллионов пользователей создали свыше 700 миллионов изображений – это настоящий бум! Уверен вы видели или даже сами делали Ghibli-фикацию – изображения в стиле аниме студии Гибли. Но что еще крутого может делать новая генеративная модель?
OpenAI откатывает обновление, которое сделало ChatGPT «слишком подхалимским»
Во вторник генеральный директор OpenAI Сэм Альтман заявил, что компания «откатывает» последнее обновление модели искусственного интеллекта по умолчанию, на которой работает ChatGPT, GPT-4o, после жалоб на странное поведение, в частности чрезмерное подхалимство.
Почему до сих пор ни один ИИ не может написать даже простой проект сам?
Автор: A.AnkalaevCистемный администратор с опытом более 20 летСреди специалистов по разработке, особенно тут на Хабре, бытует мнение, что большие языковые модели (LLM) не способны генерировать полноценные приложения «под ключ». Сам работаю с нейросетями со времён GPT, бесконечное количество раз применял их в своей работе для:обучения персонала безопасности в сетипроектирования концепцийматематических вычислений (нагрузка, мощность, распределение)личного карьерного роста.Если верить данным в сети:
OpenAI обновляет поиск ChatGPT функциями покупок
Компания OpenAI объявила в понедельник, что обновляет поиск ChatGPT , свой инструмент веб-поиска в ChatGPT, чтобы предоставить пользователям улучшенный опыт совершения покупок в Интернете.
Microsoft сокращает расходы на центры обработки данных — Oracle и CoreWeave получают выгоду
Microsoft значительно сократила свои планы по расширению центров обработки данных, отказавшись от них в большей степени, чем сообщалось ранее. Это решение было принято в связи с серьёзными изменениями в отношениях с OpenAI и низкой эффективностью собственного бизнеса в сфере ИИ.
ChatGPT получает обновление: OpenAI обещает более интуитивно понятный GPT-4o
OpenAI выпускает обновление GPT-4o для ChatGPT, но, как обычно, официального списка изменений нет.
Новые модели Baidu Ernie конкурируют с Deepseek и OpenAI по сверхнизким ценам
Китайский технологический гигант Baidu представил две новые языковые модели на конференции разработчиков Create 2025 в Ухане. Модели Ernie 4.5 Turbo и Ernie X1 Turbo предназначены для обработки текста и изображений, поддерживают логические рассуждения и стоят дешевле своих предшественников.

