ai. - страница 268

ai.

Ошибка 404: интеллект не найден? Обзор ИИ-агента OpenAI Operator (часть 2)

Насколько ИИ‑помощники действительно полезны? OpenAI Operator

продолжить чтение

Grok 3 бета — эпоха «думающих» агентов

Grok 3 — это последняя серия моделей компании xAI Илона Маска. Представленная 17 февраля 2025 года, эта модель была обучена с использованием суперкомпьютера Colossus, оснащенного около 200 000 графических процессоров Nvidia H100, что в десять раз превышает вычислительные мощности, использованные для предыдущей версии Grok 2.Согласно результатам бенчмарков, представленным xAI, Grok 3 превосходит другие передовые модели, такие как GPT-4o, Claude 3.5 Sonnet, Gemini-2 Pro и DeepSeek-V3, в областях математики, программирования и научных исследований.

продолжить чтение

Как выбрать embedding модель без датасета и исторических данных

ВведениеС появлением больших языковых моделей тема векторного поиска обрела новое дыхание. Компании, которые хотят внедрить архитектуру Retrieval-Augmented Generation (RAG), сталкиваются с вопросом: как выбрать эмбеддинги, которые будут работать эффективно именно с их данными?Выбор эмбеддинг-модели — это стратегически важное и долгосрочное решение, так как оно определяет качество поиска и производительность системы. Но этот выбор особенно сложно сделать на ранних этапах развития вашего проекта, когда данных для анализа ещё нет. При этом замена модели в будущем может оказаться дорогостоящей и ресурсозатратной.

продолжить чтение

DeepSeek на железе за 45к

Джарвис — мечта многих гиков. Однако будем объективны: мы реально все ближе к его появлению. Я бы не очень хотел, чтобы все мои запросы передавались на серверы OpenAI, DeepSeek, Anthropic и других компаний. Ну и ещё с лета начал свою домашнюю рубрику — ЭЭЭЭКСПЕРИМЕНТЫ на домашнем сервере.

продолжить чтение

Стремление OpenAI к росту оказывает давление на стартапы в сфере AI

Поскольку OpenAI трансформируется из простого поставщика API в компанию, предлагающую полный спектр решений в области искусственного интеллекта, многим стартапам, созданным на основе ее технологии, возможно, придется пересмотреть свои стратегии. Адам Гилберт, менеджер GTM компании OpenAI , говорит, что преимущество компании заключается в наличии всего: мощной инфраструктуры, обширных данных, мощных моделей, возможностей тонкой настройки и удобных для пользователя приложений.

продолжить чтение

Языковые модели могут перегружать себя мыслями и застревать в бесконечных циклах мыслей

Новое исследование выявило неожиданную слабость языковых моделей: они могут зацикливаться на мышлении вместо действия, особенно в интерактивных средах. Эта тенденция к чрезмерному размышлению может значительно повредить их производительности, даже несмотря на то, что эти модели специально разработаны для рассуждений. Исследователи из нескольких университетов США и ETH Zurich разработали методы для измерения и решения этой проблемы в интерактивных сценариях, называемых «агентными задачами».

продолжить чтение

«Темпоральные головы» в языковых моделях: новые возможности для AI

Исследование ученых из Korea University, Upstage AI и AIGEN Sciences выявило специализированные компоненты в больших языковых моделях, которые обрабатывают информацию, зависящую от времени. Эти «темпоральные головы» играют решающую роль в том, как системы AI обрабатывают факты, которые меняются со временем.

продолжить чтение

Лгал ли xAI о тестах Grok 3?

Дискуссии по поводу тестов AI и того, как их результаты представляются лабораториями AI, выплескиваются на общественное обозрение.На этой неделе сотрудник OpenAI обвинил компанию Илона Маска xAI, занимающуюся разработкой искусственного интеллекта, в публикации вводящих в заблуждение результатов тестов для ее последней модели искусственного интеллекта Grok 3. Один из соучредителей xAI, Игорь Бабушкин, настаивал на том, что компания права.

продолжить чтение

Наделла предостерегает от излишнего увлечения AGI и призывает к реальным изменениям в экономике

Лаборатории AI, такие как OpenAI, нацелены на создание AGI, универсальных систем AI, которые возьмут на себя большую часть когнитивной работы. Генеральный директор Microsoft Сатья Наделла призывает к реальному росту, а не к шумихе вокруг эталонных показателей.

продолжить чтение

AI-буткемп от red_mad_robot: прокачиваем скиллы в NLP и MarkUp

Хотите ворваться в разработку AI-решений? Мы в red_mad_robot запускаем интенсивный буткемп для джунов, где за 4 недели вы освоите востребованные навыки и получите практический опыт в разработке AI-продуктов под руководством экспертов red_mad_robot.Два направленияNLP-инженер (работа с LLM, промпт-инжиниринг, трансформеры)

продолжить чтение

Rambler's Top100