Машинное обучение. - страница 411

Руководство Google по промпт-инжинирингу. Часть 2: продвинутый промптинг и работа с кодом

От переводчикаПредставляю вашему вниманию перевод второй части статьи "Prompt Engineering" (Промпт-инжиниринг) авторства Lee Boonstra - Software Engineer Tech Lead, Office of the CTO в Google. Эта публикация продолжает цикл переводов, посвященных методам эффективного взаимодействия с большими языковыми моделями.В первой части

продолжить чтение

ChatGPT определяет местоположение по фотографиям, почему это вызывает беспокойство

Появилась новая тенденция, вызывающая некоторое беспокойство: люди используют ChatGPT, чтобы определить местоположение, изображённое на фотографиях.

продолжить чтение

xAI добавляет функцию ‘памяти’ в Grok

Компания Илона Маска по разработке искусственного интеллекта xAI постепенно доводит своего чат-бота Grok до уровня ведущих конкурентов, таких как ChatGPT и Gemini от Google.

продолжить чтение

Учёные из СПб ФИЦ РАН научили нейросеть находить кейлоггеры

Специалисты Санкт‑Петербургского федерального исследовательского центра (СПб ФИЦ) РАН создали нейросеть для поиска кейлоггеров. Разработка выявляет следы работы кейлоггеров в сетевом трафике.Система мониторинга на базе методов машинного обучения в реальном времени отслеживает сетевой трафик и сообщает о подозрительных действиях, которые могут указывать на активность вредоносного ПО.

продолжить чтение

Как обучить русскоязычную модель рассуждений — LRM?

Ранее на моем YouTube-канале уже были видео о моделях рассуждений — OpenAI o1/o3, DeepSeek R1. Эти модели обучены с помощью стратегии reinforcement learning находить решения для задач, требующих логических рассуждений. Способность строить цепочки рассуждений, ведущих к решению поставленной задачи, открывают возможность применения таких моделей в математике, программировании и других подобных направлениях.​

продолжить чтение

Как готовить Triton: рецепты вашей собственной Inference-платформы

Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов Selectel. Если вам нужно запустить небольшой инференс одной ML-модели, можно взять команду бэкендеров, дать им эту модель, они обернут ее в эндпоинт — и готово. Достаточно короткого скрипта из нескольких строк на Python. Но что если нужно запускать несколько моделей, оптимизировать выполнение, работать с ансамблем моделей, задействовать CPU и GPU одновременно и т. д.? Все эти проблемы решает NVIDIA Triton Inference Server. Правда, он добавляет одну новую: разобраться с ним и его документацией — тот еще квест. В статье посмотрим, насколько сложной задачей может оказаться создание собственного инференса и какие аспекты нужно учитывать. Научимся запускать различные форматы моделей, посмотрим на основные фичи Inference-платформы Selectel, запустим несколько популярных LLM и моделей, а также познакомимся со способами оптимизации конфигурации и проектирования интерфейса для модели.

продолжить чтение

Как ИИ воплощает мечты: персональный план развития за 5 минут

Недавно в Instagram завирусились рилсы, где пользователи показывают, как ChatGPT за пару минут составляет подробные планы: от саморазвития до инвестиций. Мы протестировали этот метод на реальных запросах и делимся результатами.

продолжить чтение

В lmarena добавили Search Arena — рейтинг нейросетевых поисковиков

Разработчики lmarena выпустили Search Arena — рейтинг нейросетевых поисковиков. Исследователи проанализировала более 7 тыс. пользовательских оценок и нашли лидера — языковую модель Gemini-2.5-Pro-Exp-03-25-Grounding от Google. Нейросеть от OpenAI занимает седьмое место в списке.

продолжить чтение

OpenAI выпустила новые рекордные модели o3 и o4-mini

Шаг к ещё более «умному» искусственному интеллектуКомпания OpenAI анонсировала выпуск двух новых моделей из серии o: OpenAI o3 и OpenAI o4-mini

продолжить чтение

Популярные API для работы с искусственным интеллектом

API для искусственного интеллекта предоставляют разработчикам доступ к мощным предобученным моделям и при этом не требуют глубоких знаний в области машинного обучения. В статье представлен обзор самых популярных API для работы с искусственным интеллектом. Давайте рассмотрим, как эффективно использовать их в своих проектах.В статье рассмотрим: OpenAI API · · Anthropic · · Google Vertex AI · · AWS Bedrock · · Groq · · Cerebras Зачем использовать API для ИИ?

продолжить чтение