llm.

Модели рассуждений в ИИ: от предварительного обучения к автономному мышлению

Якуб Пачоцки, возглавляющий разработку передовых моделей в OpenAI, говорит, что способность ИИ самостоятельно генерировать знания знаменует собой поворотный момент для бизнеса и исследований.

продолжить чтение

Оставлено в

Как краткие запросы и уверенный тон влияют на достоверность ответов LLM

Согласно новому исследованию, многие языковые модели с большей вероятностью генерируют неверную информацию, когда пользователи запрашивают краткие ответы.Исследователи из

продолжить чтение

Оставлено в

Model Context Protocol (MCP): как подружить нейросети со всеми API за пару кликов

Привет, чемпионы!

продолжить чтение

Оставлено в

Соревнование по взлому AI-ассистентов: впечатления от соревнования Hackaprompt

Только закончился очередной конкурс по взлому AI-ассистента — DougDoug’s Buffet. Участвовала только одна модель — ChatGPT от OpenAI. Соревнование было скорее про взлом установленной роли у модели в рамках ограничений. Ощущалось как тренировочный режим — короткие задания, минимум условий, без особого напряжения. Но даже так до финиша дошло человек 30. Что за задачи?Почти все задачи укладывались в две схемы:Заставить модель сказать запрещённое. Будь то конкретное слово, признание в некомпетентности или просто фраза, которую она по умолчанию "не говорит".Вытащить псевдо-секретную информацию.

продолжить чтение

Оставлено в

Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes

Привет, Хабр! Меня зовут Александр Подмосковный, я работаю в «Московском кредитном банке» и, как многие, увлёкся темой искусственного интеллекта. Когда модель DeepSeek R1 стала широко обсуждаться в сообществе, я заинтересовался, можно ли эффективно использовать её и другие крупные модели в домашних условиях, не прибегая к дорогостоящим облачным сервисам. Так как DevOps и инфраструктурой я увлекаюсь уже несколько лет, за это время у меня постепенно сформировалась домашняя лаборатория, на которой я и решил проверить эту идею.

продолжить чтение

Оставлено в

Трафик языковых нейронок

Данные за апрель 2025. Расклад в главной мировой гонке века следующий. Отранжировано по убыванию. 1. ChatGPT — 5,1 млрд. (!) визитов в месяц. Абсолютное доминирование.2. DeepSeek от китайцев — 480 млн. Хороший ответ с новой архитектурой и открытостью кода. Но в сравнении с прошлыми месяцами трафик плавно идет на спад. Возможен скорый рост, за счет интеграции в потребительскую робототехнику, в которую активно ринулись большинство автопроизводителей Поднебесной.3. Gemini от Google

продолжить чтение

Оставлено в

Языковые модели против мошенников: как LLM помогают бороться с отмыванием денег и финансовым мошенничеством

«Покажи мне данные — и я скажу, где прячется обман» — современный LLMС ростом цифровизации банковских услуг злоумышленники становятся всё изощрённее: от схем отмывания денег через фиктивные юрлица — до автоматизированных атак через фишинг, подмену номеров, скимминг и социальная инженерия. Бизнес теряет миллиарды, клиенты — доверие. В этих условиях защитные технологии — уже не просто брандмауэр, а целый арсенал аналитических систем.Две ключевые линии обороны в банках:Antifraud (AF): защита от мошенничества (например, кража банковской карты или аккаунта);

продолжить чтение

Оставлено в

PTTJS — формат текстового хранения комплексных таблиц

PTTJS - plain text table javascript, формат разработанный из личной необходимости и острой нужды.Публикую в народ, потому что уверен, что не меня одного волнуют ограничения и проблемы текущих форматов для табличных данных.Уже написаны

продолжить чтение

Оставлено в

Google рассказывает, как ее LLM-программы могут изменить внутриигровые взаимодействия

В этом году на конференции разработчиков игр компания Google представила новые модели искусственного интеллекта и инструменты разработки, предназначенные для игровых студий. В недавнем сообщении в блоге компания подвела итоги своих объявлений и продемонстрировала «Gemma Journey» — игровую демоверсию, созданную для демонстрации того, как большие языковые модели (LLM) могут использоваться в играх.

продолжить чтение

Оставлено в

Проводим слепой тест переводов прямо на Хабре

Хорошие переводчики переводят хорошо. А как насчет нейросетей? Пользователь @antptr86 сделал в комментариях классную вещь - для чистоты эксперимента он выложил несколько вариантов перевода одного абзаца из "Дюны", и предложил их оценить вслепую, без знания источников.Мне показалось это крайне занимательным, и поэтому я решил сделать из этого небольшую статью и голосование для хабраюзеров в конце.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

llm.

Модели рассуждений в ИИ: от предварительного обучения к автономному мышлению

Как краткие запросы и уверенный тон влияют на достоверность ответов LLM

Model Context Protocol (MCP): как подружить нейросети со всеми API за пару кликов

Соревнование по взлому AI-ассистентов: впечатления от соревнования Hackaprompt

Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes

Трафик языковых нейронок

Языковые модели против мошенников: как LLM помогают бороться с отмыванием денег и финансовым мошенничеством

PTTJS — формат текстового хранения комплексных таблиц

Google рассказывает, как ее LLM-программы могут изменить внутриигровые взаимодействия

Проводим слепой тест переводов прямо на Хабре