llm.
Microsoft Research: системы ИИ невозможно сделать полностью безопасными
Исследователи Microsoft Research, которые проверили безопасность более 100 собственных продуктов генеративного ИИ, пришли к выводу, что эти модели усиливают существующие риски безопасности и создают новые.
Эмоциональное принятие решений в LLM: исследование, которое мы показали на NeurIPS 2024
Привет, Хабр! Меня зовут Михаил, я — младший научный сотрудник группы «ИИ в промышленности» в AIRI. В этом году на конференции NeurIPS 2024 мы представили работу, посвященную сложной теме современного ИИ — эмоциональным большим языковым моделям (LLM) В целом понятно, что LLM умеют так или иначе эмулировать эмоции, ведь их обучают по большей части на данных, сгенерированных человеком. А человек — весьма эмоциональное создание. Но что такое правильная эмуляция?насколько правильно происходит эта эмуляция?
Как мы запилили свой первый внутренний AI-хакатон и что из этого вышло
Рассказываем, как у нас появилась идея сделать внутренний хакатон по нейронкам, как мы к этому готовились и как всё реализовали, а также какие проекты взяли в работу. Статья будет полезна командам, которые тоже хотят попробовать подобную активность и ищут кейсы крупных компаний.🔥
Свой стартап на LLM и агентах — это просто! (нет). Или почему технология не всегда так важна
В эпоху повального увлечения AI кажется, что достаточно взять OpenAI API, найти проблему, написать сложненький промпт и готово — ваш следующий единорог уже на подходе. Однако реальность, как всегда, оказывается намного сложнее и это мираж технологической простоты. В этой статье — рассуждения о том, почему базовая технология или стек целиком — это лишь верхушка айсберга в создании успешного продукта, и почему даже имея доступ к самым передовым технологиям, создать по-настоящему ценный продукт остается сложной задачей.
Как превратить LLM в инструмент для принятия решений (с помощью промпта)
Делаем виртуального помощника с помощью промпт‑инжиниринга Привет, Хабр!Казалось бы, большие языковые модели (LLM), самой известной из которых является ChatGPT, должны быть идеальными помощниками для принятия решений. Кто, как не LLM, соберёт всю необходимую информацию, проанализирует данные, составит таблицу аргументов за и против, а затем примет чёткое и обоснованное решение? И всё это без эмоций, предубеждений и самообмана, свойственных человеку. Однако на практике, выполняя задачи на принятие решений, LLM выдают расплывчатые и неконкретные ответы.
Google представили Titan: архитектуру нейросетей, которая может стать новой серебряной пулей LLM
Все современные LLM построены на архитектуре трансформера. GPT-4o от OpenAI, Gemini от Google, Claude Sonet от Anthropic, Grok от xAI... перечислять можно долго. Трансформер – действительно очень мощная архитектура (и кстати тоже была придумала в Google), но и в ней есть свои недостатки.
Метрики оценки LLM: полное руководство по оценке LLM
Независимо от того, улучшаете ли вы точность модели путем дообучения или улучшаете контекстную релевантность системы генерации с дополненной выборкой (RAG), понимание того, как разрабатывать и выбирать подходящий набор метрик оценки LLM для вашего варианта использования, является обязательным для построения надежного конвейера оценки LLM.
LLM в телекоме, ЦОД и на периферии [исследования]
Работа с большими языковыми моделями не только требует серьезных вычислительных ресурсов (например, облачных GPU), но и грамотного их использования. Зачастую инженерам приходится учитывать специфические особенности работы GPU-кластеров.
Делимся материалами с RSHB QA MeetUP: AI в тестировании
18 декабря в офисе РСХБ-Интех (Москва, Профсоюзная 125А) прошел митап для QA-инженеров RSHB QA MeetUP: AI в тестировании, организованный РСХБ.цифра при поддержке JUG Ru Group и Сколково. Рассказываем о том, как прошел митап, о чем рассказывали спикеры, а также даем записи докладов и другие материалы мероприятия.
Я, робот или как использовать генеративный ИИ для своего первого пет-проекта
Привет, Хабр!На новогодних праздниках исполнил свою давнюю мечту, собрал на Python сервис, который показывает случайный эпизод любимого сериала «Друзья» (Friends). Хостится локально на мини-ПК с Raspberry Pi (Debian 11), пока доступен только для домашних по WiFi.Решить "проблему белого листа" помог Claude 3.5 Sonnet, он же написал весь код и отвечал на мои глупые вопросы, помогал разобраться почему все не заработало с первого раза 😅