RAG: борьба с низким качеством ответов в условиях экономии памяти на GPU
Привет, Хабр! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы начинаем серию статей, в которой я расскажу о том, как мы с командой разрабатывали ИИ-помощника, а также приведу практические кейсы по улучшению точности ответов с минимальными затратами памяти графических процессоров. Как вы уже могли догадаться, наш ИИ-помощник разработан на основе RAG (Retrieval-Augmented Generation) системы. Хотя принцип работы RAG многим уже знаком и не вызывает того самого «вау», я всё же кратко напомню, как эта система работает, почему она так популярна и почему её ответам можно доверять.
Disrupt по делу: как внедрять AI-продукты без розовых очков — опыт продакшена
Как не утонуть в инновациях: от стабильного AI-продакшена до смелых прорывов.
Incident.io привлекает $62 млн при оценке в $400 млн, чтобы помочь IT-отделам быстрее реагировать на сбои
В мире технологий некоторые могут утверждать, что термин десятилетия — AI, но в более широком плане вещей, за пределами этого отдельного сектора, самым важным словом вполне может быть «устойчивость». Насколько хорошо люди, организации и страны готовы к непредвиденным, негативным экономическим, геополитическим, социальным и экологическим событиям? Это вопрос, который вызывает много суеты в поисках ответов.
Рост популярности моделей рассуждений AI делает бенчмаркинг более дорогим
Лаборатории AI, такие как OpenAI, утверждают, что их так называемые «рассуждающие» модели AI, которые могут «думать» о проблемах шаг за шагом, более способны, чем их нерассуждающие аналоги в определенных областях, таких как физика. Но хотя это, как правило, так и есть, модели рассуждений также намного дороже для бенчмаркинга, что затрудняет независимую проверку этих заявлений.
xAI запускает API для своей флагманской модели Grok 3
Миллиардер Илон Маск только что получил встречный иск от OpenAI, но это не помешало его компании xAI, занимающейся разработкой искусственного интеллекта, сделать свою флагманскую модель Grok 3 доступной через API.
Госслужащие США опасаются, что агентство Маска следит за ними с помощью ИИ
Американские госслужащие обеспокоены
OpenAI подает встречный иск против Илона Маска
Илоном Маском, не собирается утихать. В заявлении, поданном в среду, адвокаты OpenAI и другие ответчики по делу, включая генерального директора Сэма Альтмана, призвали запретить Маску «дальнейшие незаконные и несправедливые действия» и «привлечь его к ответственности за ущерб, который он уже причинил» ответчикам.
Зачем моему бизнесу нейросети: гайд для не-программистов
Как мне применить нейросети в своем бизнесе?Если ваша область деятельности напрямую не связана с разработкой, то этот вопрос легко может поставить вас в тупик. Действительно – из каждого утюга трубят про новые удивительные технологии и их достижения, а как их использовать, не ясно.На днях я общался с человеком, который огорченно рассказывал, что нейросеть (так он назвал ChatGPT) не справляется даже с самой простой задачей (найти в интернете все доступные стиралки и отсортировать их по техническим характеристикам из документации). Дескать для человека это было бы не сложно, так пусть робот этим занимается.
Чипы H20 AI от Nvidia могут быть освобождены от экспортного контроля
администрацией Трампа, чтобы избежать экспортных ограничений на чипы H20 AI компании. Сообщается, что H20, самый передовой чип искусственного интеллекта производства Nvidia, который все еще может быть экспортирован из США в Китай, был спасен благодаря обещанию Хуана инвестировать в новые центры обработки данных искусственного интеллекта в США. По данным NPR, Хуан сделал это предложение во время ужина на курорте Трампа Мар-а-Лаго на прошлой неделе.

