RAG вместо GPT: как мы сделали внутреннего ассистента для корпоративных данных
В больших компаниях поиск почти всегда «работает». Но это не значит, что сотрудники быстро находят нужное: нередко они тратят часы на попытку вспомнить формулировку, место и контекст.Мы построили внутренний RAG-ассистент в закрытом контуре: изоляция данных, контроль доступа, бенчмарки качества и долгая работа с вендором. В статье — архитектура, переговоры с вендором, ошибки, компромиссы и выводы для тех, кто думает о корпоративном ИИ всерьёз.
Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве
Qwen-3-Coder-Next — модель с 80 миллиардами параметров и весом 159,4 ГБ. Примерно столько RAM потребовалось бы для её запуска, и это ещё без учёта длинного контекстного окна. И эта модель не считается большой моделью! По слухам, у frontier-моделей более триллиона параметров, для которых понадобилось бы минимум 2 ТБ оперативной памяти. Последний раз я видел столько RAM в одной машине — никогда.
За год стоимость оперативной памяти DDR4 выросла почти в 9 раз
С февраля 2026 года стоимость модулей оперативной памяти DDR4 ёмкостью 8 ГБ выросла в 8,8 раз, пишет IT Home со ссылкой на Nikkei Asian Review. Если в начале прошлого года средняя планка ОЗУ четвёртого поколения стоила около $15, то спустя год её цена превысила $130.
Когда фреймворки бессильны: четыре задачи без готовых ответов
Привет, Хабр!В работе легко скатиться в автопилот: привычные подходы, проверенные аргументы и готовые решения. Вопрос в том, что делать, когда они перестают работать. В проекте
Yandex B2B Tech представила платформу Stackland для запуска и масштабирования приложений в закрытом контуре компаний
Команда Yandex B2B Tech представила Yandex Cloud Stackland — платформу для быстрого запуска и масштабирования ИТ-приложений, в том числе на базе искусственного интеллекта. Компания отмечает, что инструмент позволяет ускорить разработку цифровых продуктов и снизить затраты в среднем в 1,5 раза.
Game Over для мышления? Динамическая теория человеческой агентности в эпоху ИИ
Пролог. О чем эта статьяБольшинство из нас, так или иначе, пользуется ChatGPT, Claude, DeepSeek. Мы просим их написать письмо, составить отчет, придумать идею, сгенерировать текст, выдать экспертное мнение, иногда - принять решение. Это удобно, быстро, эффективно.А теперь вопрос: кто в этой связке принимает решения? Если вы думаете "конечно, я" - задержитесь на секунду. Когда вы в последний раз спорили с ответом ИИ? Когда вы в последний раз говорили: "нет, это неверно, вот почему" - и могли объяснить, почему так считаете? Когда вы в последний раз принимали решение, которое шло вразрез с рекомендацией ИИ?
«Дзен» запустил новостного ИИ-ассистента «Глиф»
Контент‑платформа «Дзен» 26 марта запустила новостного ИИ‑ассистента «Глиф», который поможет пользователям лучше понимать повестку и разбираться в значении новостей. Об этом в интервью ТАСС сообщил
