BrainTools - Методики для развития мозга - страница 193

RAG вместо GPT: как мы сделали внутреннего ассистента для корпоративных данных

В больших компаниях поиск почти всегда «работает». Но это не значит, что сотрудники быстро находят нужное: нередко они тратят часы на попытку вспомнить формулировку, место и контекст.Мы построили внутренний RAG-ассистент в закрытом контуре: изоляция данных, контроль доступа, бенчмарки качества и долгая  работа с вендором. В статье — архитектура, переговоры  с вендором, ошибки, компромиссы и выводы для тех, кто думает о корпоративном ИИ всерьёз.

продолжить чтение

Готовим ИИ-агента к продакшену

Готовим ИИ-агента к продакшену

продолжить чтение

TAPe‑дневник, день 6: синтетика, эмбеддинги и первый уход от трансформеров

В этой статье продолжаем онлайн‑дневник экспериментов с TAPe‑подходом к компьютерному зрению на COCO. Здесь – про обучение эмбеддингов на полностью синтетических TAPe‑данных, 74% точности классификации на 5k val‑изображениях и первые выводы о том, почему стандартные трансформеры нам не подходят.Если вы тут впервые, сначала можно посмотреть:базовую статью про TAPe+ML — TAPe + ML: универсальная архитектура компьютерного зренияFAQ по TAPe‑детекции —

продолжить чтение

Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве

Qwen-3-Coder-Next — модель с 80 миллиардами параметров и весом 159,4 ГБ. Примерно столько RAM потребовалось бы для её запуска, и это ещё без учёта длинного контекстного окна. И эта модель не считается большой моделью! По слухам, у frontier-моделей более триллиона параметров, для которых понадобилось бы минимум 2 ТБ оперативной памяти. Последний раз я видел столько RAM в одной машине — никогда.

продолжить чтение

Вайб-кодинг: конструктор для профи или магия для «чайников»? Разбираемся на реальном кейсе

продолжить чтение

За год стоимость оперативной памяти DDR4 выросла почти в 9 раз

С февраля 2026 года стоимость модулей оперативной памяти DDR4 ёмкостью 8 ГБ выросла в 8,8 раз, пишет IT Home со ссылкой на Nikkei Asian Review. Если в начале прошлого года средняя планка ОЗУ четвёртого поколения стоила около $15, то спустя год её цена превысила $130.

продолжить чтение

Когда фреймворки бессильны: четыре задачи без готовых ответов

Привет, Хабр!В работе легко скатиться в автопилот: привычные подходы, проверенные аргументы и готовые решения. Вопрос в том, что делать, когда они перестают работать. В проекте

продолжить чтение

Yandex B2B Tech представила платформу Stackland для запуска и масштабирования приложений в закрытом контуре компаний

Команда Yandex B2B Tech представила Yandex Cloud Stackland — платформу для быстрого запуска и масштабирования ИТ-приложений, в том числе на базе искусственного интеллекта. Компания отмечает, что инструмент позволяет ускорить разработку цифровых продуктов и снизить затраты в среднем в 1,5 раза.

продолжить чтение

Game Over для мышления? Динамическая теория человеческой агентности в эпоху ИИ

Пролог. О чем эта статьяБольшинство из нас, так или иначе, пользуется ChatGPT, Claude, DeepSeek. Мы просим их написать письмо, составить отчет, придумать идею, сгенерировать текст, выдать экспертное мнение, иногда - принять решение. Это удобно, быстро, эффективно.А теперь вопрос: кто в этой связке принимает решения? Если вы думаете "конечно, я" - задержитесь на секунду. Когда вы в последний раз спорили с ответом ИИ? Когда вы в последний раз говорили: "нет, это неверно, вот почему" - и могли объяснить, почему так считаете? Когда вы в последний раз принимали решение, которое шло вразрез с рекомендацией ИИ?

продолжить чтение

«Дзен» запустил новостного ИИ-ассистента «Глиф»

Контент‑платформа «Дзен» 26 марта запустила новостного ИИ‑ассистента «Глиф», который поможет пользователям лучше понимать повестку и разбираться в значении новостей. Об этом в интервью ТАСС сообщил

продолжить чтение