Как я разрабатываю агентские ИИ системы для извлечения признаков (feature-extraction) из мультимодальных данных
Извлечение признаков (feature extraction) из текстов — ключевой шаг при анализе документов: он является основной практической частью таких задач по обработке данных, как классификация, тематическое моделирование, NER, QA. Если раньше почти что для каждой из таких задач, и в особенности для разных модальностей данных использовались специализированные архитектуры нейронных сетей, то сейчас подобные системы обычно строятся вокруг LLM/VLM. Однако и современные модели на практике настраиваются под конкретные задачи через fine‑tuning или distillation, в связке с retrieval (RAG) и агентскими архитектурами.
Baidu откроет исходный код генеративной ИИ-модели Ernie
Китайский технологический гигант Baidu заявил, что планирует открыть исходный код генеративной модели искусственного интеллекта Ernie. Ранее компания выступала против политики открытого кода.
Мы всё чаще не отличаем реального автора от AI
В прошлом гайде https://habr.com/ru/articles/918226/
Deepseek может быть удалён из немецких магазинов приложений
Берлинский уполномоченный по защите данных и свободе информации признал Deepseek незаконным контентом в соответствии со статьей 16 Закона о цифровых услугах (DSA). Теперь Apple и Google должны изучить отчет и принять решение о блокировке приложения в Германии.
В Германии попросили Apple и Google удалить DeepSeek из магазинов приложений
Немецкие власти объявили китайский чат-бот DeepSeek угрожающим безопасности, а местный регулятор требует удалить его из App Store и Google Play.
Я немного устал от SQL и решил попробовать себя в веб-разработке
Я дата-инженер, которому захотелось немного творчества. Писать сотни строк SQL на работе не всегда доставляет радость, поэтому решил углубиться в веб-разработку, чтобы иметь возможность сделать то, что можно "потрогать" руками и, возможно, поделиться этим с окружающими.В итоге родилась идея AI тьютора - смесь двух популярных нынче направлений Онлайн-обучение и AI. AI Тьютор - сервис генерации образовательного контента с возможностью проверки знаний и виртуальным помощником.
GenAI Outlook Report 2025
Не так давно вышел GenAI Outlook Report — отчёт для европейских политиков и экспертов не только в цифровой сфере, но и во всех ключевых отраслях.Основные тезисы просты:– GenAI меняет социально- техно- экономический ландшафт– Без стратегических инвестиций не обойтись– Масштабирование требует системного надзора– Спрос на навыки работы с ИИ стремительно растёт– Самые популярные сервисы с общим охватом 91%+: ChatGPT, Gemini, Copilot, DeepSeek, Perplexity
GenAI в ЕС в 2025: высокие стандарты и низкая скорость
Не так давно вышел GenAI Outlook Report 2025 — отчёт для европейских политиков и экспертов не только в цифровой сфере, но и во всех ключевых отраслях.Основные тезисы просты:– GenAI меняет социально- техно- экономический ландшафт– Без стратегических инвестиций не обойтись– Масштабирование требует системного надзора– Спрос на навыки работы с ИИ стремительно растёт– Самые популярные сервисы с общим охватом 91%+: ChatGPT, Gemini, Copilot, DeepSeek, Perplexity
Ускорение DeepSeek-R1 с подвохом: Когда токены в секунду врут о реальной скорости
ВведениеПосле сборки домашнего сервера для работы с LLM DeepSeek-R1 подробно о нём можно прочитать в статье Локальный DeepSeek-R1-0528. Когда скорость улитки – не приговор, а точка старта возникла потребность сравнить разные квантизации для оптимизации скорости/качества работы. Запуская работу с разными моделями, я заметил что квантизация зачастую приводит к ускорению генерации токенов.
ИИ-помощники для учебы: какие нейросети лучше всего справляются с написанием сочинений
Доброго времени суток, «Хабр»!В современном мире нейросети стали мощными помощниками в создании текстов. ИИ умеют генерировать идеи, исправлять ошибки и даже писать целые работы. В сегодняшней подборке — лучшие нейросети, которые упростят вам написание сочинений.Готовы погрузиться в мир умных текстов? Тогда держитесь — мы начинаем!

