Как я разрабатываю агентские ИИ системы для извлечения признаков (feature-extraction) из мультимодальных данных
Извлечение признаков (feature extraction) из текстов — ключевой шаг при анализе документов: он является основной практической частью таких задач по обработке данных, как классификация, тематическое моделирование, NER, QA. Если раньше почти что для каждой из таких задач, и в особенности для разных модальностей данных использовались специализированные архитектуры нейронных сетей, то сейчас подобные системы обычно строятся вокруг LLM/VLM. Однако и современные модели на практике настраиваются под конкретные задачи через fine‑tuning или distillation, в связке с retrieval (RAG) и агентскими архитектурами.
Как нейросетям перестать бояться и полюбить «синтетику»
LLM требуют все больше данных для обучения, но обучаться постепенно становится не на чем: аппетиты ИИ-систем превосходят возможности человечества по генерации контента, к тому же использовать реальные данные в одних случаях дорого, в других — не очень-то законно.Спасти ситуацию может «синтетика», но и с ней не все гладко. Мы в beeline cloud решили разобраться, какие риски несут в себе подобные датасеты, что такое «ML-аутофагия» и как с ней борются разработчики LLM.
«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций
В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда.
Cооснователь PayPal Питер Тиль: ИИ не спасёт от «стагнации» в IT
Миллиардер и сооснователь PayPal Питер Тиль видит в искусственном интеллекте такую же преобразующую силу, какой Интернет был в конце 1990-х годов. Однако, по его мнению, этого может быть недостаточно, чтобы положить конец «застою» в технологических достижениях.
Я сплю на рабочем месте и вам советую
Привет! Это Саша, продакт в системе управления проектами YouGile. Раньше я замечал, что долго не могу собраться. То ногу под себя закину, то спину поправлю, то опять позу поменяю. Все было не то, росла утомляемость, затекала спина. Вот как я решил эту проблему и открыл три секрета продуктивного дня.
Совместная работа за 500: как объединить сотни сотрудников и выстроить эффективные процессы
В своей предыдущей статье я рассказала о том, какие инструменты совместной работы подойдут для компаний среднего размера, которые справились с активным ростом и задумались о повышении эффективности работы. Сегодня поговорим о том, что нужно взрослым компаниям — мы называем их Small Enterprise. Это компании со средней численностью сотрудников от 500 человек, с четкой развитой структурой компании, множеством отделов, руководителей, заместителей и т.д.
Компании спамят Reddit сгенерированными ИИ сообщениями
Платформа Reddit, которая страдает от нашествия ИИ-ботов и веб-сканеров, закрыла им доступ к своим материалам и индексируется только через Google. Однако это привело к тому, что компании начали атаковать соцсеть сгенерированными ИИ сообщениями.
Baidu откроет исходный код генеративной ИИ-модели Ernie
Китайский технологический гигант Baidu заявил, что планирует открыть исходный код генеративной модели искусственного интеллекта Ernie. Ранее компания выступала против политики открытого кода.
