BrainTools - Методики для развития мозга - страница 623

Как я разрабатываю агентские ИИ системы для извлечения признаков (feature-extraction) из мультимодальных данных

Извлечение признаков (feature extraction) из текстов — ключевой шаг при анализе документов: он является основной практической частью таких задач по обработке данных, как классификация, тематическое моделирование, NER, QA. Если раньше почти что для каждой из таких задач, и в особенности для разных модальностей данных использовались специализированные архитектуры нейронных сетей, то сейчас подобные системы обычно строятся вокруг LLM/VLM. Однако и современные модели на практике настраиваются под конкретные задачи через fine‑tuning или distillation, в связке с retrieval (RAG) и агентскими архитектурами.

продолжить чтение

Как нейросетям перестать бояться и полюбить «синтетику»

LLM требуют все больше данных для обучения, но обучаться постепенно становится не на чем: аппетиты ИИ-систем превосходят возможности человечества по генерации контента, к тому же использовать реальные данные в одних случаях дорого, в других — не очень-то законно.Спасти ситуацию может «синтетика», но и с ней не все гладко. Мы в beeline cloud решили разобраться, какие риски несут в себе подобные датасеты, что такое «ML-аутофагия» и как с ней борются разработчики LLM.

продолжить чтение

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда.

продолжить чтение

Личный опыт: как ChatGPT помог выбрать смартфон

продолжить чтение

Cооснователь PayPal Питер Тиль: ИИ не спасёт от «стагнации» в IT

Миллиардер и сооснователь PayPal Питер Тиль видит в искусственном интеллекте такую ​​же преобразующую силу, какой Интернет был в конце 1990-х годов. Однако, по его мнению, этого может быть недостаточно, чтобы положить конец «застою» в технологических достижениях.

продолжить чтение

Я сплю на рабочем месте и вам советую

Привет! Это Саша, продакт в системе управления проектами YouGile. Раньше я замечал, что долго не могу собраться. То ногу под себя закину, то спину поправлю, то опять позу поменяю. Все было не то, росла утомляемость, затекала спина. Вот как я решил эту проблему и открыл три секрета продуктивного дня.

продолжить чтение

OpenAI в меморандуме просит сотрудников отклонить «смехотворные» предложения Meta* о переманивании

Главный научный сотрудник OpenAI Марк Чен разослал сотрудникам меморандум с просьбой отклонить предложения Meta* о трудоустройстве. Письмо из Slack компании попало в распоряжение Wired.

продолжить чтение

Совместная работа за 500: как объединить сотни сотрудников и выстроить эффективные процессы

В своей предыдущей статье я рассказала о том, какие инструменты совместной работы подойдут для компаний среднего размера, которые справились с активным ростом и задумались о повышении эффективности работы. Сегодня поговорим о том, что нужно взрослым компаниям — мы называем их Small Enterprise. Это компании со средней численностью сотрудников от 500 человек, с четкой развитой структурой компании, множеством отделов, руководителей, заместителей и т.д.  

продолжить чтение

Компании спамят Reddit сгенерированными ИИ сообщениями

Платформа Reddit, которая страдает от нашествия ИИ-ботов и веб-сканеров, закрыла им доступ к своим материалам и индексируется только через Google. Однако это привело к тому, что компании начали атаковать соцсеть сгенерированными ИИ сообщениями.

продолжить чтение

Baidu откроет исходный код генеративной ИИ-модели Ernie

Китайский технологический гигант Baidu заявил, что планирует открыть исходный код генеративной модели искусственного интеллекта Ernie. Ранее компания выступала против политики открытого кода.

продолжить чтение

Rambler's Top100