Машинное обучение.

Data-driven корова: как мы строим SaaS для геномной селекции и решаем проблемы «грязных» данных в агротехе

Вам когда-нибудь казалось, что современное ИТ — это в основном про перекладывание JSON-ов, покраску кнопок и борьбу за миллисекунды в банковских транзакциях? Недавно я наткнулся на статистику о том, сколько данных генерирует одна современная молочная ферма, и как я удивился, когда понял: большинство этих данных оседает в разрозненных Excel-таблицах, тетрадках зоотехников или, в лучшем случае, в древних локальных базах типа «СЕЛЭКС», которые не обновлялись годами.

продолжить чтение

Оставлено в

Data poisoning: бэкдоры в данных, RAG и инструментах

TL;DRВ 2025 году отравление данных оказалось в центре внимания. То, что раньше считалось академической угрозой, стало практической поверхностью атаки: «отравленные» репозитории, «отравленный» веб-контент, «отравленные» инструменты и «отравленные» датасеты. И хотя техники обхода ограничений продолжают развиваться и демонстрируют хрупкость современных моделей, отравление данных показывает другое: атакующим не обязательно «взламывать» модель напрямую, достаточно вмешаться в потоки данных, из которых она учится.

продолжить чтение

Оставлено в

Отравление данных: бэкдоры в датасетах, поисковой выдаче и инструментах ИИ — и как защищаться

продолжить чтение

Оставлено в

Введение в отравление данных

продолжить чтение

Оставлено в

Claude Sonnet 4.6: обзор, бенчмарки, сравнение

Пристегните ремни, коллеги-разработчики и любители нейросетей. Если вы думали, что битва титанов между GPT-5.3 и Claude 4.6 Opus, вышедшими в один день, — это пик гонки, то спешу вас обрадовать. Это был только прогрев.

продолжить чтение

Оставлено в

RAG vs Fine-tuning: когда что выбирать — опыт 30+ проектов

RAG vs Fine-tuningПредставьте: клиент хочет «умного бота для базы знаний». Первый вопрос, который я задаю: «Данные часто меняются?»От ответа зависит архитектура. И бюджет. И сроки. И головная боль на следующие полгода.

продолжить чтение

Оставлено в

У нас есть джун, и мы его учим

Амбициозный, с собственными пет-проектами, участвующий в формах и профильных ивентах/конференциях — софты уже есть, на нашей стороне — харды.Начали обучение мы даже без погружения в то, как работает LLM, просто научили его работать в графическом интерфейсе нашей платформы, создавать простейшие цепочки и написания промптов.Плюс, постепенно изучаем то, из чего состоит само приложение (что можно подключить память, что там можно выбирать различные инструменты для работы), отдельные моды в LangChain для разных задач, для вопросно-ответных систем, для систем, где агент выбирает сам инструменты, где система работает с реактом.

продолжить чтение

Оставлено в

Инженеры Uber создали ИИ-версию главы компании

Инженеры Uber создали ИИ-версию генерального директора компании Дары Хосровшахи. Чат-бот Dara помогает сотрудникам в рамках подготовки к встречам с высшим руководством. Об этом рассказал сам Хосровшахи в выпуске подкаста Стивена Бартлетта The Diary Of A CEO.

продолжить чтение