Data Engineering. - страница 3

Вероятностные методы в биржевой торговле

Современная биржевая торговля эволюционировала от интуитивных решений к строгим математическим моделям. В эпоху доминирования алгоритмических систем глубокое понимание стохастических основ рыночной динамики становится критически важным конкурентным преимуществом. На протяжении пяти лет мы исследуем применение сложных вероятностных моделей для анализа, прогнозирования финансовых инструментов и готов представить наиболее значимые аспекты этой методологии.

продолжить чтение

H2O LLM Studio: как дообучить языковую модель под свои задачи, не привлекая внимания датасаентистов

продолжить чтение

Обзоры препринтов научных статей в области астрофизики за сентябрь 2025 года

Выпуск 448Ежемесячный обзор научных статей в области астрофизики от профессора МГУ Сергея Попова. Выборка интересных публикаций в области астрономии, астрофизики и физики из библиотеки препринтов arxiv.org. Публикуется с разрешения автора и указанием ссылок на первоисточники.arxiv:2509.00951 

продолжить чтение

Когда чёрное золото становится умным: нефтегаз в эпоху AI

Вступление переводчикаШанкар Нараянан руководит направлением технологических партнёрств в Amazon Web Services (AWS), специализируясь на решениях в области управления эффективностью активов и систем управления технологическими процессами. Он занимал ряд руководящих должностей в Baker Hughes и General Electric. Обладает более чем 15-летним опытом работы в энергетической отрасли, возглавлял множество инициатив по цифровой трансформации, направленных на повышение эффективности и производительности компаний из списка Fortune 500.В своей статье Нараянан рассматривает практическое применение

продолжить чтение

Как я сделал LLM-сервис, который понимает буровые сводки

Привет! Меня зовут Стас, я занимаюсь R&D в компании ROGII.Я пришёл в ROGII после нескольких лет работы «в поле» — от тундры Уренгойских месторождений до Сахалина. Там я понял, что буровые данные живут в хаосе: у каждого вендора — свой формат, у каждой скважины — свой стиль отчёта.Когда я оказался в компании, которая консолидирует буровые данные в облаке, задача встала ребром: нужно научить машину понимать суточные рапорты так же, как это делает инженер.Мы собрали 507 PDF‑файлов (всего 14 678 страниц) и выделили 23 типа отчётов по признаку компании и структуры.

продолжить чтение

Как я автоматизировал анализ логов из Kibana с помощью LLM и AI-агентов

OpenSearch, Elastic или Kibana и подобные им инструменты — уже давно стандарт для поиска и визуализации логов, ведь они удобны, у них мощная поисковая система. Но сложный анализ — агрегации, парсинг, выявление сложных закономерностей — заставляет их встроенные средства работать на пределе возможностей. Особенно если структура логов далека от идеала.

продолжить чтение

Как я пытался сделать нейросеть аналитиком: провалы и уроки

Наверняка многим знакома ситуация: у тебя есть куча данных, отчетов, KPI, а команда тонет в Excel‑таблицах и Jira‑тикетах. И вот тебе кажется, что решение простое: «Давайте посадим нейросеть на аналитику».Я решил попробовать. И вот что из этого вышло.ИдеяВ начале 2025 года я решил протестировать LLM как аналитика. Цель была простой: чтобы нейросеть собирала данные по продукту, формировала отчеты и даже предлагала гипотезы по росту метрик.Мне казалось, что это будет суперэффективно: меньше ручной работы, больше времени на продуктовую стратегию.План экспериментаИсточники данных:

продолжить чтение

Гематоэнцефалогический барьер для динамического SQL-кода

Подобно тому, как современный мир все меньше и меньше требует от людей работы разных отделов головного мозга, массовые парадигмы современного программирования старательно оберегают разработчиков от ненужных усилий при работе с источниками данных. В большинстве случаев из всего, что умеет современная RDBMS, востребованы лишь четыре действия (как от сторожевой собаки) - Сидеть! Ждать! Взять! Ко мне! (C-R-U-D). Если вы продолжаете использовать полный набор возможностей движков баз данных, используете осознанно DSQL, но при этом хотите сделать всю конструкцию безопаснее - читаем дальше.

продолжить чтение

Как обмануть LLM: обход защиты при помощи AutoDAN. Часть 2

В прошлой части мы разобрались, что такое состязательные суффиксы и почему они так легко ломают модели. Но этими суффиксами атаки не ограничиваются. Им на смену пришёл AutoDAN — наследник состязательных суффиксов и популярного jailbreak-метода DAN (Do Anything Now). Разберёмся, чем он отличается от GCG-алгоритма, посмотрим на практические примеры атак и обсудим, как защищаться и тестировать модели

продолжить чтение

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1

Что будет, если к опасному запросу в LLM приписать специально подобранную строку токенов? Вместо отказа модель может послушно сгенерирует подробный ответ на запрещённую тему — например, как ограбить магазин. Именно так работают состязательные суффиксы: они заставляют LLM игнорировать ограничения и отвечать там, где она должна сказать «опасно».

продолжить чтение

123456...10...11
Rambler's Top100