анализ данных. - страница 4

Anthropic расширяет присутствие на корпоративном рынке: новые ИИ-решения и инвестиции

Anthropic объявила о нескольких шагах, направленных на расширение своего присутствия на корпоративном рынке. Среди них — специализированное ИИ-решение для финансовых услуг, каталог интегрированных программных инструментов, назначение высокопоставленного руководителя отдела продаж и инвестиции в размере 2 миллионов долларов в американскую энергетическую инфраструктуру и обучение кибербезопасности.

продолжить чтение

Линеаризация в офлайн-тестах: как не стереть сигнал вместе с шумом

Если хочешь навести порядок в шуме — сначала разберись, не затёр ли ты в нём сам сигнал.

продолжить чтение

Прокачаться в data science: блоги и каналы

Делимся блогами, посвященными машинному обучению и data science. Материалы от практикующих дата-сайентистов, программистов, физиков и биоинформатиков будут интересны как начинающим, так и «прожженным» специалистам.Фотография Claudio Schwarz / UnsplashЛонгриды о машинном обученииАвтор

продолжить чтение

Сделка OpenAI с Министерством обороны направлена на здравоохранение, анализ данных и киберзащиту

Компания OpenAI подписала свой первый официальный контракт с Министерством обороны США, согласившись предоставлять и развивать технологии искусственного интеллекта на сумму 200 миллионов долларов. Эта годовая сделка, ориентированная в основном на район Вашингтона, округ Колумбия, знаменует собой дебют компании в качестве прямого подрядчика Пентагона.

продолжить чтение

Когда O(n) мешает отбирать резюме в Росатоме

Главная проблема поиска сотрудников — предвзятость. Порой кажется, что наше резюме подходит под свою роль на 100 %, а рекрутер отклоняет его. Проблема с противоположной стороны баррикад: рекрутер должен отсмотреть по 200, 300 и более резюме в день. По разным данным, на каждое уходит всего лишь 6–10 секунд. А что если можно решить эти две проблемы с помощью ML? Сделать модель, которая исключит любой байес и поможет рекрутеру объективно отбирать подходящих кандидатов (где «подходящесть» обусловлена красивой математикой!). Мы это сделали. Оказалось, что если вы хотите добиться непредвзятости, то вам придётся внести в систему предвзятость. Оксюморон в статистике! Что мы увидели: Женатые и замужние — в топе: пока вы не уходите глубоко в анализ, этот быстрый фактор повышает ранг. Чем точнее ваша модель, тем меньше его вес. Английский — плохо: знание английского почему-то работало как антипаттерн, снижая релевантность. ОГУРЕЦ: кто-то зачем-то написал это слово в резюме. Оно попало в словарь модели и получило большой вес. Иксель — люди пишут Excel как угодно, и само слово в правильном написании оказалось снижающим оценку. К резюме может быть приложено много мусора. Самый эпичный пример: авиабилет Москва — Челябинск вместо резюме. Но давайте начну с начала.

продолжить чтение

Мультимодальные LLM: ключик к AGI или зачем бизнесу модели, которые видят, слышат и понимают?

Мультимодальные модели — звучит как что-то для исследовательских лабораторий и презентаций на AI-конференциях. Но на самом деле они уже работают здесь и сейчас: анализируют документы, пишут тексты, создают рекламу, генерируют видео, помогают врачам и юристам.Привет, Хабр! Это интервью с Александром Капитановым. Саша руководит исследовательскими ML-командами в Сбере. Активный контрибьютор в Open Source. А ещё он член программного комитета AiConf X и HighLoad++ от «Онтико».

продолжить чтение

Проектирование Информационных систем. Часть 1. Введение

При подготовке специалиста в области проектирования Информационных систем, важно учитывать конъектуру применения навыков в дальнейшем. Это может быть либо роль “Проектировщик” в каком-то из проектов, либо постоянная профессия “Проектировщик ИТ-продуктов”.Для кого предназначен курс?Для ИТ аналитиков:

продолжить чтение

Разведочный анализ данных (EDA) через тематическое моделирование и мягкую кластеризацию

Привет! Меня зовут Соня Асанина, я работаю в команде Центра технологий искусственного интеллекта Газпромбанка. В этой статье я расскажу, как тематическое моделирование и мягкая кластеризация помогают нам извлекать ценные инсайты из клиентских отзывов.Каждый день мы получаем тысячи отзывов от клиентов. В каждом есть информация, которая помогает выявлять проблемы и дает понимание, как улучшать продукты и сервисы. Но часто очень сложно извлечь эти инсайты из огромного потока неструктурированных данных.

продолжить чтение

Офлайн А-Б тесты в ресторанах фастфуда. Часть 2: Анализ и интерпретация результатов A-B-тестов

Методология — это не шаблон, это компас. А его стрелка — всегда на стороне ваших данных. В первой части «

продолжить чтение

Офлайн А-Б тесты в ресторанах фастфуда. Часть 1: Планирование и верификация офлайн A-B-тестов

"Основа надёжного A/B — не магия формул, а понимание, с чего вы стартуете и с чем работаете."

продолжить чтение

Rambler's Top100