ml. - страница 30

ml.

Машинное обучение в продуктовой разработке, где его не ожидают

Базовые подходы и подводные камни

продолжить чтение

Reasoning-LLM: архитектура и обзор передовых моделей

Reasoning-LLM — это большие языковые модели, нацеленные на логическое рассуждение при решении сложных задач. В отличие от обычных LLM, которые часто выдавали ответы сразу, такие модели способны «думать» пошагово — как человек, анализируя задачу и выстраивая цепочку вывода. Появление reasoning-LLM связано с тем, что традиционные LLM (например, GPT-4 или Llama 3.1) хотя и хорошо справляются с языковыми и энциклопедическими запросами, нередко ошибались в задачах, требующих сложных вычислений, планирования или логического вывода. В этой статье мы подробно разберем, как работают reasoning-LLM, их внутреннее устройство (Transformer, self-attention, механизмы «мышления»). А еще — рассмотрим передовые модели (OpenAI o1, DeepSeek R1 и Claude 3.7 Sonnet), факторы, влияющие на их точность, и дадим практические рекомендации по применению.

продолжить чтение

Десять уроков развития аппаратных ускорителей для ИИ: как эволюция TPU привела к созданию TPUv4i

В последние годы стало очевидно, что классические центральные процессоры (CPU) и видеокарты (GPU) уже не всегда поспевают за непрерывным ростом и усложнением нейронных сетей. Вместо бесконечного наращивания «универсального» железа, компании начали разрабатывать и внедрять в своих дата-центрах Domain-Specific Architecture (DSA) — аппаратные ускорители, заточенные под конкретные задачи.Google TPU (Tensor Processing Unit) — одно из первых крупных решений такого рода. Начиная с 2015 года (поколение TPUv1), Google успела вывести на рынок несколько поколений TPU для внутренних нужд: TPUv1 и TPUv2/v3, а в 2020 году — новое решение TPUv4i

продолжить чтение

Machine learning на ESP32

Распознавание жестов — это технология, которая позволяет людям взаимодействовать с устройствами без физического нажатия кнопок или сенсорных экранов. Интерпретируя жесты человека, эта технология нашла свое применение в различных потребительских устройствах, включая смартфоны и игровые консоли. В основе распознавания жестов лежат два ключевых компонента: сенсор и программный алгоритм.

продолжить чтение

Как OSA превращает пустые полки в полные корзины?

Привет, Хабр! Меня зовут Анастасия Трапезникова, и я ведущий аналитик данных в Magnit Tech. Вы когда-нибудь сталкивались с разочарованием перед пустой полкой, где должен быть ваш любимый майонез? А что если я вам скажу, что майонез в магазине есть. Помимо разочарования, это приводит еще и к потере выручке магазина.

продолжить чтение

ML-модель в поисках ЛПР

ЗавязкаДавайте рассмотрим вымышленную компанию «Орионик Групп» — холдинг, который объединяет несколько компаний, обеспечивающих полный производственный цикл и продажи.В головную компанию — «Орионик Групп» — входят:«Орионик Девелопмент» (девелоперский бизнес): управляет коммерческой и жилой недвижимостью. Генеральный директор: Артем Сергеевский.«Орионик Логистика» (транспорт и складские услуги): контрактная логистика, транспортные перевозки. Генеральный директор: Марина Маринина.

продолжить чтение

AutoML и NAS

Автор статьи: Сергей Артамонов - DS Wildberries, Research Engineer Skoltech, аспирант мехмата МГУ, преподаватель Школы Высшей Математики

продолжить чтение

AI Engineering vs ML Engineering: Как фундаментальные модели меняют подход к разработке

В эпоху, когда ИИ проникает в каждый сектор, понимание различий между AI Engineering и ML Engineering становится ключевым для выбора стратегии разработки. Книга AI Engineering: Building Applications with Foundation Models ярко иллюстрирует, как фундаментальные модели (foundation models) переворачивают традиционные подходы. Вот что важно знать.Почему сегодня AI Engineering вытесняет ML Engineering?Демократизация доступа к ИИ— Раньше: Создание ML‑моделей требовало месяцев работы с raw data, обучения архитектур и настройки гиперпараметров. Например, обучение GPT-3 потребовало 3,5 тыс. GPU‑лет.— Сейчас

продолжить чтение

От данных к действиям: как мы создавали рекомендации на главной странице Uzum Market

Меня зовут Фарит, я ML-инженер в команде рекомендаций Uzum Market. Сегодня я расскажу, как мы с нуля разработали персональные рекомендации для главной страницы нашего маркетплейса. Мы разберем архитектуру системы, используемые алгоритмы и способы измерения успеха проекта.

продолжить чтение

Цифровые двойники в сельском хозяйстве: изучим потенциал на примере выращивания мандаринов

Цифровые двойники — это воспроизведенные с помощью технологий цифровые представления объектов из реального мира. Благодаря системам управления большими данными цифровые двойники в сельском хозяйстве можно использовать для прогнозирования будущего урожая. Учёные из Южной Кореи Стивен Ким и Сон Хо создали цифровые двойники мандариновых деревьев, чтобы продемонстрировать возможность их использования в сельском хозяйстве. Мандарин в качестве модельной культуры был выбран из-за его широкого распространения на корейском острове Чеджу и возможности многолетнего наблюдения.

продолжить чтение

Rambler's Top100