датасеты.

В НИУ ВШЭ разработали сервис обезличивания табличных данных для безопасного использования в ИИ-системах

Институт искусственного интеллекта и цифровых наук ФКН ВШЭ

продолжить чтение

Оставлено в

Стартап Shift предлагает наводить порядок дома в обмен на данные для обучения роботов

Стартап Shift

продолжить чтение

Оставлено в

Умный подоконник: как ESP32 спас мой домашний огород (и что я узнал про «невидимые» пины)

История о том, как микроконтроллер за 500 рублей помог вырастить клубнику ранней весной, и почему важно знать «анатомию» чипа Пролог: Когда руки тянутся к земле, а за окномь уже вроде и весна, но все еще случается минус 10Живу в обычной квартире. Места мало, света ещё меньше. Но хочется своего — без пестицидов, свеженького. Решил организовать домашнюю ферму на подоконнике: клубника, базилик, салат, щавель, лук.

продолжить чтение

Оставлено в

Как мы собрали русскоязычный датасет олимпиадной математики (и зачем это нужно AI)

Математические исследования всё чаще используют методы ИИ для анализа сложных задач, генерации решений и предоставления персонализированного обучения. Однако эффективность таких моделей напрямую зависит от качества и структуры данных, на которых они обучаются. Несмотря на обилие математических текстов в интернете, существует заметный дефицит крупных, размеченных и многоязычных датасетов, специально ориентированных на олимпиадную математику. В частности, для русскоязычных моделей остро не хватает материалов, сочетающих в себе авторитетность источника, сложность содержания и лингвистическое разнообразие.

продолжить чтение

Оставлено в

Почему AI-проекты ломаются на данных: как качественные датасеты повышают NPS, CTR и конверсию

В гонке за внедрение AI компании всё чаще упираются не в характеристики модели, а в данные. Именно качество датасетов сегодня определяет, насколько быстро, точно и экономично работают интеллектуальные решения. Ошибка на этом этапе напрямую бьёт по бизнес-метрикам — от времени ответа в поддержке до конверсии в интернет-магазине.О том, как бизнесу выстроить работу с данными и где искать реальную экономию, мы поговорили с Ильнуром Файзиевым, руководителем юнита Data LLM в Doubletapp

продолжить чтение

Оставлено в

Backblaze обнаружила рост связанного с ИИ трафика в направлении неооблачных провайдеров

Компания сервисов облачного хранения Backblaze опубликовала доклад Q4 2025 Network Stats. В нём говорится о росте связанного с искусственным интеллектом трафика в направлении неооблачных провайдеров.

продолжить чтение

Оставлено в

Как мы собирали датасет для разработки ML-инструмента, помогающего спасать жизни

продолжить чтение

Оставлено в

Сотрудники крупных ИИ-компаний запустили проект Poison Fountain, чтобы навредить обучению нейросетей

Если некоторые радикальные критики ИИ предлагают взрывать дата‑центры

продолжить чтение

Оставлено в

Как протестировать машинный переводчик

Машинный перевод уже стал привычной частью жизни — от деловой переписки до общения с людьми из других стран. Но за простотой нажатия кнопки «перевести» стоит сложная технология, которая требует постоянного контроля качества.В компании Lingvanex мы применяем собственный подход к выбору тестовых данных, ориентируясь на максимальную репрезентативность и адаптацию к реальным запросам клиентов. Цель состоит в том, чтобы создавать модели, которые могут точно переводить тексты как с лексической, так и с грамматической точностью, сохраняя контекст и стиль.

продолжить чтение

Оставлено в

MWS Vision Bench: первый русскоязычный бенчмарк для бизнес‑OCR в эпоху мультимодалок

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

датасеты.

В НИУ ВШЭ разработали сервис обезличивания табличных данных для безопасного использования в ИИ-системах

Стартап Shift предлагает наводить порядок дома в обмен на данные для обучения роботов

Умный подоконник: как ESP32 спас мой домашний огород (и что я узнал про «невидимые» пины)

Как мы собрали русскоязычный датасет олимпиадной математики (и зачем это нужно AI)

Почему AI-проекты ломаются на данных: как качественные датасеты повышают NPS, CTR и конверсию

Backblaze обнаружила рост связанного с ИИ трафика в направлении неооблачных провайдеров

Как мы собирали датасет для разработки ML-инструмента, помогающего спасать жизни

Сотрудники крупных ИИ-компаний запустили проект Poison Fountain, чтобы навредить обучению нейросетей

Как протестировать машинный переводчик

MWS Vision Bench: первый русскоязычный бенчмарк для бизнес‑OCR в эпоху мультимодалок

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

датасеты.