Что делает shuffle=True и как не сломать порядок
Привет, Хабр! Сегодня рассмотрим невинный на первый взгляд параметр shuffle=True в train_test_split.Под «перемешать» подразумевается применение псевдо-рандомного пермутационного алгоритма (обычно Fisher–Yates) к индексам выборки до того, как мы режем её на train/test. Цель — заставить train-и-test быть независимыми и одинаково распределёнными (i.i.d.). В scikit-learn эта логика зашита в параметр shuffle почти всех сплиттеров. В train_test_split он True по умолчанию, что прямо сказано в документации — «shuffle bool, default=True».train_test_split
На Spotify завирусились треки несуществующей группы — пользователи считают, что эту музыку продвигает сама платформа
На Spotify завирусились треки группы The Velvet Sundown. За месяц коллектив собрал более 500 тыс. прослушиваний и даже успел выпустить два альбома. Единственная проблема в том, что об участниках группы ничего не известно, а поиск по их именам не даёт результатов. Пользователи считают, что творчество The Velvet Sundown сгенерировано нейросетью, а коллектив продвигает Spotify, чтобы сэкономить на выплатах артистам.
В Томске началась летняя школа по ИИ для молодых учёных
В Томске 30 июня 2025 года стартовала летняя школа по искусственному интеллекту для молодых учёных. Организаторы — Институт AIRI и Томский государственный университет. В школу приехали 80 участников из 10 регионов России. Программа идёт 11 дней. С участниками работают учёные из AIRI, ТГУ, МГУ, МФТИ, ВШЭ, МТУСИ, Сколтеха и других вузов и научных организаций.
Почему ваш мозг (и ИИ) должен сначала «пережить» событие, чтобы потом его осмыслить
Разбираемся, почему современные LLM, несмотря на всю свою мощь, остаются «философскими зомби», и какая архитектурная деталь могла бы это изменить.ВведениеС одной стороны, модель генерирует код, пишет осмысленные тексты и проходит сложнейшие тесты. С другой — в любой нестандартной ситуации или при глубоком вопросе о ее собственном «понимании» вся магия рассыпается. Мы видим умную, но пустую оболочку. «Статистического попугая», как его метко назвали.Интуиция подсказывает, что простое масштабирование — больше данных, больше параметров — не решит эту проблему. Мы упираемся в невидимую стену.
Petlibro выпустила умную ИИ-камеру для питомцев, которая распознаёт действия животного
Компания Petlibro, которая выпускает автоматические кормушки и поилки, представила
АО «АТОМДАТА» и ВСП Глобал подписали соглашение о сотрудничестве
В рамках VIII Форума «ЦОД: модели, сервисы, инфраструктура» подписан Меморандум о сотрудничестве по развитию инфраструктуры и информационных технологий в сфере искусственного интеллекта.
Как заставить AI-ассистента работать с базой знаний в enterprise-компании. RAG-модель в архитектуре
Компания платит дважды: за создание базы знаний и за ее игнорирование. В этой статье разберем, как превратить ее из цифрового кладбища в мощный инструмент с AI-ассистентом – без галлюцинаций LLM и нарушений compliance.Для начала небольшая ремаркаМногие представляют базу знаний как эдакую внутреннюю википедию, где описаны основные процессы, в отдельных папках хранятся регламенты и инструкции, все красиво упаковано, на лугах пасутся розовые пони. Никто не суется в эту базу знаний, потому что информация устаревает до того, как будет опубликована.
Полное руководство по всем видам тестирования
Программные проекты зависят от тщательного тестирования для обеспечения качества, надежности и удовлетворенности пользователей. Есть много разных типов тестирования, каждый из которых предназначен для обнаружения проблем на разных этапах жизненного цикла разработки.
