Машинное обучение. - страница 268

Создаем датасет печатных букв с любым шрифтом за 170 строк

Всем привет, это моя первая статья на Хабре. В этой статье я хочу рассказать, как сгенерировать датасет печатных букв с помощью .ttf файла и кода на Python в 170 строк.Зачем?

продолжить чтение

Llama 3.1 и «Гарри Поттер»: сколько текста действительно запоминает ИИ?

Может ли искусственный интеллект запомнить целую книгу? А если да, что это значит для авторов, издателей и самих разработчиков ИИ? Недавнее исследование от ученых из Стэнфорда, Корнелла и Университета Западной Виргинии показало, что языковая модель Llama 3.1 может дословно воспроизвести до 42% текста «Гарри Поттера и Философского камня». Это заставляет усомниться в механизмах ограничения памяти ИИ и поднимает вопросы о защите авторских прав. Дальше — как раз об этом.

продолжить чтение

Минцифры анонсировало запуск новых программ «Топ-ИТ» и «Топ-ИИ» для подготовки IT-кадров уровня senior

С 1 сентября 2025 года Минцифры совместно с вузами и IT‑компаниями запустит новые учебные программы «Топ‑ИТ» и «Топ‑ИИ» для подготовки высококвалифицированных ИТ‑специалистов уровня senior, в том числе для научных направлений по искусственному интеллекту.Ранее Минцифры планировало обязать аккредитованные

продолжить чтение

ИИ уличили в рекомендациях фишинговых ссылок на бренды

Исследователи Netcraft провели эксперимент с чат-ботом ChatGPT и ИИ-поисковиками, попросив их перейти на различные известные платформы. Из 131 имени хоста для 50 брендов 34% оказались фишинговыми ссылками.

продолжить чтение

ИИ в радиологии: определение контура опухоли легких во время дыхания

Мы неоднократно наблюдали всплески «трендовых» технологий, реакция общества на которые варьировалась от фанатичного желания получить эту технологию до радикального ее отрицания. Дополненная реальность, 3D-печать, голограммы, ИИ — все эти технологии очень громко обсуждались, но не все их них распространились и стали частью нашего быта. ИИ во всех его проявлениях (языковые модели, машинное обучение и т. д.) кажется проник везде, от браузеров и ОС смартфонов, до телевизоров и пылесосов. К ИИ вопросов много, от их этичности до воздействия на экологию. Однако стоит отметить, что не все ИИ одинаково плохи. Многие из них помогают в исследованиях и становятся инструментами улучшения уже имеющихся технологий. Ученые из Северо-Западного университета (Эванстон, штат Иллинойс, США) разработали систему, которая объединяет МРТ и ИИ, что позволяет трехмерно визуализировать контуры опухолей легких, которые меняются при дыхании пациента. Как именно работает данная система, что она позволяет увидеть в легких, и насколько она лучше экспертов-радиологов? Ответы на эти вопросы мы найдем в докладе ученых.

продолжить чтение

Илья Суцкевер стал CEO Safe Superintelligence после ухода Даниэля Гросса

3 июля 2025 года Илья Суцкевер, сооснователь и бывший главный научный сотрудник OpenAI, был назначен генеральным директором компании Safe Superintelligence (SSI) — стартапа в сфере искусственного интеллекта, который он основал в 2024 году после ухода из OpenAI.Эта смена руководства произошла после ухода предыдущего CEO, Даниэля Гросса, покинувшего компанию 29 июня 2025 года. Сооснователь Даниэль Леви занял пост президента, а Суцкевер теперь будет напрямую курировать техническую команду.Safe Superintelligence — уникальная компания на рынке ИИ, сосредоточенная исключительно на разработке

продолжить чтение

200 000+ снимков мусора: что мы узнали о датасетах

В нашей работе хватает безумных задач. Мы создали первого в России цифрового PR-менеджера, разрабатывали виртуальную примерочную и делали много чего еще, о чем не всегда можно рассказать. Но когда мы взялись за создание ИИ-сортировщика мусора MARQUS, поняли — будет совсем жестко.Не так давно мы создали систему сортировки ТКО (Твердых коммунальных отходов) MARQUS, которая делит отходы на бумагу, металл, пластик, стекло и т.д. Система использует искусственный интеллект и специальные сенсоры, чтобы распознавать различные типы отходов прямо на конвейере и направлять их в соответствующие секции для переработки.

продолжить чтение

ICLR-2025: что нового в мультимодальном ранжировании

Всем привет! Недавно мы — Алексей Спасёнов и Кирилл Никоров @KIIN из ML‑команды Мультимедиа Поиска Яндекса (Картинки и Видео) — и ещё 90 яндексоидов побывали на конференции ICLR-2025 и рады рассказать о свежих направлениях исследований в области мультимодального ранжирования.

продолжить чтение

Шесть моделей ИИ дали один и тот же ответ при угадывании числа

Специалист по работе с данными из консалтинговой компании Capco Мохд Фарааз провёл эксперимент, предложив популярным ИИ-моделям угадать число от 1 до 50. Все они выбрали один и тот же вариант ответа.

продолжить чтение

Кросс-валидация на временных рядах: как не перемешать время

Привет, Хабр!Сегодня рассмотрим то, что чаще всего ломает даже круто выглядящие модели при работе с временными рядами — неправильная кросс-валидация. Разберем, почему KFold тут не работает, как легко словить утечку будущего, какие сплиттеры реально честны по отношению ко времени, как валидировать фичи с лагами и агрегатами.Почему KFold — плохая идея для time-seriesKFold — штука классная… но только если твои данные не зависят от времени. Он был создан для мира, где каждый объект независим. Для задач классификации изображений или анализа табличных данных KFold

продолжить чтение

Rambler's Top100