- BrainTools - https://www.braintools.ru -

С 24 апреля 2026 года платформа GitHub начнет использовать данные о взаимодействиях разработчиков с ИИ-помощником Copilot для обучения [1] своих алгоритмов. Новые правила сбора телеметрии коснутся пользователей тарифов Free, Pro и Pro+, в то время как корпоративные клиенты сохранят полную приватность. Этот шаг направлен на повышение качества генерации кода за счет анализа реальных сценариев использования нейросети в повседневной практике программистов.
Решение платформы отойти от практики обучения моделей исключительно на открытых исходниках и синтетических базах данных вызвало широкое обсуждение в IT-сообществе. Доступ к рабочим процессам независимых программистов позволит алгоритмам анализировать не только успешный финальный код, но и сам путь его создания: от первых черновиков и опечаток до финального рефакторинга. При этом владельцам корпоративных подписок Business и Enterprise беспокоиться не о чем, их коммерческая тайна и интеллектуальная собственность по-прежнему защищены условиями договоров и не участвуют в тренировке ИИ.
Долгое время качество ИИ-ассистентов упиралось в ограниченность и «стерильность» обучающих выборок. Однако интеграция внутренних логов от разработчиков материнской компании Microsoft продемонстрировала значительный потенциал этого подхода. Аналитики зафиксировали заметный рост доли принимаемых пользователями подсказок сразу в нескольких языках программирования. Обучение на живых проектах помогает системе глубже понимать архитектурный контекст, точнее предлагать автодополнение и эффективнее выявлять потенциальные уязвимости до этапа компиляции.
Исторический факт: Использование реального пользовательского поведения [2] для обучения машин – фундаментальный драйвер развития IT-индустрии. Настоящий скачок в качестве поисковой выдачи в начале 2000-х годов произошел именно тогда, когда поисковики начали массово анализировать клики, время сессий и отказы, превратив ежедневную рутину пользователей в беспрецедентную обучающую выборку.
Если разработчик не отключит передачу телеметрии вручную, алгоритмы будут агрегировать весьма обширный набор параметров. В обучающий датасет попадут принятые или измененные фрагменты кода, тексты запросов к чат-боту, а также локальный контекст, который среда разработки передает нейросети. Кроме того, система учтет навигацию по файлам, общую структуру текущего репозитория, пользовательские комментарии и реакции [3] на предложенные решения (лайки или дизлайки).
Важный нюанс: хотя сканирование закрытых репозиториев «в состоянии покоя» не производится, активная работа в приватном проекте с включенным плагином Copilot автоматически инициирует обработку строк кода и может отправить их на серверы для дальнейшего обучения.
Пользователям оставили простой механизм отказа от участия в программе (opt-out). Прекратить передачу логов можно в любой момент через настройки конфиденциальности в профиле платформы. Если разработчик ранее уже снимал галочку, разрешающую использовать статистику для улучшения продуктов, этот параметр сохранится автоматически.
Собранная информация останется строго внутри корпоративной инфраструктуры и будет доступна только аффилированным подразделениям GitHub и Microsoft. Разработчики сервиса заверяют, что никаким сторонним провайдерам ИИ-моделей или независимым лабораториям логи пользователей передаваться не будут.
Автор: stas-clear
Источник [4]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/27738
URLs in this post:
[1] обучения: http://www.braintools.ru/article/5125
[2] поведения: http://www.braintools.ru/article/9372
[3] реакции: http://www.braintools.ru/article/1549
[4] Источник: https://habr.com/ru/news/1015128/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1015128
Нажмите здесь для печати.