Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса

Ян Лекун, один из крёстных отцов современного ИИ, в своём твиттере резко критикует ^[1] корпоративных исследователей ИИ, которые ведут проприетарные разработки и занимаются «нагнетанием страха». Среди этих людей называются Сэм Альтман (OpenAI), Демис Хассабис (Google DeepMind) и Дарио Амодеи (Anthropic)

Ян Лекун ^[2] (Yann LeCun) — французский и американский учёный в области машинного обучения ^[3] и компьютерного зрения ^[4]. Известен как автор легендарной системы LeNet ^[5] (1989 г.), где одним из первых начал применять методы биологических нейронных сетей для оптического распознавания символов (OCR).

Сейчас занимает должность вице-президента и ведущего исследователя ИИ в корпорации Meta (руководит разработкой опенсорсной языковой модели LLaMA ^[6], в том числе). При этом остаётся ярым приверженцем опенсорса, свободной науки и научно-технического прогресса человечества.

Ян Лекун родился в пригороде Парижа, получил диплом по специальности «Электротехника и электроника» в инженерной школе ESIEE Paris (1978−1983), а затем докторскую степень по информатике в Университете Пьера и Марии Кюри, сейчас это университет Сорбонна (1983−1987 гг).

Именно в 1987 году перед получением докторской степени он предложил раннюю форму алгоритма с обратным распространением ошибки ^[7] (backpropagation) для нейросетей.

Затем в 1987−1988 гг. занимался исследованиями машинного обучения как постдок под руководством Джеффри Хинтона в университете Торонто (как и Илья Суцкевер, об этом ниже).

Потом начал длительную и успешную карьеру в американских компаниях.

▍ Распознавание символов. Первые системы машинного зрения на основе нейросетей

После получения докторской степени в 1988 году Ян Лекун начал работать в AT&T Bell Laboratories в городке Холмдел, Нью-Джерси, где разработал серию методов машинного обучения, в том числе свёрточные нейронные сети.

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 2

Группа Лекуна в AT&T Bell Laboratories, 2002 год ^[8]

Первой разработкой стала архитектура нейросети, которая распознаёт рукописные цифры почтового индекса с очень низким процентом ложных срабатываний. Система описана в научных статьях 1988-го ^[9] и 1989-го ^[10] гг.

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 3

Рукописные примеры почтовых индексов и нормализованные цифры из тестового набора данных. Позже был разработан эталонный набор MNIST ^[11] для обучения нейросетей

Архитектура нейросети из научной статьи «Применение метода обратного распространения ошибки для распознавания рукописных почтовых индексов» ^[10] 1989 года:

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 4

Извлечение признаков (фич) из оцифрованных рукописных символов по описанию в научной статье «Система распознавания рукописных цифр почтового индекса» ^[12] 1988 года:

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 5

▍ LeNet

Кроме метода обратного распространения ошибки ^[13] для этой и других OCR-систем, Ян Лекун разработал и применил несколько инновационных методов машинного обучения:

свёрточные нейросети ^[14], работающие по образцу биологических систем,
методы регуляризации нейросетей, описанные в работе «Оптимальное повреждение мозга» ^[15],
метод Graph Transformer Networks ^[16] (GTN), похожий на условные случайные поля (CRF) ^[17].

Всё это использовалось в инновационных системах оптического распознавания символов (OCR) на банковских чеках, почтовых письмах и т. д. Впоследствии универсальная нейросеть Лекуна с коллегами получила название LeNet ^[5], под таким названием в дальнейшем она и упоминается в научной литературе. Так оно и вошло в историю.

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 6
Примеры необычных, искажённых и зашумлённых символов, которые корректно распознала LeNet-5, источник: научная статья Лекуна ^[16] 1998 года

Архитектура LeNet-5 из статьи «Обучение на основе градиента для распознавания документов» ^[16] 1998 года:

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 7

Уровень ошибок на тестовом наборе данных для различных методов классификации (максимальная погрешность около 0,1%), оттуда же ^[16]:

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 8

Таким образом, начиная с LeNet для оптического распознавания символов начали использоваться искусственные нейросети, созданные по образцу биологических систем, которые работают в нервной системе ^[18] животных на Земле (поскольку все живые организмы ведут происхождение из одного источника, то механизм работы нейронных сетей у всех практически одинаковый).

Так зарождалось машинное зрение нового типа.

Это и есть главный вклад Лекуна в современную индустрию ИИ, которая к 2025 году всколыхнула всё человечество.

▍ Формат DjVu

В 1996 году Ян Лекун перешёл на работу в AT&T Labs-Research и занялся преимущественно разработкой технологии сжатия изображений и открытого формата DjVu ^[19]. Оптическое распознавание символов и сжатие изображений — естественное продолжение работы эксперта по машинному зрению.

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 9 DjVu является конкурентом PDF как контейнер для отсканированных документов. При этом DjVu превосходит PDF по степени сжатия ^[20]. Согласно научной статье ^[21] с описанием формата, страницы цветных журналов сжимаются до 40−70 КБ, чёрно-белые технические документы — до 15−40 КБ, а древние рукописи — примерно до 100 КБ, удовлетворительное изображение JPEG обычно требует 500 КБ.

DjVu разделяет исходное изображение на три слоя:

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 10

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 11

Передний план. Цветовая информация о маске (3-й слой), разрешение максимально понижается.
Задний план. Иллюстрации и текстура страницы: их разрешение по умолчанию понижается для экономии места.
Чёрно-белая (однобитовая) маска. Маска сохраняется с разрешением исходного файла, она содержит изображение текста и прочие чёткие детали.

Задний и передний планы сжимаются с помощью вейвлет-преобразования ^[22] (как в JPEG2000), а маска — алгоритмом JB2. Для своего времени это были уникальные передовые технологии сжатия.

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 12

Дискретное вейвлет-преобразование в JPEG2000, источник ^[23]

DjVu оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения загрузки файла.

Как и PDF, файл DjVu содержит текстовый (OCR), позволяя осуществлять полнотекстовый поиск по файлу. Файл может содержать интерактивное оглавление и активные области — ссылки, что позволяет реализовать удобную навигацию в книгах.

До стандартизации PDF в 2008 году DjVu считался наиболее подходящим открытым форматом для хранения электронных документов. В те времена не было даже программы для просмотра PDF под Linux, то был закрытый проприетарный формат. Сообщество склонялось к мнению принять DjVu единым стандартом для цифровых документов.

Некоторые организации до сих пор используют DjVu для хранения и распространения отсканированных документов, как Архив Интернета ^[24] (хотя в 2016 году сканирование новых документов в DjVu прекращено ^[25]).

▍ Другие проекты

В 2002 году вместе с Леоном Боту ^[26] разработал язык программирования Lush ^[27] (Lisp Universal Shell), это Lisp-подобный язык для машинного обучения, прямой наследник языка SN, написанного в 1987 году в качестве фронтенда для симулятора нейросети. Авторы Lush те же, что у DjVu. Насколько можно понять, Lush лишён известных недостатков Python ^[28].

За последние десятилетия Лекун стал сооснователем, советником или исследователем в ряде новых компаний и стартапов, в некоторых участвует до сих пор:

сооснователь и советник компании Element ^[29] (2012 — наст. время), которая разрабатывает технологии и софт для биометрической аутентификации,
сооснователь компании MuseAmi ^[30] (2007 — 2016 гг): разработка инновационных программных и аппаратных технологий для музыкального продакшна, образования и развлечений, включая мобильные приложения Improvox, Hook’d и MusicPal,
владелец YLC Consulting LLC (2008 — 2013): исследования, разработки и технологический консалтинг в области ПО, машинного обучения, машинного зрения, робототехники, дата-майнинга, моделирования данных, статистического анализа, OCR, сжатия данных, музыкальных технологий и др.

▍ Дальнейшая карьера

После Bell Labs и AT&T Labs в 2003 году исследователь занял должность профессора компьютерных наук и нейронаук Курантовского института математических наук в Нью-Йоркском университете (NYU). Также является профессором Инженерной школа Тандона NYU.

В 2012 году основал университетский Центр науки о данных ^[31] с первой в мире программой высшего образования по data science (сейчас такие много где есть, даже у «Яндекса»).

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 13
Ян Лекун в университете Миннесоты, октябрь 2014 года ^[32]

С 2013 года возглавил лабораторию ИИ в Facebook, сейчас занимает должность вице-президента и ведущего исследователя ИИ в Meta (VP & Chief AI Scientist).

На самом деле эта соцсеть одной из первых начала использовать машинное обучение в прикладных разработках. Как Лекун говорил в анонсе Moments ^[33] от 2015 года, это мобильное приложение распознаёт людей на фотографиях и упорядочивает фотоальбом в смартфоне. Такая же технология реализована на сайте социальной сети. Она частично основана на работе, проведённой командой Facebook AI Research (FAIR), которую тогда возглавлял Ян Лекун.

В последующие годы важность машинного обучения стала очевидна более широкому кругу людей, а к 2025 году — почти всем. Как известно, ИИ уже прошёл строгий тест Тьюринга ^[34] и обогнал людей в выполнении большого количества прикладных задач.

Ян Лекун является лауреатом многочисленных премий и обладателем почётных званий, в том числе премии Тьюринга 2018 года ^[35] совместно с Йошуа Бенжио ^[36] и Джеффри Хинтоном ^[37] как «отцы революции глубокого обучения».

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 14
Слева направо: Ян Лекун, Джеффри Хинтон и Йошуа Бенжио

Напомним, что Хинтон в университете был научным руководителем Ильи Суцкевера ^[38], ведущего разработчика всех моделей GPT в компании OpenAI, который сейчас работает над сверхмощным ИИ. Сеть AlexNet от Суцкевера была конкурентом LeNet в бенчмарках.

Джеффри Хинтон и Джон Хопфилд ^[39] получили ещё и Нобелевскую премию по физике 2024 года ^[40] «за основополагающие открытия, которые привели к созданию машинного обучения и искусственных нейросетей».

Так что круг выдающихся учёных в области ИИ хорошо известен и ограничен. Впрочем, как и в любой другой области. И рано говорить, например, что Google DeepMind всех победил и у конкурентов нет шансов ^[41]. В других компаниях тоже работают гениальные умы, как Ян Лекун, а ресурсы IT-корпораций практически не ограничены, так что исход этой гонки никак не определён.

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 15

Несмотря на трудоустройство в коммерческой корпорации, Ян Лекун остаётся последовательным приверженцем Open Source ^[42], старается публиковать в открытом доступе результаты исследований, которые ведёт его научная группа в Meta, выступает с лекциями (например, одна из последних — «Математические препятствия на пути к ИИ человеческого уровня» ^[43] на математической конференции). То есть он в первую очередь учёный и исследователь, а уже затем сотрудник корпоративной машины. Стал вирусным его недавний пост ^[44], где он приводит DeepSeek и другие китайские LLM в пример того успеха, которого добился опенсорс:

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса - 16

Это необычная точка зрения, которая идёт наперекор настроениям общей неприязни к Китаю. На самом деле стоит гордиться тем, что они сделали — это наше общее достижение.

Выдающиеся программисты 21 века. Предыдущие статьи

Telegram-канал со скидками, розыгрышами призов и новостями IT 💻 ^[71]

^[72]

Автор: alizar

Источник ^[73]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/14916

URLs in this post:

[1] резко критикует: https://x.com/ylecun/status/1718670073391378694?s=20

[2] Ян Лекун: http://yann.lecun.com/

[3] обучения: http://www.braintools.ru/article/5125

[4] зрения: http://www.braintools.ru/article/6238

[5] LeNet: https://en.wikipedia.org/wiki/LeNet

[6] LLaMA: https://www.llama.com/

[7] обратным распространением ошибки: https://en.wikipedia.org/wiki/Backpropagation

[8] 2002 год: http://yann.lecun.com/ex/ex/group/index.html

[9] 1988-го: https://proceedings.neurips.cc/paper/1988/hash/a97da629b098b75c294dffdc3e463904-Abstract.html

[10] 1989-го: https://web.archive.org/web/20100612150820/http://www.ics.uci.edu/~welling/teaching/273ASpring09/lecun-89e.pdf

[11] MNIST: https://github.com/mbornet-hl/MNIST/tree/master

[12] «Система распознавания рукописных цифр почтового индекса»: https://proceedings.neurips.cc/paper_files/paper/1988/file/a97da629b098b75c294dffdc3e463904-Paper.pdf

[13] ошибки: http://www.braintools.ru/article/4192

[14] свёрточные нейросети: https://en.wikipedia.org/wiki/Convolutional_neural_network

[15] «Оптимальное повреждение мозга»: https://proceedings.neurips.cc/paper/1989/file/6c9882bbac1c7093bd25041881277658-Paper.pdf

[16] Graph Transformer Networks: http://www.dengfanxin.cn/wp-content/uploads/2016/03/1998Lecun.pdf

[17] условные случайные поля (CRF): https://en.wikipedia.org/wiki/Conditional_random_field

[18] нервной системе: http://www.braintools.ru/nervous-system

[19] DjVu: http://djvu.org/

[20] DjVu превосходит PDF по степени сжатия: https://web.archive.org/web/20190121142932/http://www.djvu.org/resources/whatisdjvu.php

[21] научной статье: https://leon.bottou.org/publications/pdf/jei-1998.pdf

[22] вейвлет-преобразования: https://en.wikipedia.org/wiki/Discrete_wavelet_transform

[23] источник: https://en.wikipedia.org/wiki/File:Jpeg2000_2-level_wavelet_transform-lichtenstein.png

[24] Архив Интернета: http://archive.org/

[25] прекращено: https://archive.org/post/1053214/djvu-files-for-new-uploads

[26] Леоном Боту: http://leon.bottou.org/

[27] Lush: https://lush.sourceforge.net/

[28] известных недостатков Python: https://x.com/ylecun/status/1628386056641847296

[29] Element: https://www.elementresearch.com/

[30] MuseAmi: https://web.archive.org/web/20130212143810/http://www.museami.com/

[31] Центр науки о данных: https://cds.nyu.edu/

[32] октябрь 2014 года: https://upload.wikimedia.org/wikipedia/commons/8/84/Yann_LeCun_at_the_University_of_Minnesota.jpg

[33] анонсе Moments: https://www.youtube.com/watch?v=9T45bs9di_U

[34] прошёл строгий тест Тьюринга: https://habr.com/ru/news/896938/

[35] премии Тьюринга 2018 года: https://www.acm.org/media-center/2019/march/turing-award-2018

[36] Йошуа Бенжио: https://yoshuabengio.org/

[37] Джеффри Хинтоном: https://www.cs.toronto.edu/~hinton/

[38] был научным руководителем Ильи Суцкевера: https://habr.com/ru/companies/ruvds/articles/892646/

[39] Джон Хопфилд: https://en.wikipedia.org/wiki/John_Hopfield

[40] Нобелевскую премию по физике 2024 года: https://www.nobelprize.org/prizes/physics/2024/summary/

[41] Google DeepMind всех победил и у конкурентов нет шансов: https://www.thealgorithmicbridge.com/p/google-is-winning-on-every-ai-front

[42] остаётся последовательным приверженцем Open Source: https://www.forbes.com/sites/luisromero/2025/01/27/chatgpt-deepseek-or-llama-metas-lecun-says-open-source-is-the-key/

[43] «Математические препятствия на пути к ИИ человеческого уровня»: https://news.ycombinator.com/item?id=43768791

[44] пост: https://www.linkedin.com/posts/yann-lecun_to-people-who-see-the-performance-of-deepseek-activity-7288591087751884800-I3sN

[45] Джастин Танни: https://habr.com/ru/company/ruvds/blog/682150/

[46] Джей Фриман (saurik): https://habr.com/ru/company/ruvds/blog/688716/

[47] Михал Залевски: https://habr.com/ru/company/ruvds/blog/695386/

[48] 1: https://habr.com/ru/company/ruvds/blog/701556/

[49] 2: https://habr.com/ru/company/ruvds/blog/721150/

[50] Марк Руссинович: https://habr.com/ru/company/ruvds/blog/710268/

[51] Юрки Алакуйяла: https://habr.com/ru/company/ruvds/blog/713648/

[52] Андрей Карпаты: https://habr.com/ru/companies/ruvds/articles/728056/

[53] Даниэль Стенберг, автор curl: https://habr.com/ru/companies/ruvds/articles/733002/

[54] Колин Персиваль, автор tarsnap: https://habr.com/ru/companies/ruvds/articles/739392/

[55] Джефф Дин: https://habr.com/ru/companies/ruvds/articles/752206/

[56] antirez, автор СУБД Redis: https://habr.com/ru/companies/ruvds/articles/758112/

[57] Оскар Толедо: потомственный волшебник: https://habr.com/ru/companies/ruvds/articles/765074/

[58] Ральф Меркл: криптограф, крионик и теоретик молекулярной инженерии: https://habr.com/ru/companies/ruvds/articles/770556/

[59] Чем сейчас занимается Фабрис Беллар: https://habr.com/ru/companies/ruvds/articles/781922/

[60] Мигель де Икаса и его мечта — Linux на десктопах: https://habr.com/ru/companies/ruvds/articles/787860/

[61] Давид Хейнемейер Ханссон (DHH): автор Ruby on Rails: https://habr.com/ru/companies/ruvds/articles/795275/

[62] Карсон Гросс, создатель HTMX: https://habr.com/ru/companies/ruvds/articles/814193/

[63] Клеман Лефевр, создатель Linux Mint: https://habr.com/ru/companies/ruvds/articles/817327/

[64] Андреас Клинг, его операционная система SerenityOS и браузер Ladybird: https://habr.com/ru/companies/ruvds/articles/823778/

[65] Джеффри Сновер и создание PowerShell: https://habr.com/ru/companies/ruvds/articles/832744/

[66] Реймонд Хилл и его блокировщик uBlock Origin: https://habr.com/ru/companies/ruvds/articles/845576/

[67] Ричард Столлман, автор GCC и Emacs: https://habr.com/ru/companies/ruvds/articles/857666/

[68] Дрю ДеВолт — автор языка Hare и платформы кодохостинга SourceHut: https://habr.com/ru/companies/ruvds/articles/863866/

[69] Хакерские утилиты Дидье Стивенса: https://habr.com/ru/companies/ruvds/articles/869680/

[70] Линус Торвальдс: https://habr.com/ru/companies/ruvds/articles/878076/

[71] Telegram-канал со скидками, розыгрышами призов и новостями IT 💻: https://t.me/ruvds_community

[72] Image: https://ruvds.com/ru-rub?utm_source=habr&utm_medium=article&utm_campaign=alizar%0A&utm_content=yan_lekun_sozdatel_lenet_formata_djvu_i_advokat_opensorsa

[73] Источник: https://habr.com/ru/companies/ruvds/articles/903640/?utm_campaign=903640&utm_source=habrahabr&utm_medium=rss

Нажмите здесь для печати.