ML Q & AI. Глава 1. Эмбеддинги, латентные пространства и представления
Известный эксперт в области машинного обучения и ИИ Себастьян Рашка был добр бесплатно поделиться с миром своей уникальной книгой о фундаментальных вопросах в области современного машинного обучения. В ней он рассматривает вопросы создания эффективных архитектур для глубинного обучения. Книга охватывает 30 важных аспектов этой сферы в максимально доступной и понятной форме: каждый вопрос рассмотрен как небольшая, но интересная статья, подобно тем, что мы читаем здесь, на Хабре. Отсутствие такой книги в русскоязычном сегменте - большое упущение, поэтому верю, что серия переводов этой книги будет полезна сообществу Хабра.
Адаптация по-арабски: технологии для печати этикеток товаров
Меня зовут Сергей Меркулов и я старший консультант Fix Price. Наши магазины работают уже в 10 странах мира. И это значит, что каждый товар, который представлен на наших полках в зарубежных магазинах, обязательно имеет этикетку на иностранном языке. Для понимания масштабов: в нашей сети примерно 32 тысячи наименований локальных кодов (или SKU, то есть единиц складского учета). В среднем у одного локального кода — 3 штрихкода. То есть фактически у нас 96 000 различных этикеток! И сегодня я расскажу вам о том, как мы научились эффективно работать с ними на рынке ОАЭ.Об особенностях перевода
Что Google Translate может рассказать нам о вайб-кодинге
В последнее время часто звучат мрачные прогнозы (и даже скрытая реклама) о том, что крупные языковые модели (LLM) уничтожат программирование как профессию. Многие обсуждения лишены нюансов, поэтому я хотел бы внести свои пояснения. С одной стороны звучат заявления вроде: «Я использовал $LLM_SERVICE_PROVIDER, чтобы создать маленькую временную программу, и скоро все программисты останутся без работы за $ARBITRARY_TIME_WINDOW». С другой – категорический отказ признавать какую-либо пользу таких инструментов. Думаю, лучше всего прояснить эту ситуацию можно на примере другой отрасли, где подобные технологии появились раньше: перевод.
Подбираем лучший механизм аппаратной конкурентности для машинного обучения на ЦП
В среде выполнения задач ИИ для Firefox можно задействовать сразу множество потоков в выделенном процессе логического вывода, чтобы ускорить выполнение таких операций на ЦП. В среде WASM/JS можно создать SharedArrayBuffer и обрабатывать содержимое этого буфера сразу несколькими потоками. Такая рабочая нагрузка поддаётся конкурентному распределению на несколько ядер ЦП.
Google внедряет речевой перевод в Meet
Google объявила о внедрении функции перевода речи в сервис для видеосвязи Google Meet. Функцию на базе Gemini представили на конференции Google I/O.
Jupyter-Ascending — новый способ работы с Jupyter Ноутбуками в Emacs
05 мая 2025 года Duncan Britt публиковал статью о том, как можно работать с Jupyter ноутбуками в Emacs. Он создал пакет Jupyter-Ascending , чтобы упростить редактирование и выполнение Python кода в Jupyter-ноутбуках напрямую из Emacs. Оригинал статьи можно найти на сайте автора: https://duncanbritt.com/blog/jupyter-ascending/jupyter-ascending.htmlГлавным образом, jupyter-ascending использует Jupytext и Jupyter Ascending. Инструменты пакета предоставляют следующие возможности:отображение .ipynb
AI делает разработчиков тупее
Графические материалы взяты с freepik, постер носит иллюстративный характерВсем привет! Предлагаю вашему вниманию перевод статьи «AI is Making Developers Dumb». Перевод выполнен человеком, а не LLM :)
Audible запустил ИИ-инструменты для создания аудиокниг
Принадлежащий Amazon онлайн-сервис Audible запустил
В Дании решили: постредактирование — это не перевод
Дания стала первой страной, официально отделившей человеческий литературный перевод от текстов, полученных через постредактирование машинного перевода. С мая 2025 года такие тексты больше не считаются полноценным переводом и не попадают под действие системы Public Lending Right (PLR), которая предусматривает выплаты авторам, переводчикам и другим творческим специалистам за использование их работ в библиотеках.
Проводим слепой тест переводов прямо на Хабре
Хорошие переводчики переводят хорошо. А как насчет нейросетей? Пользователь @antptr86 сделал в комментариях классную вещь - для чистоты эксперимента он выложил несколько вариантов перевода одного абзаца из "Дюны", и предложил их оценить вслепую, без знания источников.Мне показалось это крайне занимательным, и поэтому я решил сделать из этого небольшую статью и голосование для хабраюзеров в конце.

