архитектура.

Халява уходит из программирования

Для меня халява — это гарантированный результат за вложенные усилия. Логика повествования требует такого определения, дальше всё будет ясно.Халяве учили и учат в школе. Сделай домашнее по алгебре, выучи стихотворение, научись решать линейные уравнения — и получишь пятерку, то есть лучшее из возможного. Любовь получать пятерки сыграла злую шутку со многими, ведь в жизни вне учебных заведений халявы практически нет.Слово «легко» ниже по статье тоже означает гарантированный результат за усилия, но подразумевается «легко, если умеешь работать с собственной мотивацией».

продолжить чтение

Оставлено в

Архитектурное мышление, скорочтение и изучение чего-нибудь нового

У переводчиков есть понятие “слова-ловушки” — реактивное мышление, когда ты видишь слово, очень похожее на слово из твоего языка, и на автомате пытаешься его перевести. Но на самом деле оно значит совсем другое.

продолжить чтение

Оставлено в

Что волнует фронтенд-разработчиков в 2025 году? Итоги исследования CFP для Frontend Conf 2025

Каждый год программный комитет Frontend Conf проводит глубокое исследование отрасли, чтобы понять, какие темы действительно волнуют фронтенд-разработчиков. Всё начинается с кастдевов — интервью с компаниями, в которых обсуждаются текущие боли и потребности. На основе этих разговоров мы составили список тем, которые затем прошли количественную проверку. В этом году удалось собрать порядка 300 мнений. На их основе сформировали общую картину интересов, которая и легла в основу программы конференции.

продолжить чтение

Оставлено в

Проектируем собственную inhouse Feature Platform

Всем хорошего дня! На связи с вами Домклик #MLOps, и эта статья будет полезна тем, кто интересуется построением внутренней платформы. Меня зовут Алина Баймашева, я руководитель разработки ML-команд, недавно выступила с докладом на конференции HighLoad++ 2024, а теперь подготовила статью по мотивам доклада. Поэтому если вы пропустили доклад, то можно почитать статью. В ней отражены как общие концепции построения подобных платформ, так и возможности практического применения.

продолжить чтение

Оставлено в

Merge 2025 в Иннополисе: два дня прокачки и нетворкинг на максималках

продолжить чтение

Оставлено в

Native Sparse Attention: новый вид разреженного внимания от DeepSeek

Когда Маск выпустил Grok 3, а Сэм Альтман все еще колебался, стоит ли открывать исходный код, Лян Вэньфэн, как соавтор, работал с исследовательской группой DeepSeek над созданием шокирующей и сенсационной исследовательской статьи. DeepSeek официально представила свой последний научный прорыв — Native Sparse Attention (NSA)! Эта технология имеет большое значение. Она, скорее всего, значительно повысит способность следующего поколения больших языковых моделей обрабатывать длинные тексты, полностью учитывая при этом операционную эффективность. Нет сомнений, что это еще одна веха в области больших языковых моделей (LLM)!

продолжить чтение

Оставлено в

MoE: Как Смесь Экспертов меняет правила игры в мире AI

При просмотре последних опубликованных статей вы можете заметить в названиях слово «MoE». Что же означает это «MoE» и почему его так часто используют сейчас? В этом наглядном руководстве мы подробно рассмотрим этот важный компонент с более чем 50 иллюстрациями: Смесь Экспертов (MoE)!Table_1Введение

продолжить чтение

Оставлено в

Свой стартап на LLM и агентах — это просто! (нет). Или почему технология не всегда так важна

В эпоху повального увлечения AI кажется, что достаточно взять OpenAI API, найти проблему, написать сложненький промпт и готово — ваш следующий единорог уже на подходе. Однако реальность, как всегда, оказывается намного сложнее и это мираж технологической простоты. В этой статье — рассуждения о том, почему базовая технология или стек целиком — это лишь верхушка айсберга в создании успешного продукта, и почему даже имея доступ к самым передовым технологиям, создать по-настоящему ценный продукт остается сложной задачей.

продолжить чтение

Оставлено в

Google представили Titan: архитектуру нейросетей, которая может стать новой серебряной пулей LLM

Все современные LLM построены на архитектуре трансформера. GPT-4o от OpenAI, Gemini от Google, Claude Sonet от Anthropic, Grok от xAI... перечислять можно долго. Трансформер – действительно очень мощная архитектура (и кстати тоже была придумала в Google), но и в ней есть свои недостатки.

продолжить чтение

Оставлено в

Микроархитектура простого нейросетевого ускорителя на SystemC

Привет, Хабр! Меня зовут Михаил Степанов, я инженер-стажер группы функциональной верификации YADRO. Эта статья — логическое продолжение предыдущей, «Простая нейронная сеть на C++». Для лучшего понимания темы рекомендую сначала ознакомиться с ней.В этих двух статьях я работал с синтетической задачей, решение которой нельзя применить в реальных системах. На всеобъемлющий анализ я не претендую, это просто академическое исследование. Оно поможет понять, с чего начать погружаться в тему ускорения нейросетей.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

архитектура.

Халява уходит из программирования

Архитектурное мышление, скорочтение и изучение чего-нибудь нового

Что волнует фронтенд-разработчиков в 2025 году? Итоги исследования CFP для Frontend Conf 2025

Проектируем собственную inhouse Feature Platform

Merge 2025 в Иннополисе: два дня прокачки и нетворкинг на максималках

Native Sparse Attention: новый вид разреженного внимания от DeepSeek

MoE: Как Смесь Экспертов меняет правила игры в мире AI

Свой стартап на LLM и агентах — это просто! (нет). Или почему технология не всегда так важна

Google представили Titan: архитектуру нейросетей, которая может стать новой серебряной пулей LLM

Микроархитектура простого нейросетевого ускорителя на SystemC

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

архитектура.