От RLHF к DPO и дальше: как мы разучились бояться и полюбили выравнивание LLM
В 2022 году существовал ровно один способ сделать языковую модель «хорошей» — RLHF. Один. Если вы хотели, чтобы ваша LLM отвечала адекватно, не генерировала токсичность и хотя бы делала вид, что понимает вопрос, — вам нужен был Reinforcement Learning from Human Feedback, армия аннотаторов и бюджет уровня OpenAI. Четыре года спустя у нас зоопарк из десятка методов выравнивания, половина из которых можно запустить на одной RTX 4090. Мир изменился. Разбираемся, как именно.Вот факт, который в 2022-м взорвал индустрию: модель InstructGPT с 1.3 миллиарда параметрами, обученная через RLHF, победила базовый GPT-3 со 175 миллиардами
Слияние капитала, ии и технологий
кдпв и сутьПредисловиеИи сейчас одна из технологий. Но в скором будущем это будет совсем не так.Основной фактор роста торговая схема: капитал ↔ наука, технология.Капитал, это всего лишь один очень сильный мем.
VK внедрила визуально-языковые модели ИИ в поиск своих сервисов
Компания VK начала внедрять в поиск своих продуктов визуально‑языковые модели (VLM). VLM) представляют собой искусственный интеллект, который одновременно анализирует текст, изображения, звук и видеоряд. Технология уже работает в «VK Видео». Она появится в других сервисах компании, где есть поисковые системы.
Исследователи AIRI и МФТИ создали среду CAMAR для управления сотнями автономных агентов
Исследователи Института AIRI и МФТИ разработали CAMAR — универсальную среду для обучения и тестирования алгоритмов управления большим числом автономных агентов. Работа принята на основной трек конференции AAAI-2026 и получила Best Poster Award среди 24 тысяч поданных исследований. Разработка ориентирована на ускорение исследований и внедрение технологий автономной логистики и робототехники, рассказали информационной службе Хабра в пресс‑службе AIRI. Проект распространяется как open‑source под лицензией MIT и доступен для исследователей и компаний.
Разработчик представил трекер задач SheepCat для нейроотличных пользователей
Пользователь chadders13 поделился
Как я снизил WER с 33% до 3.3% для русской речи на CPU: сравнение GigaAM, Whisper и Vosk
Мне нужен был офлайновый голосовой ввод для Windows — push‑to‑talk, без облака, с хорошим распознаванием русского. Звучит просто? Я тоже так думал. За два месяца перепробовал три ASR‑движка, кучу оптимизаций, и большая часть идей оказалась тупиком. Но в итоге — 3.3% WER на CPU, в 2.4 раза лучше Whisper large‑v3-turbo на RTX 4090.Зачем это вообще понадобилосьГолосовой ввод на русском в 2026 году — грустная история. Встроенный в Windows работает через облако и плохо понимает русскую речь. Google Cloud STT — платный и требует интернет.
Университетские годы Джулиана Ассанжа
Джулиан Ассанж в старой комнате MUMSДжулиан Ассанж - основатель Wikileaks и вероятный создатель сообщества Cicada 3301
Социальный субъект трансформации общественных отношений перед лицом нового технологического уклада
Один из главных вопросов, который стоит сегодня на повестке — это какое преобразующее воздействие окажет новая технологическая революция, связанная с нейросетевыми агентами и роботизацией на рабочие места. Будет ли уничтожен труд?Давайте сначала раскроем само понятие труда. Маркс определял его следующим образом:
«Я всё сломал за выходные»: как мы учим LLM писать в стиле конкретного СМИ
Привет, я Лена, это мой первый пост здесь, и он про техническую задачу, с которой мы столкнулись: как заставить LLM писать текст так, чтобы его нельзя было отличить от написанного конкретной редакцией. Не «хороший текст», не «грамотный текст», а такой, который звучит как этот конкретный городской портал или этот Telegram-канал.
Как выбрать язык программирования новичку: Обзор ситуации на 2026
Выбор первого языка программирования — важное решение, которое может определить траекторию вашего профессионального развития. В этом расширенном руководстве мы подробно рассмотрим каждый популярный язык программирования объективно, без предпочтения какого-либо одного решения.📋 СодержаниеPythonJavaScriptJavaC#Go (Golang)RustSwiftKotlinRZator
