Le Chat: что внутри мобильного приложения с чат-ботом от Mistral
Европейская компания Mistral выпустила мобильное приложение с чат-ботом на базе собственных моделей машинного обучения. Приложение должно составить конкуренцию ChatGPT и другим похожим сервисам.
Запускаем DeepSeek-R1 на обычном сервере с 768Гб ОЗУ в LM-Studio
Что побудило написать статью?Была тут недавно статья с картинками железа, ценами на железо, но без описания настроек, но зато с ссылками на GitHub и цитирую «Инструкция: Следуйте руководству в репозитории GitHub».:‑) Хотя в нынешних реалиях запустить нейросеть можно уже на чем угодно и не обязательно обладать навыками выше «Опытного пользователя ПК». (Если рассматривать «дистиллированные» сети, не знаю как правильно перевести.) Поэтому использования сложных инструментов и инструкций чтобы запустить что‑то и тем более отправку на GitHub считаю не совсем корректно. О себе
В GitHub Copilot появилась возможность задать кастомные инструкции в репозитории проекта
В блоге GitHub рассказали, что к репозиторию проекта теперь можно добавить файл с кастомными инструкциями для Copilot. Например, в них можно детально описать используемые технологии или рекомендации для оформления кода. Чат-бот будет учитывать эти инструкции во время генерации ответов.Для активации кастомных инструкций надо создать файл .github/copilot-instructions.md и на естественном языке описать в нём все важные детали проекта. Если папку .github
Anthropic просит кандидатов не использовать нейросети в откликах на вакансии
В вакансиях на сайте компании Anthropic, которая разрабатывает семейство языковых моделей Claude, заметили просьбу не использовать нейросети для откликов. Компания хочет оценить коммуникативные навыки будущего сотрудника, а не возможности чат-бота.Страница отклика на вакансию на сайте Anthropic состоит
GitHub представил Vision for Copilot: генерация кода по изображениям
GitHub анонсировал ряд обновлений для Copilot, а также дал возможность заглянуть в более агентное будущее своего парного программирования на базе искусственного интеллекта . Среди заметных обновлений — функция Vision for Copilot, которая позволяет пользователям прикреплять к чату снимок экрана, фотографию или диаграмму, а Copilot генерирует интерфейс, код и альтернативный текст для их воплощения в жизнь.
ИИ простыми словами, часть 2. Reinforcement Learning (RL)
Когда я пишу новости про ИИ, то часто сталкиваюсь с проблемой: они пестрят техническими терминами, которые не всегда понятны даже людям использующим ИИ регулярно. SFT, MoE, RL/RLHF/DPO, миллионы их.Я захотел описать самые популярные термины простым русским языком, чтобы каждый, даже нетехнический человек, мог разобраться в самой главной технологии современности. Чтобы, когда я пишу на Хабр или куда-то ещё, для сложных терминов я сразу мог бы дать ссылку на понятное и простое объяснение.
DeepSeek и Qwen 2.5 против ChatGPT: как китайские компании запустили новый скачок в мире ИИ
В последние недели мир искусственного интеллекта (ИИ) был потрясен значительными достижениями китайских компаний, особенно DeepSeek и Alibaba, которые представили свои передовые модели — DeepSeek-R1 и Qwen 2.5-Max соответственно. Конечно же, эти события вызвали широкий резонанс в технологическом сообществе и привели к обсуждению будущего ИИ.Меня зовут Роман Ленц, я начальник отдела анализа данных и машинного обучения ПГК Диджитал — цифровой дочки Первой грузовой компании
LLM в науке, тюнинг и регулирование систем ИИ
Продолжим рассказ о том, для чего можно использовать виртуальную инфраструктуру с GPU. Сегодня поговорим о том, какие ИИ пишут научные статьи, кто оптимизирует LLM с помощью других LLM, а также затронем регулирование систем ИИ. Мечта студента
Как попасть на международную конференцию по ИИ
Привет, Хабр! Меня зовут Даша Галимзянова, я – NLP-разработчик в MTS AI. Сегодня на своем опыте расскажу, как попасть на топовые международные ИИ-конференции – и зачем вам это нужно.В MTS AI я работаю почти два года. За это время статьи, которые я готовила вместе с коллегами, приняли на две крупнейшие международные конференции: EMNLP (Empirical Methods in Natural Language Processing), которая прошла в ноябре 2024 года во Флориде, и ECIR (European Conference on Information Retrieval) — она состоится в Италии в этом году. Сразу скажу, что далеко не всегда статьи проходят отбор на конференции. Например, мы с коллегами готовили исследование
ИИ без хайпа: что реально работает уже сегодня, а что пока просто красиво звучит? (февраль 2025)
Мы постоянно слышим хайповые заявления: “ИИ нас всех заменит”, “экспертиза больше не является ограничением", “мы уже знаем как создать AGI” итп. Под влиянием медиа и общественных ожиданий многие воспринимают потенциальные или прогнозируемые технологии как уже существующие.В этой статье мы разберём, какие задачи искусственный интеллект реально решает уже сегодня, и как их можно разделить на категории: Инженер, Аналитик, Рассказчик и Ассистент. Мы также рассмотрим текущее распределение задач между этими категориями и спрогнозируем, какие изменения произойдут в ближайшие годы.

