Машинное обучение. - страница 263

Как небольшой набор данных и управление вычислениями могут улучшить работу языковых моделей

Новый подход показывает, что тщательно подобранные обучающие данные и гибкое управление вычислениями во время тестирования могут помочь AI-моделям более эффективно решать сложные задачи, требующие логического мышления.

продолжить чтение

Нейросеть «Сбера» GigaChat сдала экзамен в Волгоградском медуниверситете по специальности «Кардиология»

Модель GigaChat MAX от Сбера теперь может оказывать помощь людям в вопросах, касающихся здоровья сердца и сосудистой системы. Нейросеть дополнительно обучили на данных по кардиологии, после чего она

продолжить чтение

ИИ простыми словами, часть 1. Архитектура Mixture of Experts (MoE)

Когда я пишу новости про ИИ, то часто сталкиваюсь с проблемой: они пестрят техническими терминами, которые не всегда понятны даже людям использующим ИИ регулярно. SFT, MoE, RL/RLHF/DPO, миллионы их.Я захотел описать самые популярные термины простым русским языком, чтобы каждый, даже нетехнический человек, мог разобраться в самой главной технологии современности. Чтобы, когда я пишу на Хабр или куда-то ещё, для сложных терминов я сразу мог бы дать ссылку на понятное и простое объяснение.

продолжить чтение

Об OpenAI Deep Research

Всем привет! Меня зовут Владимир, я разработчик ИИ с 8-летним стажем (до этого много backend-frontend, веб-разработки и всего такого), увлеченный наукой и технологиями (в первую очередь наукой омоложения, физикой, автоматизацией -- в прочем как и Вы). В своей карьере мне довелось пережить эволюцию поисковых инструментов: от эпохи простых поисковиков, через взрыв популярности форумов и Stack Overflow, до появления современных AI-ассистентов. И каждый новый виток этой эволюции менял наш подход к поиску и анализу информации.

продолжить чтение

В Австралии запретили использовать DeepSeek в госсистемах и рабочих ПК чиновников по соображениям нацбезопасности

4 февраля 2025 года МВД Австралии запретило чиновником

продолжить чтение

Машинный перевод

Автор статьи: Сергей Артамонов - DS Wildberries, Research Engineer Skoltech, аспирант мехмата МГУ, преподаватель Школы Высшей Математики

продолжить чтение

AI-помощник Adobe Acrobat теперь может расшифровывать контрактный жаргон

Adobe добавляет в AI-помощник Acrobat функции, которые призваны упростить сложные контракты и юридические документы как для компаний, так и для потребителей. Новые «возможности интеллектуального анализа контрактов» позволяют чат-боту программы для работы с PDF-файлами автоматически распознавать файлы и отсканированные документы как контракты и обобщать сложные формулировки, чтобы пользователям было проще их понимать.

продолжить чтение

Оценка систем больших языковых моделей (LLM): метрики, проблемы и лучшие практики

Фото Яни Каасинен на Unsplash.

продолжить чтение

ByteDance выпустили OmniHuman-1: генерация видео по одной картинке и аудиодорожке

Ссылка на официальный анонс (англ): https://omnihuman-lab.github.io/Примеры некоторых сгенерированных видосов под катом, но на Хабре не очень удобный плеер, поэтому остальные я выложил в телеге.Анимация человека, а именно - генерация говорящего человека на основе аудиодорожки за последние годы сильно прокачалась в качестве. Но существующие подходы всё ещё испытывают трудности с масштабированием.

продолжить чтение

Цензура в DeepSeek работает при локальном запуске модели

Некоторые эксперты в области искусственного интеллекта считали, что хорошо задокументированная цензура DeepSeek существует только на уровне приложения и не работает, если запустить приложение локально на устройстве. Теперь выяснилось, что это не так.

продолжить чтение

Rambler's Top100