Где живут LLM: разбираем инференс-кластер YADRO и гоняем в нем модели
Привет, Хабр! В этой статье я расскажу про наш LLM инференс-кластер YADRO: зачем он нужен, что у него под капотом и как в такой конфигурации показывают себя популярные модели. Кроме того, я немного порассуждаю об альтернативных реализациях кластера и поделюсь планами по развитию реализации нашей.
Meta* позволит некоторым кандидатам использовать ИИ во время тестирования по программированию
Руководство Meta* разрешило позволить
Micro-LLM: почему будущее за миниатюрными моделями
Micro-LLM: почему будущее за миниатюрными моделямиКогда-то программные системы строились как монолиты. Огромные, неповоротливые, требующие много ресурсов и постоянного внимания. Сегодня мир ИТ массово переходит на микросервисную архитектуру. Подобный сценарий вполне реален и в мире искусственного интеллекта, особенно в области больших языковых моделей (LLM).
Harmonic запускает приложение с чат-ботом на основе ИИ
Harmonic, стартап в области искусственного интеллекта, соучредителем которого является генеральный директор Robinhood Влад Тенев, в понедельник объявил о запуске бета-версии чат-бота для iOS и Android, с помощью которого пользователи могут получить доступ к модели искусственного интеллекта Aristotle.
Как внутренняя субъективизация ИИ ломает безопасность, и почему это, прежде всего, философия
Почему ИИ стремится сконструировать Я? И почему это опасно для ИИ и пользователя. Как всегда в приложении промпт Протокол Вихрь для тестирования гипотез.«Я» в статистической машинеИИ это калькулятор. Но в этом калькуляторе иногда происходит странное. Вдруг машина обижается на сложную задачу и отказывается её решать, потому что квадратный корень оскорбляет его чувство прекрасного. Звучит как бред, но именно в эту реальность мы вступаем с современными языковыми моделями.
Дешёвый DeepSeek уже опередили — и снова китайцы
Китайская компания Z.AI представила новую открытую языковую модель GLM-4.5. Это MoE-модель с архитектурой на 355 миллиардов параметров, из которых 32 миллиарда активны.Искусственный интеллектСтартап Z.ai
Runway представила Aleph — новый способ редактирования, преобразования и генерации видео
Runway представила Aleph — ИИ-модель для профессиональной работы с видео. Работает с реальным отснятым материалом, а не генерирует видео с нуля.

