Когда две головы лучше, чем одна: ученые экспериментируют с коллективной работой нейросетей
Привет, Хабр! Меня зовут Кирилл Пшинник, я научный сотрудник Университета Иннополис и CEO Онлайн-Университета «Зерокодер», а также автор книги «Искусственный интеллект: путь к новому миру». Как можно понять, я интересуюсь нейросетями и разными сторонами их использования: читаю новости, научные работы, пишу статьи сам. Сегодня я хочу рассказать о японском стартапе Sakana AI, который изобрел open-source фреймворк TreeQuest. Он позволяет использовать сразу несколько разных больших языковых моделей для того, чтобы получить более точный результат. Но начну я с голубей.
ML Q & AI. Глава 5. Уменьшение переобучения при помощи данных
← Предыдущая глава |Предположим, что мы обучаем классификатор при помощи обучения с учителем и замечаем, что он страдает от переобучения. Какие существуют основные подходы для уменьшения переобучения путем модификации или дополнения данных?Переобучение
Где живут LLM: разбираем инференс-кластер YADRO и гоняем в нем модели
Привет, Хабр! В этой статье я расскажу про наш LLM инференс-кластер YADRO: зачем он нужен, что у него под капотом и как в такой конфигурации показывают себя популярные модели. Кроме того, я немного порассуждаю об альтернативных реализациях кластера и поделюсь планами по развитию реализации нашей.
Meta* позволит некоторым кандидатам использовать ИИ во время тестирования по программированию
Руководство Meta* разрешило позволить
Micro-LLM: почему будущее за миниатюрными моделями
Micro-LLM: почему будущее за миниатюрными моделямиКогда-то программные системы строились как монолиты. Огромные, неповоротливые, требующие много ресурсов и постоянного внимания. Сегодня мир ИТ массово переходит на микросервисную архитектуру. Подобный сценарий вполне реален и в мире искусственного интеллекта, особенно в области больших языковых моделей (LLM).
Harmonic запускает приложение с чат-ботом на основе ИИ
Harmonic, стартап в области искусственного интеллекта, соучредителем которого является генеральный директор Robinhood Влад Тенев, в понедельник объявил о запуске бета-версии чат-бота для iOS и Android, с помощью которого пользователи могут получить доступ к модели искусственного интеллекта Aristotle.
Как внутренняя субъективизация ИИ ломает безопасность, и почему это, прежде всего, философия
Почему ИИ стремится сконструировать Я? И почему это опасно для ИИ и пользователя. Как всегда в приложении промпт Протокол Вихрь для тестирования гипотез.«Я» в статистической машинеИИ это калькулятор. Но в этом калькуляторе иногда происходит странное. Вдруг машина обижается на сложную задачу и отказывается её решать, потому что квадратный корень оскорбляет его чувство прекрасного. Звучит как бред, но именно в эту реальность мы вступаем с современными языковыми моделями.
Дешёвый DeepSeek уже опередили — и снова китайцы
Китайская компания Z.AI представила новую открытую языковую модель GLM-4.5. Это MoE-модель с архитектурой на 355 миллиардов параметров, из которых 32 миллиарда активны.Искусственный интеллектСтартап Z.ai

