На своей первой конференции разработчиков искусственного интеллекта LlamaCon во вторник компания Meta* анонсировала API для своей серии моделей искусственного интеллекта Llama: Llama API.
продолжить чтение
Во вторник Meta* проводит LlamaCon, свое первое мероприятие для разработчиков AI. Оно будет посвящено семейству открытых моделей AI компании Llama, и мы ожидаем больших обновлений для разработчиков. Также в повестке дня: основные доклады руководителей Meta* и беседы у камина с руководителями крупных технологических компаний и главой Meta Марком Цукербергом.
продолжить чтение
Журналисты издания CNBC сообщили, что американские компании Meta* и Booz Allen Hamilton развернули большую языковую модель Llama 3.2 на Международной космической станции. Ожидается, что нейросеть будет помогать космонавтам в ежедневных задачах и научных экспериментах.Booz Allen Hamilton — американская компания, которая в 2024 году доставила на МКС необходимое оборудование для локального запуска нейросетей. Благодаря партнёрству с Meta* на оборудовании запустили Space Llama — дообученную и оптимизированную версию языковой модели Llama 3.2.
продолжить чтение
Выпущенные в прошлую субботу Llama Scout (17 миллиардов активных параметров, 16 экспертов, 109 миллиардов параметров суммарно) и Llama Maverick (17 миллиардов активных параметров, 128 экспертов, 400 миллиардов параметров суммарно) выглядят крайне разочаровывающе. Они разочаровывают настолько, что пользователи даже предполагают причиной неправильную конфигурацию; они задаются вопросами и спорят о том, насколько сильно манипулировали бенчмарками.
продолжить чтение
LMArena опубликовала доказательства, устраняющие опасения по поводу «экспериментальной» модели искусственного интеллекта Meta*. Платформа опубликовала более 2000 сравнений, включая подсказки пользователей, ответы моделей и предпочтения пользователей.
продолжить чтение
Буквально пару дней назад, комада Llama сообщила о появлении трех новых нейронок под общим зонтиком Llama-4: быстрый Scout с контекстом 10 миллионов токенов. Медленный Maverick с контекстом 1 миллион, но 128 экспертами под капотом. И гигантский Behemoth, который использовался как учитель для предыдущих двух. 10 миллионов токенов и нахаляву — это, мягко говоря, дофига. Можно закрыть глаза и представить, как где-то там в далеком Сан-Франциско, разработчики Gemini Pro начинают искать себе новую работу сантехниками, электриками и ассенизаторами.Но вот прошла пара дней, и Царь оказался ненастоящий.
продолжить чтение
Meta представила новое поколение открытых моделей искусственного интеллекта — семейство Llama 4. Это первые нативно мультимодальные модели с открытыми весами, которые объединяют понимание изображений, видео и текста в единой архитектуре.P.S кратко написал об этом в Телеграм канале, ссылка на постКлючевые особенности новых моделей1. Llama 4 Scout
продолжить чтение
Некоторое время назад я был в восторге от Ollama: простое скачивание моделей одной консольной командой, наличие SDK для NodeJS и Python, OpenAI-подобное API. Однако, так как отрасль рынка активно развивается, инструмент с каждым днем становится менее конкурентноспособнымПроблемы OllamaПункты ниже заставят вас задуматься рассмотреть другой инструмент запуска GGUF, например: LMStudio, LocalAI, KoboldCPP, vLLM или llama-server
продолжить чтение
Привет, Хабр! Развертывание языковой модели на собственном сервере требует тщательного планирования аппаратной составляющей. В этой статье мы разберем, какие компоненты критически важны для эффективной работы LLM, как они взаимодействуют, и какую конфигурацию выбрать под разные сценарии использования.
продолжить чтение
Мировой гигант социальных сетей внедряет усовершенствованные функции, делая ставку на технологии, которые, как ожидается, станут двигателем роста ИИ-агентов.
продолжить чтение