llama. - страница 4

Meta* представляет предварительный просмотр API для своих моделей искусственного интеллекта Llama

На своей первой конференции разработчиков искусственного интеллекта LlamaCon во вторник компания Meta* анонсировала API для своей серии моделей искусственного интеллекта Llama: Llama API.

продолжить чтение

LlamaCon, первое мероприятие Meta* для разработчиков AI

Во вторник Meta* проводит LlamaCon, свое первое мероприятие для разработчиков AI. Оно будет посвящено семейству открытых моделей AI компании Llama, и мы ожидаем больших обновлений для разработчиков. Также в повестке дня: основные доклады руководителей Meta* и беседы у камина с руководителями крупных технологических компаний и главой Meta Марком Цукербергом.

продолжить чтение

Космолама: Meta* и Booz Allen Hamilton запустили языковую модель Llama на МКС

Журналисты издания CNBC сообщили, что американские компании Meta* и Booz Allen Hamilton развернули большую языковую модель Llama 3.2 на Международной космической станции. Ожидается, что нейросеть будет помогать космонавтам в ежедневных задачах и научных экспериментах.Booz Allen Hamilton — американская компания, которая в 2024 году доставила на МКС необходимое оборудование для локального запуска нейросетей. Благодаря партнёрству с Meta* на оборудовании запустили Space Llama — дообученную и оптимизированную версию языковой модели Llama 3.2.

продолжить чтение

Llama 4 плоха во всём

Выпущенные в прошлую субботу Llama Scout (17 миллиардов активных параметров, 16 экспертов, 109 миллиардов параметров суммарно) и Llama Maverick (17 миллиардов активных параметров, 128 экспертов, 400 миллиардов параметров суммарно) выглядят крайне разочаровывающе. Они разочаровывают настолько, что пользователи даже предполагают причиной неправильную конфигурацию; они задаются вопросами и спорят о том, насколько сильно манипулировали бенчмарками.

продолжить чтение

Результаты Llama 4 от Meta* в бенчмарках

LMArena опубликовала доказательства, устраняющие опасения по поводу «экспериментальной» модели искусственного интеллекта Meta*. Платформа опубликовала более 2000 сравнений, включая подсказки пользователей, ответы моделей и предпочтения пользователей.

продолжить чтение

Бенчмарки Llama-4, предположительно — скам на самом высоком уровне

Буквально пару дней назад, комада Llama сообщила о появлении трех новых нейронок под общим зонтиком Llama-4: быстрый Scout с контекстом 10 миллионов токенов. Медленный Maverick с контекстом 1 миллион, но 128 экспертами под капотом. И гигантский Behemoth, который использовался как учитель для предыдущих двух. 10 миллионов токенов и нахаляву — это, мягко говоря, дофига. Можно закрыть глаза и представить, как где-то там в далеком Сан-Франциско, разработчики Gemini Pro начинают искать себе новую работу сантехниками, электриками и ассенизаторами.Но вот прошла пара дней, и Царь оказался ненастоящий.

продолжить чтение

Вышла Llama 4 с контекстным окном в 10M токенов (в 50 раз больше конкурентов)

Meta представила новое поколение открытых моделей искусственного интеллекта — семейство Llama 4. Это первые нативно мультимодальные модели с открытыми весами, которые объединяют понимание изображений, видео и текста в единой архитектуре.P.S кратко написал об этом в Телеграм канале, ссылка на постКлючевые особенности новых моделей1. Llama 4 Scout

продолжить чтение

На сколько Ollama готова для Production?

Некоторое время назад я был в восторге от Ollama: простое скачивание моделей одной консольной командой, наличие SDK для NodeJS и Python, OpenAI-подобное API. Однако, так как отрасль рынка активно развивается, инструмент с каждым днем становится менее конкурентноспособнымПроблемы OllamaПункты ниже заставят вас задуматься рассмотреть другой инструмент запуска GGUF, например: LMStudio, LocalAI, KoboldCPP, vLLM или llama-server

продолжить чтение

Комплексное руководство по конфигурации сервера для LLM

Привет, Хабр!  Развертывание языковой модели на собственном сервере требует тщательного планирования аппаратной составляющей. В этой статье мы разберем, какие компоненты критически важны для эффективной работы LLM, как они взаимодействуют, и какую конфигурацию выбрать под разные сценарии использования.

продолжить чтение

Следующие модели Llama от Meta* могут получить улучшенные голосовые функции

Мировой гигант социальных сетей внедряет усовершенствованные функции, делая ставку на технологии, которые, как ожидается, станут двигателем роста ИИ-агентов.

продолжить чтение

Rambler's Top100