- BrainTools - https://www.braintools.ru -

Распознавание изображений локальными LLM

Читая HABR, наткнулся на статью про мышление [1] больших моделей и их способности распознавания изображений. И у меня возникла идея небольшого теста одной имеющейся у меня модели LLM, которая умеет распозновать фото, а именно llama4:16x17b НО запущенной полностью локально.

Весит эта модель 67 гигабайт, если интересно на чем она была запущена отвечу в комментариях.

На написание статьи меня подвинул один из комментариев – “а как интересно нейросеть распознает разные типы животных”

Для теста я выбрал вот такую картинку

Для теста я выбрал вот такую картинку

Вопрос к модели был абсолютно простым:

Какие существа есть на картинке?

А ответ на удивление быстрым и лаконичным, всего за 30 секунд, покажу его скриншоты.

Распознавание изображений локальными LLM - 2
Распознавание изображений локальными LLM - 3

Для интересующихся, я запускаю модели ollama через open webui. Но иногда натыкаюсь на критику такой связки. Я не против критики, но только когда она конструктивна. Так что готов отвечать на любые вопросы того что я уже изучил в запуске LLM локально, а так же на обоснованную критику моих знаний и действий. )-;

Автор: softel

Источник [2]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/25943

URLs in this post:

[1] мышление: http://www.braintools.ru/thinking

[2] Источник: https://habr.com/ru/articles/1001640/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1001640

www.BrainTools.ru

Rambler's Top100