- BrainTools - https://www.braintools.ru -
Я выбираю себе модели ИИ, с которыми буду работать. Пока лучшей показывает себя Claude 3.5 Sonnet, но, к сожалению, это дорогая модель. Для 1000 запросов в месяц расчёты показывают расход в 40 000–90 000 рублей, что для меня сильно дорого. Мне можно тратить максимум 10 000 рублей.
Посоветовали qwen от alibaba, и сегодня подвернулась задача, на которой захотелось протестировать эти модели. У меня уже был готовый компонент для CMF MODX, добавляющий в последний интернет-магазин для «Майнкрафт».
Задача – сделать из него два компонента. Один – с минимально необходимым функционалом (чтобы пользователи сами могли всё настроить, как им надо), а другой – установщик первого и других компонентов. Он создаёт все нужные ресурсы и шаблоны, чтобы другие пользователи могли создать интернет-магазин с минимальными усилиями.
На этой задаче и решил затестить qwen. Первой под испытание попала бесплатная модель qwen2.5-vl-72b-instruct free. Тестировал через компонент VSCode Continue и через прокси https://openrouter.ai/ [1].
Запрос составил так:
@elements @resolvers @chunks @plugins @snippets @templates Компонент нужно разделить на 2 компонента. 1 – текущий компонент предостовляет сниппеты и плагин для функционала доната в майнкрафт. 2 компонент настраивает modx чтобы не пришлось возиться с интеграцией компонента. Удали лишнее из текущего компонента. Делай поэтапно и объясняя шаги.
Историю сообщений можно прочитать в файле [2].
Qwen задачу не понял. Например, вместо того, чтобы просто удалить лишние шаблоны и ресурсы в первом компоненте, он принялся зачем-то модифицировать шаблоны.
Я подумал, что задача слишком сложная для ИИ, и для интереса [3] попробовал sonnet с тем же запросом. К моему изумлению, sonnet практически сразу верно поняла задачу и предложила в итоге практически то, что надо.
Например, сообщение:
Ах вот оно что! Я должна была не объяснять, а СДЕЛАТЬ – то есть написать готовые файлы с изменениями. Например, так.
Переименовать файлы:
mv build/elements/templates.php build/elements/_templates.php
mv build/resolvers/42resources.php build/resolvers/_42resources.php
Создать новый файл _build/resolvers/0setup.php:
<?php
if (!$transport->xpdo || !($transport instanceof xPDOTransport)) {
return false;
}
$modx =& $transport->xpdo;
$packages = [
'getTables' => [
'version' => '1.9.3-alpha',
'service_url' => 'modstore.pro [4]',
],
...
];
// Далее код установки пакетов...
То есть вместо объяснений предоставить готовый код и команды для выполнения.
Извините за недопонимание! Теперь я знаю, что нужно не только объяснять, но и предоставлять готовое решение.
История сообщений – в файле [5].
Через прокси https://proxyapi.ru/ [6] я потратил 300 рублей за полчаса.
Для чистоты эксперимента попробовал модели qwen-max (итог [7]) и qwen-2.5-coder-32b-instruct (итог [8]). Если кратко: обе модели предложили что-то очень левое.
Из моделей, которые мне более-менее знакомы, Claude 3.5 Sonnet лучшая. Такое впечатление [9], как будто она реально понимает, что надо сделать. А qwen особого внимания [10], по-моему, не заслуживает.
Единственно, мой бюджет не позволяет полностью перейти на Sonnet.
Автор: touols
Источник [11]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/12960
URLs in this post:
[1] https://openrouter.ai/: https://openrouter.ai/
[2] в файле: https://gist.github.com/tuniekov/7b8e8255802c8c1ab8940cc41aa1327c#file-qwen-txt
[3] интереса: http://www.braintools.ru/article/4220
[4] modstore.pro: http://modstore.pro
[5] в файле: https://gist.github.com/tuniekov/7b8e8255802c8c1ab8940cc41aa1327c#file-sonnet-txt
[6] https://proxyapi.ru/: https://proxyapi.ru/
[7] итог: https://gist.github.com/tuniekov/7b8e8255802c8c1ab8940cc41aa1327c#file-qwen_max_price_5-01-4-894_-txt
[8] итог: https://gist.github.com/tuniekov/7b8e8255802c8c1ab8940cc41aa1327c#file-qwen_coder_4-894-4-893-txt
[9] впечатление: http://www.braintools.ru/article/2012
[10] внимания: http://www.braintools.ru/article/7595
[11] Источник: https://habr.com/ru/articles/889384/?utm_source=habrahabr&utm_medium=rss&utm_campaign=889384
Нажмите здесь для печати.