Машинное обучение. - страница 44

Использование машинного обучения в работе с SolidWorks (2 часть): тестирование и практическое применение

Всем привет.В прошлой статье я поделился своими наработками в области работы ИИ с CAD-программами (в моём и нашем случае, SolidWorks). В этот раз поделюсь практическими результатами на примере тестового ядра своей программы, которую уже затрагивал.Краткая теория (совсем кратко)Для тестирования я подготовил 3 папки с 10 файлами деталей в каждой, переименованными в соответствии с их истинным (по моим человеческим меркам) классом: "Без гибки", "Гибка", "Вальцовка". В папке №1 находятся детали, "родственники" которых уже приняли участие в обучении (см. "Тест №1

продолжить чтение

Новый бенчмарк по кодингу для LLM ProgramBench: 9 топ моделей, 200 задач, 248 тысяч тестов. Полностью решённых — ноль

200 задач. 248 тысяч поведенческих тестов. Девять моделей, среди них всё свежее на 2026 год: Opus 4.7, GPT 5.4, Gemini 3.1 Pro, Sonnet 4.6, Haiku 4.5. На SWE-bench те же модели стабильно берут 70 % и выше. Здесь — ноль. Полностью решённых задач у самой сильной модели — 3 %. У всех остальных — 0 % и ещё раз 0 %.Это ProgramBench — новый бенчмарк от Meta Superintelligence Labs, Stanford и Harvard, опубликован в 2026 году (paper, github). И он измеряет совсем не то, что измеряют SWE-bench и HumanEval.Чем ProgramBench отличается от других кодинг-бенчмарков

продолжить чтение

Иголка в стоге сена: как LLM помогают искать уязвимости

продолжить чтение

Что такое MCP сервер. Как работает киллер-фича современности под капотом

Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. 

продолжить чтение

Трудности перевода: почему LLM не умеют писать нормальные докстринги на русском и как это исправить

продолжить чтение

Тестируем NVIDIA HGX B300 — инференс-сервер с 8 GPU и 2,3 ТБ VRAM на DeepSeek, Qwen и MiniMax

продолжить чтение

Теряет ли OpenAI деньги на подписках и другие прикидки на салфетке

ChatGPTПроводить исследования рынка искусственного интеллекта в наше время вынуждены не только финансовые эксперты или аналитики, но и обычные пользователи. Это не преувеличение, тому есть реальные практические причины. К примеру, Сэм Альтман пообещал

продолжить чтение

Группа хакеров пригрозила опубликовать исходный код Mistral AI

Группа хакеров TeamPCP угрожает опубликовать исходный код проекта Mistral AI, если не найдёт покупателя на эти данные. В сообщении на хакерском форуме злоумышленники просят $25 000 за набор из почти 450 репозиториев.

продолжить чтение

Каким ИИ был до мощных компьютеров?

История искусственного интеллекта (ИИ) удивительная эпопея, которая длится 70 лет. Мы знаем каким ИИ был тогда и видим каким он стал сейчас. Но что было в промежутке? Расскажем об этом в ретроспективной подборке ИИ из 90-х и 2000-х.#1 Creatures — “Мы — норны”

продолжить чтение

Perceptron: Как работала самая первая нейросеть в истории?

Сегодня мы расскажем с чего началась эпоха современного ИИ. Это произошло через год после полета первого искусственного спутника Земли и имело не менее колоссальное значение для человечества.

продолжить чтение