BrainTools - Методики для развития мозга - страница 527

Битрикс24 бенчмарк для оценки LLM

В преддверии выхода GPT-5 хотелось сделать бенчмарк который по-настоящему проверит её способности. Не прекращаются споры – если LLM просто стохастические попугаи, то как решают олимпиадные задачи по математике? Если Chatgpt способен написать полезное приложение по одному запросу, то почему не может посчитать число r в слове Strawberry или описать как фермеру перевезти себя и две курицы через реку? Пора положить обсуждениям конец с помощью 150 задач по Битрикс24 разработке!Кто просил об этом?

продолжить чтение

Visiology ускорит разработку BI-платформы, опираясь на средства внешних инвесторов

продолжить чтение

Grok 4, Chimera и LLM от ETH Zurich: что нового в мире больших языковых моделей

продолжить чтение

Lotus Agenda: прабабушка цифровых личных помощников

продолжить чтение

Определение брака при 3d печати

Один из принтеров, который в работе, - creality K1C оборудован камерой для наблюдения за процессом печати. Удобно, но не более. Наблюдать часами как печатается деталь быстро надоедает. Вдвойне печально, когда результаты печати неудачны по тем или иным причинам, и печать не была вовремя остановлена. Как раз о ранней остановке печати при наличии брака на столе и пойдет речь.

продолжить чтение

Meta* позволит некоторым кандидатам использовать ИИ во время тестирования по программированию

Руководство Meta* разрешило позволить

продолжить чтение

Zero Trust Architecture и персональные данные

Эта статья — продолжение серии статей, опубликованных в этом блоге, в которых мы пытаемся отслеживать влияние новых технологических трендов на пересечении кибербезопасности и искусственного интеллекта на основной бизнес нашей компании — удостоверение персональных данных (ПД). Продумывая перспективы использования ИИ-агентов для наших задач, включая борьбу с фродом и ИИ-фродом, мы пришли к выводу, что перестройка нашей собственной системы невозможна без учета архитектурных изменений, происходящих в ИТ системах наших клиентов.

продолжить чтение

Как мы искали лучшие AI-модели (Часть 2)

В прошлой статье мы погрузились в оценку самых популярных AI продуктов.По итогам ручного тестирования и попытки автоматизации по выбранным критериям был сделан вполне себе ожидаемый вывод о невозможности применения одних и тех же метрик к оценке задач разного рода.Поэтому было принято решение ознакомиться с основными метриками для оценки качества ответов AI продуктов.Такими метриками стали: Precision, Recall, Specificity и Confusion matrix, а также MAP и MRR.Для чего такие метрики нужны?

продолжить чтение

Давайте уже потише с ИИ

Я, как и многие здесь, программист. Я учился программированию с 2003 по 2008 годы, хотя и до этого меня тянуло к технике, программированию и подобным вещам.Перед тем как я расскажу о своих доводах, хочу прояснить несколько моментов.

продолжить чтение

AsmX G3: Архитектура кодировщика ZGEN. Как hwm генерирует машинный код amd64

AsmX G3: Переосмысление взаимодействия с кремнием с нуля.Мы не просто создаем еще один компилятор. Мы переосмысливаем, как программное обеспечение взаимодействует с кремнием, исходя из первых принципов. Старые методы, основанные на громоздких, монолитных бэкендах, устарели. Они медленные, сложные в поддержке и непрозрачные. AsmX G3, с его компилятором ZGEN, меняет это.В этой статье мы погрузимся в ядро нашего подхода: как наш hwm (Hardware Machine Factory) — компонент, который является, по сути, автономным модулем, — транслирует человекочитаемый ассемблер в чистый машинный код x86_64

продолжить чтение

Rambler's Top100