тесты.

Ваш IQ в жизни намного меньше чем в тесте

Средний IQ по миру ровно 100, но когда вы проходили тест у вас было 110-120 или больше. Получается, вы умнее чем средний человек на земле? Нет.В реальности у вас на 10-20 баллов меньше, вы как раз на уровне среднего человека.Почему средний человек 100 лет назад имел 80 IQ, но не проиграл бы нам по интеллекту?Почему тесты завышают результаты IQ, и влияют ли эти тесты на интеллект и успех в жизни

продолжить чтение

Embedder для ИТ-крестьянина

Я - Дмитрий Черняк, владелец компании, производящей цифровых консультантов "Нейроботник" и архитектор этого решения. Наиболее простой и ходовой вариант нашего продукта - консультант на сайте, с подключенной моделью и RAG-базами. Простые задачи ограничиваются одной базой, более сложные - несколькими, совмещающими семантический поиск с целевым - по ключевым словам и фразам, с многошаговым ответом. Для большинства задач в данной нише этого достаточно.Эта статья посвящена предновогоднему тесту эмбеддеров (табличка результатов прилагается).

продолжить чтение

Ваша работа — выпускать код, который доказанно работает

Во всех обсуждениях ценности ИИ-помощников в разработке ПО мне встречается одна печальная история: разработчик-джун, вооружившийся каким-нибудь LLM-инструментом, создаёт для своих коллег или мейнтейнеров опенсорс-проекта огромный нетестированный PR, ожидая, что всё остальное решится благодаря процессу код-ревью.Такое поведение грубо, оно заставляет других людей впустую тратить время и идёт вразрез с долгом разработчика ПО.Ваша задача — выпускать код, который доказанно работает.Мы, разработчики ПО, не просто производим код; сегодня даже можно сказать, что для этого предназначены LLM. Мы должны выпускать

продолжить чтение

Backboard установила мировой рекорд в тесте долговременной памяти для ИИ

продолжить чтение

Ant Group представила исследование об обучении триллионных reasoning-моделей

продолжить чтение

Автоматизация QA: разбираем рынок решений для тестирования. Часть 2. Позиционирование и ценовая политика

Привет, Хабр! В первой части обзора мы рассмотрели общую характеристику каждого решения, географическое распределение, исторический контекст, модели финансирования и организационную структуру компаний. Сегодня проанализируем ценовую политику продуктов и их подходы к позиционированию, а также увидим, как компании взаимодействуют с сообществом. Ценовая политикаРоссийские вендоры, как правило, предлагают прозрачные и структурированные тарифы с понятным разделением на базовые, командные и корпоративные планы — часто с опцией on-premise. 

продолжить чтение

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска

В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире».

продолжить чтение

Компании стали внедрять когнитивные тесты при найме из-за сгенерированных ИИ резюме

Согласно опросам компании оценки талантов для работодателей TestGorilla, 76% организаций, которые наняли сотрудников за последний год, используют тесты для определения соответствия кандидата требованиям. В 2022 году таких компаний насчитывалось всего 55%.

продолжить чтение

Полное руководство по всем видам тестирования

Программные проекты зависят от тщательного тестирования для обеспечения качества, надежности и удовлетворенности пользователей. Есть много разных типов тестирования, каждый из которых предназначен для обнаружения проблем на разных этапах жизненного цикла разработки.

продолжить чтение

Китайские компании отключили функции распознавания изображений в чат-ботах на время национального экзамена гаокао

Alibaba, Tencent, ByteDance и другие китайские компании отключили функции распознавания изображений в своих чат-ботах на базе искусственного интеллекта во время сдачи национального экзамена гаокао, который ежегодно проводят 7-8 июня. Таким образом местные компании и чиновники борются со списыванием.

продолжить чтение

12
Rambler's Top100