эксперимент.

Что произойдёт с продуктом и техдолгом, если разработку отдать автономному AI: ставлю эксперимент

Заявка от незнакомца → AI пишет код → правка в общем билде, который видят всеКоротко о себе

продолжить чтение

О психологии на непсихологическом. Фильтры, которые вам выбирают

В 1965 году группа психологов под руководством Кэролла Изарда провели серию экспериментов о влиянии эмоций на перцептивно-когнитивную сферу.Добровольцев разделили на две группы. С каждой группой экспериментатор общался диаметрально противоположно: с группой А он был вежлив и корректен, в группе Б он вёл себя агрессивно и невежливо.

продолжить чтение

Эксперимент: может ли группа LLM отбирать стартапы лучше человека?

Оценивая текущую повестку вокруг ИИ, многие резонно замечают парадокс. Шума много, ботов ещё больше, а сгенерированных картинок и красивых концептов — бесконечный поток. Мы даже видим волны увольнений из-за повальной оптимизации, но где осязаемые результаты? Где то самое «пощупать»? Настоящая эффективность, которую можно поставить на стол перед скептиком и сказать: смотрите, вот оно работает. Без идеализации, но с пониманием реального потенциала.Безусловно, у технологии есть мощные стороны. Я сам о них писал (раз

продолжить чтение

Как мы получили p-value < 0.001 на 10 наблюдениях в группе: ультимативный гайд по A-B на малых выборках

Всем привет! Я Андрей Романов, тимлид команды аналитики Sales Tech в Авито, а также преподаватель и ментор по А/B-тестированию. В последние годы я регулярно работаю с A/B-тестами на малых выборках: когда в группе не тысячи пользователей, а 10–40 менеджеров, регионов или других экспериментальных единиц. На этом опыте я собрал практический гайд: что можно сделать до запуска, во время дизайна и после эксперимента, чтобы выжать максимум из ограниченных данных.

продолжить чтение

Тайная слабость нейросетей: почему большие контекстные окна не работают

Привет, Хабр! Меня зовут Михаил Сальников, я независимый исследователь в области искусственного интеллекта, автор бенчмарка AI Independence Bench и эксперимента с автономным ИИ, известным как Aria. Я почти каждый день читаю статьи в arxiv.org на эту тему и временами натыкаюсь на очень интересные результаты от других исследователей. Решил, что стоит начать делиться с хабровчанами самыми примечательными из них (а если бы я продолжил писать только про свои работы, статьи выходили бы раз в пару месяцев 🙂)

продолжить чтение

Проект AI Discovery Week в Canva застопорился из-за сотрудников

Canva в качестве эксперимента дала 5000 сотрудникам неделю на изучение ИИ-инструментов в ожидании, что это быстро изменит рабочие процессы. Однако в итоге проект застопорился.

продолжить чтение

ChatGPT не промахнулся ни в одном из пяти медицинских кейсов. И всё равно проиграл. Разбираем, почему

TL;DRВ эксперимент мы шли с уверенностью, что ChatGPT хотя бы раз из пяти промахнётся с главным диагнозом. Не промахнулся. Пять из пяти: метаболический синдром, субклинический гипотиреоз, перименопауза, MGUS, статин-индуцированный рабдомиолиз. Ставка проиграна, но самое интересное оказалось не здесь.

продолжить чтение

Нейросети поверили в историю про выдуманную болезнь

Исследовательница из Гётеборгского университета в Швеции Альмира Тунстрём придумала кожное заболевание под названием биксонимания, а затем загрузила два фальшивых исследования о нём на сервер препринтов в начале 2024 года. Она затеяла этот необычный эксперимент, чтобы проверить, смогут ли большие языковые модели отличить дезинформацию, либо же выдадут её за авторитетные медицинские рекомендации.

продолжить чтение

И всё-таки она вертится…

продолжить чтение

Мы заставили ИИ-модели торговать на бирже. И вот что из этого вышло

Могут ли языковые модели торговать на бирже — и не слить, а реально заработать? «Финам» завершил первый этап «Финам Арены

продолжить чтение