Что произойдёт с продуктом и техдолгом, если разработку отдать автономному AI: ставлю эксперимент
Заявка от незнакомца → AI пишет код → правка в общем билде, который видят всеКоротко о себе
О психологии на непсихологическом. Фильтры, которые вам выбирают
В 1965 году группа психологов под руководством Кэролла Изарда провели серию экспериментов о влиянии эмоций на перцептивно-когнитивную сферу.Добровольцев разделили на две группы. С каждой группой экспериментатор общался диаметрально противоположно: с группой А он был вежлив и корректен, в группе Б он вёл себя агрессивно и невежливо.
Эксперимент: может ли группа LLM отбирать стартапы лучше человека?
Оценивая текущую повестку вокруг ИИ, многие резонно замечают парадокс. Шума много, ботов ещё больше, а сгенерированных картинок и красивых концептов — бесконечный поток. Мы даже видим волны увольнений из-за повальной оптимизации, но где осязаемые результаты? Где то самое «пощупать»? Настоящая эффективность, которую можно поставить на стол перед скептиком и сказать: смотрите, вот оно работает. Без идеализации, но с пониманием реального потенциала.Безусловно, у технологии есть мощные стороны. Я сам о них писал (раз
Как мы получили p-value < 0.001 на 10 наблюдениях в группе: ультимативный гайд по A-B на малых выборках
Всем привет! Я Андрей Романов, тимлид команды аналитики Sales Tech в Авито, а также преподаватель и ментор по А/B-тестированию. В последние годы я регулярно работаю с A/B-тестами на малых выборках: когда в группе не тысячи пользователей, а 10–40 менеджеров, регионов или других экспериментальных единиц. На этом опыте я собрал практический гайд: что можно сделать до запуска, во время дизайна и после эксперимента, чтобы выжать максимум из ограниченных данных.
Тайная слабость нейросетей: почему большие контекстные окна не работают
Привет, Хабр! Меня зовут Михаил Сальников, я независимый исследователь в области искусственного интеллекта, автор бенчмарка AI Independence Bench и эксперимента с автономным ИИ, известным как Aria. Я почти каждый день читаю статьи в arxiv.org на эту тему и временами натыкаюсь на очень интересные результаты от других исследователей. Решил, что стоит начать делиться с хабровчанами самыми примечательными из них (а если бы я продолжил писать только про свои работы, статьи выходили бы раз в пару месяцев 🙂)
Проект AI Discovery Week в Canva застопорился из-за сотрудников
Canva в качестве эксперимента дала 5000 сотрудникам неделю на изучение ИИ-инструментов в ожидании, что это быстро изменит рабочие процессы. Однако в итоге проект застопорился.
ChatGPT не промахнулся ни в одном из пяти медицинских кейсов. И всё равно проиграл. Разбираем, почему
TL;DRВ эксперимент мы шли с уверенностью, что ChatGPT хотя бы раз из пяти промахнётся с главным диагнозом. Не промахнулся. Пять из пяти: метаболический синдром, субклинический гипотиреоз, перименопауза, MGUS, статин-индуцированный рабдомиолиз. Ставка проиграна, но самое интересное оказалось не здесь.
Нейросети поверили в историю про выдуманную болезнь
Исследовательница из Гётеборгского университета в Швеции Альмира Тунстрём придумала кожное заболевание под названием биксонимания, а затем загрузила два фальшивых исследования о нём на сервер препринтов в начале 2024 года. Она затеяла этот необычный эксперимент, чтобы проверить, смогут ли большие языковые модели отличить дезинформацию, либо же выдадут её за авторитетные медицинские рекомендации.
Мы заставили ИИ-модели торговать на бирже. И вот что из этого вышло
Могут ли языковые модели торговать на бирже — и не слить, а реально заработать? «Финам» завершил первый этап «Финам Арены

