Мебельный гвоздь в крышку гроба AGI
Все мы слышали, что нейросети уже решают сложнейшие олимпиадные задачи по математике, пишут код лучше людей и вообще «кожаным мешкам» осталось недолго. Но есть нюанс. Если задача похожа на то, что было в датасете, они её решат. Если же задача требует построения геометрической модели и физической интуиции, отличается от типичных моделей из задачников — начинается «галлюцинаторный цирк».
Дерево против Wi-Fi, «проклятый» стол, погодные катаклизмы и другие причины и истории о неочевидных, порой нелепых багах
Сегодня мы в Beeline Cloud решили взглянуть на нестандартные и порой совершенно нелепые баги из мира ИТ — например, когда причиной сбоя стало чрезмерно разросшееся растение или криво уложенная плитка. Рассказываем о подобных ситуациях.
Пеликаны, сарказм и логические игры — забавные LLM-бенчмарки
Новые нейронки появляются чуть ли не еженедельно и каждая борется за первенство в лидербордах. Но есть и другой способ оценить их — например, с помощью необычных тестов. Мы в beeline cloud подобрали креативные бенчмарки: от рисования птиц на велосипедах до игр в духе логических загадок с наводящими вопросами.

