Lexometrica Ground Truth: бенчмарк LLM по российскому праву
Всем привет! Делюсь итогом двухмесячной работы - релизом рейтинга юридического рассуждения больших языковых моделей Lexometrica Ground Truth.Изначально цель была сугубо практической: требовалось выбрать лучшие модели для LegalTech-проекта "неШемяка!". Но в процессе пришлось столкнуться с фундаментальной проблемой индустрии оценки ИИ - открытые тесты дают сильно искаженную картину. Финальные результаты спроектированного стресс-теста оказались сколь ожидаемыми, столь же и неожиданными.
HPE прогнозирует выручку выше ожиданий на фоне роста спроса на AI-серверы
Компания Hewlett Packard Enterprise (HPE)
Смена парадигм в нейрофизиологии: от рефлекторной машины к самоорганизующейся системе
Данная статья представляет собой краткий обзор и пересказ ключевых идей - этой статьи. В тексте использованы данные современной научной литературы для уточнения и расширения обсуждаемой темы.Введение
Дорога к звездам начинается на Земле
Девятого марта исполнилось бы 92 года со дня рождения человека, который сказал: «Поехали!» - и навсегда изменил историю. В преддверии дня рождения Юрия Алексеевича Гагарина студенты, преподаватели и сотрудники Российского нового университета отправились в Музей космонавтики, чтобы узнать, что привлекает современных молодых людей в эпохе первых полетов.
Учёные запустили компьютерную эмуляцию мозга плодовой мушки
Компания Eon Systems опубликовала видео, которое называет первой в мире демонстрацией работы полной эмуляции мозга, управляющей телом в симуляции. Ещё в 2024 году учёные опубликовали в журнале Nature
Оценка Cursor: на Claude Max за $200 возможно истратить токенов на сумму до $5000
Глава Cursor Майкл Труэлл. ForbesВ издании Forbes вышла статья
Эволюция Telegram-бота на локальной LLM от болтуна до мини-игр, генерации фото, возможности выбора модели
Хочу поделиться историей создания Telegram-бота, работающего полностью на локальной ИИ. В качестве языковой основы используется Ollama, а для генерации изображений — AUTOMATIC1111. Весь код написан на Python с библиотекой python-telegram-bot. Почему выбрал именно Ollama? Потому что она бесплатна, есть множество открытых моделей и её очень просто развернуть в своем проекте. Если брать облачные решения от других компаний, например ChatGPT, то тут можно уперется в то, что за них нужно платить. Модели я подбирал под свой компик: 5070 и 32 гб оперативы. Сервера своего нету, поэтому бот работает только когда я дома.
Nano Banana 2: Обзор возможностей Gemini 3.1 Flash
Новая нейросеть от Google для генерации изображений выглядит чертовски впечатляюще.
Разработчик в поиске вакансии получил доступ к ИИ-эйчару и попросил его самого ответить на вопросы за человека
По информации
Как Red Teaming и человеческий креатив позволяют оценить риски внедрения LLM в бизнес-процессы
В кибербезопасности существует подход под названием Red Teaming — когда одна команда имитирует атакующего, а другая защищает систему. С появлением больших языковых моделей тот же принцип стал применяться к ИИ. Только теперь атакуют не серверы и базы данных, а сами LLM-агенты — системы, которые умеют рассуждать, выполнять команды и взаимодействовать с внешними инструментами. Red Team здесь ищет способы выявить уязвимости и подсветить риски модели, а Blue Team — защитить её. Именно на стыке этих подходов возникла новая область — Red Teaming LLM-агентов, где тестирование превращается в исследование границ самого искусственного интеллекта.
