Perplexity представила BrowseSafe для защиты ИИ-браузеров от скрытых инструкций
Perplexity выпустила инструмент BrowseSafe
Зрительно-языковые модели читают хуже (или лучше), чем вам кажется
Знакомство с бенчмарком ReadBench, позволяющим без труда оценить, насколько хорошо ваши любимые зрительно-языковые модели читают изображения с большими объёмами текста.В этой статье будет рассказано о ReadBench. ReadBench — это очень простой бенчмарк, который мы разработали для оценки важного, но недооценённого аспекта мультимодального ИИ: насколько хорошо моделям удаётся, собственно, читать текст на картинках, рассуждать о нём и извлекать информацию из таких изображений, на которых много текста.
Как я программирую с помощью агентов
TL;DRАгент в контексте LLM — это не магия, а цикл, в котором модель по шагам вызывает инструменты (bash, git, тесты, web) и получает от них обратную связь.Такой агент умеет ориентироваться в живой кодовой базе, запускать компилятор и тесты, читать логи и документацию, поэтому генерирует и правит код куда надёжнее, чем «голая» модель в чате.
ИИ-министра Албании «задержали» после получения взяток в криптовалюте
Специальная прокуратура по борьбе с коррупцией и организованной преступностью Албании (SPAK) распорядилась срочно «заморозить» и перевести в автономный режим работу ИИ-министра Диеллы, отвечающей за госзакупки и прозрачность. Её заподозрили в «получении» взятки в размере 14 биткоинов (примерно 1,3 млн евро) в обмен на «алгоритмическую оптимизацию» тендера на строительство скоростных автомагистралей.
Глава Google DeepMind: AGI на горизонте, риск для человечества — «значительный»
Генеральный директор Google DeepMind Демис Хассабис заявил

