Учёные представили метод, который ускоряет self-attention до 4.4×
Новая архитектура Adamas предлагает радикальное ускорение механизма внимания до 4.4× быстрее, при сохранении качества даже на длинных контекстах (100k+ токенов).
Трамп помиловал основателя Binance
Бывший CEO Binance Чанпэн Чжао, известный как CZ, получил официальное помилование от Дональда Трампа, сообщает The Wall Street Journal.
В Кремниевой долине опасаются угрозы промышленного шпионажа через личные отношения
В Кремниевой долине усиливается тревога. Разведслужбы Китая и России начали использовать личные отношения как инструмент доступа к важным данным.
Почему разработчики не доверяют вайб-кодингу и как это исправить
По-моему, вайб-кодинг — полезная фича, но я знаю, что многие его недолюбливают и считают, что AI генерит чушь, а не нормальный код. Ну тут я могу сказать как в той рекламе с гепардом: «Ты просто не умеешь их готовить».Я начал заниматься вайб-кодингом 2 года назад (привет первая версия GPT Engineer), то есть еще до того, как ввели сам термин (он появился только в этом году). За это время у меня накопился опыт, который я переложил в небольшие рекомендации, возможно они помогут начинающим вайб-кодерам.
ИИ-платформа Hugging Face начала сотрудничать с антивирусным сканером VirusTotal
Платформа искусственного интеллекта с открытым исходным кодом Hugging Face начинает сотрудничать с облачным антивирусным сканером VirusTotal для борьбы с новыми угрозами. Теперь, загрузив модель ИИ на Hugging Face, пользователь увидит соответствующую информацию о безопасности от различных сканеров вредоносных программ.
OpenAI покупает разработчиков ИИ-ассистента для Mac
OpenAI объявила о приобретении Software Applications Incorporated, разработчиков Sky — интеллектуального интерфейса для macOS, который буквально живёт поверх всех окон и приложений.
BERT — это всего лишь одноэтапная диффузия текста
Некоторое время назад компания Google DeepMind представила Gemini Diffusion — экспериментальную языковую модель, генерирующую текст методом диффузии. В отличие от традиционных моделей, написанных в стиле GPT и генерирующих слово за словом, Gemini создаёт текст целыми блоками, пошагово уточняя случайный шум.Я прочитал статью «Large Language Diffusion Models» — и с удивлением узнал, что дискретная диффузия языка представляет собой просто обобщение метода генерации пропущенного токена (MLM), практикуемого уже с 2018

