Машинное обучение. - страница 111

Ant Group представила исследование об обучении триллионных reasoning-моделей

продолжить чтение

Учёные представили метод, который ускоряет self-attention до 4.4×

Новая архитектура Adamas предлагает радикальное ускорение механизма внимания до 4.4× быстрее, при сохранении качества даже на длинных контекстах (100k+ токенов).

продолжить чтение

Трамп помиловал основателя Binance

Бывший CEO Binance Чанпэн Чжао, известный как CZ, получил официальное помилование от Дональда Трампа, сообщает The Wall Street Journal.

продолжить чтение

В Кремниевой долине опасаются угрозы промышленного шпионажа через личные отношения

В Кремниевой долине усиливается тревога. Разведслужбы Китая и России начали использовать личные отношения как инструмент доступа к важным данным.

продолжить чтение

Почему разработчики не доверяют вайб-кодингу и как это исправить

По-моему, вайб-кодинг — полезная фича, но я знаю, что многие его недолюбливают и считают, что AI генерит чушь, а не нормальный код. Ну тут я могу сказать как в той рекламе с гепардом: «Ты просто не умеешь их готовить».Я начал заниматься вайб-кодингом 2 года назад (привет первая версия GPT Engineer), то есть еще до того, как ввели сам термин (он появился только в этом году). За это время у меня накопился опыт, который я переложил в небольшие рекомендации, возможно они помогут начинающим вайб-кодерам.

продолжить чтение

ИИ-платформа Hugging Face начала сотрудничать с антивирусным сканером VirusTotal

Платформа искусственного интеллекта с открытым исходным кодом Hugging Face начинает сотрудничать с облачным антивирусным сканером VirusTotal для борьбы с новыми угрозами. Теперь, загрузив модель ИИ на Hugging Face, пользователь увидит соответствующую информацию о безопасности от различных сканеров вредоносных программ.

продолжить чтение

OpenAI покупает разработчиков ИИ-ассистента для Mac

OpenAI объявила о приобретении Software Applications Incorporated, разработчиков Sky — интеллектуального интерфейса для macOS, который буквально живёт поверх всех окон и приложений.

продолжить чтение

BERT — это всего лишь одноэтапная диффузия текста

Некоторое время назад компания Google DeepMind представила Gemini Diffusion — экспериментальную языковую модель, генерирующую текст методом диффузии. В отличие от традиционных моделей, написанных в стиле GPT и генерирующих слово за словом,  Gemini создаёт текст целыми блоками, пошагово уточняя случайный шум.Я прочитал статью «Large Language Diffusion Models» — и с удивлением узнал, что дискретная диффузия языка представляет собой просто обобщение метода генерации пропущенного токена (MLM), практикуемого уже с 2018

продолжить чтение

Агентная операционная система — новая парадигма взаимодействия человека и машины

продолжить чтение

PyTorch представил фреймворк, который превращает тысячи GPU в один логический компьютер

продолжить чтение

Rambler's Top100