Глубокое обучение: Алгоритм обратного распространения ошибки. Теория и реализация. С нуля
Всем привет. Меня зовут Алмаз Хуснутдинов. В этой статье я рассказываю про алгоритм обратного распространения ошибки, который используется для обучения нейросетей.Содержание: архитектура простой нейросети и инициализация переменных, прямое распространение ручной расчет, вывод производных, вывод алгоритма, обратное распространение ручной расчет, реализация простой архитектуры нейросети и задача «логическое или», реализация класса для многослойной нейросети и изображения MNIST.Архитектура нейронной сети
Кибербезопасность по-умному: LLM-агенты без лишнего пафоса
Всем привет, меня зовут Артём Семенов, я являюсь автором Телеграм канала PWN AI. С момента релиза GPT 3.5 прошло больше 2ух лет. Это явление, я про распространение LLM, стало революционным во всех сферах, включая кибербезопасность. Модели стали применять для разных вещей. Например, использовать как дополнение к SAST, анализатор Vulnhunter
Гидрогель для регенерации костей
Вне зависимости от травмы, болезни или других факторов, отсутствующие части кости довольно трудно заменить. Здесь и перспективы заживления и риски отторжения накладываются друг на друга. Однако новый инъекционный гидрогель рассматривается как потенциальный материал для регенерации костей под воздействием видимого света.
Обзор уязвимостей для LLM. Часть 1. Атака
Большие языковые модели где только не применяют: генерируют внешний вид автомобилей, домов и кораблей, саммаризируют круглые столы и конференции, придумывают тезисы к статьям, рассылкам и презентациям. Но при всех «плюшках» от внедрения ИИ, не стоит забывать про безопасность. Большие языковые модели атакуют разнообразными изощрёнными способами. В топе новостей о нейросетях — многомиллионные инвестиции в средства защиты от промпт-инъекций. Поэтому поговорим о том, какие угрозы существуют и почему инвесторы платят большие деньги за создание таких бизнесов. А во второй части статьи расскажу, как от них защищаться.
Прикручиваем доступ к API OpenAI gpt-4o через proxy
Запилил я в том году приложение на Python по доступу к YandexGPT через API, теперь вот появилось желание попилить дальше и добавить доступ к gpt-4o и gpt-4o‑mini заодно.Чем будет полезна эта программа — можно будет поэкспериментировать с системными запросами (в программе «Специализация»), которые можно создавать самому, и температурой («Креативность») к YandexGPT и OpenAI gpt-4o минуя их промпты и настройки системы, плюс не надо платить за подписку и пользоваться по надобности, плюс частично автоматизировать свои процессы запросов и проверить разные версии работы с GPT моделями.
GAN и диффузионные модели: как научить нейросеть рисовать
Привет! Сегодня хочу поговорить о двух очень горячих темах в области искусственного интеллекта — генеративно‑состязательные сети (GAN) и диффузионные модели (типа Stable Diffusion). Я сама как‑то подсела на все эти AI‑картинки и поняла, что нужно срочно поделиться тем что накопала. Поехали!:‑)GAN: Генератор vs. Дискриминатор
Алгоритмы спекулятивного инференса LLM
ВведениеЗа последние годы качество LLM моделей сильно выросло, методы квантизации стали лучше, а видеокарты мощнее. Тем не менее качество генерации все еще напрямую зависит от размера весов и, как следствие, вычислительной сложности. Кроме того, генерация текста авторегрессионна - токен за токеном по одному, потому ее сложность зависит от размера контекста и количества генерируемых токенов.Но генерация текста не всегда имеет однородную сложность, так же как мы во многом мыслим идеями, а слова произносим “на автомате”. В статье обсудим алгоритмы, позволяющие использовать эту неоднородность для ускорения.
Как действительно понять нейронные сети и KAN на интуитивном уровне
Вот вы читаете очередную статью про KAN и ловите себя на мысли, что ничего не понимаете.Знакомая ситуация?Не переживайте, вы не одни. И дело тут не в вас, суть в том, что множество материалов описывают концепции по отдельности, не объединяя их в единую картину.И чтобы решить эту проблему раз и навсегда, а также окончательно понять KAN, нам необходимо переосмыслив всё с нуля и постепенно двигаясь от базовых принципов линейной алгебры через нейронные сети. Завершив, обобщая всё с помощью множеств. В процессе мы также рассмотрим некоторые довольно уникальные и новые идеи!Статья будет следовать данной структуре:
Прогноз по охвату функций ИИ роботами в Московских компаниях в ближайшее десятилетие
Искусственный Интеллект начинает выполнять многие функции дешевле, а часто и лучше работника. Но пройдет еще много времени до тех пор, когда половину бухгалтеров и программистов заменит ИИ. Кроме замены рутинных операций, ИИ открывает новые возможности по эффективной эксплуатации работников, в том числе: анализ эмоций работника, моделирование его поведения, оптимальная схема управления работником на основании цифровых двойников работника и коллектива. По состоянию на начало 2025 года ИИ начинает превосходить человека по многим тестам.
FTC обязала стартап accessiBe, занимающийся обеспечением доступности AI, выплатить 1 млн $ за недостоверную рекламу
Федеральная торговая комиссия США (FTC) наложила штраф на стартап accessiBe, который утверждает, что помогает сделать веб-сайты доступными для программ чтения с экрана, используемых людьми с нарушениями зрения, за ложную рекламу и скрытое спонсирование рецензий.
