Пришёл, накодил, победил: хакатон глазами победителей и организаторов
В этой статье мы хотим поделиться своим опытом, который поможет вам подготовиться к любому хакатону (hackathon). Наверняка вы уже слышали про этот специфический формат соревнований для айтишников. На них ставятся практические задачи, которые участники решают за определённое время, имея ограниченные ресурсы. Обычно участники представлены командами, поэтому крайне важно уметь работать сообща. Помимо денежного приза победители получают известность. В дальнейшем это способствует обращению к ним с заказами на решение подобных задач.
Все, что нужно для создания приложений с LLM: обзор возможностей LangChain
Сегодня появляется все больше и больше приложений на основе больших языковых моделей — условным чат-ботом в Telegram уже никого не удивить. В рамках обучения в магистратуре AI Talent Hub мне не раз приходилось разрабатывать такие приложения с использованием ChatGPT или GigaChat. В этой статье я расскажу о полезном инструменте для работы с LLM - мы рассмотрим главные возможности фреймворка LangChain, а также методы мониторинга и проверки качества существующего приложения с ИИ.
Apple не будет использовать DeepSeek в ИИ-помощнике Apple Intelligence в Китае
По информации профильных источников, Apple не будет использовать системы нейросети DeepSeek в ИИ-помощнике Apple Intelligence в материковом Китае.
«Вспомнить всё»: исследователи предложили архитектуру языковых моделей с большой памятью
9 февраля на arXiv была опубликована новая научная работа "LM2: Large Memory Models", в которой исследователи описали обновление классической архитектуры LLM на базе трансформеров. LM2 превосходит как модель RMT с дополненной памятью на 37.1%, так и базовую модель Llama-3.2 на 86,3% в среднем по задачам.В чем суть?Исследователи из Convergence Labs представили Large Memory Model (LM2) – новую архитектуру языковых моделей, которая преодолевает ограничения традиционных трансформеров в обработке длинного контекста.LM2 дополняет стандартный механизм внимания отдельным модулем памяти
Модели Goku от ByteDance могут создавать реалистичные видеоролики о продуктах без участия людей-актеров
Последние модели искусственного интеллекта китайской технологической компании могут генерировать реалистичные видеоролики, на которых люди взаимодействуют с продуктами, потенциально меняя подход компаний к созданию рекламного контента.
Google расширяет возможности NotebookLM Plus для индивидуальных пользователей
Google расширил NotebookLM Plus, платную версию своего помощника для создания заметок и проведения исследований на основе искусственного интеллекта, для индивидуальных пользователей, подписавшихся на план Google One AI Premium, спустя почти два месяца после его дебюта для предприятий в Google Cloud и через Google Workspace.
Венчурные инвесторы предпочитают стартапы в сфере искусственного интеллекта другим технологиям
Венчурные инвесторы охотно вкладывают средства в стартапы, занимающиеся искусственным интеллектом, но остаются разборчивыми, когда дело доходит до финансирования более широкого спектра технологий.
Нейронкам делегируют многое, но остаются сложности — LLM в научной деятельности и работе с кодом
Недавно мы провели обзор исследований, посвященных работе с большими языковыми моделями в ЦОД. Обсудили, почему происходят сбои при обучении моделей и применимость LLM в кибербезопасности.
Автоматизация разведочного анализа данных (EDA) с помощью Python
Всем привет! Меня зовут Константин Некрасов, я работаю дата-сайентистом в Газпромбанке. Хочу рассказать про инструмент, который серьезно упростил мою повседневную работу с данными, и поделиться им.Если вы когда-нибудь занимались машинным обучением, то знаете — перед тем как строить модель, нужно как следует изучить свои данные. Этот этап называется EDA (Exploratory Data Analysis), или разведочный анализ данных (РАД). Он критически важен — именно здесь мы находим скрытые закономерности, выдвигаем первые гипотезы и понимаем, как лучше обработать данные для будущей модели.

