Google X запускает стартап Heritable Agriculture, использующий AI для повышения урожайности
На этой неделе «фабрика лунных проектов» Google X объявила о выпуске своего последнего продукта. Heritable Agriculture — это стартап, основанный на данных и машинном обучении и направленный на улучшение методов выращивания сельскохозяйственных культур.
Восстание DeepSeek: что не попало в заголовки новостей
Недавние публикации об ИИ-моделях компании DeepSeek посвящены, в основном, двум моментам. Первый — эти модели гораздо лучше, чем другие, показывают себя в тестах. Второй — они обходят другие модели в плане эффективности работы. Эти достижения достойны внимания, они несут определённые политические последствия (ниже мы поговорим об этом подробнее). Но дело в том, что реальная картина, включающая в себя и доступ к вычислительным ресурсам, и экспортные ограничения, и разработки в сфере ИИ, гораздо сложнее, чем это представлено во многих материалах. Вот несколько важных вопросов, которые заслуживают более пристального внимания.
Поднимаем DeepSeek llm локально
Все уже слышали про новую модель DeepSeek r1, которая обогнала по бенчмаркам openai. Компания DeepSeek выложила веса и дистилляты в открытый доступ, поэтому мы можем их запустить.В статье поднимем дистилляты модели r1 используя llama.cpp - потребуются лишь базовые умения работы с bash, docker и python. Самостоятельный запуск проще простого.Что имеем?Основная модель, о которой говорят, DeepSeek r1 - 671b Mixture of Experts (37B активаций на forward). Целиком пытаться инференсить такую модель очень затратно.Если очень хочется r1, но не полную - есть квантизации от unsloth.
Регулятор в Японии призвал чиновников отказаться от DeepSeek
В министерстве цифровизации Японии призвали сотрудников всех министерств и ведомств воздержаться от использования нейросети DeepSeek. Китайский чат‑бот вызывает опасения у регулятора из‑за отсутствия открытой информации о возможном сборе персональных данных.
OpenAI анонсировали Deep Research — самостоятельного агента для исследований
В 16:00 по Pacific Time OpenAI запустили стрим, на котором анонсировали новый продукт компании - Deep Research, особый режим для ChatGPT, в котором он переходит в режим высокой автономности, и может проводить длительные глубокие исследования - самостоятельно вырабатывать план работ, ходить по интернету в поисках информации, агрегировать и анализировать данные при помощи Python-скриптов, и всё это полностью без участия человека.
Применение технологии RAG при построении интегрированных систем для цифровых продуктов: детальный разбор
В 2024 году популярными словами и постоянной темой для обсуждения в IT были большие языковые модели (LLM), обработка естественного языка (NLP), искусственный интеллект и создание ценностей. Однако вкатиться в эту экосистему без подготовки может быть довольно сложно. Давайте начнём с того, что рассмотрим понятие генерации с дополненной выборкой (Retrieval Augmented Generation, RAG), чтобы лучше понять эту технологию и возможность её использования в наших цифровых продуктах.
Семь самых важных научных статей в истории Computer Science
Прежде чем мы начнём, уточню: да, это субъективный список. Его цель — не закончить обсуждения, а породить их. Эти семь работ (отсортированных по дате публикации) я выделил потому, что они сильно повлияли на современный мир. Каждая из них заслуживает отдельного поста (или даже книги!). Если ваша любимая научная статья не попала в список, до дочитайте до раздела «Бонус» в конце, куда я добавил работы, которым чуть-чуть не хватило до попадания в основной список.
В США подготовили законопроект для борьбы с китайскими технологиями в сфере ИИ со штрафом до $1 млн и тюрьмой до 20 лет
В США подготовили
HAI LLM: Как DeepSeek снизил стоимость обучения и генерации в разы без потери качества?
Работу у AI отобрал другой AI )Компания HighFlyer внедрила в свою LLM такие архитектурные фишки как Multi-Head Latent Attention, Mixture of Experts (MoE) with Auxiliary-Loss-Free Load Balancing и Multi-Token Predict. Однако все эти новшества уже были ранее представлены в других LLM: GPT-4, Llama, Mistrall и других.Полистав
Сэм Альтман: OpenAI оказался на «неправильной стороне истории» в отношении open source
Исследователи, инженеры и руководители OpenAI, включая генерального директора Сэма Альтмана, ответили на вопросы пользователей Reddit. Альтман признал, что китайская DeepSeek ослабила лидерство OpenAI в области ИИ, а его компания оказалась «на неправильной стороне истории» в отношении открытого исходного кода.

