искусственный интеллект. - страница 1054

Поднимаем DeepSeek llm локально

Все уже слышали про новую модель DeepSeek r1, которая обогнала по бенчмаркам openai. Компания DeepSeek выложила веса и дистилляты в открытый доступ, поэтому мы можем их запустить.В статье поднимем дистилляты модели r1 используя llama.cpp - потребуются лишь базовые умения работы с bash, docker и python. Самостоятельный запуск проще простого.Что имеем?Основная модель, о которой говорят, DeepSeek r1 - 671b Mixture of Experts (37B активаций на forward). Целиком пытаться инференсить такую модель очень затратно.Если очень хочется r1, но не полную - есть квантизации от unsloth.

продолжить чтение

Модель DeepSeek R-1 добавили в инструмент для программистов Cursor AI

DeepSeek R-1 теперь поддерживается в Cursor AIКак разработчик, использующий искусственный интеллект в своих личных проектах в течение последнего года, я не могу не радоваться тому, что модель DeepSeek R-1 теперь доступна в Cursor AI.О поддержке новой модели компания DeepSeek объявила 

продолжить чтение

Сопоставление номенклатур товаров ресторанов и поставщиков с помощью LLM — Case Study для ресторанного холдинга

Привет, Habr! На связи Александр Сулейкин. к. т. н. и СЕО ИТ-компании “ДЮК Технологии”. Совместно с нашим экспертом по LLM-решениям Романом Бабенко подготовили новую статью по теме применения LLM для задачи сопоставления номенклатур товаров и поставщиков - типовой задачи, с которой часто сталкиваются менеджеры по закупкам. Статья подготовлена на базе реального Use Case пилотного внедрения в крупном ресторанном холдинге. 

продолжить чтение

Регулятор в Японии призвал чиновников отказаться от DeepSeek

В министерстве цифровизации Японии призвали сотрудников всех министерств и ведомств воздержаться от использования нейросети DeepSeek. Китайский чат‑бот вызывает опасения у регулятора из‑за отсутствия открытой информации о возможном сборе персональных данных.

продолжить чтение

OpenAI анонсировали Deep Research — самостоятельного агента для исследований

В 16:00 по Pacific Time OpenAI запустили стрим, на котором анонсировали новый продукт компании - Deep Research, особый режим для ChatGPT, в котором он переходит в режим высокой автономности, и может проводить длительные глубокие исследования - самостоятельно вырабатывать план работ, ходить по интернету в поисках информации, агрегировать и анализировать данные при помощи Python-скриптов, и всё это полностью без участия человека.

продолжить чтение

DeepSeek перестал загружать pdf и картинки

Да, я понимаю, что за эту неделю новости про DeepSeek всем уже надоели. Но для меня за последние 1,5 месяца эта платформа стала мощным рабочим инструментом (и вовсе не в генерации дурацких статей, а в извлечении информации из плохо отсканированных документов!) Итак...Одной из роскошных возможностей DeepSeek была возможность сфотографировать несколько листов нужной тебе книги в специальном приложении для смартфона, сохранить их в pdf и попросить DeepSeek вытащить нужную тебе информацию (он распознавал, OCR-ил текст!).То же самое с плохо отсканированным форматом djvu (предварительно сконвертированным в pdf).

продолжить чтение

Применение технологии RAG при построении интегрированных систем для цифровых продуктов: детальный разбор

В 2024 году популярными словами и постоянной темой для обсуждения в IT были большие языковые модели (LLM), обработка естественного языка (NLP), искусственный интеллект и создание ценностей. Однако вкатиться в эту экосистему без подготовки может быть довольно сложно. Давайте начнём с того, что рассмотрим понятие генерации с дополненной выборкой (Retrieval Augmented Generation, RAG), чтобы лучше понять эту технологию и возможность её использования в наших цифровых продуктах.

продолжить чтение

«Атака ботов»: как ИИ-краулеры ддосят онлайн-проекты

DDoS-атаки становятся масштабнее и опаснее. О «самом-самом» расскажем 13 февраля, а сегодня поговорим о новом явлении. В последнее время некоторые боты-сборщики данных для обучения LLM, «используют содержимое веб-сайтов, но делают это без уважения». 

продолжить чтение

В США подготовили законопроект для борьбы с китайскими технологиями в сфере ИИ со штрафом до $1 млн и тюрьмой до 20 лет

В США подготовили

продолжить чтение

Отечественные процессоры: почему DeepSeek видит в этом тупик (и где нашёл выход)

Главная задача экономики заключается в создании товаров, которые экономят время потребителя и обеспечивают качество, превосходящее результаты его самостоятельного производства. Однако ценность таких товаров нивелируется, если их использование требует дополнительных временных затрат: освоения новых спецификаций, адаптации к нестандартным материалам, преодоления логистических сложностей или взаимодействия с неэффективным сервисом.

продолжить чтение