llm.

Тестируем пять моделей DeepSeek R1 и Qwen3 на серверах YADRO

Привет, Хабр. Меня зовут Дмитрий Крюков, я инженер по разработке ПО искусственного интеллекта в YADRO. Мы продолжаем рассказывать о возможностях GPU-серверов YADRO G4208P и YADRO VEGMAN R220 G2

продолжить чтение

Оставлено в

Как ИИ начинает понимать чёрный юмор

продолжить чтение

Оставлено в

Современные генеративные модели и приложения на их основе

продолжить чтение

Оставлено в

Опыт вайбкодинга: как заставить нейросеть работать эффективно

Данная статья написана и отредактирована мной вручную, специально, чтобы подчеркнуть ценность ручного труда в эпоху нейросетей.Сегодня, в начале XXI века, искусственный интеллект уже стал частью нашей повседневности. Мы спокойно спрашиваем у Алисы прогноз погоды, видим тексты и советы от ИИ в поиске, а изображения или даже видеоролики, созданные нейросетью, никого не удивляют.

продолжить чтение

Оставлено в

Внедрение ИИ в бизнесе. Что внедрять, как внедрять и, главное, — зачем

продолжить чтение

Оставлено в

ADSM: границы возможностей Моделей

Мое понимание LLM с точки зрения пользователя очень простое: есть сетка с весами (обученные параметры), токенизатор и декодер (преобразователи текста во входные и выходные токены), и трансформер (слои внимания), который перерабатывает входные токены и шаг за шагом предсказывает новые.Я пробовал разные Модели (GPT, Gemini, Deepseek, Grok) - все они, на мой взгляд, работают примерно одинаково. На один и тот же запрос они дают очень похожие, а иногда и идентичные ответы. Это ожидаемо, ведь все современные LLM построены на одной и той же архитектуре - трансформерах.

продолжить чтение

Оставлено в

Yandex Cloud проведёт 24 сентября 2025 года конференцию Yandex Neuro Scale 2025

Сервис Yandex Cloud открыл

продолжить чтение

Оставлено в

Как оживить научные статьи: превращаем исследования в интерактивных ИИ-ассистентов

продолжить чтение

Оставлено в

Неудачные эксперименты с Vibe Coding на Python

Команда Python for Devs подготовила перевод статьи Элa Свейгарта о неудачных экспериментах с vibe coding. Все говорят, что ИИ уже умеет писать приложения, но стоит чуть отклониться от привычных сценариев — и всё идёт наперекосяк. Картофельная Африка вместо карты, пинбол, превращающийся в пинг-понг, и счёты с отрицательными числами — автор собрал коллекцию своих провалов с vibe coding.

продолжить чтение

Оставлено в

ADSM: ролевые игры

Я слишком давно в ИТ для того, чтобы наделять программы разумом. Пусть даже и искусственным. Для меня LLM - это прежде всего программа. Текстовый интерфейс к распределённой статистической базе знаний, представленной в несколько необычной форме - хранимая информация размазана в виде весов нейросети. Этот интерфейс превращает входной текст в токены, токены - в эмбеддинги, эмбеддинги многократно преобразуются в более сложные представления, а затем на их основе выбираются выходные токены. Чтобы скрыть детерминированную сущность программы при выборе выходных токенов подмешиваются вероятности.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

llm.

Тестируем пять моделей DeepSeek R1 и Qwen3 на серверах YADRO

Как ИИ начинает понимать чёрный юмор

Современные генеративные модели и приложения на их основе

Опыт вайбкодинга: как заставить нейросеть работать эффективно

Внедрение ИИ в бизнесе. Что внедрять, как внедрять и, главное, — зачем

ADSM: границы возможностей Моделей

Yandex Cloud проведёт 24 сентября 2025 года конференцию Yandex Neuro Scale 2025

Как оживить научные статьи: превращаем исследования в интерактивных ИИ-ассистентов

Неудачные эксперименты с Vibe Coding на Python

ADSM: ролевые игры

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

llm.