llm.
ChatOSINT. Цифровые аватары Д. Трампа и В. Путина формируют геополитический ландшафт
Прочитал тут недавно, что специалисты из Си-Ай-Эй создали (или создают) цифровых двойников мировых лидеров в целях общения и прогнозирования их поведения в различиных ситуациях. Ну что ж, пожалуй, настал новый виток ситуативной аналитики think tank-ов от продвинутых LLM. Попробуем и мы с вами!Дисклеймер. Все нижеописанное является по сути мысленным экспериментом. Любые совпадения с предстоящими событиями случайны.
ChatOSINT. Моделируем геополитические сценарии с помощью цифровых аватаров президентов стран
Прочитал тут недавно, что специалисты из Си-Ай-Эй создали (или создают) цифровых двойников мировых лидеров в целях общения и прогнозирования их поведения в различиных ситуациях. Ну что ж, пожалуй, настал новый виток ситуативной аналитики think tank-ов от продвинутых LLM. Попробуем и мы с вами!Дисклеймер. Все нижеописанное является по сути мысленным экспериментом. Любые совпадения с предстоящими событиями случайны.
DeepSeek — очередной квантовый скачок в развитии AI
深度求索, запомните эти слова.Пока скептики в области ИИ продолжают размышлять о том, что ИИ никогда не обретет сознание и останется лишь имитатором интернета, небольшая китайская компания совершила прорыв. Они создали думающую
AI-driven TDD — используем Code-LLM на максимум
С момента своего появления и по сей день подход Test-Driven Development (TDD) вызывает оживленные дискуссии в сообществе разработчиков, и до сих пор нет единого мнения о ее эффективности.Но что будет, если совместить TDD и AI-генерацию кода? В статье я покажу:Как соединить TDD и AI;Как AI-driven TDD улучшает процесс разработки;Как TDD влияет на качество сгенерированного AI кода.
Новый тест HLE выявил слабые места AI: 90% задач остаются нерешенными
Международная исследовательская группа разработала новый бенчмарк, который выявляет текущие ограничения LLM. Даже самые продвинутые модели не справляются с 90 процентами задач — на данный момент.Тест под названием «Последний экзамен человечества» (HLE) включает 3000 вопросов по более чем 100 специализированным областям, 42 процента из которых посвящены математике. В его разработке приняли участие около 1000 экспертов из 500 учреждений в 50 странах.
Как я программирую при помощи больших языковых моделей
От переводчика.Я решил предложить вам перевод этого объёмистого и довольно сложного текста, так как в течение последнего года немало слышал серьёзных успехах больших языковых моделей (БЯМ) в обработке программного кода - в куда большей степени, чем при коммуникации на естественном языке. Например, мой давний знакомый и собеседник Виктор Георгиевич Сиротин @visirokмного пишет в своей Telegram-группе "Материализация идей
Субъективный взгляд на перспективы Больших Языковых Моделей
Прошло около полугода после последней моей статьи о перспективах развития больших языковых моделей. Чтобы не утомлять долгим чтением, её краткое резюме:Критика современных больших языковых моделей (БЯМ): они статичны, неэффективны в вычислениях и обучении, что ведет индустрию к технологическому тупику. Главные проблемы связаны с экспоненциальным ростом вычислительных мощностей, дефицитом качественных данных и ограничениями архитектуры.Итак, можно подвести некоторые итоги, что же мы увидели за прошедшее время.
Один год вместе с LLM в кибербезопасности: как ИИ менял индустрию
В 2024 году большие языковые модели (LLM) кардинально изменили многие сферы, включая кибербезопасность. LLM научились не только помогать в поиске уязвимостей, но и предлагать их исправления. От симуляции атак и анализа уязвимостей до создания правил детектирования — LLM постепенно становятся незаменимым инструментом для разработчиков и специалистов по безопасной разработке.Меня зовут Денис Макрушин, и в Yandex Infrastructure в команде SourceCraft

