Чат-бот Deepseek провалил тест на фактчекинг, как и другие чат-боты
Недавний тест Newsguard показал, что китайский чат-бот Deepseek с трудом справляется с обработкой фейковых новостей: в 83 процентах случаев он не распознает дезинформацию или активно ее распространяет. Стоит отметить, что Newsguard тестировал языковую модель Deepseek-V3 без доступа к интернету, используя данные, действительные только до октября 2023 года. Подключение к интернету и возможности рассуждения модели R1 могли бы значительно повысить ее точность.
Сравнение кода от DeepSeek и ChatGPT
Без лишних предисловий - давайте сделаем два абсолютно одинаковых запроса для создания приложения на SwiftUI и сравним, какая модель лучше справится с этими задачами.Я решила дать два задания. Начнём с первого: нужно написать игру "Змейка", вот мой промпт:Напиши полностью с нуля приложение на SwiftUI. В приложении должен быть один экран. Сделай простейший вариант игры змейка. Изначально зеленая змея из 3-х кваратиков, по мере съедания квадратика она увеличивается на 1 квадрат (квадратики которые она съедает - разных цветов)
Генеральный директор Anthropic опровергает слухи о стоимости разработки Claude 3.5 Sonnet
Генеральный директор Anthropic Дарио Амодеи хочет развеять некоторые заблуждения о Claude 3.5 Sonnet. Разработка модели AI обошлась гораздо дешевле, чем предполагают недавние слухи, и она не была создана с использованием более продвинутых секретных моделей, как утверждают некоторые.По словам Амодеи, обучение Claude 3.5 Sonnet
Как защитить серверы критических отраслей от удаленного взлома и физического проникновения
Привет, Хабр! Как давно вы мониторили рынок современных аппаратно-программных комплексов защиты серверов и серверного оборудования? С тех пор как доступ западных новинок на наш рынок сократился под давлением внешних факторов, начала стремительно расти актуальность отечественных разработок в области надежной и эффективной защиты данных на уровне железа. Этот рост стимулировали законодательные инициативы, ужесточившие требования к локализации систем защиты. Например, был принят
Рыночная капитализация Nvidia снизилась на 600 млрд долларов на фоне роста популярности DeepSeek
DeepSeek , китайский стартап в области искусственного интеллекта, стал предметом обсуждения, когда в пятницу выпустил свою модель R1. Функциональность и точность R1 по сравнению с его американскими аналогами, несмотря на использование меньших ресурсов и вычислительной мощности, кажутся победой для всей отрасли искусственного интеллекта. Но не для всех это хорошие новости.
Коммуникационная платформа IVA One включена в реестр российского ПО
Платформе присвоен регистрационный номер 26114
Хакеры собеседований: как взламывают систему найма в IT и что с этим делать?
Представьте: вы HR-специалист, и перед вами резюме кандидата с пятилетним опытом работы с Kubernetes. Но что, если этот опыт — всего лишь удачный эксперимент с ChatGPT и парой онлайн-курсов? В последние месяцы такие случаи стали не исключением, а правилом, что недавно подтвердил сам Хабр, IT-соискатели все чаще "хакают" систему найма, и мы решили разобраться, как это работает и что с этим делать.Слитые в сеть тестовые задания, советы профильных коучей по составлению резюме и прохождению собеседования, ChatGPT для быстрых справок тоже стали всплывать в общении соискателями гораздо чаще.
Эксперты уверены, что UX-дизайн теряет душу. Мы не согласны, и вот почему
Привет, на связи Юлия Алёхина, дизайнер AGIMA! Недавно uxdesign.cc опубликовали тренды в UX на 2025 год. Все семь трендов вышли весьма пессимистичными, поэтому я обратилась к стражам дизайн-оптимизма от AGIMA: Олегу Зильбергу, дизайн-директору, и к Фёдору Ноздрину, арт-директору. Они прокомментировали список и поделились своими мыслями о трендах UX-дизайна, а я собрала их в этот текст.
