ChatGPT 4.5: бенчмарки, генерация художественных текстов и сравнение с DeepSeek-r1
В конце февраля OpenAI официально представила ChatGPT-4.5 — самую крупную и продвинутую модель для диалогового взаимодействия на сегодняшний день. 4.5
DeepSeek сообщил о «теоретической» марже в 545%
Китайский стартап в сфере искусственного интеллекта DeepSeek сообщил, что теоретическая доходность его моделей V3 и R1 достигает 545% в сутки, хотя фактические доходы компании существенно ниже.
Системы ИИ осознают собственные ограничения, когда у них больше времени на «размышления»
В результате исследования, проведённого в Университете Джонса Хопкинса, выяснилось, что если предоставить системам искусственного интеллекта больше времени на анализ информации, то они смогут более точно определять, когда они могут и не могут дать правильный ответ на вопрос.
Ставка ИИ на $305 миллионов: модели логического вывода увеличивают спрос на графические процессоры
Когда DeepSeek-R1 только вышел на рынок, в отрасли преобладал страх, что сложные вычисления можно будет производить с использованием менее сложной инфраструктуры.
Так ли хороша DeepSeek-R1, как о ней говорят
Во всем AI-мире сейчас говорят о новой китайской языковой модели DeepSeek и, конечно, наша команда развития AI не могла пройти мимо этой темы. Мы сравнили ответы новой модели на реальные запросы к нашей базе знаний с ответами других популярных моделей. Что из этого получилось и какие выводы мы сделали расскажу я — Максим Михайлов, продуктовый менеджер Cloud.ru.
Xiaomi внедрит в своего голосового ассистента поддержку DeepSeek-R1
Xiaomi тестирует совместимость голосового ассистента Xiao AI с нейросетевой моделью DeepSeek-R1. Компания работает над расширением возможностей ИИ внутри своей экосистемы HyperOS.
Так ли страшен DeepSeek, как его малюет Cerebras?
В последнее время две темы в новостях о новейших достижениях в области ИИ привлекали наибольшее внимание специалистов и досужей публики, которая желает все знать — китайский проект DeepSeek и производитель оборудования для ИИ американская компания Cerebras. Здесь, на Хабре своевременно появлялись публикации по обеим темам. Я сходил по некоторым ссылкам к первоисточникам, приведенным в этих публикациях для проверки фактов. Вы тоже можете это сделать, если захотите.
Руководитель DeepMind опроверг прорыв DeepSeek в области ИИ
Генеральный директор Google DeepMind Демис Хассабис заявил, что модель искусственного интеллекта DeepSeek «вероятно, стала лучшей работой» исследователей из Китая, но добавил, что компания не продемонстрировала никаких новых научных достижений.
Гендиректор Anthropic: DeepSeek показал себя «худшим» в тесте безопасности данных о биологическом оружии
Генеральный директор Anthropic Дарио Амодеи обеспокоен работой китайской DeepSeek и её моделью R1. В интервью подкасту ChinaTalk Джордана Шнайдера он сказал, что DeepSeek сгенерировала информацию о биологическом оружии в ходе теста безопасности.Производительность DeepSeek оказалась «худшей из всех моделей, которые мы когда-либо тестировали», заявил Амодеи. По его словам, у модели «нет никаких барьеров против генерации чувствительной информации».
Запускаем DeepSeek-R1 на обычном сервере с 768Гб ОЗУ в LM-Studio
Что побудило написать статью?Была тут недавно статья с картинками железа, ценами на железо, но без описания настроек, но зато с ссылками на GitHub и цитирую «Инструкция: Следуйте руководству в репозитории GitHub».:‑) Хотя в нынешних реалиях запустить нейросеть можно уже на чем угодно и не обязательно обладать навыками выше «Опытного пользователя ПК». (Если рассматривать «дистиллированные» сети, не знаю как правильно перевести.) Поэтому использования сложных инструментов и инструкций чтобы запустить что‑то и тем более отправку на GitHub считаю не совсем корректно. О себе

