Исследование Anthropic: ИИ умеет планировать и сознательно врать
Учёные из Anthropic опубликовали
Нейронки пошли не туда
Долго пытался сформулировать, почему мне нравится Claude и Gemini и умение рассуждать ChatGPT.И наоборот, не нравится (точнее, кажется по большей части бесполезной на практике) умение ChatGPT написать точный, с первого раза работоспособный код. Или там, решить задачки из олимпиады по математике, выдавая потрясающий балл на экзаменах в MIT.Интуиция не врёт. (Юдковский перевернулся в гробу)
Неделя жизни продакт-лида с ИИ
Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь материалами, которые помогают:Продуктовым менеджерам — интегрировать AI без перегрузки команд;Разработчикам — выбирать инструменты под конкретные бизнес-задачи;Специалистам по данным — избегать ошибок в production-развертывании.У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.Статья A Week in My Life as a Product Leader with AI
Новая DeepSeek V3: рекорды в бенчах, кодинг лучше Claude и GPT-4.5
Позавчера DeepSeek загадочно и молчаливо залили новую модель на HuggingFace, даже не написав ничего не в блоге, ни в README файле.Сегодня, наконец, вышел анонс с подробным описанием характеристик новой модели (а точнее, крутого обновления старой модели). Давайте разбираться, что в этот раз нам подогнали китайские исследователи.
Лучшие нейросети для написания кода и программирования
На заре вычислительных устройств программисты писали код самостоятельно — полностью с нуля и в одиночку. Режим хардкор! Единственное, что могло облегчить их труд, — бумажные справочники, описывающие синтаксические особенности отдельного языка.Сегодня всё иначе. Помимо многочисленных электронных документаций, гайдов, статей, видео и форумов существуют нейросети — похоже, одна из самых прорывных технологий начала 21 века.Обученные на больших объемах данных, теперь они — основные поставщики справочного материала.
Как выбрать LLM-модель, которая заберет у вас работу
Пока одни спорят, заменит ли ИИ людей, другие уже выбирают, какую нейросеть поставить себе в напарники. ChatGPT, Claude, Mistral, а еще китайские модели, которые неожиданно набирают популярность — надо бы разобраться в этом хаосе.Не стоит полагаться только на отзывы или случайные тесты. Разбираемся, по каким критериям действительно стоит оценивать LLM, чтобы выбрать мощную и полезную модель, а не просто хорошо обученного бота.По каким параметрам оценивать языковые модели
Новый инструмент от Anthropic позволяет Claude делать заметки для решения сложных задач
Компания Anthropic нашла простой способ улучшить способность своего помощника на основе искусственного интеллекта выполнять сложные многоэтапные задачи: позволить ему делать заметки по ходу работы. Компания утверждает, что добавление «блокнота», где Клод может записывать свои мысли, в сочетании с примерами подсказок значительно улучшает его способности решать задачи.
Claude внедрила функцию веб-поиска: новые возможности для пользователей
У Claude появилась новая функция веб-поиска, которая помогает находить более актуальные ответы. Когда ИИ-помощник находит информацию в интернете, он показывает пользователям, откуда именно были взяты данные, и преобразует результаты поиска в ответы в диалоговом режиме, а не просто в список ссылок, как в традиционной поисковой системе. Подобные функции уже существуют в таких инструментах, как Perplexity, ChatGPT и Google Gemini.
Сообщается, что Anthropic готовит голосовой режим для Claude
Согласно отчёту, стартап Anthropic, занимающийся искусственным интеллектом, работает над голосовыми возможностями своего чат-бота Claude на базе искусственного интеллекта.
Практическое руководство по выбору между ChatGPT, Claude, Gemini, Grok и Perplexity
Всем привет! Меня зовут Александр, я COO в SaaS-платформе для аналитики данных. Последний год активно изучаю AI-решения в кросс-функциональные процессы. В своих переводах делюсь материалами, которые помогают:Продуктовым менеджерам — интегрировать AI без перегрузки команд;Разработчикам — выбирать инструменты под конкретные бизнес-задачи;Специалистам по данным — избегать ошибок в production-развертывании.Сегодняшний перевод Субъективный гид по выбору модели искусственного интеллекта в 2025 году

