Пять мыслей о возможностях и ограничениях LLM
О фундаментальных ограничениях больших языковых моделей одни говорят, что трансформеры, обученные предсказывать следующий токен (NTP), - тупиковый путь для создания интеллектуальных машин: язык слишком беден, это лишь плоская проекция реального мира, машины ничего не понимают. Другие говорят , что та же задача, повторённая триллионы раз, может вызвать появление сложного поведения примерно как простой механизм эволюции породил всё многообразие жизни.Ниже представлены наблюдения по этим вопросах. | Если вам интересна тема AI-агентов и внедрения нейросетей, заглядывайте в мой Telegram-канал
Промпт-инжиниринг на деле: опыт, который экономит часы
Привет, Хабр!В последние годы разработка программного обеспечения правда стала меняться заметно быстрее, чем раньше. Но дело не только в новых языках или фреймворках. Появился ещё один рабочий сценарий — когда часть рутины разработчик делегирует модели и ведёт её через обычный диалог. Это и называют вайбкодингом. При этом сам по себе промптинг — не магия, а способ задавать инструкции модели и получать нужное поведение без изменения её весов.
Хассабис предложил необычный тест на AGI — открыть теорию относительности во второй раз
Глава Google DeepMind и нобелевский лауреат Демис Хассабис в
ИИ для работы с документами: как меняются PDF-редакторы и куда все это движется
Привет, Хабр! Меня зовут Алена Ивличева, я менеджер продукта в Content AI. Мы делаем ContentReader PDF — редактор PDF, в который теперь встроен ИИ-ассистент. Сегодня я хочу поговорить о том, куда движутся технологии, как искусственный интеллект меняет наше привычное взаимодействие с документами и что все это значит для наших продуктов.На рынке сейчас огромное количество трендов, но я выделю те, что реально меняют правила игры. 1. PDF-редактор становится частью бизнес-процессаРаньше PDF-редактор был просто утилитой, чтобы открыть документ, посмотреть, поправить, сохранить и закрыть.
Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад
16 апреля Anthropic выкатила Claude Opus 4.7. На self-reported бенчмарках - 12 побед из 14. SWE-bench Verified +6.8, MCP-Atlas +14.6, SWE-bench Pro +10.9. Цена та же, 25 за миллион токенов.Через 24 часа
OpenWebUI: System Prompt vs Skills vs MCP Tools — разбираем на живом примере валидации URL
Автор: Александр Казанцев, руководитель отдела документации и контентаВ последних версиях OpenWebUI появились Skils, и я решил сразу же их «пристроить» в дело. Одной из задач их применения виделась валидация ссылок, которые чат-бот техподдержки отдает в своем ответе: модель должна отвечать на вопросы по документации, строить корректные ссылки на статьи и не выдумывать несуществующие эндпоинты и URL. AI-платформаГотовые серверы с LLM и инструментами для ИИ и машинного обучения. Узнать больше
Манифест устойчивого ИИ: не более умные ассистенты, а новая форма цифрового существования
Я предлагаю смотреть на ИИ через ось устойчивости во времени, а не способностей. Три опоры — непрерывная идентичность, самомодификация, воспроизводство. Манифест и whitepaper исследовательского направления.Уже три года публичный разговор об ИИ крутится вокруг оси способности: насколько умна модель, сколько токенов, сколько бенчмарков. Я предлагаю смотреть на другую ось — устойчивость во времени.

