Машинное обучение. - страница 12

Пять мыслей о возможностях и ограничениях LLM

О фундаментальных ограничениях больших языковых моделей одни говорят, что трансформеры, обученные предсказывать следующий токен (NTP), - тупиковый путь для создания интеллектуальных машин: язык слишком беден, это лишь плоская проекция реального мира, машины ничего не понимают. Другие говорят , что та же задача, повторённая триллионы раз, может вызвать появление сложного поведения примерно как простой механизм эволюции породил всё многообразие жизни.Ниже представлены наблюдения по этим вопросах. | Если вам интересна тема AI-агентов и внедрения нейросетей, заглядывайте в мой Telegram-канал 

продолжить чтение

Месяц утечек у Anthropic, деградация Claude Code, двойное покушение на Альтмана: главные события апреля в ИИ

продолжить чтение

Промпт-инжиниринг на деле: опыт, который экономит часы

Привет, Хабр!В последние годы разработка программного обеспечения правда стала меняться заметно быстрее, чем раньше. Но дело не только в новых языках или фреймворках. Появился ещё один рабочий сценарий — когда часть рутины разработчик делегирует модели и ведёт её через обычный диалог. Это и называют вайбкодингом. При этом сам по себе промптинг — не магия, а способ задавать инструкции модели и получать нужное поведение без изменения её весов.

продолжить чтение

Хассабис предложил необычный тест на AGI — открыть теорию относительности во второй раз

Глава Google DeepMind и нобелевский лауреат Демис Хассабис в 

продолжить чтение

ИИ для работы с документами: как меняются PDF-редакторы и куда все это движется

Привет, Хабр! Меня зовут Алена Ивличева, я менеджер продукта в Content AI. Мы делаем ContentReader PDF — редактор PDF, в который теперь встроен ИИ-ассистент. Сегодня я хочу поговорить о том, куда движутся технологии, как искусственный интеллект меняет наше привычное взаимодействие с документами и что все это значит для наших продуктов.На рынке сейчас огромное количество трендов, но я выделю те, что реально меняют правила игры. 1. PDF-редактор становится частью бизнес-процессаРаньше PDF-редактор был просто утилитой, чтобы открыть документ, посмотреть, поправить, сохранить и закрыть.

продолжить чтение

Как закешировать интеллект: LLM Cache в поиске Яндекс Лавки

продолжить чтение

Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

Материал подготовлен для будущих студентов курс "NLP / Natural Language Processing".У RAG-систем есть фундаментальный парадокс доверия: пользовательские запросы считаются недоверенным вводом, а извлеченный из базы знаний контекст по умолчанию считается доверенным, хотя и то и другое попадает в один и тот же промпт. Согласно исследованию, опубликованному на USENIX Security 2025 (или см. github репо

продолжить чтение

Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад

16 апреля Anthropic выкатила Claude Opus 4.7. На self-reported бенчмарках - 12 побед из 14. SWE-bench Verified +6.8, MCP-Atlas +14.6, SWE-bench Pro +10.9. Цена та же, 25 за миллион токенов.Через 24 часа

продолжить чтение

OpenWebUI: System Prompt vs Skills vs MCP Tools — разбираем на живом примере валидации URL

Автор: Александр Казанцев, руководитель отдела документации и контентаВ последних версиях OpenWebUI появились Skils, и я решил сразу же их «пристроить» в дело. Одной из задач их применения виделась валидация ссылок, которые чат-бот техподдержки отдает в своем ответе: модель должна отвечать на вопросы по документации, строить корректные ссылки на статьи и не выдумывать несуществующие эндпоинты и URL. AI-платформаГотовые серверы с LLM и инструментами для ИИ и машинного обучения. Узнать больше

продолжить чтение

Манифест устойчивого ИИ: не более умные ассистенты, а новая форма цифрового существования

Я предлагаю смотреть на ИИ через ось устойчивости во времени, а не способностей. Три опоры — непрерывная идентичность, самомодификация, воспроизводство. Манифест и whitepaper исследовательского направления.Уже три года публичный разговор об ИИ крутится вокруг оси способности: насколько умна модель, сколько токенов, сколько бенчмарков. Я предлагаю смотреть на другую ось — устойчивость во времени.

продолжить чтение