llm.
ai-sidekick: Быстрый старт в мир AI-агентов и RAG
Приветствую, Хабр! Представляю вам свой framework - ai-sidekickМы разберём готовый к работе фреймворк для экспериментов с MCP-tools. А также, на его основе, рассмотрим архитектуру RAG (Retrieval-Augmented Generation) AI-ассистента для поиска информации в вашей собственной базе знаний. Это не набор абстракций в тысячу строк, а минималистичная кодовая база на Python и Docker, которая предоставляет возможность эксперементировать с конфигурациями и кодом под ваши задачи.
Language Dove: как я транскрибирую и перевожу фильмы
Я обожаю смотреть иностранные фильмы в оригинале.Во-первых, мне нравится расширять кругозор, погружаться в другую культуру, расшифровывать структуру разных языков, пополнять словарный запас.Во-вторых, мне просто нравится звучание некоторых языков - например, французского, датского, китайского.Также я работаю над сайтом по изучению языков Language Dove, а учить языки по фильмам - это очень эффективно.Так родился проект по генерации идеальных субтитров.Функциональность субтитров:Подсветка слов в момент произношения - для тренировки восприятия на слух
Генеральный директор Databricks считает, что SaaS не умер, но ИИ скоро сделает его неактуальным
По мнению Али Годси из Databricks, ИИ не заменит основные SaaS-приложения самодельными версиями, но может породить конкурентов. В понедельник Databricks
Детерминированное поведение и стейт-машины для ваших агентов
Агенты отлично справляются с узкими, конкретными задачами — например, написать функцию или короткий текст — но начинают буксовать на сложных многошаговых процессах. Чем более абстрактна и «высокоуровнева» работа, тем больше ошибок они допускают: путают шаги, пропускают операции, неверно интеретируют инструкции. Такие ошибки накапливаются и усиливают друг друга, приводя к неожиданным результатам. Чем больше задача, которую вы отдаёте агенту, тем выше шанс, что он её провалит.Помедитировав немного над этим, я пришёл к интересным эвристикам:
LLM в инструментах Data Governance и их практическое применение
Привет, Хабр! Меня зовут Антон, я аналитик в команде разработки продукта RT.DataGovernance (далее — DG) компании TData. В моей прошлой статье об ИИ в DG было упущением не описать контекст технологического развития, внутри которого, так или иначе, принималось решение о начале интеграции ИИ в наш продукт. Здесь я также постараюсь дать более подробный ответ, почему сначала мы выбрали решения классического ML. Ну и опишу, как мы все-таки внедрили LLM в DG в контуре нашего клиента ПАО Ростелеком.. Повышение требований к информационной безопасности
LLM‑разметка в поиске: от эксперимента к инструменту
Привет! Меня зовут Александр Баранов, я аналитик данных в команде поиска Купера. Цель этого рассказа, поделиться наработками в деле оптимизации разметки текстовых данных при помощи большой языковой модели (LLM). Если после прочтения вы захотите что-то добавить или спросить, буду только рад!
Я измерил «личность» 6 open-source LLM (7B-9B), заглянув в их hidden states. Вот что получилось
У LLM есть устойчивые «личности», даже если вы об этом не просили. DeepSeek — восторженный друг, который объясняет всё в три раза подробнее, чем нужно. Llama — пугающе нейтральный (4 из 7 осей в «слабой зоне»). Yi — слегка холодный, терпеливый и уверенный. У каждой модели свой измеримый «отпечаток» в hidden states.Под «личностью» дальше имею в виду устойчивые стилевые тенденции, измеряемые в hidden states, — не «чувства» и не внутренние состояния.TL;DR
Ксаверий, Терминус и языковые модели против кодировщиков
Оригинал заметки (2024). Перечитал текст двухлетней давности, и решил, что ничего не надо менять.Генеральный директор NVIDIA Дженсен Хуанг высказал мнение, что каждый сможет стать программистом с помощью ИИКто такие Ксаверий и Терминус вы узнаете ближе к концу текста, а пока поговорим о делах наших.
Юрист нашёл в договоре 32 проблемы, AI — 41. Разбираю, кто что пропустил
Как детекторы на основе судебной практики довели AI-анализатор до 41 находки при 0 ложных срабатываний. Как анализ работы юриста превратился в 23 новых проверки. И почему юрист до сих пор незаменим — но уже в другом.КонтекстЭто третья статья про Legal Parser — AI-анализатор договоров для российского рынка.В первой я рассказывал, как построил модульную систему из 32 тематических промптов для YandexGPT. Во второй — как добавил Claude и получил в 2.5 раза больше находок на том же договоре.С тех пор произошло два существенных изменения:
SaaSpocalypse: технологии AI ломают бизнес-модель SaaS?
Когда-то программное обеспечение «съело мир». Теперь Уолл-стрит всерьёз обсуждает другой сценарий: а что, если искусственный интеллект начнет поедать само программное обеспечение — его бизнес-модели, доходность и прибыль?

