Benchmark Driven Development: почему мы перестали верить чужим бенчмаркам
Каждый день появляются новые LLM, OCR, мультимодальные модели и агенты. В новостях — одни заголовки: «Модель X побила все бенчмарки». Руководство хочет «самое новое и передовое», команда — «самое лучшее по метрикам». А вот как понять, что конкретно для вашего кейса это действительно лучше — обычно не очень понятно.В этой статье расскажем, как мы пришли к подходу, который внутри называем Benchmark Driven Development (BDD) — разработка, движимая бенчмарками на своих данных. (Да, мы знаем, что BDD — это ещё и Behavior Driven Development, тут у нас своя расшифровка 🙂)Задача из практики: документы в одном длинном PDF
Mistral выкатили Devstral 2 — открытая SOTA модель для кодинга
Неделю назад мы писали про Mistral 3 с MoE-моделью на 675B параметров. Сегодня компания представила Devstral 2 — новое поколение открытых моделей для кодинга.Главное:Devstral 2 (123B): 72.2% на SWE-bench Verified, фактически новый SOTA среди open-weight кодовых агентов.
Мир интернета вещей, людей и всего — предсказания Николы Тесла сбываются
Мир интернета вещей, людей и всего
Увольте своих программистов. Или спросите их…
Увольте своих программистов. Или хотя бы спросите их, почему ваш продукт всё время тонет.... или спросите их, почему ваш продукт всё время тонет?!
Анимированный UI: как улучшить взаимодействие с пользователем
Анимация пользовательского интерфейса прошла долгий путь за последнее десятилетие, они превратились в универсальный цифровой язык, который люди узнают и понимают. Эти микровзаимодействия позволяют дизайнерам общаться с пользователями посредством движения и анимации, предоставляя им рекомендации, контекст и создавая захватывающий пользовательский опыт.
IBM достигла соглашения о покупке Confluent
IBM объявила о приобретении платформы управления данными Confluent за $11 млрд. На фоне сделки акции последней выросли на 29%. Генеральный директор IBM Арвинд Кришна заявил, что Confluent станет частью программного подразделения возглавляемой им корпорации.
Автоматизация приема заказов по телефону. Личный опыт и реальные результаты
Каждый день миллионы клиентов звонят в компании по телефону - и каждый такой звонок обходится бизнесу в деньги, время и репутацию. Операторы выгорают от монотонных разговоров, клиенты бросают трубку после долгого ожидания, а бизнес теряет прибыль на рутине, которую давно пора автоматизировать. Я уже несколько лет занимаюсь разработкой и внедрением голосовых ботов для приема заказов по телефону - не в теории, а для реальных компаний, с реальными клиентами и реальными заказами.В этой статье я поделюсь конкретными кейсами, которые помогут владельцам и руководителям бизнеса понять:
