BrainTools - Методики для развития мозга

Benchmark Driven Development: почему мы перестали верить чужим бенчмаркам

Каждый день появляются новые LLM, OCR, мультимодальные модели и агенты. В новостях — одни заголовки: «Модель X побила все бенчмарки». Руководство хочет «самое новое и передовое», команда — «самое лучшее по метрикам». А вот как понять, что конкретно для вашего кейса это действительно лучше — обычно не очень понятно.В этой статье расскажем, как мы пришли к подходу, который внутри называем Benchmark Driven Development (BDD) — разработка, движимая бенчмарками на своих данных. (Да, мы знаем, что BDD — это ещё и Behavior Driven Development, тут у нас своя расшифровка 🙂)Задача из практики: документы в одном длинном PDF

продолжить чтение

Оставлено в

Mistral выкатили Devstral 2 — открытая SOTA модель для кодинга

Неделю назад мы писали про Mistral 3 с MoE-моделью на 675B параметров. Сегодня компания представила Devstral 2 — новое поколение открытых моделей для кодинга.Главное:Devstral 2 (123B): 72.2% на SWE-bench Verified, фактически новый SOTA среди open-weight кодовых агентов.

продолжить чтение

Оставлено в

Илон Маск научил ИИ вставлять рекламу прямо в фильмы без пауз

продолжить чтение

Оставлено в

Мир интернета вещей, людей и всего — предсказания Николы Тесла сбываются

Мир интернета вещей, людей и всего

продолжить чтение

Оставлено в

Увольте своих программистов. Или спросите их…

Увольте своих программистов. Или хотя бы спросите их, почему ваш продукт всё время тонет.... или спросите их, почему ваш продукт всё время тонет?!

продолжить чтение

Оставлено в

Анимированный UI: как улучшить взаимодействие с пользователем

Анимация пользовательского интерфейса прошла долгий путь за последнее десятилетие, они превратились в универсальный цифровой язык, который люди узнают и понимают. Эти микровзаимодействия позволяют дизайнерам общаться с пользователями посредством движения и анимации, предоставляя им рекомендации, контекст и создавая захватывающий пользовательский опыт.

продолжить чтение

Оставлено в

IBM достигла соглашения о покупке Confluent

IBM объявила о приобретении платформы управления данными Confluent за $11 млрд. На фоне сделки акции последней выросли на 29%. Генеральный директор IBM Арвинд Кришна заявил, что Confluent станет частью программного подразделения возглавляемой им корпорации.

продолжить чтение

Оставлено в

OpenAI забирает экс CEO Slack. Компания усиливает коммерческий блок и готовится к большому росту прибыли

продолжить чтение

Оставлено в

Автоматизация приема заказов по телефону. Личный опыт и реальные результаты

Каждый день миллионы клиентов звонят в компании по телефону - и каждый такой звонок обходится бизнесу в деньги, время и репутацию. Операторы выгорают от монотонных разговоров, клиенты бросают трубку после долгого ожидания, а бизнес теряет прибыль на рутине, которую давно пора автоматизировать. Я уже несколько лет занимаюсь разработкой и внедрением голосовых ботов для приема заказов по телефону - не в теории, а для реальных компаний, с реальными клиентами и реальными заказами.В этой статье я поделюсь конкретными кейсами, которые помогут владельцам и руководителям бизнеса понять:

продолжить чтение