Машинное обучение.

PLC AI Studio, часть 2: многопроектный режим и маршрутные окна — как провести ИИ через целый объект

Дисклеймер: Это продолжение первой статьи про PLC AI Studio — инструмент, который заставляет ИИ сначала разобраться в задании, а потом писать код ПЛК, и проверяет результат фактами. В первой части был разобран базовый режим: одна установка, один IOLIST + одно ТЗ → один проверенный ST-файл. Здесь рассказываю то, что в прошлый раз было только тизером «что дальше»: многопроектный (многосистемный) режим и маршрутные окна

продолжить чтение

Оставлено в

Может ли ИИ думать? Разбираем вопрос без философии

Этот вопрос обычно заканчивается одинаково: кто-то произносит слово «сознание», дальше начинается философский спор, и через двадцать минут все расходятся ни с чем. Мы пойдём другим путём.Никакого Декарта, никакого Тьюринга, никаких рассуждений о душе. Только конкретный вопрос: что именно умеет и не умеет делать языковая модель — и насколько это похоже на то, что мы в быту называем мышлением.Что мы вообще называем «думать»

продолжить чтение

Оставлено в

Anthropic выпустила Fable 5 — и я задумался, не движемся ли мы не в ту сторону

Самая мощная публично доступная модель оказалась дороже и медленнее. Разбираю релиз и рассуждаю, почему удешевление и ускорение, возможно, важнее роста потолка9 июня Anthropic выпустила Claude Fable 5 — первую публично доступную модель класса Mythos. Той самой Mythos, которую в апреле компания сочла настолько мощной (и потенциально опасной в части кибербезопасности), что не стала открывать публике, а раздала ограниченному кругу организаций в рамках программы Project Glasswing. Спустя меньше трёх месяцев Anthropic решила, что готова дать публике модель того же класса — с оговорками.

продолжить чтение

Оставлено в

Как я за месяц перевела команду с SQL-промптов на мультиагентную систему и сэкономила команде 200 часов

Дарья Воронкина

продолжить чтение

Оставлено в

Модель, которую боялись выпускать, теперь доступна всем. До 22 июня — бесплатно в подписке

Помните Claude Mythos? Ту самую модель Anthropic, которая в апреле находила уязвимости во всех основных ОС и браузерах, хотя её даже не учили этому специально. Тогда компания просто отказалась её выпускать. Доступ дали только Apple, Google, Microsoft и ещё паре гигантов, чтобы те успели залатать собственные дырыТак вот, вчера её выпустили. Называется Claude Fable 5

продолжить чтение

Оставлено в

Откуда в обучении берётся nan: численная нестабильность в ML и почему всё считают в логарифмах

Модель обучается, loss падает, метрики растут. На какой‑то эпохе loss внезапно становится nan и больше не восстанавливается, как бы вы ни понижали learning rate. Или инференс на проде иногда возвращает вероятность ровно 1.0 для класса, которого в обучающей выборке почти не было, а в логах при этом тихо мелькает RuntimeWarning: overflow encountered in exp. Код не менялся, данные те же, гиперпараметры те же. Просто в какой‑то момент промежуточное число вышло за границу того, что тип float умеет хранить, и дальше вся арифметика поехала.

продолжить чтение

Оставлено в

Xiaomi разогнали 1T-модель до 1200 tok-s на стандартных GPU

Китайские команды MiMo и TileRT опубликовали режим UltraSpeed для модели MiMo V2.5 Pro (1,02T параметров).На одном 8-карточном сервере со стандартными GPU, до ~1200 токенов в секунду. Cerebras выдаёт похожие скорости на кастомном железе. Здесь обошлись без него.

продолжить чтение

Оставлено в

Месть дата-сайентиста: почему LLM не отменили нашу профессию

Закончилась ли золотая эпоха дата-сайентистов? Когда-то Harvard Business Review назвал эту профессию «самой сексуальной работой XXI века». В технологической индустрии позиции data scientist часто входили в число самых высокооплачиваемых. При этом работа требовала необычного сочетания навыков:Data Scientist (сущ.): человек, который знает статистику лучше любого разработчика и разбирается в разработке лучше любого статистика.— JosH100 (@josh_wills), 3 мая 2012 года

продолжить чтение

Оставлено в

Apple + Google =? Купертиновцы представили Apple Foundation Model с интеграцией Gemini

Apple представила

продолжить чтение

Оставлено в

Видеоаналитика на промышленном объекте: почему большинство внедрений разочаровывают и как сделать правильно

Там, где нет людей, нет времени и нет права на ошибкуХочу поделится одной историей из жизни. На удалённом нефтепромысле в -30С° за бортом бригада выполняет огневые работы — сварку, рядом с действующим трубопроводом. По регламенту каждый должен быть в полном комплекте СИЗ, с газоанализатором. Мастер провел инструктаж, расписался в наряде‑допуске, и уехал на следующий объект. Инспектор по ТБ появится через два часа.Что происходит в эти два часа — не знает никто.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Машинное обучение.

PLC AI Studio, часть 2: многопроектный режим и маршрутные окна — как провести ИИ через целый объект

Может ли ИИ думать? Разбираем вопрос без философии

Anthropic выпустила Fable 5 — и я задумался, не движемся ли мы не в ту сторону

Как я за месяц перевела команду с SQL-промптов на мультиагентную систему и сэкономила команде 200 часов

Модель, которую боялись выпускать, теперь доступна всем. До 22 июня — бесплатно в подписке

Откуда в обучении берётся nan: численная нестабильность в ML и почему всё считают в логарифмах

Xiaomi разогнали 1T-модель до 1200 tok-s на стандартных GPU

Месть дата-сайентиста: почему LLM не отменили нашу профессию

Apple + Google =? Купертиновцы представили Apple Foundation Model с интеграцией Gemini

Видеоаналитика на промышленном объекте: почему большинство внедрений разочаровывают и как сделать правильно

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Машинное обучение.