ai.

Как я обошел современные GPT модели с помощью GPT2-small на задачах рассуждения

Не так давно я уже писал статью по такому необычному явлению, как гроккинг - отложенная генерализация. Если долго тренировать модель на наборе данных, то тестовая точность достигнет 100% и модель станет безошибочно решать задачу. Звучит круто! Но вот проблема - никто до сих пор не мог применить гроккинг на задачах из реального мира, а мы это сделали и сейчас публикуемся на крупнейшей МЛ конференции. Если интересно, как мы этого достигли, то прошу под кат.

продолжить чтение

Оставлено в

Что покажет бенчмарк? Оценка мультиагентных систем в действии

Оценка ИИ-агентов с контролем затрат

продолжить чтение

Оставлено в

Как ИИ-контент проклял интернет и почему это закономерно

Сколько сгенерированного ИИ контента вы видите каждый день? Вопрос риторический. Весело создавать изображения или получать быстрый ответ от нейросети на заковыристый вопрос. ИИ будет выдавать все, что кто-то попросит, пусть ответ будет и не очень хорошего качества в большинстве случаев. Зато быстро и иногда бесплатно. Но есть и обратная сторона: низкое качество, недостоверность, дипфейки. Конечно, ИИ лишь выполняет команды людей, но многие уже бьют тревогу о мертвом Хабре интернете, ведь объем нейросетевого контента скоро превысит объем контента от живых людей. В этой статье хотелось бы развить мысль о том, что это закономерно. Несомненно, подавляющее большинство контента, создаваемого ИИ, — просто ужасно. Это ленивый, неинтересный, минимально жизнеспособный мусор, который публикуют контент-фермеры, боты или люди, которым просто нет дела до качества. Но это эволюционный этап детства ИИ и проба использования новых доступных инструментов. Такой сценарий был неизбежен.

продолжить чтение

Оставлено в

Опыт написания игры с помощью Ai-инструментов. От идеи до прода

Введение Как-то раз я прочитал новость про то, что какой-то умелец написал браузерную игру с самолетиками с помощью AI. Понимая, что технологии искуственного интеллекта сейчас развиваются семимильными шагами, я решил, что не пощупав это все руками, велик риск остаться на обочине прогресса в обозримом будущем. И я решил, что надо сделать что-то свое. Я не хотел делать что-то очень простое, чтобы все-таки приблизиться к условиям реальности, но и не хотел делать какой-то непонятный сервис ради сервиса, который будет делать непонятно что. Поэтому я решил тоже написать игру. Очень хотелось сделать что-то интерактивное, когда ты можешь играть с кем-то живым. Но при этом от не хотелось красть идею парня из новости и я вспомнил про времена детства, когда я кучу времени проводил в пвп-браузерках, где нужно было «драться», выбирая области для атаки и для защиты. Так родилась идея. В качестве инструмента я решил использовать IDE Cursor. Я посчитал полезным поделиться этим опытом через призму того, как технология может повлиять на процессы в компании.

продолжить чтение

Оставлено в

Меня заставили повайбкодить

продолжить чтение

Оставлено в

Как сделать AI бота для Битрикс24 с подключением к Tg, VK, Avito

а многие уже используютПростая инструкция, не требующая знаний программирования или администрирования. Собственный бот вы сможете тестировать уже через минуту после установки приложения в Битрикс24, а далее - разбираем настройки.

продолжить чтение

Оставлено в

Как изменилась логика управления проектами с приходом искусственного интеллекта

Казалось бы, проект — он и есть проект. Есть цели, сроки, ресурсы, ответственность. Команда, бэклог, релизы, метрики.Но если в проекте появляется компонент на основе ИИ — всё, забудьте привычную механику. Внутри осталась та же конструкция, но логика её работы уже другая.Я веду AI-проекты не первый год, и могу точно сказать: управление такими системами требует другой оптики. Всё начинается с привычного project/product management — но уже на ранних этапах возникает ощущение, что ты управляешь не только задачами и людьми, а поведением. Плавающим, обучающимся, порой нелогичным.Что остаётся от классики

продолжить чтение

Оставлено в

Юнит тесты роя агентов

Исходный код, разобранный в статье, опубликован в этом репозиторииПри разработке роя агентов встает вопрос юнит тестирования. Рой агентов позволяет использовать разные LLM с выбором другой активной модели исходя из действий пользователя. Как следствие, обрабатывать идентичную переписку может любой агент из роя, например, был сделан Redis FLUSHALL и активный агент потерялся: чат продолжается с корневого Triage agent

продолжить чтение

Оставлено в

Gemini 2.5 Pro от Google прошел Pokémon Blue

Самая дорогая модель искусственного интеллекта от Google, похоже, преодолела важный рубеж: она победила в видеоигре 29-летней давности. Вчера вечером генеральный директор Google Сундар Пичаи с триумфом опубликовал на X: «Какой финиш! Gemini 2.5 Pro только что прошел Pokémon Blue!»

продолжить чтение

Оставлено в

Gemini 2.5 Flash от Google показала худшие результаты по безопасности

Согласно внутреннему сравнительному анализу компании, недавно выпущенная модель искусственного интеллекта Google показала худшие результаты в некоторых тестах безопасности, чем ее предшественница. В

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

ai.

Как я обошел современные GPT модели с помощью GPT2-small на задачах рассуждения

Что покажет бенчмарк? Оценка мультиагентных систем в действии

Как ИИ-контент проклял интернет и почему это закономерно

Опыт написания игры с помощью Ai-инструментов. От идеи до прода

Меня заставили повайбкодить

Как сделать AI бота для Битрикс24 с подключением к Tg, VK, Avito

Как изменилась логика управления проектами с приходом искусственного интеллекта

Юнит тесты роя агентов

Gemini 2.5 Pro от Google прошел Pokémon Blue

Gemini 2.5 Flash от Google показала худшие результаты по безопасности

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

ai.