Выжимаем из ChatGPT максимум: советы по правильном выбору модели
Привет! С вами Андрей с канала “сбежавшая нейросеть”, на котором я рассказываю про ИИ с творческой стороны. В работе я использую модели разных компаний, среди которых, конечно, есть и ChatGPT с подпиской Plus. Это один из лучших ИИ на рынке, у которого есть одна большая проблема — доступных моделей настолько много, что в замешательстве оказывается даже опытный пользователь. Ниже расскажу, к какой модели и в каких случаях я прибегаю.
Многоагентный подход в ИИ — Anthropic ускоряет и улучшает поисковые запросы
Компания Anthropic опубликовала технические подробности своего нового исследовательского агента Claude, который использует многоагентный подход для ускорения и улучшения сложных поисковых запросов.
Новый метод адаптирует языковые модели без обучения
Исследователи из Sakana AI представили метод Text-to-LoRA (T2L), который адаптирует большие языковые модели к новым задачам, используя только простое текстовое описание — никаких дополнительных обучающих данных не требуется.
Как мы программировали робота-краба для ЦИПР2025: AI, который выделяет нас на фоне пультов
Привет, Хабр! Мы - команда NIKTA.AI, и на конференции ЦИПР2025 мы решили не просто участвовать, а задать жару с нашим роботом-крабом, управляемым через Visual Language Model (VLM). Пока другие команды щелкали пультами, наш краб самостоятельно принимал решения, осматривал стенд и искал объекты. Как мы это сделали за полтора месяца? Рассказываем!
OpenAI обновляет поиск в ChatGPT, делая ответы более продуманными, а поиск изображений — более эффективным
Компания OpenAI выпустила крупное обновление для интегрированного поиска в ChatGPT, в котором представлены более умные ответы, улучшенная обработка длинных диалогов и новая функция поиска изображений.
Новые тесты Apple показывают, что её ИИ-модели всё ещё отстают от лидеров рынка
Apple опубликовала новые данные о производительности двух своих моделей искусственного интеллекта и открыла доступ к меньшей по размеру системе для сторонних разработчиков. Тесты показывают, что технология LLM от Apple по-прежнему уступает конкурентам.
Как устроено глубокое обучение нейросетей
Глубокое обучение — Подход в машинном обучении, основанный на многослойных нейронных сетях. Нейронные сети, в свою очередь, вдохновлены биологическими нейронами, которые взаимодействуют между собой, образуя структуры, способные обрабатывать информацию, анализировать её и выполнять классификацию, генерировать текст и много чего ещё. Модели глубокого обучения это те же нейронные сети, но с огромным количеством слоёв, каждый из которых выполняет свою функцию по обработке данных.
WSJ: китайская компания вывезла в Малайзию жёсткие диски с 80 ТБ данных для обучения ИИ-модели в обход ограничений США
В начале весны 2025 года четыре инженера китайской компании вывезли из Пекина в малайзийский Куала-Лумпур по одному чемодану с 15 жёсткими дисками в каждом. Носители содержали 80 ТБ электронных таблиц, изображений и видео для обучения модели искусственного интеллекта. В малайзийском центре обработки данных работодатель инженеров арендовал около 300 серверов с передовыми чипами Nvidia. Обученную на этих данных модель вывезли обратно в Китай, пишет Wall Street Journal.

