Новый метод адаптирует языковые модели без обучения
Исследователи из Sakana AI представили метод Text-to-LoRA (T2L), который адаптирует большие языковые модели к новым задачам, используя только простое текстовое описание — никаких дополнительных обучающих данных не требуется.
Как мы программировали робота-краба для ЦИПР2025: AI, который выделяет нас на фоне пультов
Привет, Хабр! Мы - команда NIKTA.AI, и на конференции ЦИПР2025 мы решили не просто участвовать, а задать жару с нашим роботом-крабом, управляемым через Visual Language Model (VLM). Пока другие команды щелкали пультами, наш краб самостоятельно принимал решения, осматривал стенд и искал объекты. Как мы это сделали за полтора месяца? Рассказываем!
OpenAI обновляет поиск в ChatGPT, делая ответы более продуманными, а поиск изображений — более эффективным
Компания OpenAI выпустила крупное обновление для интегрированного поиска в ChatGPT, в котором представлены более умные ответы, улучшенная обработка длинных диалогов и новая функция поиска изображений.
Новые тесты Apple показывают, что её ИИ-модели всё ещё отстают от лидеров рынка
Apple опубликовала новые данные о производительности двух своих моделей искусственного интеллекта и открыла доступ к меньшей по размеру системе для сторонних разработчиков. Тесты показывают, что технология LLM от Apple по-прежнему уступает конкурентам.
Как устроено глубокое обучение нейросетей
Глубокое обучение — Подход в машинном обучении, основанный на многослойных нейронных сетях. Нейронные сети, в свою очередь, вдохновлены биологическими нейронами, которые взаимодействуют между собой, образуя структуры, способные обрабатывать информацию, анализировать её и выполнять классификацию, генерировать текст и много чего ещё. Модели глубокого обучения это те же нейронные сети, но с огромным количеством слоёв, каждый из которых выполняет свою функцию по обработке данных.
WSJ: китайская компания вывезла в Малайзию жёсткие диски с 80 ТБ данных для обучения ИИ-модели в обход ограничений США
В начале весны 2025 года четыре инженера китайской компании вывезли из Пекина в малайзийский Куала-Лумпур по одному чемодану с 15 жёсткими дисками в каждом. Носители содержали 80 ТБ электронных таблиц, изображений и видео для обучения модели искусственного интеллекта. В малайзийском центре обработки данных работодатель инженеров арендовал около 300 серверов с передовыми чипами Nvidia. Обученную на этих данных модель вывезли обратно в Китай, пишет Wall Street Journal.
Google «засветила» новые версии ИИ-модели Gemini 2.5
У части пользователей Google AI Studio на некоторое время появилась вкладка Confidential, на которой завестились две новые языковые модели компании: финальная Gemini 2.5 Pro и Gemini 2.5 Flash Lite.
ИИ от Google теперь может предсказывать траектории ураганов за 15 дней
Компания Google DeepMind только что совершила, возможно, самый большой прорыв в прогнозировании ураганов за последние десятилетия. Новая система искусственного интеллекта компании может предсказывать, где будут формироваться ураганы, и отслеживать их вероятные пути на срок до 15 дней вперёд. Впервые в истории Национальный центр по наблюдению за ураганами США использует эти экспериментальные прогнозы ИИ наряду со своими традиционными моделями прогнозирования.

