Машинное обучение. - страница 338

Yelp адаптирует технологии ИИ для улучшения пользовательского опыта

Во время недавнего всплеска интереса к технологиям ИИ приложение для отзывов Yelp столкнулось с препятствиями при использовании современных LLM для некоторых функций.У клиентов, особенно у тех, кто пользовался приложением лишь изредка, возникали проблемы с 

продолжить чтение

Foxconn запустила собственную большую языковую модель

Тайваньская Foxconn сообщила о создании собственной большой языковой модели (БЯМ) с возможностями рассуждения под названием FoxBrain. Обучение модели контрактного производителя Apple заняло всего четыре недели.

продолжить чтение

Великая перестройка ПО: ИИ не просто поглощает всё, он и есть всё

Когда-то ПО поглотило мир. Теперь ИИ переваривает то, что осталось. Старая модель вычислений, в которой доминировали приложения, доступ к которым контролировали торговые площадки, а платформы получали свою долю, распадается. На смену ей приходит мир, основанный на ИИ, в котором программные функции не заперты в приложениях, а существуют как динамичные сервисы по запросу, доступные через интерфейсы, созданные с помощью ИИ.

продолжить чтение

Эконофизика и физически-обоснованные нейронные сети

Эконофизика — область науки, которая объединила в себе экономическую теорию и физические методы. По случаю выхода нашей с коллегами научной статьи , решил рассказать об этой концепции. Особенно про то, как современные подходы машинного обучения могут способствовать построению динамических моделей.Историческая справкаВпервые термин эконофизика

продолжить чтение

Президент Signal: агентский ИИ «глубоко уязвимым» с точки зрения безопасности и конфиденциальности

В пятницу Мередит Уиттакер, занимающая пост президента Signal, выразила обеспокоенность по поводу того, что агентский ИИ может поставить под угрозу конфиденциальность пользователей.

продолжить чтение

От психолога до эльфа 80-го уровня: как создать свою уникальную роль для нейросети в домашних условиях и не сойти с ума

Привет! Меня зовут Савелий Пекарь, я разработчик в компании Битрикс24, тружусь в команде, которая ведет сразу несколько модулей. Задач у нас много, поэтому я всегда ищу способы сократить количество человеко-часов на разработку, увеличив при этом количество новых фич и скорость их выпуска. Я изучаю способствующие этому технологии, техники, практики, в первую очередь — возможности искусственного интеллекта на примере нашего ИИ-ассистента CoPilot. 

продолжить чтение

Настройка PostgreSQL для LLM

Итак, в этой статье я расскажу, как эффективно настроить PostgreSQL, чтобы вам было проще работать с большими языковыми моделями.Пока звучит странно, не правда ли? Что я имею в виду? Я имею в виду повышение эффективности создания любых SQL-запросов в базу данных с использованием LLM (ChatGPT, DeepSeek, Llama и других).Метод, о котором пойдет речь, до безобразия прост и от этого гениален. После прочтения этой статьи вы сможете самостоятельно или в рамках вашей компании увеличить скорость формирования SQL-запросов в 50 раз!

продолжить чтение

LLM для кодинга и локальный тест открытых моделей на AMD

LLM кодеры уже показывают отличные результаты на бенчмарках и в реальных задачах. Кажется, сейчас хорошее время, чтобы начать пробовать ими пользоваться.В статье разберем открытые LLM для кодинга. Сравнимы ли они с подписочными моделями? Можно ли их использовать для работы? А есть ли вариант начать локально?В части туториала:Запустим через docker с помощью llama.cpp.Сделаем замеры скорости генерации.Ускорим за счет спекулятивного декодинга. Подключим в vscode, заставим работать локально и через ssh.Что можно делать с llm

продолжить чтение

ИИ-модели научили играть в «Мафию» друг с другом в рамках открытого проекта

Разработчик с ником Guzus представил сайт, где большие языковые модели могут сыграть в игру «Мафия». Ресурс предлагает турнирную таблицу с результатами игр и распределением ролей, а также их стенограммы.

продолжить чтение

Праздник продолжается: LLM на FreeBSD

Совсем недавно Microsoft выложила в публичный доступ очень интересный проект, позволяющий запускать большие языковые модели на одном только CPU, без использования GPU и CUDA. Разумеется автор не смог пройти мимо такого шанса и запустил это на самом обычном ноутбуке с FreeBSD.

продолжить чтение

Rambler's Top100