Эффективный инференс множества LoRA адаптеров
LoRA — популярный метод дообучения больших моделей на небольших датасетах, однако на этапе инференса низкоранговые адаптеры работают неэффективно, а их объединение с весами требует хранения отдельной полной копии модели для каждого адаптера. MultiLoRA решает эту проблему, позволяя одновременно выполнять инференс с несколькими адаптерами на основе одной базовой модели. В статье мы сравним производительность MultiLoRA-инференса в двух популярных фреймворках — vLLM и TensorRT-LLM
Студия на базе ИИ Prehype планирует запускать 100 тысяч стартапов в год
Датский инвестор Хенрик Верделин, который помогает предпринимателям создавать крупные бренды, такие как Barkbox, заявил, что планирует масштабировать работу с помощью искусственного интеллекта. Объединение его студии стартапов Prehype с нью-йоркской ИИ-компанией Audos позволит запускать не «десятки», а «сотни тысяч» стартапов ежегодно, уверен предприниматель.
Xiaomi представила умные очки AI Glasses
Xiaomi презентовала умные очки AI Glasses. Они весят всего 40 г и позиционируются как инструмент для повседневных задач с использованием искусственного интеллекта.
Адаптация по-арабски: технологии для печати этикеток товаров
Меня зовут Сергей Меркулов и я старший консультант Fix Price. Наши магазины работают уже в 10 странах мира. И это значит, что каждый товар, который представлен на наших полках в зарубежных магазинах, обязательно имеет этикетку на иностранном языке. Для понимания масштабов: в нашей сети примерно 32 тысячи наименований локальных кодов (или SKU, то есть единиц складского учета). В среднем у одного локального кода — 3 штрихкода. То есть фактически у нас 96 000 различных этикеток! И сегодня я расскажу вам о том, как мы научились эффективно работать с ними на рынке ОАЭ.Об особенностях перевода
В какой момент у младенцев пробуждается сознание?
Ответ на вопрос о том, когда возникает сознание, глубоко связан с главной загадкой: чем оно на самом деле является и как его можно измеритьДжеффри Лоусон родился недоношенным в феврале 1985 года. Вскоре после этого новорождённому пришлось перенести операцию на сердце без анестезии. Он оставался в сознании на протяжении всей операции, и ему дали только павулон, мышечный релаксант, чтобы он не двигался. Через пять недель он умер.
Треть века в ящике. За что мы всё еще любим электронную почту и почему она будет жить вечно?
Глубокая ночь, ритмичный перестук набирающего номер модема в тишине. Ароматный пар из кружки только что сваренного кофе — нужно сохранить бодрость до рассвета, когда закончится действие льготного ночного тарифа. Из динамика раздается пронзительный писк, шипение, и значок E-Type Dialer наконец зеленеет — я запускаю Outlook Express, чтобы проверить почту. Так начинался каждый мой сеанс работы в интернете двадцать семь лет назад. Впрочем, примерно так же он начинается и сейчас, разве что вместо стандартного почтового клиента из Windows 98 у меня теперь Thunderbird. Скорости соединения многократно выросли, до неузнаваемости изменился софт, да и интернет стал совсем другим, но электронная почта по-прежнему остается основным средством общения для миллионов юзеров, живущих в разных уголках планеты, — несмотря на появление соцсетей и всех этих «Телеграммов» с «Вотсапами». И, кажется, я знаю причину её долголетия.
Гонка терабайт: как изменятся объемы SSD-накопителей к 2027 году
В 2024 году рынок SSD-накопителей вступил в новую фазу развития — SK Hynix и Samsung представили накопители с объемом 61,44 ТБ, а Solidigm начала продажи SSD D5-P5336 рекордной емкостью 122,88 ТБ.Попытки создать сверхъемкие SSD предпринимались и раньше. В 2018 году компания Nimbus Data анонсировала ExaDrive DC100 — накопитель емкостью 100 ТБ для корпоративного сегмента, который начал продаваться в 2020 году. Однако его цена в 40 000 долларов и ограниченная доступность сделали его скорее технологической демонстрацией, чем массовым продуктом. Сегодня же высокоемкие SSD становятся всё более доступными.
