98% дефляции за 33 месяца: токены LLM дешевеют быстрее, чем когда-то транзисторы
Недавно Google выпустила Gemini 3 Flash с соотношением цена/производительность в 4-9 раз лучше других передовых моделей (зависит от показателей ИИ и цены на API). Венчурный инвестор Томаш Тунгуз (партнер Theory Ventures) посчитал, что это означает для рынка: стоимость "единицы интеллекта" упала на 98% за 33 месяца. Для расчетов он использовал метрику "цена за балл качества" — сколько стоит получить одну условную единицу производительности на бенчмарках. У GPT-4 в марте 2023 года это было $65, у Gemini 3 Flash сейчас — $1,10.
Дайджест по некоторым научным новостям из МФТИ за последние 2 месяца
В августе этого года я начал выкладывать свои релизы по научным статьям, которые делаю для МФТИ, на Хабр. Эти релизы представляют из себя особый жанр статей: это подробные пересказы содержания научных статей и исследований российских ученых, содержание которых они сами одобрили и в большинстве случаев отредактировали.
Nvidia лицензирует технологии конкурента Groq на рынке чипов для ИИ и наймёт его генерального директора
Nvidia заключила неисключительное лицензионное соглашение со своим конкурентом на рынке чипов для искусственного интеллекта — Groq. В рамках сделки Nvidia наймёт основателя Groq Джонатана Росса, президента Санни Мадру и ряд других сотрудников.
От текста к токенам: как работают пайплайны токенизации
Команда AI for Devs подготовила перевод статьи о том, как поисковые системы превращают обычный текст в токены и почему этот процесс важнее, чем кажется. Разбираем каждый этап: нормализацию, токенизацию, стоп-слова, стемминг и то, как всё это влияет на качество поиска.Когда вы вводите предложение в строку поиска, легко представить, что поисковая система видит то же самое, что и вы. На самом деле поисковые системы (или поисковые базы данных

