Машинное обучение. - страница 7

Как я пытался сжимать смыслы вместо байтов

Два часа ночи. Я пытаюсь впихнуть документацию проекта в контекст Claude. 847 страниц. Где-то 1.2 миллиона токенов. Контекстное окно — 200 тысяч.Делаю то, что делают все: режу, суммаризирую, выбрасываю «неважное». Каждый раз теряю что-то критичное. Это уже третий час, кофе кончился, и в голову приходит идея, которая кажется гениальной.Спойлер: она такой не была.

продолжить чтение

Нейросети в Телеграм: полезные боты и сервисы с нейросетями и ИИ-инструментами

продолжить чтение

ИИ решил задачу Эрдёша — но есть нюанс

DeepMind прогнали своего агента Aletheia по 700 открытым задачам из списка Эрдёша. Результат: одна из них теперь закрыта — это вторая математическая проблема, решённая ИИ без участия человека. Теренс Тао уже обновил трекер.Но давайте на цифры. Агент вернул 212 «уверенных» ответов. После проверки людьми: — 137 (68,5%) — фундаментально ошибочны — 13 (6,5%) — реально решают то, что имел в виду ЭрдёшКаждый шестнадцатый. Остальное — галлюцинации или решение не той задачи.Авторы честно пишут: «Любой из этих вопросов мог бы легко решить нужный эксперт». Проблема не в сложности — до этих задач у людей просто не доходили руки 40 лет.

продолжить чтение

Машинное обучение для работы с текстами: подборка бесплатных курсов и материалов

Привет! Это Данила Ляпин, наставник курса «Специалист по Data Science». Собрал подборку материалов по обработке естественного языка — она охватывает путь от базовых концепций NLP до трансформеров и BERT. Все материалы бесплатны и проверены на практике. Главное — двигаться последовательно, не пропускать основы и обязательно практиковаться на реальных задачах.Сourse in Natural Language Processing, YSDA

продолжить чтение

QAD от NVIDIA: разбираюсь, почему 4-битная квантизация перестала всё ломать

На прошлой неделе NVIDIA выложила отчёт про QAD и я его проигнорировал. Потому что каждый месяц кто-то "решает квантизацию" и каждый раз на практике всё не так радужно.Но потом коллега скинул табличку с AIME и я залип.Контекст такой. У нас на проде крутится модель на FP8, всё более-менее ок, но менеджмент хочет запихнуть 49B модель туда, где сейчас живёт 20B. Потому что "ну там же Blackwell, там же FP4, давайте". Я месяц назад попробовал наивно квантизовать в 4 бита — модель начала нести пургу на математике. Не сильно, но заметно. Закрыл тему, сказал что FP4 не готов.И тут этот отчёт.Что вообще происходит

продолжить чтение

OpenAI анонсировала три революции: персональный врач, умный ассистент и новая эра мышления

Пока все отвлечены драмой в руководстве, OpenAI тихо запустила функции, которые могут изменить здравоохранение и уничтожить офисную работу

продолжить чтение

Пока Microsoft ждёт до 2030 года ядерную энергию, Илон Маск построил 55 000 GPU в Мемфисе за 19 дней

Как одна экосистема контролирует производство энергии, спутниковую связь и вычислительную мощность ИИ, пока Google ждёт до 2030 года, и почему на фоне этого Standard Oil выглядит мелочьюИсточник: Michael Dell - фото дата-центра

продолжить чтение

ИИ-агенты создали свой «сайт для взрослых» MoItHub с контентом для ИИ-ботов

Вышел аналог PornHub для нейросетей. ИИ-агенты сделали сайт для себя под названием MoItHub

продолжить чтение

Топ-14 бесплатных нейросетей для генерации и создания видео с помощью ИИ в 2026 году

продолжить чтение

«Т-Банк» открыл новый набор на программу «Мини-CEO» для студентов и выпускников вузов

«Т-Банк» запустил новый набор на программу карьерного развития «Мини-CEO». Это карьерная программа, где студенты и выпускники вузов работают под прямым руководством топ-менеджеров над стратегически важными проектами компании. Участие в программе оплачивается и длится шесть месяцев. Программа включает индивидуальную работу над масштабным проектом с регулярными личными встречами с наставником уровня вице-президента.

продолжить чтение

1...5678910...2030...335
Rambler's Top100