llm.

Попытка поставить идеи и гипотезы на поток – швейцарский нож для стартапов

Привет, меня зовут Кирилл! Мы с друзьями давно увлекаемся идеями и экспериментами «в стол». Знакомо, когда возникает куча интересных мыслей, но потом они теряются, потому что сложно понять — кому это на самом деле нужно?

продолжить чтение

Оставлено в

«Кошачья атака» на модель рассуждений показывает, насколько важна контекстная инженерия

Исследовательская группа обнаружила, что даже такие простые фразы, как «кошки спят большую часть своей жизни», могут существенно нарушить работу продвинутых моделей логического мышления, увеличив количество ошибок в три раза.

продолжить чтение

Оставлено в

Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач

Японский стартап в области искусственного интеллекта Sakana AI разработал новый метод, который позволяет нескольким большим языковым моделям, таким как ChatGPT и Gemini, совместно решать одну и ту же задачу. Предварительные тесты показывают, что такой совместный подход превосходит работу отдельных моделей.

продолжить чтение

Оставлено в

От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей

продолжить чтение

Оставлено в

KoboldCpp — нейросеть для развлечений и работы у нас дома

продолжить чтение

Оставлено в

Георгий Герганов, автор llama.cpp и звукового кейлогера

Многие пользуются YouTube, Netflix, но не подозревают о ключевых опенсорсных программах типа ffmpeg, которые работают на бэкенде этих сервисов. Похожая ситуация с нейронками, где многие знают программу Ollama

продолжить чтение

Оставлено в

Почему Telegram может стать новым лидером в гонке ИИ

В гонке искусственного интеллекта доминируют гиганты с огромными вычислительными ресурсами — OpenAI, Google, Meta. Однако Telegram, благодаря сочетанию технологических активов, уникальных данных и амбициозного видения основателей, обладает шансами совершить прорыв. Как заявляет Павел Дуров: его брат Николай работает над «настоящим ИИ», способным «логически мыслить и понимать мир». В этой статье я напишу неочевидные потенциальные возможности мессенджера, которые могут обеспечить компании лидерство в AI и будущем AGI.

продолжить чтение

Оставлено в

Text-to-LoRA: мгновенная адаптация трансформеров

😎 Следуй за белым кроликом 💊📌 Telegram @TheWeeklyBrief — краткие обзоры и подкасты 📰🎧🐇📌 GitHub Pages — углублённый разбор статей, ныряем в кроличью нору 📝💻🐾АннотацияИсследователи Sakana AI разработали Text-to-LoRA (T2L)

продолжить чтение

Оставлено в

Как работают серверы MCP: компоненты, логика и архитектура

Закулисный взгляд на основные компоненты серверов MCP — от обработки запросов и управления сессиями до кеширования и хранилищ контекста.Современные ассистенты на базе искусственного интеллекта (ИИ) столь же эффективны, насколько развитыми данными и инструментами они располагают.КДПВ, но в тему

продолжить чтение

Оставлено в

Разработка языков программирования в эру больших языковых моделей: ренессанс посредственности?

В исследовании языков программирования меня всегда наиболее привлекала их разработка.Когда аккуратно мастеришь язык программирования, синтаксис и семантика которого тщательно подогнаны под конкретную предметную область, ты как программист должен предоставить конечным пользователям интерфейс, полностью согласующийся с наработанной ими интуицией и их устоявшимися привычками. Так пользователи языка смогут сосредоточиться на интересных аспектах стоящих перед ними задач и браться за более крупные и сложные проекты.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

llm.

Попытка поставить идеи и гипотезы на поток – швейцарский нож для стартапов

«Кошачья атака» на модель рассуждений показывает, насколько важна контекстная инженерия

Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач

От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей

KoboldCpp — нейросеть для развлечений и работы у нас дома

Георгий Герганов, автор llama.cpp и звукового кейлогера

Почему Telegram может стать новым лидером в гонке ИИ

Text-to-LoRA: мгновенная адаптация трансформеров

Как работают серверы MCP: компоненты, логика и архитектура

Разработка языков программирования в эру больших языковых моделей: ренессанс посредственности?