llm. - страница 167

llm.

Попытка поставить идеи и гипотезы на поток – швейцарский нож для стартапов

Привет, меня зовут Кирилл! Мы с друзьями давно увлекаемся идеями и экспериментами «в стол». Знакомо, когда возникает куча интересных мыслей, но потом они теряются, потому что сложно понять — кому это на самом деле нужно?

продолжить чтение

«Кошачья атака» на модель рассуждений показывает, насколько важна контекстная инженерия

Исследовательская группа обнаружила, что даже такие простые фразы, как «кошки спят большую часть своей жизни», могут существенно нарушить работу продвинутых моделей логического мышления, увеличив количество ошибок в три раза.

продолжить чтение

Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач

Японский стартап в области искусственного интеллекта Sakana AI разработал новый метод, который позволяет нескольким большим языковым моделям, таким как ChatGPT и Gemini, совместно решать одну и ту же задачу. Предварительные тесты показывают, что такой совместный подход превосходит работу отдельных моделей.

продолжить чтение

От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей

продолжить чтение

KoboldCpp — нейросеть для развлечений и работы у нас дома

продолжить чтение

Георгий Герганов, автор llama.cpp и звукового кейлогера

Многие пользуются YouTube, Netflix, но не подозревают о ключевых опенсорсных программах типа ffmpeg, которые работают на бэкенде этих сервисов. Похожая ситуация с нейронками, где многие знают программу Ollama

продолжить чтение

Почему Telegram может стать новым лидером в гонке ИИ

В гонке искусственного интеллекта доминируют гиганты с огромными вычислительными ресурсами — OpenAI, Google, Meta. Однако Telegram, благодаря сочетанию технологических активов, уникальных данных и амбициозного видения основателей, обладает шансами совершить прорыв. Как заявляет Павел Дуров: его брат Николай работает над «настоящим ИИ», способным «логически мыслить и понимать мир». В этой статье я напишу неочевидные потенциальные возможности мессенджера, которые могут обеспечить компании лидерство в AI и будущем AGI.

продолжить чтение

Text-to-LoRA: мгновенная адаптация трансформеров

😎 Следуй за белым кроликом 💊📌 Telegram @TheWeeklyBrief — краткие обзоры и подкасты 📰🎧🐇📌 GitHub Pages — углублённый разбор статей, ныряем в кроличью нору 📝💻🐾АннотацияИсследователи Sakana AI разработали Text-to-LoRA (T2L)

продолжить чтение

Как работают серверы MCP: компоненты, логика и архитектура

Закулисный взгляд на основные компоненты серверов MCP — от обработки запросов и управления сессиями до кеширования и хранилищ контекста.Современные ассистенты на базе искусственного интеллекта (ИИ) столь же эффективны, насколько развитыми данными и инструментами они располагают.КДПВ, но в тему

продолжить чтение

Разработка языков программирования в эру больших языковых моделей: ренессанс посредственности?

В исследовании языков программирования меня всегда наиболее привлекала их разработка.Когда аккуратно мастеришь язык программирования, синтаксис и семантика которого тщательно подогнаны под конкретную предметную область, ты как программист должен предоставить конечным пользователям интерфейс, полностью согласующийся с наработанной ими интуицией и их устоявшимися привычками. Так пользователи языка смогут сосредоточиться на интересных аспектах стоящих перед ними задач и браться за более крупные и сложные проекты.

продолжить чтение