языковые модели.

Сокращения в IT: разбираемся, в чём виноват искусственный интеллект

Статью для Minervasoft написала фронтенд-разработчик. В своем исследовании она опиралась на официальные новости, статистику, мнения людей с форумов и свой профессиональный опыт.ИИ берёт на себя рутину, снижает ошибки и помогает компаниям уменьшать расходы — в теории.

продолжить чтение

Оставлено в

ИИ, экономика и найм в IT: разбираемся, что происходит на рынке

Статью для Minervasoft написала фронтенд-разработчик. В своем исследовании она опиралась на официальные новости, статистику, мнения людей с форумов и свой профессиональный опыт.ИИ берёт на себя рутину, снижает ошибки и помогает компаниям снижает расходы — так объясняют сокращения западные корпорации.

продолжить чтение

Оставлено в

Новый метод подсказок повышает точность и проверяемость ответов языковых моделей

Новый метод подсказок под названием «Highlighted Chain of Thought» (Выделенная цепочка мыслей)(HoT) помогает большим языковым моделям лучше объяснять свои рассуждения и упрощает проверку их ответов людьми. Подход работает в два этапа: во-первых, AI переформулирует исходный вопрос и отмечает важные факты с помощью XML-тегов. Затем он генерирует ответ, который ссылается на эти выделенные факты, создавая четкие связи между вопросом и ответом.

продолжить чтение

Оставлено в

Русскоязычные LLM: отечественные разработки в сравнении с глобальными адаптациями

Современные языковые модели (они же LLM, они же Large Language Models) становятся все более востребованными практически во всех сферах. LLM уже не просто инструмент, а важнейшая часть технологического прогресса, позволяющая автоматизировать работу с текстами, проводить анализ данных, генерировать контент и даже серьезно помогать в обучении.

продолжить чтение

Оставлено в

BotHub, GPTunnel, Chad AI — считаем где ChatGPT дешевле в России

Сейчас на фоне стремительной популяризации нейросетей, в России появилось достаточно много сервисов и агрегаторов, обеспечивающих удобный доступ к популярным языковым моделям без использования VPN. Однако при выборе подходящего решения мы зачастую сталкиваемся с проблемой разношерстной тарификация: у одних внутренняя валюта, у других стоимость за слова, третьи считают символы или количество токенов в запросе.

продолжить чтение

Оставлено в

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке

В недавно опубликованных данных Deepseek говорится о том, что языковые модели могут приносить ощутимую выгоду, даже если их стоимость будет ниже, чем у OpenAI.Компания Deepseek предоставила

продолжить чтение

Оставлено в

T-Банк выходит на арену: разбираем T-Lite и T-Pro в боевых условиях

продолжить чтение

Оставлено в

Grok 3 бета — эпоха «думающих» агентов

Grok 3 — это последняя серия моделей компании xAI Илона Маска. Представленная 17 февраля 2025 года, эта модель была обучена с использованием суперкомпьютера Colossus, оснащенного около 200 000 графических процессоров Nvidia H100, что в десять раз превышает вычислительные мощности, использованные для предыдущей версии Grok 2.Согласно результатам бенчмарков, представленным xAI, Grok 3 превосходит другие передовые модели, такие как GPT-4o, Claude 3.5 Sonnet, Gemini-2 Pro и DeepSeek-V3, в областях математики, программирования и научных исследований.

продолжить чтение

Оставлено в

Языковые модели могут перегружать себя мыслями и застревать в бесконечных циклах мыслей

Новое исследование выявило неожиданную слабость языковых моделей: они могут зацикливаться на мышлении вместо действия, особенно в интерактивных средах. Эта тенденция к чрезмерному размышлению может значительно повредить их производительности, даже несмотря на то, что эти модели специально разработаны для рассуждений. Исследователи из нескольких университетов США и ETH Zurich разработали методы для измерения и решения этой проблемы в интерактивных сценариях, называемых «агентными задачами».

продолжить чтение

Оставлено в

«Темпоральные головы» в языковых моделях: новые возможности для AI

Исследование ученых из Korea University, Upstage AI и AIGEN Sciences выявило специализированные компоненты в больших языковых моделях, которые обрабатывают информацию, зависящую от времени. Эти «темпоральные головы» играют решающую роль в том, как системы AI обрабатывают факты, которые меняются со временем.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

языковые модели.

Сокращения в IT: разбираемся, в чём виноват искусственный интеллект

ИИ, экономика и найм в IT: разбираемся, что происходит на рынке

Новый метод подсказок повышает точность и проверяемость ответов языковых моделей

Русскоязычные LLM: отечественные разработки в сравнении с глобальными адаптациями

BotHub, GPTunnel, Chad AI — считаем где ChatGPT дешевле в России

Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке

T-Банк выходит на арену: разбираем T-Lite и T-Pro в боевых условиях

Grok 3 бета — эпоха «думающих» агентов

Языковые модели могут перегружать себя мыслями и застревать в бесконечных циклах мыслей

«Темпоральные головы» в языковых моделях: новые возможности для AI

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

языковые модели.