PDF. - страница 2

PDF.

Docling in Working with Texts, Languages, and Knowledge

Docling in Working with Texts, Languages, and KnowledgeHi everyone. In the context of our research project, we were solving the problem of automating academic submission workflows, which led us to discover a platform called Docling.Together, we explore the role of Docling in reshaping how research data can be represented, reused, and reasoned over in both human and machine-readable formats.

продолжить чтение

ТОП-5 сервисов и программ для бесплатного редактирования PDF-файлов

Ранее мы уже писали о нейросетях для бесплатного анализа PDF-документов. Рекомендуем ознакомиться — ссылка ниже!Перейти к статье!

продолжить чтение

Топ-5 нейросетей для работы с PDF: модели для бесплатного извлечения данных в 2025 году

Уже не сосчитать, сколько раз мы пытались найти в 50-страничном PDF всего одну цифру

продолжить чтение

Сверхспособность LLM в понимании документа, сконвертированного в текст с ошибками — или почему наш RAG работает

Недавно я столкнулся с интересным поведением языковой модели, которое меня по-настоящему удивило, и хочу поделиться этим наблюдением с сообществом.

продолжить чтение

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса

Ян Лекун, один из крёстных отцов современного ИИ, в своём твиттере резко критикует корпоративных исследователей ИИ, которые ведут проприетарные разработки и занимаются «нагнетанием страха». Среди этих людей называются Сэм Альтман (OpenAI), Демис Хассабис (Google DeepMind) и Дарио Амодеи (Anthropic) Ян Лекун (Yann LeCun) — французский и американский учёный в области машинного обучения и компьютерного зрения. Известен как автор легендарной системы LeNet (1989 г.), где одним из первых начал применять методы биологических нейронных сетей для оптического распознавания символов (OCR). Сейчас занимает должность вице-президента и ведущего исследователя ИИ в корпорации Meta (руководит разработкой опенсорсной языковой модели LLaMA, в том числе). При этом остаётся ярым приверженцем опенсорса, свободной науки и научно-технического прогресса человечества.

продолжить чтение

RAG без эмбеддингов для энтерпрайза (опыт ИИ-чемпионата)

Как я отказался от оверинжиниринга и переместился с 30 места на 7 в Enterprise RAG Challenge. И чего не хватило до 1 места.Сейчас облась ИИ – дикий запад. Никто не знает, как правильно решать задачи, а результаты экспериментов лежат приватными под NDA. Тем ценнее, когда кто-то делится реальным опытом с разбором деталей и подводных камней. Так что делюсь с хабром своей мартовской статьей про участие в Enterprise RAG Challenge от Рината LLM под капотомЕсли вы интересуетесь разработкой продуктов поверх LLM и RAG системами в частности, то обязательно прочитайте статью Ильи

продолжить чтение

История Adobe. Как математик и IT специалист решили одну из самых раздражающих проблем в компьютерном мире

продолжить чтение

Боремся с водяными знаками Gamma AI на бесплатном тарифе

Все мы любим инструменты, которые упрощают жизнь. Gamma AI – один из них, особенно когда нужно быстро сделать презентацию. Но бесплатный сыр, как известно, бывает только в мышеловке, и в случае Gamma AI этим "сыром" становится водяной знак на PDF. Мелочь, а неприятно. Да и показать такое преподу такое себе… В общем, я решил, что с этим надо что-то делать.Так родился Gamma AI Watermark Remover

продолжить чтение

Microsoft Edge вскоре сможет быстрее загружать PDF в Windows 11 на недорогих ПК

В 2023 году Microsoft начала переводить средство чтения PDF в Microsoft Edge на технологию на основе Adobe. Однако на недорогих ПК оно работало всё ещё достаточно медленно, поэтому инструмент ожидают дополнительные улучшения.

продолжить чтение

12
Rambler's Top100