Mistral випустив OCR 4: не просто розпізнавання, а розбір документа

2 хв. читання
Mystery Box до 500 USDC
BINANCE • до 26.06
Mystery Box до 500 USDC
Запрошуй друзів на Binance — збирай бокси
Приєднатися

Що сталося

23 червня 2026 року Mistral AI випустила OCR 4 — модель «документного інтелекту», яка не просто витягує текст із файлів, а повертає структуру документа цілком. Модель доступна за API під іменем mistral-ocr-latest.

Деталі

  • Не текст, а структура. OCR 4 віддає координати блоків (bounding boxes), класифікує їх за типами (заголовки, таблиці, формули, підписи тощо), проставляє оцінку впевненості за кожним словом і сторінкою та видає результат у вигляді структурованого markdown. Підтримуються PDF, DOC, PPT і OpenDocument.
  • Мови. 170 мов у 10 мовних групах.
  • Ціни. $4 за 1000 сторінок через звичайний API; $2 за 1000 сторінок у Batch API (знижка 50%); $5 за 1000 сторінок у режимі Document AI (на дату анонсу, 23 червня).
  • Бенчмарки. 85,20 на OlmOCRBench (найкращий результат у тесті) і 93,07 на OmniDocBench; у сліпих порівняннях незалежні оцінювачі віддавали перевагу OCR 4 перед іншими провідними системами із середнім показником перемог близько 72%.
  • Де доступно. Mistral Studio, Amazon SageMaker, Microsoft Foundry, на підході — Snowflake; для вимог до приватності даних є self-hosting.

Що це означає

Стосується насамперед розробників і команд, які будують на документах: RAG-пошук по базі знань, обробку рахунків і договорів, оцифрування архівів. Практична різниця зі звичайним OCR — у тому, що модель віддає не «простирадло тексту», а розмічену структуру з координатами та оцінкою впевненості: це різко спрощує подальшу автоматизацію та перевірку результату, де раніше доводилося дописувати власні парсери. Конкретна економіка: $2–5 за 1000 сторінок робить масову обробку документів доступною навіть невеликим проєктам, а self-hosting знімає питання з конфіденційними даними. Горизонт — одразу: модель уже в API на кількох платформах, спробувати можна сьогодні. Бенчмарки та заявлені 72% переваг — заявка вендора, реальну якість варто перевіряти на своїх документах.

Mystery Box до 500 USDC
BINANCE • до 26.06
Mystery Box до 500 USDC
Запрошуй друзів на Binance — збирай бокси
Приєднатися
Поділитися
Зв'язатися:
Крипто- та data-аналітик, інженер-програміст (факультет комп'ютерних наук ХНУРЕ). В IT з 2008 року: адміністрував корпоративний моніторинг у «Vodafone Україна», сім років розробляв і просував веб-проєкти, п'ять років керував маркетингом на метриках — конверсія, CTR, ROI, LTV.Криптовалютними ринками займаюся з 2021 року: ончейн-метрики, токеноміка, макроекономічні індикатори. Розробив власну data-driven модель аналізу ринку на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математична статистика та EDA; збір і звірку даних автоматизую AI-агентами.Принцип — «Don't trust, verify»: кожна цифра перевірена за першоджерелом, ключові — щонайменше за двома незалежними; прогнози — лише сценарії з умовами. Теза без даних не публікується.