πŸ‹ DeepSeek выпустили DeepSeek-OCR 2 - Π½ΠΎΠ²ΠΎΠ΅ ΠΏΠΎΠΊΠΎΠ»Π΅Π½ΠΈΠ΅ OCR с Π²Ρ‹ΡΠΎΡ‡Π°ΠΉΡˆΠΈΠΌ качСством

πŸ‹ DeepSeek выпустили DeepSeek-OCR 2 - Π½ΠΎΠ²ΠΎΠ΅ ΠΏΠΎΠΊΠΎΠ»Π΅Π½ΠΈΠ΅ OCR с Π²Ρ‹ΡΠΎΡ‡Π°ΠΉΡˆΠΈΠΌ качСством

DeepSeek прСдставили DeepSeek-OCR 2 - 3B модСль для ΠΏΡ€ΠΎΠ΄Π²ΠΈΠ½ΡƒΡ‚ΠΎΠ³ΠΎ понимания ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² ΠΈ OCR, которая Π²Ρ‹Ρ…ΠΎΠ΄ΠΈΡ‚ Π½Π° ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ SOTA.

ΠšΠ»ΡŽΡ‡Π΅Π²Π°Ρ Π½ΠΎΠ²ΠΈΠ½ΠΊΠ° - DeepEncoder V2.

Π’ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ классичСских vision LLM, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Β«Ρ‡ΠΈΡ‚Π°ΡŽΡ‚Β» ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ сСтку (слСва-Π½Π°ΠΏΡ€Π°Π²ΠΎ, свСрху-Π²Π½ΠΈΠ·), DeepEncoder V2 Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π±Π»ΠΈΠΆΠ΅ ΠΊ Ρ‚ΠΎΠΌΡƒ, ΠΊΠ°ΠΊ Ρ‡ΠΈΡ‚Π°Π΅Ρ‚ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ:

- Π‘Π½Π°Ρ‡Π°Π»Π° формируСтся глобальноС ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ изобраТСния

- Π—Π°Ρ‚Π΅ΠΌ модСль опрСдСляСт логичСский порядок чтСния β€” Ρ‡Ρ‚ΠΎ Π²Π°ΠΆΠ½ΠΎ ΠΏΠ΅Ρ€Π²Ρ‹ΠΌ, Ρ‡Ρ‚ΠΎ дальшС

Π§Ρ‚ΠΎ это Π΄Π°Ρ‘Ρ‚ Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅

πŸ“„ Π›ΡƒΡ‡ΡˆΠ΅ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ со слоТными ΠΌΠ°ΠΊΠ΅Ρ‚Π°ΠΌΠΈ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ²

πŸ“Š ΠšΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Ρ‡ΠΈΡ‚Π°Π΅Ρ‚ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹

🧾 БвязываСт подписи ΠΈ значСния

πŸ“° ΠŸΠΎΠ½ΠΈΠΌΠ°Π΅Ρ‚ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ ΠΈ структурированный тСкст

πŸ”€ НадёТнСС ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ смСсь тСкста ΠΈ Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎΠΉ структуры

По качСству

- ΠžΠ±Ρ…ΠΎΠ΄ΠΈΡ‚ Gemini 3 Pro Π½Π° рядС Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠΎΠ²

- Π”Π°Ρ‘Ρ‚ >4% прироста ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с ΠΏΡ€ΠΎΡˆΠ»ΠΎΠΉ вСрсиСй DeepSeek-OCR

И это ΠΏΡ€ΠΈ Ρ€Π°Π·ΠΌΠ΅Ρ€Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ всСго 3B ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ².

МоТно Π·Π°ΠΏΡƒΡΠΊΠ°Ρ‚ΡŒ ΠΈ Π΄ΠΎΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ

Π’Π΅ΠΏΠ΅Ρ€ΡŒ DeepSeek-OCR 2 ΠΌΠΎΠΆΠ½ΠΎ ΡƒΠ΄ΠΎΠ±Π½ΠΎ Π·Π°ΠΏΡƒΡΠΊΠ°Ρ‚ΡŒ ΠΈ fine-tune Ρ‡Π΅Ρ€Π΅Π· Unsloth ΠΏΠΎ Π³ΠΎΡ‚ΠΎΠ²ΠΎΠΌΡƒ Π³Π°ΠΉΠ΄Ρƒ.

πŸ”— Guide: https://unsloth.ai/docs/models/deepseek-ocr-2

πŸ”— Model: https://huggingface.co/deepseek-ai/DeepSeek-OCR-2

πŸ”— Github: https://github.com/deepseek-ai/DeepSeek-OCR-2/tree/main

πŸ”— Paper: https://github.com/deepseek-ai/DeepSeek-OCR-2/blob/main/DeepSeek_OCR2_paper.pdf

ΠΠ°Ρ‡Π°Ρ‚ΡŒ Π΄ΠΈΡΠΊΡƒΡΡΠΈΡŽ