|   |   | 
| 
 | Практический опыт OCR распознавания с использованием CuneiForm | ☑ | ||
|---|---|---|---|---|
| 0
    
        25-11 24.12.19✎ 15:03 | 
        Поделитесь опытом. Если, например, имеется фотография паспорта, сделанная мобильным телефоном, удаётся ли определить, что это именно паспорт? И корректно распознать ФИО владельца и номер?     | |||
| 1
    
        Кирпич 24.12.19✎ 15:07 | 
        (0) Паспорт закрыт или открыт?     | |||
| 2
    
        Кирпич 24.12.19✎ 15:10 | ||||
| 3
    
        Юрий Лазаренко 24.12.19✎ 15:14 | 
        (0) Корректно распознать - получится. Определить, что это паспорт - вряд ли.     | |||
| 4
    
        palsergeich 24.12.19✎ 15:16 | 
        ABBYY на сколько я помню разпознает тип документа и данные в нем.
 Но стоит как самолет | |||
| 5
    
        palsergeich 24.12.19✎ 15:18 | 
        А по поводу сабжа -не знаю, не трогал     | |||
| 6
    
        25-11 24.12.19✎ 15:34 | 
        (4) Ну да, поэтому пока рассматриваются бесплатные компоненты. 
 (2) он-лайн сервисы всё равно, наверное, попросят довольно много денег, если нужно распознать, например, большой архив - несколько десятков тысяч, к примеру. | |||
| 7
    
        25-11 24.12.19✎ 16:30 | 
        (6) Не, вроде - копейки... Гугл 1.5 доллара за 1000 штук. Лучше, наверное, копать в этом направлении     | |||
| 8
    
        Fish гуру 24.12.19✎ 16:33 | 
        (7) А закон о защите персональных данных - лесом?     | |||
| 9
    
        25-11 24.12.19✎ 17:29 | 
        (8) В этой части не совсем понятно... Ессно, контора имеет согласие каждого на обработку перс. данных. А распознавание - это же обработка. Или при этом важно какой сервис используется?     | |||
| 10
    
        Krendel 24.12.19✎ 17:32 | 
        (9) А гугл будет распозновать на Российских мощностях или штатовских?     | |||
| 11
    
        25-11 24.12.19✎ 17:54 | 
        (10) Т.е. это важно? А яндекс-облаку можно отдать на распознавание? Тоже ведь серверы где-то там...     | |||
| 12
    
        Djelf 24.12.19✎ 18:22 | 
        Интересная коллекция у (6) в несколько десятков тысяч сканов паспортов...
 На такую коллекцию жаба душит FineReader купить? | |||
| 13
    
        25-11 24.12.19✎ 20:08 | 
        (12) А finereader чем-то лучше, чем бесплатный CuneiForm? Его тоже можно программно из 1С использовать?     | |||
| 14
    
        Лефмихалыч 24.12.19✎ 20:47 | 
        (0) во-первых, эту поделину хрен заставишь работать. Можно, но затрахаешься.
 Во-вторых, она распознает только буквы (некоторые) и скажет "я все, дальше сами". В-третьих, если паспорт вверх ногами или немного под углом или это фотка ксерокопии или ... короче получишь 30% букв с точностью до 30%, перед этим (см пункт 1) изрядно вспотев. есть сервисы (в т.ч. российские), которые совмещают OCR c ИИ, умеют переворачивать, определять тип документа и т.д. и т.п. Вот с ними надо дружить. А эти все куни-куюни - это залепа и шляпа. | |||
| 15
    
        Лефмихалыч 24.12.19✎ 20:47 | 
        яндекс тот же вижн, или гугл, или маилру или еще 100500 их разных     | |||
| 16
    
        Лефмихалыч 24.12.19✎ 20:48 | 
        (4) если сравнить с полной стоимостью курятника, который распознает вручную, то не такой уж и самолёт.     | |||
| 17
    
        Djelf 24.12.19✎ 21:47 | 
        (13) Сравни и доложи потом в этой теме.     | |||
| 18
    
        25-11 24.12.19✎ 23:09 | 
        (17) Я всё-таки сейчас больше гляжу в сторону он-лайн сервисов. Лефмихалыч - голова (14) 
 И вообще 1С подключать уже потом. Пусть какой-нибудь питоновский, наверное, распознаватель аккуратно всё разложит в структурированном виде. А уж затем 1С это всё читает. | |||
| 19
    
        Провинциальный 1сник 24.12.19✎ 23:56 | 
        (13) Вообще даже бесплатный (идущий в комплекте со сканером) finereader sprint распознает заметно качественнее, чем cuneiform. Но спринт не умеет неинтерактивного или пакетного режима, так что для автоматизации ввода в программу не годится.     | |||
| 20
    
        Злопчинский 25.12.19✎ 00:56 | 
        млин... на инфостарте в поиске набрать слово паспорт лень
 http://catalog.mista.ru/public/1164721/ | |||
| 21
    
        uzerp2 25.12.19✎ 10:20 | 
        вот здесь по распознаванию зоны MRZ паспорта описано
 https://www.pyimagesearch.com/2015/11/30/detecting-machine-readable-zones-in-passport-images/ (сам не пробовал этот проект, но некоторые вещи этого чувака поднимал на питоне, замечаний не было) | |||
| 22
    
        Djelf 25.12.19✎ 10:43 | 
        (18) Онлайн паспорта распознавать как то не айс... 
 В принципе CuneiForm нормально распознает текст, но только текст. Но есть оболочка на C# Puma.NET https://archive.codeplex.com/?p=pumanet Т.е. если предварительно отзонировать паспорт, то результат будет нормальным. Вопрос в том сколько времени потребуется, чтобы дописать это зонирование... | |||
| 23
    
        25-11 25.12.19✎ 12:19 | 
        (20) Спасибо! Не лень, конечно, а просто не пришло в голову. Я как-то ИС в последнее время не очень посещаю.     | 
| Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |