ABBYY

Возможность использовать смартфон как средство распознавания визитных карточек, обсуждалась, пожалуй, со времени появления первых мобильных устройств с более–менее совершенными камерами. Так, ещё в конце 1990-х годов отдел распознавания текста ABBYY задумался о создании программы, обрабатывающей данные визитной карточки – Business Card Reader, или сокращённо BCR. Эта идея, что называется, «висела в воздухе», но, к сожалению, и возможности камер, и вычислительная мощность устройств не позволяли реализовать её.

ABBYY Business Card Reader

Мало кто знает, что на самом деле ABBYY Business Card Reader – наследник знакомого всем ABBYY FineReader. Изначально используемая в FineReader технология OСR, позволяющая распознать и сохранить любой сканированный текст, была «заточена» только под персональные компьютеры. Чтобы адаптировать ее под мобильные устройства, разработчики фактически заново переписали ее, учитывая массу ограничений, свойственных операционным системам смартфонов.

Первое приложение ABBYY для распознавания текста на мобильных устройствах разработчики написали в конце 1990-х для портативного сканера, а вовсе не для телефона. Этот сканер производства шведской компании C Technologies AB представлял собой небольшое устройство, отдалённо напоминающее маркер или ручку, и позволял построчно сканировать книги, журналы, газеты. Устройство передавало отсканированное изображение в компьютер или ноутбук по USB-кабелю, а приложение ABBYY распознавало отсканированный текст. Кстати, C Technologies AB до сих пор существует и выпускает портативные сканеры, в которых используются современные решения от ABBYY.

16 мая 2006 года ABBYY объявила о выходе ABBYY Mobile OCR SDK, инструментария, который позволял сторонним разработчикам включать в мобильные устройства функцию оптического распознавания (OCR), в том числе чтения визитных карточек. ABBYY Mobile OCR SDK мог использоваться на многих существовавших тогда мобильных платформах, включая Windows Mobile, Symbian или LINUX.

Тогда же разработчики ABBYY собрали  модуль Business Card Reader как часть большой системы распознавания. В начале 2007 года сразу в рамках партнёрства с южнокорейской компанией Diotec несколько моделей сотовых телефонов Samsung в Европе и в Индонезии были оснащены технологией BCR.

У команды разработчиков и аналитиков не оставалось тогда ни малейшего сомнения, что технологию нужно воплощать в коммерческом приложении, тем более что ключевая работа в ABBYY велась (и успешно продолжает) над качеством распознавания. 

ABBYY Business Card Reader

ABBYY Mobile OCR SDK обеспечивал практически мгновенное получение распознанного текста. Код нового SDK позволял легко встраивать его в любые мобильные устройства, способные получать изображения: смартфоны, карманные компьютеры, портативные сканеры, цифровые фотоаппараты. Мобильное устройство, снабжённое функциями распознавания текста, давало пользователю возможность быстро переводить сфотографированные или отсканированные страницы документов, книг или презентаций в текстовый формат для последующего сохранения. Сегодня обновленный инструментарий разработчика – ABBYY Mobile OCR Engine – позволяет встраивать в мобильные устройства и приложения мощные алгоритмы обработки изображений и распознавания текста, сочетая высокую производительность с низкой нагрузкой на ресурсы устройства.
Так, в начале 2008 года вышла первая версия программы ABBYY Business Card Reader – под Symbian. Уже тогда программа для работы не требовала постоянного подключения к интернету, поддерживала 3 языка интерфейса и 16 языков распознавания текста.

К сожалению, чехарда с версиями Symbian, огромное количество выпускаемых мобильных устройств (кроме Nokia, аппараты выпускали Samsung, Motorola и Sony, причём, последние даже написали собственную модификацию Symbian – UIQ) не позволяли в полной мере реализовать возможности приложения. Выход на российский рынок первых устройств на iOS и Android помог реализовать возможности, которые хотелось заложить в ABBYY Business Card Reader.

В декабре 2009 года был выпущен ABBYY Business Card Reader под iPhone 3. Правда, в полной мере возможности ABBYY Business Card Reader удалось раскрыть уже под iPhone 3 GS, так как камера iPhone 3 «не вытягивала».

Версию ABBYY Business Card Reader под Android пользователи ждали дольше – она появилась ровно через год после выпуска программы под iOS. В это время изменялась сама парадигма работы с мобильным устройством, да и возможности смартфонов заметно выросли, превращая их из игрушки бородатых гиков в удобный и полезный инструмент для ежедневной работы.

Самая свежая версия ABBYY Business Card Reader позволяет просто навести камеру смартфона на визитку и… вуаля! Всё остальное программа сделает сама. ABBYY BCR автоматически определяет на фотографии визитной карточки место нахождение полей: имя, фамилия, организация, должность, телефоны, адрес электронной почты, адрес сайта, фактический адрес, извлекает из них данные и передает в соответствующие поля адресной книги телефона. Даже кнопку нажимать не нужно.


Как это работает? Прежде, чем приступить к структурированию визитки, выделению и идентификации блоков, ABBYY Mobile OCR преобразовывает цветное или полутоновое изображение в монохромное. Чтобы правильно определить нужные строки и слова, технология исследует яркость фона и насыщеность черного цвета на протяжении всей строки и подбирает оптимальные параметры преобразования для каждого фрагмента по отдельности. Затем строки делятся на слова, а слова – на буквы, которые распознаются и снова собираются в слова. Слова верифицируются с помощью специальных морфологически структурированных словарей, созданных лингвистами компании ABBYY для всех поддерживаемых языков распознавания. Каждый из этих словарей способен моделировать различные словоформы, за счёт чего охватывает более 98% реального словарного объёма соответствующего языка. При эти словари весьма компактны, это позволяет быстро проверять результаты распознавания. После такой проверки извлеченные данные ABBYY BCR позволяет сохранить в адресную книгу телефона или собственную визитницу. Надо отметить, что весь этот сложный технологический процесс сегодня происходит моментально.

За все эти 8 лет истории развития от идеи о технологии, портируемой в мобильные сканеры до бизнес-приложения для смартфонов, развитие BCR идёт в нескольких направлениях:

1.  Доведение качества распознавания до максимального (этого практически достигли для латинских языков) 
2.  Повышение скорости  перенесения контакта с бумажного носителя на электронный (именно этого успешно добились в недавней версии с автозахватом, описанным выше)
3.  Замена традиционного бумажного обмена визитками цифровым.
4.  Data mining, или извлечение дополнительной информации из социальных сетей (прежде всего, из LinkedIn, Facebook) на основе данных визитки.


Сегодня ABBYY Business Card Reader – это:

Технология ABBYY Mobile OCR Engine, которая обеспечивает непревзойденное качество и скорость распознавания данных. Приложение быстро и точно распознает все данные с визитки, которые автоматически сохраняются в адресной книге смартфона или собственной визитнице приложения. А вот его возможности:

— 25 языков распознавания.
— Распознавание QR кодов на визитке. 
— Обмен визитками по Wi-Fi, электронной почте или SMS в текстовом, графическом или *.vcf форматах.
— Поиск контакта в социальных сетях LinkedIn, Facebook, Twitter.
— Отображение места оцифровки визитки на географических картах.
— Синхронизация базы визиток между iOS и Android устройствами.
— Текстовые заметки к визитке.  
Читать далее