ABBYY FineReader Engine

  • home >
  • SDK >
  • ABBYY FineReader Engine





  • ABBYY FineReader Engine 주요기능-2



     문서 구조 API
     
         정확한 문서 구조 및 레이아웃 유지 기능
                  ADRT 적응형 문서인식 기술 탑재 문서 전체의 논리적 구조 분석 및 이해
                  문서 차원의 형식 복원 (문단 머리말 꼬리말 각주 하이퍼링크 페이지 번호 등 복원)

    ADRT_Picture_Caption1.jpg
        

               필드 / 영역 분석

                  문서 인덱싱을 위한 사용자 지정 필드/영역에 대한 분석 및 추출

     
     비주얼 컴포넌트
     
         비주얼 컴포넌트 표시 및 제어 API 제공
         l 스캔 인터페이스 – TWAIN 호환 스캐너에 대한 제어 
         l 문서 뷰어
            문서 이미지의 썸네일 보기테이블 형식으로 상세보기 인식 진행 상태 표시
         l 이미지 뷰어
                전체 이미지 표시인식블록의 생성을 위한 툴 제공
    FRE11_VC_Image_Viewer.png


     
        텍스트 에디터
                인식 결과 표시 및 불확실한 문자에 대한 하이라이트
            기본적인 텍스트 서식 툴 제공
    FRE11_VC_Text_Editor.png


     
        텍스트 검증기
                텍스트 주요 부분의 ’ 보기불확실한 문자로 인식된 결과에 대한 검증 툴

    FRE11_VC_Text_Validator.jpg




               l Windows, Linux and OS X 동시지원  
     
       l 64-bit native support
     
    X64 어플리케이션에 C++ DLL을 바로 링크 가능 (COM proxy 불필요)
    .NET / Java 상호 연동 가능
     


       l 다양한 방식의 분류기반 적용 


       l 이미지 기반 분석
            -CNN(Convolutional neural network)를 사용하여 외관으로 이미지를 구별하는 분류 방식 (FAST)
      l 텍스트 기반 분석
         -전체 페이지에 OCR 처리를 하여 내용으로 구별하는 분류 방식 (SLOW)
          두 방식을 같이 사용할 수도 있고 따로도 사용 가능 
          또한 속도 모드와 정확성모드 중 하나를 선택하여 트레이닝 후 통계를 볼 수 있음    
    l 테이블 재구성 성능 향상 
         -docx로 내보낼 때 테이블 테두리 재구성
         -txt로 내보낼 때 레이아웃 보존 기능 향상 
         -xlsx에 내보낼 때 셀 테두리 색을 감지하고 내보냄 
     
     
          
                l 명함 인식 API
           명함 인식 기능의 API Full set 제공
           한///영 포함한 27개국 언어 인식
           vCard, CSV, XML 포맷으로 저장
           여러 장의 명함 자동 분할 기능
           명함 필드 정보 추출
       - 이름회사명직책주소/직장주소전화/휴대폰/팩스이메일웹사이트
     
                l 한국어 OCR 성능 개선


                       주요 기술 변경으로 인한 OCR 성능 개선
     
                          - 한국어 normal mode의 경우 전 버전 대비 속도 12% 상승 및 정확성 0.2% 향상

                          -한국어 Fast mode의 경우 전 버전 대비 정확성 10.1%향상