'손글씨' AI 인식…교육업계, 'OCR'로 똑똑해진다
'손글씨' AI 인식…교육업계, 'OCR'로 똑똑해진다
  • 윤경진 기자
  • 승인 2022.06.10 10:04
  • 댓글 0
이 기사를 공유합니다

천재 '밀크T' 손글씨 인식해 받아쓰기 활용
'콴다' AI 기반 OCR로 문제 풀이 제공
손글씨 인식 기술이 반영된 밀크T 관련한 학습 장면.[사진=천재교육]
손글씨 인식 기술이 반영된 밀크T 학습 장면.[사진=천재교육]

최근 교육·인공지능(AI) 스타트업 업계에서 빛을 이용해 문자를 판독하는 광학문자인식(OCR)이 핵심 기술로 떠오르면서 소비자들에게 더욱 편리한 서비스를 제공하기 위해 OCR을 속속 도입하고 있다. OCR은 이미지, PDF 내 문자를 편집 가능한 텍스트 형식으로 바꿔주는 기술로 종이에 인쇄되거나 수기로 작성된 문자, 기호 등에 빛을 비추고 여기서 나온 반사 광선을 전기 신호로 바꿔준다.

쌍방향 디지털 교육 환경이 중요해진 교육 업계에서는 OCR이 차세대 에듀테크 서비스의 핵심 기술로 자리잡았다. 

10일 교육업계에 따르면, 천재교육과 콴다, 프리딕션 등은 OCR 관련 분야를 미래교육기술의 주요 기반 중 하나로 보고 그 동안 축적해 온 학습 데이터와 교육교재 제작 기술을 첨단기술에 접목하고 있다.

천재교육은 독자적인 기술 개발을 통해 필기 인식, OCR 기술 도입에 집중하고 있다. 지난 2015년 에듀테크센터 및 2018년 센터 내 AI센터 설립을 통해 다양한 연구를 진행하며 AI 기반의 학습콘텐츠를 상용화하고 있으며 빅데이터 분석, 자연어 처리, 이미지 인식(OCR, 필기체, 수식, 이미지 등), 머신러닝(딥러닝 포함), AI수학, 학습분석 관련 6가지 분야를 미래교육기술의 기반으로 삼고 온라인 기반의 스마트러닝 시장을 이끌고 있다.

그 중 천재교육 자회사 천재교과서가 만든 스마트학습 ‘밀크T’는 손글씨 인식 학습 콘텐츠를 선보여 눈길을 끌고 있다. 유치원생, 초등생들이 알아보기 어려운 글씨체를 가졌다는 점에 착안해 손글씨를 90% 이상의 정확도로 필기 인식하는 기술을 핵심으로 개발하고, 받아쓰기 또는 따라 쓰기 콘텐츠에 적극 활용하고 있다. 580만 건 이상의 필기체 이미지 데이터를 이용해 AI가 학생들의 글씨를 인식하는 것이 특징이며 학습생이 어떤 패턴으로 손글씨를 쓰는지 감지하고 받아쓰기를 통해 깊이 생각하며 학습할 수 있게 한다. 기존에는 담당 교사가 학생들이 푼 문제, 풀이과정을 직접 확인하고 데이터를 입력했다면 이 기술을 통해 자동으로 손글씨를 인식하고 AI 첨삭이 즉각적으로 이루어져 학습에 대한 신속한 피드백이 가능하다는 설명이다. 지난 2월 ▲손글씨 인식을 통한 유아 학습 시스템 ▲손글씨 인식을 통한 유아 학습 방법 및 이를 기록한 기록 매체 기술 등 AI 관련 특허를 받은 바 있다.

OCR 기술이 활용된 '우리 학교 AI 시험 족보' 서비스를 오픈한 바 있다. 천재교과서가 만든 스마트 중등인강 ‘밀크T 중학’이 선보인 서비스로, 밀크티 중학 학습생의 학교 기출 시험지를 OCR 기술을 통해 확인한 후 빅데이터 분석으로 학교별 시험 문제를 예측하고 문제풀이 결과를 AI로 분석한다. 취약 유형에 대한 문제와 개념 중등인강 강의도 추천해주며, 효율적인 중학교 시험 대비가 가능하다.

또한 OCR 활용 범위 확대를 통해 선생님, 콘텐츠 편집자들을 위한 문항 편집을 용이하게 해 T셀파 서비스 등에 공개할 예정이며 디지털 참고서, 디지털 교과서 등 활용 범위를 넓혀갈 예정이다. 또한 방대한 문항을 효율적으로 검색하기 위해 수식 인식, 이미지 인식(도형 인식) 등을 고도화하여 전 과목에 적용할 수 있도록 개발할 예정이다.

권기덕 천재교육 AI센터 본부장은 “온라인 수업 등 비대면 기술을 도입한 이후, 개인 맞춤형 학습을 유도하는 다양한 서비스를 제공하고 있다”며 “앞으로도 양질의 빅데이터를 기반으로 OCR기술 등을 적극 활용해 각자의 학습 수준을 객관적으로 진단할 수 있는 서비스를 강화해나가겠다”고 말했다.

학생들이 모르는 문제를 사진으로 찍으면 문제 풀이 등을 제공하는 애플리케이션(앱) ‘콴다’도 눈길을 끈다. 2016년 1월, 에듀테크 기업 ‘매스프레소’는 AI 기반 맞춤형 학습 플랫폼 ‘콴다’를 출시했으며 해외 시장 특히 베트남, 인도네시아 등 동남아시아 국가의 중·고등학생 사이에서 좋은 받응을 얻고 있다.

‘콴다’의 핵심 기술은 AI기반 OCR로 학생들이 모르는 문제를 휴대폰 카메라로 찍으면 5초 이내에 해당 문제 풀이와 관련 유형, 개념 영상 등 맞춤형 교육 콘텐츠를 제공해준다. 대량의 해설 데이터와 자체 검색 엔진을 AI와 연결해 구현했으며 누적 문제 해결 수는 약 40억 건 정도에 이른다. 한편 2018년 11월 일본을 시작으로 베트남, 인도네시아, 태국 등에 진출했으며, 현재 7개 언어를 지원하고 있다.

그림, 수식 등을 텍스트화시키는 AI OCR 기술도 주목받고 있다. 에듀테크 스타트업 ‘프리딕션’은 초등교육 서비스에 활용될 AI OCR 모델을 개발하고 메가스터디교육 초등교육 서비스 ‘엘리하이’와 계약을 체결해 AI OCR 모델을 납품하게 됐다. ‘엘리하이’는 메가스터디교육의 초등인강 서비스로 2018년 정식으로 런칭한 후 단 6개월 만에 누적 매출 100억 원을 돌파하며 긍정적 반응을 얻고 있다.

프리딕션 AI OCR 모델은 그림, 수식, 보기 등이 존재하는 수학 문제 이미지를 Katex 문법에 맞게 텍스트로 변환하는 문서인식 기술로, 텍스트만 인식하는 기존 OCR과 달리 AI를 접목해 복잡한 수식과 기호 등 예외 사항까지 인식할 수 있다. 자체 테스트를 통해 밝혀진 정확도는 98% 수준이다.

youn@shinailbo.co.kr