피앤피뉴스 - 인공지능으로 국가기록원 기록물 접근성 향상 됐다

  • 맑음부여12.0℃
  • 맑음구미10.1℃
  • 맑음춘천11.8℃
  • 맑음장흥11.3℃
  • 맑음광양시13.4℃
  • 맑음강진군11.9℃
  • 맑음홍천12.4℃
  • 맑음북강릉10.4℃
  • 맑음금산10.4℃
  • 맑음완도12.2℃
  • 맑음전주14.6℃
  • 맑음양산시14.7℃
  • 맑음산청9.8℃
  • 맑음임실10.0℃
  • 맑음파주10.9℃
  • 맑음성산17.0℃
  • 구름조금북춘천11.7℃
  • 맑음대관령6.8℃
  • 맑음백령도14.3℃
  • 맑음창원13.3℃
  • 맑음여수15.4℃
  • 맑음보령12.2℃
  • 맑음영월10.1℃
  • 맑음태백7.0℃
  • 맑음동해11.7℃
  • 맑음수원13.9℃
  • 맑음경주시12.2℃
  • 맑음김해시13.2℃
  • 맑음흑산도12.2℃
  • 맑음강릉12.9℃
  • 맑음봉화8.0℃
  • 맑음안동11.8℃
  • 맑음보성군11.6℃
  • 맑음영광군12.8℃
  • 맑음서산13.3℃
  • 맑음영덕9.0℃
  • 맑음정읍13.4℃
  • 구름조금인제12.2℃
  • 맑음밀양12.4℃
  • 맑음목포14.8℃
  • 맑음부산14.6℃
  • 맑음통영14.3℃
  • 구름조금철원10.9℃
  • 맑음울릉도11.6℃
  • 맑음울산12.4℃
  • 맑음진도군11.0℃
  • 맑음순창군11.1℃
  • 맑음제주17.2℃
  • 맑음남원12.8℃
  • 맑음강화10.7℃
  • 맑음울진10.6℃
  • 맑음순천9.3℃
  • 맑음대구13.5℃
  • 맑음원주11.6℃
  • 맑음세종12.3℃
  • 맑음천안11.3℃
  • 맑음포항13.9℃
  • 맑음남해11.8℃
  • 맑음서울14.8℃
  • 맑음합천10.8℃
  • 맑음의성10.3℃
  • 맑음문경8.5℃
  • 맑음청주15.0℃
  • 맑음보은11.2℃
  • 구름많음속초13.0℃
  • 맑음고창군12.0℃
  • 구름조금고산16.4℃
  • 맑음부안12.9℃
  • 맑음진주10.5℃
  • 맑음군산14.1℃
  • 맑음함양군9.2℃
  • 맑음양평12.2℃
  • 맑음충주9.9℃
  • 맑음홍성13.0℃
  • 맑음영천12.3℃
  • 맑음서귀포16.7℃
  • 맑음동두천12.6℃
  • 맑음영주8.8℃
  • 맑음해남10.9℃
  • 맑음상주9.8℃
  • 맑음이천10.9℃
  • 맑음거제13.7℃
  • 맑음장수8.2℃
  • 맑음인천13.9℃
  • 맑음제천8.9℃
  • 맑음거창8.2℃
  • 맑음고창14.4℃
  • 맑음정선군9.1℃
  • 맑음서청주12.0℃
  • 맑음고흥11.5℃
  • 맑음북창원15.1℃
  • 맑음북부산13.9℃
  • 맑음광주14.5℃
  • 맑음청송군9.4℃
  • 맑음의령군9.7℃
  • 맑음대전13.4℃
  • 맑음추풍령8.5℃

인공지능으로 국가기록원 기록물 접근성 향상 됐다

이선용 / 기사승인 : 2020-12-23 15:00:00
  • -
  • +
  • 인쇄

국가기록 인공지능.jpg


국가인재원, 국내 최초 인공지능 (AI)기반 한글 타자기록 문자인식 기술 개발  

 

[공무원수험신문, 고시위크=이선용 기자] 1960년대부터 1990년대까지 정부에서 주로 사용되었던 타자기록을 쉽고 간편하게 검색하고 활용할 수 있게 된다.

 

국가기록원은 딥러닝 기반으로 약 22만 개의 한글 타자체 단어를 학습시켜 국내 최초로 비전자 타자기록의 인공지능(AI) 문자인식(OCR) 기술 개발에 성공했다고 22일 밝혔다.

 

이러한 기술은 국가기록원이 ‘20년 연구개발 사업의 일환으로 인공지능 스타트업 기업과 협업하여 수행한 「소장기록물 특성을 고려한 OCR 인식 성능 개선방안 연구」 과제를 통해 개발됐다.

 

국가기록원은 “그동안 문서를 이미지로 스캔한 파일을 제공해왔으나, 문서내용 검색에는 한계가 있어 이용자들의 불편이 있었다”라며 “특히 기존의 문자인식 기술은 활자체에 최적화되어 있어, 사람이 손으로 쓰거나 타자를 이용하여 작성된 문서의 경우에는 효과가 크지 않았다”라고 설명했다.

 

이어 “이번 개발에 사용된 학습데이터는 1960~1990년대까지 재무부, 외무부, 건설교통부 등에서 생산한 도시계획, 경제계획 문서와 국무회의, 경제장관회의 등의 회의록 및 각종 법령 등을 대상으로 하고 있다”라며 “올해는 1단계로 공공기관에서 컴퓨터가 보급되기 이전에 주로 사용해 왔던 타자기록에 대해 문자인식 연구를 추진했다”라고 전했다.

 

또한 “기존의 문자인식 기술과는 달리 문자탐지와 문자인식의 2단계로 구성된 딥러닝 기반의 인공지능 문자인식 모델을 개발하여 학습 속도를 개선하고 인식성능을 90% 이상 획기적으로 높였다”라며 “앞으로 국가기록원은 문자인식 기술을 적용·발전시켜 국민들이 보다 쉽고 편리하게 기록물을 활용할 수 있도록 비전자 기록물의 원문 검색 및 색인 등의 정보 활용 서비스에 확대 적용할 계획”이라고 덧붙였다.

 

한편, 이번에 구축된 학습데이터는 국가기록원 누리집을 통해 공개될 예정이다. 

[저작권자ⓒ 피앤피뉴스. 무단전재-재배포 금지]

WEEKLY HOTISSUE

뉴스댓글 >

많이 본 뉴스

초·중·고

대학

공무원

로스쿨

자격증

취업

오피니언

종합