김희섭 국립중앙도서관장 “도서관, 신뢰도 높은 데이터 보고… AI, 새로운 이용자 될 것” [나의 삶 나의 길]

도서관의 미래를 보다 1980년대 대두된 ‘정보화 사회’ 관심 정보 분류 학문인 문헌정보학과 진학 대학원선 AI분야 ‘전문가 시스템’ 전공 ETRI서 국내 첫 한글 검색시스템 연구 디지털 도서관 길 열다 관련 분야 연구로 박사 학위 받고 귀국 디지털 전환·AI 시대 환경 변화에 맞춰 도서관, 지식 기반 공공 플랫폼 만들 것 국가문헌보존관 구축도 중대 과제 삼아
도서반에서 ‘총류 000’으로 시작하는 도서 십진분류법을 외우며 책을 정리하던 중학생이 반세기가 지나 우리나라를 대표하는 도서관장이 됐다. 2년 가까이 공석이었던 국립중앙도서관장에 2024년 6월 임명된 김희섭 관장 이야기다. 그사이 도서관은 변했다. 작은 서랍에 빽빽이 꽂혀 있던 손바닥만 한 노란색 도서카드는 사라졌다. 누가 이 책을 나보다 먼저 읽었는지 짐작할 수 있었던 책 속 대출카드도 없어졌다. 대신 바코드와 온라인 검색 서비스가 전국 도서관을 촘촘히 연결하고, 종이책 대신 전자책을 읽는 이용자도 늘었다.

김 관장은 도서관학에서 문헌정보학으로 바뀐 학문을 평생 연구했다. 특히 한글 검색 알고리즘 등을 연구하는 등 디지털 도서관을 누구보다 먼저 고민하며 구상했다. 시대가 요구하는 새 국립중앙도서관장 적임자였던 셈이다.

김희섭 국립중앙도서관장은 12일 서울 서초동 국립중앙도서관 집무실에서 인공지능(AI) 시대 도서관이 가진 잠재력과 역할의 중요성에 대해 설명했다. 김 관장은 “AI 시대의 도서관은 사람뿐 아니라 AI에게도 신뢰할 수 있는 지식 기반을 제공하는 공공 플랫폼”이라며, 국립중앙도서관이 축적해 온 방대한 자료와 메타데이터, 사서의 전문성을 바탕으로 국가 지식 인프라의 새로운 역할을 수행해야 한다고 강조했다. 이제원 선임기자 하얀 눈발이 날린 12일 오후 월요 휴관일, 서울 서초동 국립중앙도서관 집무실에서 만난 김 관장은 일생을 매진한 문헌정보학이 가진 매력에 대해 “어마어마한 양의 정보를 분류할 수 있다는 게 매력적이었다”고 말했다.

“도서관에 책 한 권이 들어오면 목록 작업하면서 그 책의 특징을 다 적어내야 하잖아요. 그렇게 전 영역의 학문을 다 다루고, 가지런히 정리할 수 있다는 점이 매력입니다. 지금 인공지능(AI) 서비스도 마찬가지예요. 자료를 그냥 던져주면 모르니까 전처리가 필요하고, 가장 먼저 하는 게 결국 ‘끼리끼리 모아주는’ 분류작업이죠. 그게 사서의 큰 매력이라고 봅니다. ”

그는 ‘AI 시대의 도서관’도 결국 분류·구조화의 문제에서 출발한다고 덧붙였다. 전공을 택한 건 고등학생 시절이다. 1980년대 ‘정보화 사회’가 화두로 떠오르는 걸 보면서 새로운 기회가 많이 생겨날 수 있겠다는 생각에서 택한 전공이었고 그 핵심인 ‘정리·구조화’는 적성에 맞았다.

“당시 ‘미래에 정보화 사회가 온다’는 담론이 활발했는데 정보화 사회가 뭘까 궁금했습니다. 마침 아는 친척 형님 한 분이 이 분야를 전공하고 계셔서 여쭤봤더니 ‘세상에 정보가 폭발적으로 늘어나는데, 그 정보를 체계적으로 정리하고 분류하는 학문이 바로 도서관학’이라고 하시더군요. 신생 학문이라 앞으로 노력하기에 따라 크게 공헌할 기회가 많을 거라는 조언도 해주셔서 도전정신이 발동했습니다. 그렇게 문헌정보학과에 진학하게 되었고, 들어가 보니 제 선택이 옳았다는 확신이 들었습니다. 책 한 권을 다루더라도 그 안에서 제목, 저자, 발행 정보, 주제 분류 등 수많은 요소를 체계적으로 정리해야 하는데, 이런 일을 해내는 도서관학의 전문성에 큰 매력을 느꼈습니다. 그래서 학부 때부터 이 분야를 깊이 파고들어야겠다고 마음먹었고, 그 열정이 지금까지 이어져 온 것 같습니다. ”

특히 대학원에선 아예 정보학을 전공으로 택해서 이미 1980년대 주목받았던 AI 분야인 ‘전문가 시스템’을 전공하게 됐다. 김 관장은 “당시 AI는 지금처럼 데이터·기계학습 중심이 아니라 전문가의 판단 규칙을 지식베이스로 구현하는 방식이 주류였다”고 설명했다. 김 관장은 사람이 수기로 하던 목록 작성을 기계(컴퓨터)가 대신하는 ‘도서관 자동화’에 주목했다. 또 사서가 단순히 시스템을 사용하는 데 그치지 않고 직접 설계해야 한다고 믿었다. 이를 위해 학부 시절부터 코볼(COBOL) 같은 프로그래밍 언어와 DB 설계를 익혔다.

“오늘날처럼 거대한 데이터와 기계학습 위주의 AI가 아니라 그때는 사람 전문가의 지식과 판단기준을 컴퓨터에 규칙 형태로 넣어주는 방식이었지요. 저는 사서의 전문적인 판단과 노하우를 지식베이스로 구축하고, 그것을 활용해 기계가 도서 목록의 기본 항목들을 자동으로 생성하도록 하는 지능형 도서관 시스템을 설계했습니다. 도서관 현장에서 반복적으로 이루어지는 목록 작성과 분류 업무를 분석해서, 사서들이 하는 판단 과정을 규칙화하고 자동화 가능성을 모색한 연구였어요. 당시는 상당히 도전적인 시도였지만 실무 적용 가능성까지 인정받았죠.”

석사학위를 마친 김 관장은 IT 입국을 주도한 한국전자통신연구원(ETRI)에 몸담게 됐다. 전자식교환기·IMT2000 등을 개발하며 통신강국으로 발돋움하는 결정적 기반을 만들어낸 곳에서 김 관장은 기술정보 검색·제공시스템 개발에 참여했다. 아직 디지털화 안 된 온갖 기술 메모나 보고서 등을 일일이 전산화해서 구축한 정보를 보다 쉽고 빠르게 검색할 수 있는 시스템이었다.

“그렇게 만들어진 것이 국내 최초 정보통신 전문 한글 정보검색 시스템 및 데이터베이스(ETLARS)였습니다. 그 시스템 설계에 참여하면서 한글로 된 기술정보를 효율적으로 검색하는 데 주안점을 뒀죠. 지금이야 검색엔진이 일상적이지만 당시에는 한글 처리 기술도 미흡하고 검색 알고리즘도 초보적이라 상당히 어려운 도전이었습니다. ETRI 내부망은 물론 천리안 같은 PC통신망을 통해 전국 연구자들과 정보를 실시간으로 공유하는 시스템을 만들어냈습니다. ”

1995년 12월 등장한 첫 인터넷 한글 검색엔진 ‘코시크’보다 4년이나 앞선 1991년 외부에 공개된 선구적 작업이었다. “제가 했던 연구들이 시대를 조금 앞서간 셈인데, 당시 쌓은 경험 덕분에 ‘지식을 체계적으로 축적하고, 신뢰할 수 있는 방식으로 제공하는’ 도서관의 역할에 대한 저만의 철학이 생겼습니다. 덕분에 지금 디지털 전환과 AI 시대의 도서관을 고민하는 데 밑바탕이 되는 통찰을 얻을 수 있었다고 생각합니다. ”

이후 김 관장은 다시 영국문화원 장학생으로 선발되어 떠난 영국 유학에서 이공계 전문 데이터베이스인 ‘인스펙(INSPEC)’을 활용해 검색 성능 평가와 알고리즘 실험을 진행하며 디지털 도서관 분야의 전문성을 심화했다. 이렇게 디지털 도서관 기반에 대한 연구로 박사학위를 받고 귀국해서 ETRI를 거쳐 모교에서 연구와 후학 양성을 해오던 김 관장에게 국가 대표 도서관의 변혁을 주도할 기회가 온 것은 어쩌면 필연이다.

“결심이 쉽지는 않았다”는 김 관장은 특히 국립중앙도서관이 디지털 전환과 데이터·AI 환경 변화에 직면해 있다는 점을 강조했다. 도서관이 보유한 방대한 자료와 데이터 자산에 비해 이를 체계적으로 활용하고 미래 환경에 맞게 재정비해야 할 과제가 많다는 것.

“오늘날 도서관은 단순한 열람 공간이 아니라 AI가 학습할 수 있는 신뢰도 높은 AI 데이터의 보고(寶庫)이자 국민의 AI 리터러시를 높이는 핵심 기반시설로 그 역할이 확장되고 있습니다. ” 김 관장은 특히 AI 개발과 발전에 도서관이 지닌 역할과 그 잠재력이 크다고 믿는다. 생성형 AI의 성능을 좌우하는 세 가지 요소로 ‘양질의 자료, 정확한 메타데이터, 사서의 전문적 큐레이션’을 꼽으며 도서관만큼 오랜 세월 자료를 수집하고 구조화하며 의미 있게 연결해 온 기관이 없다는 설명이다.

“오랜 시간 도서관이 축적해 온 방대한 지식 자료와 정교한 서지 메타데이터 그리고 사서들의 검증 과정은 AI가 올바르게 학습하는 데 무엇보다 신뢰할 만한 기반이 됩니다. 이제 도서관의 이용자는 사람에게만 국한되지 않습니다. AI 또한 언젠가는 지능을 향상하기 위해 도서관에 의지하게 될 새로운 이용자가 될 것입니다. 그런 시대에 대비하여 국립중앙도서관은 AI가 활용할 수 있는 고품질 데이터와 메타데이터 인프라를 강화하는 한편, 사서들이 AI를 도구로 활용하여 한층 수준 높은 지식 큐레이션을 제공할 수 있도록 준비하고 있습니다. 저는 AI 시대의 도서관은 사람과 AI 모두에게 가장 신뢰할 수 있는 지식 기반을 제공하는 공공 플랫폼으로 진화해야 한다고 믿습니다. ”

2018 평창 동계올림픽의 유산인 국제방송센터를 재활용하게 될 국가문헌보존관을 제대로 구축하는 것도 김 관장이 풀어나가야 할 중대 과업이다. 서고 수용률 94%로 이미 포화에 이른 국립중앙도서관 공간에 여유를 주면서 AI 시대에 대응하는 공간으로도 구상 중이다.

“단순히 새 서고를 짓는 것이 아니라 국가 문헌의 과학적 보존·복원과 디지털 자원의 체계적 관리까지 아우르는 미래형 보존 인프라를 만들 계획입니다. 종이 자료와 디지털 자료를 함께 관리하는 새로운 국가 분산 보존 체계를 구축하는 것이 핵심 목표입니다. AI 시대에 맞는 새로운 활용방안도 함께 모색하고 있습니다. 예를 들어 보존관에 축적된 방대한 디지털 문헌 데이터를 활용하여 연구자·개발자·공공 분야 종사자들이 AI를 실험하고 연구할 수 있는 ‘AI 메이커스페이스’로 활용하는 방안을 검토 중입니다. ”

중앙도서관의 비전에 대해 김 관장은 “과거를 알고 싶으면 박물관에 가고, 현재를 알고 싶으면 시장에 가고, 미래를 알고 싶으면 도서관에 가라”는 말이 있다며 ‘미래’를 강조했다. 박물관이 유물을 관람하는 곳이라면 도서관은 이용자가 머물며 미래의 지식을 창조하는 공간이라는 설명이다. “세계를 대표하는 국가 도서관들 중에서 디지털 자료를 빼고 장서량만 놓고 보면 우리가 한 20위 정도 되는데 디지털 대전환(DX)과 인공지능 대전환(AX)에선 우리가 가장 앞서 나가고자 합니다. ”

김희섭 국립중앙도서관장은…

●경북대 도서관학 학사·정보학 석사 졸업(1989) ●영국 셰필드대 정보학 M.Phil.(1998) 노섬브리아대 정보학 박사(2001) ●1989∼2003 한국전자통신연구원 ●국제표준화기구 문헌정보 기술위원 ●2003∼ 경북대 문헌정보학과 강사·교수 ●2024년 6월∼ 국립중앙도서관장

박성준 선임기자 alex@segye.com